大模型最新进展！阿里、DeepSeek发布！|agent|deepseek|大模型|盘和林|知名企业|算法|阿里巴巴集团

深圳商报·读创客户端首席记者陈小慧

1月27日，大模型领域迎来两个重磅发布——阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking；DeepSeek团队发布全新DeepSeek-OCR 2模型并开源。

记者了解到，千问旗舰推理模型Qwen3-Max-Thinking总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。

据阿里方面介绍，千问新模型通过总参数、强化学习、推理计算的极致规模扩展，实现了性能的大幅飞跃，在多项关键性能基准测试中刷新全球新纪录。同时，该模型采用全新测试时扩展机制，推理性能提升同时更经济，并大幅增强原生Agent能力，模型对话时可自主调用工具。

目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。此外，千问APP也即将接入新模型，所有用户都可免费体验千问最强模型。

据悉，面向即将到来的智能体Agent时代，Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力。

同一天，DeepSeek团队发布全新DeepSeek-OCR 2模型并开源。据了解，2025年10 月20日，DeepSeek AI团队正式发布并开源DeepSeek-OCR模型，其凭借高压缩比、高识别精度等优势，在AI领域迅速引发强烈反响。简单来说，就是实现了长文本处理效率与精度的大幅提升。

而DeepSeek-OCR 2模型是在去年10月的版本上更进一步。据报道，全新DeepSeek-OCR 2模型采用创新的DeepEncoder V2方法，让AI能够根据图像的含义动态重排图像的各个部分，更接近人类的视觉编码逻辑。

在工信部信息通信经济专家委员会委员盘和林看来，deepseek是多模态上的突破，AI视觉识别能力更强，千问是AI Agent上的进步，这也是国内头部大模型发展的两条思路，deepseek探索基础算法，改进算法，增加多模态能力，而千问则通过生态应用软件的整合，实现AI Agent处理具体任务能力的提升。

盘和林表示，从应用角度，千问这样的AI Agent可以更快渗透到用户端，普及也更快；而从基础算法角度，deepseek则是夯实了国内大模型算法的基础，未来后劲更足。

“但个人有个观点，那就是我认为千问这样的AI Agent能力将是2026年关注的焦点，原因是当前AI算力投入过大，如果没有应用端的实际场景，那么AI大模型公司很可能被庞大的算力需求压垮。所以，今年大模型的主要竞争会集中在AI应用，尤其是综合解决问题的AI Agent。”盘和林说。

人工智能开源社区抱抱脸（Hugging Face）数据显示，截至2025年8月，中国开源模型累计下载量已超越美国。有报告预计,中国企业级大模型人工智能应用解决方案市场的市场规模预计将在2029年达到2394亿元，2024年至2029年的复合年增长率有望达到44.0%。