深圳商报·读创客户端首席记者 陈小慧
1月27日,大模型领域迎来两个重磅发布——阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking;DeepSeek团队发布全新DeepSeek-OCR 2模型并开源。
记者了解到,千问旗舰推理模型Qwen3-Max-Thinking总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
据阿里方面介绍,千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。
目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。
据悉,面向即将到来的智能体Agent时代,Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力。
同一天,DeepSeek团队发布全新DeepSeek-OCR 2模型并开源。据了解,2025年10 月20日,DeepSeek AI团队正式发布并开源DeepSeek-OCR模型,其凭借高压缩比、高识别精度等优势,在AI领域迅速引发强烈反响。简单来说,就是实现了长文本处理效率与精度的大幅提升。
而DeepSeek-OCR 2模型是在去年10月的版本上更进一步。据报道,全新DeepSeek-OCR 2模型采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。
在工信部信息通信经济专家委员会委员盘和林看来,deepseek是多模态上的突破,AI视觉识别能力更强,千问是AI Agent上的进步,这也是国内头部大模型发展的两条思路,deepseek探索基础算法,改进算法,增加多模态能力,而千问则通过生态应用软件的整合,实现AI Agent处理具体任务能力的提升。
盘和林表示,从应用角度,千问这样的AI Agent可以更快渗透到用户端,普及也更快;而从基础算法角度,deepseek则是夯实了国内大模型算法的基础,未来后劲更足。
“但个人有个观点,那就是我认为千问这样的AI Agent能力将是2026年关注的焦点,原因是当前AI算力投入过大,如果没有应用端的实际场景,那么AI大模型公司很可能被庞大的算力需求压垮。所以,今年大模型的主要竞争会集中在AI应用,尤其是综合解决问题的AI Agent。”盘和林说。
人工智能开源社区抱抱脸(Hugging Face)数据显示,截至2025年8月,中国开源模型累计下载量已超越美国。有报告预计,中国企业级大模型人工智能应用解决方案市场的市场规模预计将在2029年达到2394亿元,2024年至2029年的复合年增长率有望达到44.0%。
热门跟贴