文心、讯飞星火之后，通义千问也公布大版本迭代综合性能超GPT-3.5|大模型|文心|星火|综合性|讯飞|通义千问

封面新闻记者欧阳宏宇

继日前文心大模型、星火认知大模型完成迭代，又一头部通用大模型也宣告升级。

10月31日，阿里云在杭州正式发布了通义千问2.0。据介绍，通义千问2.0拥有千亿级参数，综合性能超过GPT-3.5，正在加速追赶GPT-4。现场，阿里云CTO周靖人透露，通义千问的APP版本在各大手机应用市场正式上线，所有人都可通过APP直接体验。

大模型是本轮AI浪潮的核心技术，基础模型的质量很大程度决定了AI产业化的前景。周靖人介绍，过去6个月，通义千问2.0在性能上取得巨大飞跃，相比4月发布的1.0版本，新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

在具体能力方面，中英文理解、数学计算、代码推理能力是大语言模型的基本功。据了解，以英语任务为例，通义千问2.0在MMLU基准中仅次于GPT-4；在HumanEval测试中，其得分也紧跟GPT-4和GPT-3.5。

模型能力的提升，也带来了市场需求的扩容，千行百业都想借助大模型实现生产和服务方式的变革。类似于文心大模型4.0推出后上线了十余款原生应用，星火大模型升级至3.0版本后，新增了虚拟人格、心理健康等功能，更多的通用大模型也在垂直场景深化布局。

据介绍，通义大模型2.0也同步训练了包括编码、阅读、研投等垂类大行业模型。开发者可以通过网页嵌入、API/SDK调用等方式，这些模型能力集成到自己的大模型应用和服务中。

“随着大模型技术与云计算本身的融合，我们希望未来的云可以像车一样也能够自动驾驶，大幅提升开发者使用云的体验。”周靖人回忆称，他此前提到过“数据中心就是一台计算机”的理念，今天，AI时代更加需要这样的技术体系。“云计算就是一台超级计算机，可高效连接异构计算资源，突破单一性能芯片瓶颈，协同完成大规模智能计算任务，携手千行百业推动AI创新，共享技术红利。”