还记得五月初那场引发热议的AI评测吗?开发者toyama nao发布的测试结果里,两款神秘国模A和B横空出世。其中,极限分数超越Gemini 3.1 Pro和Claude Opus 4.6的国模A,一时间众说纷纭。如今,随着2026年阿里云峰会主论坛的开幕,这个谜底终于揭晓——阿里云正式发布新一代旗舰模型Qwen3.7-Max。

但这次的峰会与以往截然不同。主角不再是参数规模、上下文长度和聊天体验的炫技,而是一个清晰且激进的方向:All in智能体。与其称之为一场发布会,不如说这是一场阿里与所有AI用户的技术探讨。

打开网易新闻 查看精彩图片

CTO李飞飞在主论坛演讲中直言:"云的价值,正在从规模化管理和运营算力,进入规模化管理和运营智力。"3月正式接手Qwen的周靖人则更加直白:"大模型已经从'人类价值对齐'转向'任务对齐'。"短短两句话,指向同一个目标:阿里的AI战略正在拆除模型、算力、安全、应用之间的边界,将它们重构为Agent体系下的标准化组件。

以下从开发者视角,拆解这场峰会透露的三个隐秘信号。

01 一切皆为Agent组件

如果说过去两年,大模型公司的竞争焦点是"谁的模型更强",那么阿里给出的答案是:模型只是起点,Agent是目前能看到的终点。这不是口号,而是实打实地反映在两个方面。

第一,模型正在被重新定义——在Agent中,模型不能只是大脑,还要成为智能中枢。

Qwen3.7-Max的定位很清晰:面向智能体时代的新一代旗舰模型,官方宣传的核心能力全部围绕Agent展开:

• 长周期自主执行:在长达35小时、超过1000次工具调用的内核优化实验中,模型能够持续推理且保持能力不退化
• 跨框架泛化:无论部署在Claude Code、OpenClaw还是自家的Qwen Code,性能表现相对稳定
• 原生工具调用:支持MCP集成和多智能体协作,可直接操控办公软件、云服务甚至具身智能的物理机器人

新一代模型的最大转变,是从孤立的"大脑"变成Agent的中央处理器。这也符合Agent设计的核心要求——必须能规划、调用工具、反思、纠错并适应各种运行环境。

从官方公布的评测数据来看,Qwen3.7-Max的基准测试结果已接近Anthropic上一代旗舰Claude Opus 4.6和国内模型顶尖水平。当然,这些多为阿里自报成绩,部分编程基准测试与Claude Opus 4.6仍存在几个百分点的差距。

结合Artificial Analysis的第三方测试结果,Qwen3.7-Max智能水平位列全球第五,编程能力位列全球第七,二者均为国内第一。代理能力略逊于小米和智谱,但差距只在毫厘之间。

第二,云基础设施正在被重构——从AI原生云,演进为Agent原生云。

李飞飞提出了两个关键概念:AI Native Cloud(AI原生云)和Agent Native Cloud(智能体原生云)。二者并非字面意义上的包含关系:

AI原生云的核心是生产token,通过预训练、后训练和推理的全链路优化(如KV Cache命中率超过90%),让token足够便宜和高效。

Agent原生云的核心是把token变成action,为智能体提供运行时沙箱、编排、治理、安全、记忆、数据平面六个方向的支撑。

这两个概念的提出,间接否定了以DAU、token消耗量、DAA等中间变量作为衡量Agent产出价值唯一标准的观点。与其过早关注如何评判Agent的价值,不如先搞清楚Agent该如何发挥价值。

更值得关注的是,李飞飞当场宣布:阿里云旗下所有云产品将在今年完成控制面改造,实现Agent应用所需的"Skill化"、"MCP化"和"CLI化"。智能体将替代人类成为云产品的第一用户。未来企业调用OSS存储、PolarDB数据库和DataWorks数据平台,不再需要人工点击控制台或编写脚本,全部由Agent自然语言驱动。

从上述变动可以清晰看出,阿里已一改往日全面覆盖的策略,完全将Agent作为设计原点。模型、硬件、安全框架和存储都不再是独立产品线,而是成为Agent体系下的插件。从程序员角度看,这完美符合操作系统的设计哲学:Agent是应用程序,底层基础设施提供标准化的API和运行时。

02 企业级市场明确定为主战场

纵观主论坛的发布内容,尽管没有白纸黑字地写出来,但阿里云的服务中心已经明显偏向企业级客户。若是程序员中的个体户,甚至会在聆听中产生一种陌生感。

这不是个人偏见。李飞飞在峰会上花费