5月20日,在2026阿里云峰会上,阿里云宣布进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。

阿里云资深副总裁刘伟光表示,Agent突破临界点后可24小时不间断工作,对AI和云的需求无穷无尽。

打开网易新闻 查看精彩图片

以下内容根据官方消息总结:

一、芯片层:真武 M890+128 卡超节点服务器

真武 M890 AI 芯片(平头哥)

性能为真武 810E 的3 倍,144GB 显存,片间互联带宽800GB/s。

原生支持 FP32~FP4 全精度,覆盖训练 / 推理全场景。

路线图:2027Q3真武 V900、2028Q3真武 J900。

累计出货56 万片,服务 400 + 政企客户。

磐久 AL128 超节点服务器

搭载自研 ICN Switch 1.0,128 卡互联,P2P 时延<150ns。

面向 Agent 海量并发推理与大模型训练。

二、云层:全面升级为 Agentic Cloud

云产品Skill 化 / MCP 化 / CLI 化,变成 Agent 可直接调用的标准化能力模块。

重构运行环境:轻量沙箱、多 Agent 协同、跨任务记忆、数据高速流转、全域智能运维。

适配 Agent“无规律弹性、短生命周期、瞬时起量即走” 的负载特征

三、模型层:Qwen3.7-Max 国产第一,胜任 35 小时长程任务

Qwen3.7-Max(通义千问旗舰)

Arena 全球盲测国产第一,对标全球顶级模型。

面向 Agent 重构:强编程 / 推理 / 多智能体协作 / 办公自动化能力。

里程碑演示:在真武 M890 上自主运行 35 小时,千次工具调用,自研 AI 内核性能提升 10 倍。

迭代加速:近 3 个月连续发布3.5/3.6/3.7三个版本。

四、推理层:百炼平台极致弹性 + 开放生态

百炼推理平台

并池调度 + 上下文缓存 + 弹性吞吐,优化 Agent 高并发推理。

内置Agentic RL:基于执行反馈的强化学习,驱动模型持续迭代。

安全治理:约束自主 Agent 行为,防止越界。

生态开放:接入 Qwen、GLM5.1、MiniMax M2.7、Kimi K2.6、可灵、Vidu Q3 等150 + 主流模型。

五、新入口:千问云发布

Agent 原生模型服务平台,聚合150 + 模型 API。

核心能力封装为 Skills 与 CLI 工具,便于 Agent 调用与 AI 应用开发。

定位:从 “为人服务” 转向 “为 Agent 服务” 的下一代模型入口。

据媒体报道,这是行业首次围绕Agent进行全栈产品发布。阿里云资深副总裁刘伟光在峰会上表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。