从云栖大会，透视中国AI水面下的暗涌|中国|云栖大会|云计算|互联网|人工智能领域|何小鹏|吴泳铭|阿里云

阿里CEO吴泳铭：我们依然还处于AGI变革早期。

2024云栖大会上，极少在公开场合露面的阿里CEO、阿里云董事长兼CEO吴泳铭对AI的未来发展提出了积极的观点。他认为过去22个月，AI发展速度已超任何历史时期，“但我们依然还处于AGI变革早期”。面向未来，他提出生成式AI最大的想象力，“绝不是在手机屏幕上做一两个新的超级app，而是接管数字世界，改变物理世界。”

此刻距离OpenAI发布ChatGPT已过去22个月。全球AI技术圈和创投圈经历了一个完整周期：技术奇点爆发引发狂热追捧，再到创新曲线放缓，失望和质疑声音浮现。如今随着OpenAI发布o1模型，AI深入各行各业，市场的信心正在重新爬升。吴泳铭的此次发声，在当下的冷暖切换期，无疑更具参考意义。

如何看待这一次AI革命浪潮？AGI的最终形态会是什么？我们如何把握这一次技术革命？

吴泳铭发言和这届云栖大会变成了最好的解题集。主论坛成为AI创业者的舞台，阿里云请来了国内大模型、自动驾驶和人型机器人的明星创业者和科学家。走进云栖小镇，阿里云几乎搬来了中国AI圈所有的创业公司和产品，4万平米的展区，挤满了全球百余款AI应用。400多场并行话题及论坛中，150余场和大模型相关。在世界机器人大会爆火的人形机器人，在云栖再次当上了顶流。

上一届云栖大会，焦点还在AI上游的算力和生态。这一届云栖成为中国AI产业的微缩地图。AI开始走出服务器，深入千行百业。始于2009年的云栖大会，见证了每一波中国科技潮水的方向，也给出了理解当下的线索。

01 悄然演进的新产业革命

ChatGPT爆火后，如何定义这一浪潮的级别，成为全球顶级大脑热议的话题。其中，互联网是个热门对比维度。

A16Z创始人 Marc Andreessen提出过一个有趣的观点：互联网通过连接现有的计算机来促进新计算机的创建，而AI尤其是大模型，则更像是一种新型计算机。

对于这个全球记者采访提纲里的CEO热门问题，吴泳铭给出了进一步的延伸。他认为，过去三十年，互联网浪潮的本质是连接，互联网连接了人、信息、商业、服务等等，通过连接提高了世界的协作效率，创造了巨大的价值，改变了人们的生活方式。但生成式AI是通过给生产力供给增加智能，从而为世界创造更大的内在价值。“这种价值创造，可能是移动互联网连接价值的十倍、几十倍。”

吴泳铭给予AI浪潮如此之大的预期，很大原因在于作为中国最大云厂商的掌舵者，他可以亲眼见证中国AI市场水面之下的暗流涌动。正如他在云栖大会上提到：

“今天我们接触到的所有客户、所有CTO，几乎都在用AI重构自己的产品。大量新增需求正在由GPU算力驱动，大量存量应用也在由GPU重新编程。在汽车、生物医药、工业仿真、气象预测、教育、企业软件、移动APP、游戏等行业，AI计算正在加速渗透。”

传统AI焦点在于模拟人类的感知，生成式AI却将机器智能跃升到了思考推理和创造的维度。吴泳铭在演讲中进一步解释道：

“生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、代码、图像、视频、声音。AI模型可以通过对物理世界数据的Token化，理解真实世界的方方面面，比如人类行走、奔跑、驾驶车辆、使用工具的动作，绘画、作曲、写作、表达、教学、编程的技巧。理解之后，AI就可以模仿人类去执行物理世界的任务。这将带来新的产业革命。”

互联网本质上只改变了人类“连接”另一个人类、信息、商业、服务的形态，但大模型同时改造前端的交互界面，和后端的生产环节。很多悄然开始的产业革命，并不容易被普通人所察觉。

以深势科技为例。这家公司是“AI for Science”科学研究范式的头部践行者，运用人工智能和多尺度模拟仿真算法，结合先进计算手段求解重要科学问题，为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。

基于深势科技发布的Uni-Mol分子构象大模型，可实现分子生成、性质预测等多种通用能力。在药物发现领域，基于Uni-Mol开发的虚拟动力学分子生成方法VD-Gen，能直接在蛋白靶点空腔中生成具有高结合亲和力的分子。

基于阿里云高性能计算，深势科技将单次预测能支持的最大氨基酸序列长度提升至 6.6k，覆盖99.992%已知的蛋白序列。

来自广东的拓斯达工业机器人公司，则将传统的工业机器人控制软件与通义大模型结合，让工业机器人在指令控制、传感反馈、知识学习等方面具备了新能力。在 3C、锂电、光伏等行业的自动化生产场景中，集成了大模型能力的拓斯达六轴工业机器人，可以与现场工程师通过语言交互，无代码完成码垛、喷涂、装配等复杂任务。

生成式AI的想象力正在徐徐展开。物理世界的大部分事物都会具备AI能力，形成下一代的全新产品，并与云端AI驱动的数字世界连接产生协同效应。

02 生成式AI的机会在改变物理世界

2008年，移动互联网诞生，2012年获得全行业共识，这中间走过了五年。ChatGPT引发的生成式AI创业热潮，几乎是从第一天诞生起就达到了全球性共识，全球科技巨头都在不计成本火速投入。

一大原因在于，移动互联网只做到了物理世界的联网，但生成式AI可以真正改造物理世界。吴泳铭在云栖大会上指出，“我们不能只停在移动互联网的视角看未来。生成式AI最大的想象力，绝不是在手机屏幕上做一两个新的超级app，而是接管数字世界，改变物理世界。”

汽车行业正在发生这样的变革。之前的自动驾驶技术，是靠人来写算法规则，几十万行代码，仍然无法穷尽所有的驾驶场景。小鹏汽车董事长、CEO何小鹏在云栖大会现场提到，自动驾驶从1925年开始研发，但接近百年时间都只能做到特定场景下使用。“一个人无法用规则去面对世界上所有的场景，即使仅仅在开车这一个专业的业务。”

采用“端到端”的大模型技术训练后，AI模型直接学习海量人类驾驶视觉数据，让汽车具备了超越大部分司机的驾驶能力。何小鹏表示：“对于最普通的用户，从现在到未来的36个月，可以让我们每一个人在每一个城市都像老司机一样开车。”

宇树科技CEO王兴兴也分享了类似的感受，他曾经非常反对做人形机器人，直到大模型的出现看到了新的可能。

过去让大模型实现跟人类一样的复杂操作基本是无解的，因为人类动作是无穷的。即使是端茶、倒水这样的简单场景，就涉及到几百种细微动作。过去都要依靠人类专家手动编程，大模型为机器人提供了一种可能性——机器人能够形成理解事物本质及其处理方法的世界模型。

人型机器人带来的好处有两方面，首先，今天生活的世界是围绕人类行为所优化的，人形可以让机器人最大程度上适应环境，其次，通用机器人在制造方面存在巨大的规模效应。只有大规模制造，从而获得成本优势，才能真正实现机器人的真正普及。

吴泳铭指出：“机器人将是下一个迎来巨变的行业。未来，所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、家庭里的宠物狗。”

在吴泳铭的畅想里，未来，工厂里会有很多机器人，在AI大模型的指挥下，生产机器人。现在每个城市家庭里有一辆车，未来每个家庭可能会有两三个机器人。

AI驱动的数字世界连接着具备AI能力的物理世界，将会大幅提升整个世界的生产力，对物理世界的运行效率产生革命性的影响。而这一切来临的快慢，取决于AI基础设施的进化速度。

03 我们仍处于AI大基建时期

历史上每一波应用的喷涌而出，前提都是基础设施的完善。4G、5G和智能手机的普及，带来了短视频呼啸而来的大爆发。公路、铁路基建，催生了中国领先全球的电商、物流业。

以互联网基建为例。截止到今年6月，中国光缆线路总长度达6712万公里，中国互联网宽带接入端口11.7亿个，我国移动电话基站总数达1188万个，5G基站总数达391.7万个。

AGI应用的繁荣，同样势必根植于一个健全的大一统的算力基建之上。从2012年的AlexNet模型到2017年的AlphaGo Zero，算力消耗足足翻了30万倍。而ChatGPT横空出世的背后是，微软Azure云上的数万张A100芯片，成本高达数亿美元。

根据OpenAI的研究报告，自2012年开始，AI训练需要的算力每隔 3-4 个月便会翻番，到 2018 年，训练所耗费的算力更是增长了大概 30 万倍，而相比之下，摩尔定律在同样的时间里只有 7 倍的增长。

当物理世界被纳入AI改造的范畴后，训练和推理所需的算力成本更会爆发式增长。

这让云计算天生地跟AIGC绑定在了一起。云计算的算力集中、灵活部署、按需付费、成本较低等特点，尽管不能解决全部问题，但几乎是算力短缺昂贵的背景下的唯一答案。无论是训练还是推理，大模型都离不开云。

吴泳铭在云栖大会上提到，在新增算力市场上，超过50%的新需求由AI驱动产生，AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年，阿里云投资新建了大量的AI算力，但还是远远不能满足客户的旺盛需求。

CPU主导的计算体系正在加速向GPU主导的计算体系转移，AI计算正在加速渗透千行百业。当前，行业前沿模型训练计算量每年增长4~5倍，中国AI算力规模2022~2027年复合增长率高达33.9%；模型参数以10倍速增长，模型数据集以50倍速增长，对存力也提出了更高需求。

为提升智驾大模型训练效率，小鹏汽车早在2022年就携手阿里云在乌兰察布建成中国最大的自动驾驶智算中心，将自动驾驶模型训练效率提升了超600倍。而近两年内，由于大模型技术快速发展，阿里云已将此智算中心的算力储备扩张超4倍至2.51Eflops，为小鹏汽车提供稳定高效的算力底座，支撑了大模型快速迭代，实现智驾“全国都好用”。

本届云栖大会上，“全球首款AI汽车”小鹏P7+也亮相了2024云栖大会。这款车搭载了业内领先的端到端大模型。过去2年，小鹏汽车与阿里云共建的AI算力规模提升超4倍。何小鹏表示，将继续深化与阿里云的AI算力合作，加速推动端到端大模型拓展自动驾驶上限，提升下限。

吴泳铭无疑清晰地看到了这一趋势。自宣布“AI驱动、公共云优先”以来，阿里云大刀阔斧地进行投入AI基础设施建设。在今年的云栖大会，他再次强调：

“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。我们的单网络集群已拓展至十万卡级别，正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面，重新打造面向未来的AI先进基础设施。”

本次云栖大会，阿里云展示了AI驱动的全系列产品家族升级。

最新上线的磐久AI服务器，支持单机16卡、显存1.5T，并提供AI算法预测GPU故障，准确率达92%；阿里云ACS首次推出GPU容器算力，通过拓扑感知调度，实现计算亲和度和性能的提升；为AI设计的高性能网络架构HPN7.0，可稳定连接超过10万个GPU ，模型端到端训练性能提升10%以上；阿里云CPFS文件存储，数据吞吐20TB/s，为AI智算提供指数级扩展存储能力；人工智能平台PAI，已实现万卡级别的训练推理一体化弹性调度，AI算力有效利用率超90%。

同时，阿里云宣布通义千问三款主力模型再次大幅降价，最高降幅85%，百万tokens价格低至0.3元。过去半年，阿里云百炼平台持续降低大模型调用的门槛，进一步推动大模型的普惠。

模型成本与整个社会的创新之间是一个结构明确的跷跷板。伴随AI基础设施成本下降一同发生的，则是跷跷板另一端创新的喷涌而出。