市场的一系列变化,让阿里云管理层下决心把Token作为下一个增长曲线,整个公司再次进入“创业状态”
文|吴俊宇
编辑|谢丽容
阿里云正在迎来一场激进的转型。这家公司正在进入新一轮的创业状态。
今年四月,在阿里云一场内部全员会中,阿里集团CEO(首席执行官)吴泳铭提到,阿里云要比创业公司更激进去做转型。阿里云今年的任务,是要为Agent(智能体)重构基础设施,做到最好的AI训练工厂和AI推理工厂。
我们了解到,阿里管理层达成了一个重要共识:传统云计算主要服务开发者和IT工程师,这个人群不超过1000万。但Agent时代的云不仅会被更多没有代码基础的普通人使用,甚至不再只是被人类调用。云计算将面向数十亿个Agent。Agent可以24小时不间断工作,对AI和云的需求无穷无尽。
5月20日的阿里云峰会,阿里云管理层,包括公共云事业部总裁刘伟光、CTO(首席技术官)李飞飞、通义大模型事业部负责人周靖人等人轮番披露了阿里云要如何围绕“芯片-云-模型-推理”进行全栈Agent化升级。
此次,阿里同步推出了新的AI产品入口“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及新款旗舰模型Qwen3.7-Max。
与技术架构同步调整的,还有阿里云对自身的业绩增长的预期。
今年3月,2026财年三季度(2025年四季度,阿里财年为每年4月初-次年3月末)财报电话会上,吴泳铭提出,五年内阿里的“云+AI”外部收入要超过1000亿美元/年(约合6800亿元)。
截至今年2月,阿里云外部客户(剔除淘宝天猫等阿里集团内部业务)年收入超过1000亿元。按照这个基数计算,未来五年阿里云外部收入年复合增长率预计将超过40%。如果实现的话,这将回到2021年之前的高速增长期。
这一业绩增长预期的激进程度,甚至远超亚马逊AWS、微软Azure、谷歌GCP等全球主流云厂商从1000多亿元营收规模到7000多亿元营收规模时的增速(详见云+AI”营收1000亿美元,阿里能否实现?》)。
有阿里云相关人士对我们表示,这是按照尽可能高的收入目标去制定的。阿里习惯在变革的关键阶段,通过设置高目标的方式倒逼一线调整动作。
上述人士解释,“取其上者得其中,取其中者得其下”,即便最终未完全达到既定目标,高目标本身也会推动整个组织围绕新的业务方向重新配置资源、调整节奏。
2026财年(2025年4月1日-2026年3月31日),阿里云营收1581亿元,同比增长34.0%。这回到了近四年的高点。旧对手都逐渐偃旗息鼓,但阿里云面临的竞争不减——在Token市场,新的对手正在给它带来压力。
对阿里云这样一家在中国云市场连续17年保持领头羊位置的企业来说,激进转型并不容易。它不仅需要打破过去的思维惰性,还需要打破组织惯性。这在短期内会给内部带来困惑和混乱,但这是保持组织生命力的必要方式。
Token成为下一个增长曲线
半年前,阿里云内部对Token(词元)这种新的算力形式仍然存在矛盾心态(详见成为“北极星指标”,AI云市场可能忽略了什么?》)。
一方面阿里云的管理层和一线都知道Token是未来,必须用Token牵引整个产品技术的转型;另一方面Token在收入大盘中占比很低,客户对它的需求仍未真正爆发。
2026年的Agent爆发改变了这一切。传统云计算时代,云服务的主要使用对象是开发者与IT工程师。但今天,越来越多普通业务人员、没有代码基础的个人用户,甚至Agent本身,都开始成为云的直接用户。
国际市场调研机构IDC 2026年预测,全球活跃Agent数量将从2025年的2860万,增长至2030年的22.16亿。五年后,活跃Agent数量将是目前的近80倍。
中国市场的Token消耗量也在指数级增长。国家数据局3月24日显示,截至2026年3月,中国日均Token调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍。相比2025年底的100万亿,三个月时间增长超过40%。
市场的一系列变化,让阿里云管理层下决心把Token作为下一个增长曲线,整个公司再次进入“创业状态”。
今年4月初,阿里云管理层设定了一个短期Token收入增长目标。具体要求是,到5月15日前,日均Token收入较4月初要增长5倍。这意味着要在45天内完成目标。目前,这个目标已经达成(详见收入较4月初已增长五倍》)。
我们了解到,目前阿里云日均Token收入相比1月初已经增长约15倍。阿里云的月度Token收入已经达到数亿元级别。
这个激进的增长目标在4月初刚刚制定时,多位阿里云一线人士更多感受到的是压力。在他们看来,如此激进的增长目标几乎是不可能完成的。
但这个目标最终完成了。一位阿里云销售人士今年5月中旬对我们表示,他至今仍然觉得这不可思议。
事实上,这是技术剧变带来的力量。过去,AI对话工具一次对话消耗的Token数量可能只有几千。但一次Agent任务,可能就会消耗数万,甚至数十万Token。因为Agent任务执行过程中,不仅需要理解目标,还需要规划任务、调用工具、访问数据、编写代码,并根据执行结果持续调整行为。一次Agent任务,模型可能会触发数十次、数百次推理调用。
阿里云公共云事业部总裁刘伟光在演讲
“在云这个产业经营太久后,每一个人,包括我自己,都会有一些思维惯性”,刘伟光在5月20日的一场小规模沟通中对我们表示,他的想法近半年在不断发生变化。
阿里云的销售团队在云计算行业一直被竞争对手视为“铁军”,其他云厂商几乎都选择从阿里云挖角。这支团队不仅有着强悍的作战能力,还有清晰的“作战地图”——他们不仅清楚客户人群,还会根据企业客户的IT预算结构反推能够实现的销售目标。
刘伟光认为,这些都是“看得见答案”的生意。但在今天高速增长的AI云市场,“作战地图”是看不见的。“转型”这两个字说起来容易,但做起来很难。
这对阿里云的销售团队提出了更高的要求。阿里云一线销售团队过去主要接触企业IT人员,但现在需要打破自己,去接触以前没接触过的业务和团队,或者和企业一号位对话了解他们的真实业务需求。这对销售人员的知识结构和沟通方式都提出了更高的要求。
转型的时候,人容易有惰性。这甚至需要阿里云的一线架构师“挖地三尺”去了解客户的真实想法。因为,阿里云的客户人群、客户用云的方式、客户的预算结构正在发生翻天覆地的变化——这就是短短半年来正在发生的变化。
在刘伟光看来,2023年-2025年,在企业内部Token能够创造的价值有限。但是随着2025年末大模型的Coding能力(代码生成)跨越临界点,它带来了巨大的分水岭。
越来越多没有代码基础的普通人、企业内更多不懂IT的业务人员都在成为云计算的直接用户。他们使用Agent工具消耗Token时,其实就在用云。
普通用户使用Agent时,Coding无处不在。因为给Agent下达任务指令时,它会调用模型自动生成代码,进而操作电脑、编写应用。Agent在这个过程中会在云上迅速消耗Token。
各个领域都在发生这个变化。近一个月,我们利用OpenAI的Codex平台搭建了覆盖多家科技公司的财务分析Demo(原型)应用,并对企业财报PDF文档进行批量分析。
这个应用单月消耗了10亿Token。按Codex订阅价格计算,单月费用高达200美元。如果按照API(应用接口)调用价格粗略估算,Token价格高达1000美元。Codex背后的云服务提供商是亚马逊AWS和微软Azure。
随着这类Agent使用方式不断普及,AI云市场的增量空间在迅速扩大。
2025年下半年,我们多方调研了解到,当时包括互联网企业以及金融、零售、制造等领域的企业,Token支出在其IT总支出中的占比不到1%。
但2026年情况已经截然不同。刘伟光粗略估算,一些AI创业公司的Token支出可能占其IT总支出的100%。互联网公司Token支出占比普遍达到15%-20%,其他步伐相对更慢的企业则仍在5%以下。
“过去我们盘点客户IT预算时会发现,有一些预算阿里云永远吃不到,比如企业内部的软件开发和外包定制”,刘伟光解释,但随着模型Coding能力提升,企业不仅IT预算在投向AI,业务预算也在投向AI。外包开发这部分需求就很适合大模型Coding来改造。
刘伟光进一步介绍,四川、河南某些畜牧类企业也在拥抱大模型。这在过去几乎无法想象。这些企业正在了解AI、使用AI,利用大模型的Coding能力一点点改造过去的业务。
围绕Agent把阿里云改造一遍
销售层面的业绩,需要后端的模型和产品做支撑,也需要组织层面的配合。
阿里集团在今年3月进行了一次组织架构调整。3月16日,阿里成立了Alibaba Token Hub(ATH)事业群。从字面意义上理解,这是一个以Token为核心目标的组织。
其中包括五个事业部——通义大模型事业部,负责千问等基础模型的研发;MaaS(模型平台)业务线,提供模型服务平台;千问事业部,负责千问个人AI助手;悟空事业部,负责钉钉AI原生工作平台;创新事业部,探索各类AI创新应用。
ATH事业群各个事业部的组合逻辑是,创造Token、输送Token、应用Token。
一位阿里云人士对我们表示,阿里云和ATH事业群的关系更像“前店后厂”。ATH事业群在后台,持续孵化模型、推理能力与AI应用。阿里云拥有庞大的销售体系、客户体系以及贴近企业需求的产品研发组织,它负责在前台为客户提供这些模型和产品。
这种组织方式的确有一定的协调成本,甚至有时候不同团队之间都不知道对方在做同一件事,它带来了一定的内部竞争。但这种有生命力的混乱在当下转型关键期是必要的。
上述阿里云人士对我们表示,阿里过去常见组织形态,包括实体组织和虚拟组织。实体组织通常有独立编制和KPI(关键考核目标),虚拟组织往往只是为了协调。ATH事业群介乎两者之间。它既整合了模型、平台、应用的关键资源,又不完全拆散原有业务单元。
阿里云的通义实验室、百炼被纳入ATH事业群后,拥有相对独立的发展空间。它们可以根据自己的业务特点去发展。我们了解到,吴泳铭会定期和这两个业务进行复盘、对齐。
阿里目前包括多个基础模型团队——千问、万相、HappyHorse(快乐小马),这三个团队的主要研究方向分别是LLM(大语言模型)、图像和视频模型、视频生成模型。
目前AI Coding能力依旧是千问模型团队的核心突破方向。一位资深算法技术人士和一位阿里云高管同时对我们分析称,这背后的逻辑是Coding几乎可以“For Everything”,它是Agent得以运行的基础,它能够把Token和云这两件事完整结合在一起。
阿里云的企业客户使用Token时,重要入口是百炼MaaS平台。
早在2025年下半年,多位行业人士曾对我们表示,他们担忧百炼的产品能力。百炼虽然拥有较强的模型能力与底层资源,但产品形态仍然带有明显的传统云产品特征,使用方式显得更复杂。
当时,部分阿里云一线业务人士曾多次收集客户需求,并反馈给百炼团队。一位阿里云人士的看法是,ATH事业群成立之后,百炼产品迭代速度明显开始加快。它正在变得更像一个AI Native(AI原生)产品。
更重要的是,百炼平台一直在围绕工程和模型进行深度优化。它的关键目标是让芯片和阿里千问,乃至月之暗面、智谱、MiniMax等第三方模型深度融合,在更短的时间内生产出更多Token。这是真正能够体现一家云计算工程能力的关键指标。
百炼目前正在承载着阿里云更高的期待——它被认为是阿里云下一个营收和利润增长点。
今年5月,阿里管理层在2026财年电话会议中披露,包括百炼平台在内的模型和应用年度经常性收入(ARR,通常计算方式为当月收入×12)在快速增长。它在2026财年四季度收入超过80亿元,2027财年一季度有可能超过100亿元,2027财年末将超过300亿元。
支撑基础模型和MaaS推理平台的,是阿里云的基础架构——它已经历经17年,同样需要针对Agent和Token进行全面改造。
李飞飞是这个任务的核心负责人。李飞飞今年4月开始担任阿里云CTO,负责阿里云技术以及AI云基础设施建设。他2018年加入阿里,是阿里云数据库产品负责人。
李飞飞在阿里云峰会演讲中提到,传统云产品的交互逻辑是为人设计的。用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,这与传统云计算的稳态负载截然不同。
为此,阿里云正在转型成一朵AI Native(AI原生)和Agent Native(智能体原生)的云——这其中一个细节做法是,阿里云另起炉灶推出了“千问云”这个新入口。
它其实是个新的网站,将阿里云所有模型服务的核心能力封装为Skills(技能)和CLI(命令行界面)工具,可让Agent工具高效地用模型和开发AI应用。
在推出“千问云”之前,阿里云内部曾有过非常激烈的讨论。原因是,阿里云官网入口诞生已有17年,几乎所有企业开发者和企业用户都习惯在这个入口去寻找自己所需要的计算、存储、数据库、网络等传统产品。
2009年阿里云诞生时,最初依靠中小企业和开发者起家,简单易用让它聚拢了一批用户。阿里云目前超过500万客户,其中既包括大型企业客户,也包括数百万中小企业。这虽然让阿里云的产品线变得品类丰富,却也变得不容易被新一代AI原生用户使用。
如何让更多没有代码基础的普通用户,或者是新一代AI开发者开始用云?阿里云副总裁张启的看法是,一个使用门槛更低,计量、计费、控制台更简洁的AI原生产品变得重要。内部最终还是决定推出这个纯粹的For AI、For Agent入口。
一位阿里云人士今年4月对我们表示,阿里云和ATH事业群面向AI转型时几乎都采取了“AB面”的方案。
他解释,A面是公司长期存在的既有业务,B面是面向未来的探索业务。阿里云和千问云、钉钉和悟空都是类似的做法。这种做法的好处是,让B面尽量减少传统业务体系、组织惯性与既有KPI的影响,以更快的速度进行迭代。
自研芯片是激进转型的压舱石
Agent推动了Token消耗增长,但Token收入能否变成利润,取决于推理成本。推理成本的决定因素是芯片性能和芯片供给。
阿里云自研芯片要解决的问题是,如何以更低成本生产Token。
自研芯片是阿里云长期以来的压舱石,也是支撑阿里云激进转型的底气。平头哥半导体是阿里集团的全资子公司,它长期承担着帮助阿里云降低算力成本的重要任务。
阿里集团在2025年初曾制定三年3800亿元的资本支出,但根据阿里管理层的判断,阿里最终很可能会超过这一资本支出计划。自研AI芯片有助于降低阿里云的算力采购成本。
根据阿里管理层在2026财年三季度、四季度两次财报电话的说法,平头哥半导体的年营收已经达到100亿元。阿里自研AI芯片的性价比较高,未来两三年,阿里云的毛利率将因为自研AI芯片显著提高。
平头哥半导体的新一代的AI芯片真武890也在此次阿里云峰会发布。它是2024年二季度推出的AI芯片真武810E的继任版。
按照阿里云方面的说法,真武890的计算性能相比上代产品提升了三倍。真武890支持FP32到FP4(FP32、FP16、FP8、FP4都是精度浮点数格式,FP4精度更低,可让同一张芯片跑得动更大的模型,且速度更快、成本更低)等多种数据精度,可应用于高精度训练、低精度和超低精度的推理。低精度推理场景下,可以大幅降低推理算力开销。
从发布会披露的真武890的144GB显存、800GB/S卡间互联带宽来看,这两个参数明显超过英伟达的H20芯片,接近英伟达在2023年11月发布的H200芯片。不过,阿里云方面未披露真武890的计算性能。
理论上看,它的计算性能会远超英伟达H20芯片。一位地方国企智算技术人士2025年12月对我们表示,他测试了包括真武810系列等多款主流国产AI芯片的推理性能。真武810系列跑DeepSeek-R1和阿里千问等经过适配优化的模型,Token吞吐效率优于英伟达H20。
阿里甚至还公布了真武系列芯片未来三年的路线图——2026年二季度推出真武890,2027年三季度推出真武V900,2028年三季度推出真武J900。
阿里云方面披露称,截至今年5月真武系列AI芯片累计出货已达56万片。它在阿里云多个万卡集群已经部署,在智能驾驶场景部署超过13万卡,在金融场景部署超过10万卡。它还服务了包括中国电信、中国一汽、浦发银行在内的400多家企业。
国际市场调研机构IDC数据显示,2025年国产AI芯片市场,华为昇腾市场份额位居国内第一,阿里平头哥市场份额位居国内第二。
一位阿里云高管对我们表示,真武并不是像很多AI芯片仅仅只是披露高性能参数,它已经进入工程化大规模商用阶段。
阿里云在AI芯片领域的布局已经长达八年。它最早可以追溯到2018年含光800立项。我们了解到,真武810系列研发在2020年秘密启动,并于2022年底、2023年初,完成了研发和场景验证。真武810系列芯片的研发和验证几乎始终处在“只对内部开放”的状态(详见芯片PPU存在,大规模出货已有一年》)。
2025年初,真武810逐浮出水面。2025年2月初我们曾多方获悉,阿里曾与国内部分算力服务商进行合作洽谈,为真武810系列的批量上市做准备。
我们在2025年11月曾获得了一份阿里为企业客户提供的销售材料。这份材料中销售的AI Stack大模型训推软硬一体解决方案。上述地方国企智算技术人士对我们表示,阿里云方面向其销售的AI Stack大模型训推一体机就搭载了真武810系列芯片。
真武系列AI芯片的意义,并不是追赶英伟达GPU的性能参数。它让阿里云形成了类似亚马逊、谷歌的“芯片+云+模型+应用”的全栈布局。
“芯片+云+模型+应用”全栈布局并不只是一个战略口号,它的真实价值是,能让阿里云用更低成本、持续稳定生产Token。这在2026年全球算力短缺的大环境下变得尤为难得。
热门跟贴