亚马逊把芯片藏了11年，拆开一看年入200亿|aws|nvidia|亚马逊公司|知名企业|英伟达|英特尔

「我们的芯片业务火热。」

这句话既不是出自英伟达、英特尔，也不是谷歌、微软，而是亚马逊CEO安迪·杰西最新股东信里的原话。

他还补了一句：Trainium芯片的需求正在爆发。

过去这段时间，你听到的亚马逊大概率不是这个故事。你听到的是裁员、自由现金流被AI基建吞掉、AWS增速被质疑，以及它和甲骨文一起被放进「AI包工头」那一拨。

在很多人的印象里，亚马逊根本就不是一家站在AI潮头的公司。模型这边，OpenAI有ChatGPT，Anthropic有Claude，谷歌有Gemini。如果我问你亚马逊最强的模型叫什么，很多人可能还真得先搜一下。

但在大家没怎么注意的地方，亚马逊其实已经暗度陈仓了。

这封股东信里写到，AWS的AI业务年化收入已经超过150亿美元。更关键的是，包含Graviton、Trainium和Nitro在内的自研芯片业务，年化收入已经超过200亿美元，而且还在以三位数同比增长。

安迪表示，如果把这块业务单独拆出来，像英伟达、英特尔那样直接向第三方卖芯片，它的年化规模大约可以达到500亿美元。

这个规模就不能再管它叫「内部降本工具」了，这是一块真正长出来的新业务。

更重要的是，亚马逊现在不是只做芯片。它有底层芯片，有数据中心，有AWS，有Bedrock，有Anthropic这样的深度绑定客户，也有OpenAI、苹果这些外部大客户。

虽然模型本身没那么亮眼，不过亚马逊的确是一家全栈AI公司了。

微软还在OpenAI、Copilot、Azure和Maia之间摸索主轴，但亚马逊的方向反而越来越清楚：让AI尽可能跑在AWS上，尽可能消耗AWS自己的芯片，最后把AI时代的利润率和控制权重新抓回自己手里。

所以我才觉得，芯片正在成为亚马逊的「AWS」。

就比如Anthropic，现在他们的Claude模型，全都已经在亚马逊的芯片上跑过了。为了吃定这个大客户，亚马逊还专门建了一个AI算力集群，叫Project Rainier。

这个集群是全球已知最大的非Nvidia算力集群之一，仅印第安纳州New Carlisle这一处园区，当时就已经部署了大约50万颗Trainium2芯片。到2025年底，规模扩大到100万颗。而这些芯片存在的目的就一个：跑Claude。

亚马逊都这么客气了，Anthropic自然也得礼尚往来，后者直接参与了亚马逊Trainium3芯片的设计工作。

以前都是芯片公司有什么芯片，AI公司才能训练怎样的模型。现在反过来了，AI公司开始教云厂商怎么造芯片。

问题也随之而来。亚马逊为啥非要自己造芯片？它真的是为了挑战英伟达，还是只是想把AWS的利润率再抬高一点？

归根结底，亚马逊造芯片这件事，表面看是个硬件故事，但你只要往深处看，就会发现还是亚马逊那套平台逻辑：把别人的增长，变成自己的基础设施收入。

Annapurna Labs成立于2011年，长期处于隐身模式。这家公司由三位工程师创立，采用了一种很叛逆的设计理念：从云计算、数据流量、实际需求倒推回去，再设计芯片。这种反向思维方法，恰好与亚马逊的工作方式完全契合。

2015年初，亚马逊以3.5亿美元收购这家以色列芯片创业公司。没有新闻发布会，财报里只有一条简短声明。当时所有人都觉得，这只是亚马逊众多投资中不起眼的一笔。

收购完成后，亚马逊并没有急于推出产品。Annapurna Labs的团队先是参与了AWS相关项目，后来开始给Nitro System的底层做硬件设计。

Nitro System是AWS的一套云基础设施底层架构，把原来由服务器主CPU和传统虚拟化软件负责的很多事情，拆出来交给专门的硬件去做。Annapurna Labs就是负责来设计这个硬件。

有一说一，这只是小打小闹，或者你可以直接理解为Annapurna Labs在融入亚马逊这个大家庭之前的一次团建。真正的故事要从2018年开始讲起。

3年之后，AWS推出了Inferentia，这是一款专门用于推理的机器学习芯片。亚马逊认为，与训练相比，推理任务对芯片的要求略低，更容易切入。这属于人之常情，很多国内做AI芯片的厂商也秉持着相同的想法。

2019年，搭载Inferentia芯片的Inf1实例正式上线。

这玩意到底性能如何呢？亚马逊之前有一套搭载英伟达T4 GPU的云服务器，主打图形渲染、视频处理和机器学习推理。Inf1比G4多了最高3倍的吞吐，每次推理成本最多低40%。

但是，Inf1在市场上却没什么声量。原因在于它是专门为推理场景做了优化，特别适合用来做推荐系统、图像识别、语音识别、NLP推理这些。可问题就在于，亚马逊的整个芯片生态刚起步，你想用Inf1，就必须得用亚马逊自己的AWS Neuron SDK。

这个SDK的框架虽然支持TensorFlow/PyTorch/MXNet，但兼容性和成熟度远不如英伟达的CUDA。并且早期编译器限制很多，比如控制流、模型大小、BERT序列长度等都有约束。

所以Inf1更像是个概念产品，只是给市场打了个样，亚马逊自己也深知这一点。

不过Inf1的表现还是超出了亚马逊的预期，于是接下来，亚马逊开始高歌猛进。

2021年，AWS正式发布了首款面向客户用于训练AI模型的芯片Trainium。训练芯片的技术难度远高于推理芯片，第一代Trainium基于7纳米工艺，拥有约550亿个晶体管，于2022年开始为EC2 Trn1实例提供算力。

亚马逊表示，在特定工作负载下，Trainium的每token成本比A100集群低54%。对于GPT类模型，Trainium的吞吐量与A100相当，但成本只有一半左右。

2023年底，亚马逊在re:Invent大会上发布了第二代Trainium2芯片。这款芯片采用5纳米工艺，计算核心数量是第一代的4倍，训练速度提升4倍，内存容量显著增加。

Trainium2针对生成式AI训练做了专门优化，支持结构化稀疏性，能够更高效地处理大语言模型的训练任务。且相较于基于H200/H100的同类云配置，价格性能可再提升30%到40%。

2024年12月，亚马逊在re:Invent大会上首次公布了新一代Trainium3芯片。这是AWS首款采用3纳米工艺的AI芯片。

到2025年底，Trainium3被正式集成到Trn3 UltraServer中，每台服务器搭载144颗芯片，提供362 petaflops的总算力。这些服务器采用液冷技术，能效比前代提升约4倍。

AWS表示在部分训练和推理场景下，客户可将成本进一步压低至英伟达GPU方案的一半左右。

从2015年到2026年，亚马逊在芯片业务上的投入是渐进式的，因此越后面投入越大。

2025年，亚马逊的资本支出达到约1250亿美元，其中绝大部分流向AI所需的数据中心、电力和芯片。2026年，这个数字预计将达到2000亿美元，比分析师预期高出近40%，也超过了谷歌宣布的1850亿美元上限。

前文提到亚马逊芯片业务的年化营收已超过200亿美元，这个数字包括Graviton处理器、Trainium训练芯片和Nitro网络芯片的总收入。

这封信还透露，如果芯片业务作为独立公司运营，像英伟达或英特尔那样直接向第三方销售芯片，年化营收规模可达500亿美元。

Graviton本质上就是Annapurna Labs开发的一款Arm服务器CPU，用来替代英特尔和AMD那类传统x86处理器，负责跑Web服务、数据库、容器和各种企业应用。

你可能要问了，那为啥要有这玩意呢？我用英特尔的CPU不行吗？

AWS上有大量的工作负载，其实根本不需要GPU，也不需要什么AI芯片，这些东西吃的就是最普通、最稳定、最长期的服务器CPU算力。对这些常见的工作负载来说，Graviton更便宜、更省电，还更容易推广。

目前，亚马逊的芯片主要通过AWS以租用形式提供给客户，而不是直接销售硬件。客户购买的是EC2实例的计算能力，背后可能是Graviton、Trainium或Inferentia芯片。这种商业模式与传统芯片厂商完全不同，倒是和网上一些租显卡的个体户很像。

从后来的结果看，Graviton也确实成了亚马逊自研芯片里最早跑通商业闭环的产品。它不像Trainium那样需要客户重写大量训练流程，也不像Inferentia那样强依赖特定推理场景。

在AWS弹性计算产品的1000个最大客户中，超过90%正在使用Graviton芯片。AWS还披露，有超过5万名客户在使用Graviton。知名企业如苹果、SAP、Pinterest、Datadog都是Graviton的用户。

所谓一分钱难倒英雄汉，很多公司迁移到Graviton，就是因为它便宜、稳定，而且迁移成本低。

Graviton先帮亚马逊证明了一件事：只要价格便宜，客户并不介意自己用的是什么芯片。而这件事一旦被证明，Trainium和Inferentia后面的故事才真正有了继续讲下去的底气。

亚马逊把芯片藏了11年，拆开一看年入200亿

热搜

热门跟贴

热搜

热门跟贴

相关推荐

被美卡脖子八年，中国“芯”反暴增72.6%！竟是这两市场疯狂扫货

真被马斯克说中，全球争抢的不是芯片，而是中国20万一台的变压器

芯片大消息！马斯克要建芯片厂：史上规模最大，年生产超过1台瓦

马斯克突然明白：美国还在死磕芯片，中国却早就换了赛道！

全球仅3家能造的芯片，中国1家企业，拿下全球50%市场？

Intel把12核CPU藏了3年，用户用AI破解BIOS后终于开

微软把1TB盘藏了15%空间，用户骂了10年才发现真相

Anthropic年入300亿反超OpenAI，但最可怕的不是收入

英特尔具身智能机器人，竟解锁了rap技能

微软变革人力资源部，HR的天变了？

不只是卖服务器，中兴通讯想做AI时代的基础设施商

二元成功率已经过时！PRM-as-a-Judge是你需要的具身操作评测框架

斯坦福大学重磅发布2026年AI指数报告：AI仍在狂奔；中美差距消失；虚拟细胞成新前沿

头号玩家照进现实！NTU发布世界模型交互新范式，攻克主动操作难题

对话黑芝麻智能杨宇欣：汽车下一站是具身智能，芯片供应商将留在牌桌

猛砸270亿元，日本全力押注一家芯片公司，要做2nm直追台积电

全球AI芯片被一家味精厂卡脖子？份额超95%，英伟达也得排队抢产能

OpenAI内部信“摊牌”：微软联盟已成枷锁

车企造芯下半场：蔚来要把芯片做成一门生意

当千亿参数撞上5毫米芯片