作者 |肖恩

编辑 |德新

打开网易新闻 查看精彩图片

xAI的启发

打开网易新闻 查看精彩图片

做 AI 到底要花多少钱?

OpenAI 2025 年现金消耗约 80 亿美元,服务器租赁成本超过 140 亿。Anthropic 刚和微软、英伟达签下 300 亿美元的算力采购协议。Google 每年投给 DeepMind 的预算也在 30 亿美元以上,这还不含内部云资源。

这些数字已经够夸张了。但放到 xAI 面前,仍然显得保守。

xAI 每个月烧掉 10 亿美元。2025 年前九个月,现金支出 78 亿;全年预计亏损 130 亿,收入只有 10 亿。

更值得关注的不是财务报表,而是它的做法。

2024 年夏天,xAI 从海外买下一座停运发电厂,拆成 35 台燃气轮机运到孟菲斯。原因很简单:等不及电网审批,先自己发电。122 天后,第一期集群上线,10 万张 GPU;一年后扩到 55 万张。

电不够怎么办?和 SpaceX 合并,把数据中心往太空推,直接吃太阳能。

这已经不是典型软件公司的打法,而是重工业逻辑。

模型优势会被追平,基础设施差距往往不会。xAI 正把 AI 竞争拉进另一个维度。

打开网易新闻 查看精彩图片

为「理解宇宙」而生

打开网易新闻 查看精彩图片

xAI 的起点,在 2018 年马斯克退出 OpenAI 董事会的那一刻。

2015 年,他和 Sam Altman 在硅谷的 Rosewood 酒店见面,决定一起建一个非营利的 AI 实验室。目标是通用人工智能,但要安全、开源、不被任何公司垄断。马斯克不仅出了钱,还亲自挖人——Ilya Sutskever 就是他从 Google 拉来的。

三年后,分歧浮出水面,马斯克退出了 OpenAI 董事会。官方说法是「避免和特斯拉的利益冲突」。

真实原因没那么简单。据多方报道,马斯克当时认为 OpenAI 已经「致命地落后于 Google」,提出由他接管公司、亲自掌舵。Sam Altman 和其他创始人拒绝了。马斯克转身离开,还撤回了一笔计划中的大额捐款。

之后几年,OpenAI 转型成了营利公司,和微软深度绑定,GPT-4 闭源。马斯克的批评越来越激烈:这完全背离了当初的使命。2024 年,他直接把 OpenAI 告上法庭。

但在那之前,他已经决定自己干了。

2023 年 4 月,马斯克在 Tucker Carlson 的节目上第一次提出「TruthGPT」的概念:

「我要做一个最大限度追求真理的 AI,目标是理解宇宙的本质。这可能是通往安全的最佳路径——一个试图理解宇宙的 AI,不太可能毁灭人类,因为人类是宇宙中有趣的一部分。」

三个月后,xAI 正式亮相。

2023 年 7 月 12 日,马斯克发了一条推:「宣布成立 @xAI,目标是理解现实。」

日期是故意选的。7 + 12 + 23 = 42——《银河系漫游指南》里「生命、宇宙和一切的终极答案」。这是马斯克最喜欢的科幻小说之一。这种极客式的彩蛋贯穿 xAI 的基因。他们的 AI 叫 Grok,名字来自科幻小说《异乡异客》,意思是「深刻地、直觉地理解某事」。Logo 是一个风格化的「G」,看起来像一只眼睛——或者像宇宙中的奇点。

创始团队只有 12 个人,但来头都不小,几乎每个人都从 Google、DeepMind 或 OpenAI 出来。马斯克的招聘方式也很硬核:不用猎头,技术人员直接看代码和能力。他在 X 上发招聘帖:「加入 xAI,如果你相信我们的使命——理解宇宙,这需要最大限度地追求真理,不管它是否流行,是否政治正确。」

这句话定义了 xAI 的气质。它不是要做一个更好的聊天机器人,不是要和 ChatGPT 抢市场。它的野心是理解物理世界的运行规律。

听起来像哲学口号,但马斯克的公司在做的事——让汽车自己开、让机器人干活、让火箭可回收——都需要这种能力。

xAI 成立九个月后,发布了第一个模型。

2024 年 8 月,Grok-2 上线,补齐视觉和图像生成;2025 年 2 月,Grok-3 发布。Grok-3 的训练规模约 20 万张 GPU,算力约为 Grok-2 的 10 倍,参数 1.7 万亿,上下文窗口 100 万 token。发布当天在 Chatbot Arena 拿到 1402 分,成为首个跨过 1400 Elo 的模型。

它更关键的变化不是跑分,而是训练范式。xAI 在预训练阶段大规模引入强化学习,让模型具备回溯和纠错能力。这套方法让 Grok-3 在数学和物理推理上拉开了差距。

2025 年 7 月,Grok-4 发布,原生多模态,覆盖文本、图像和语音。AIME 2025 上,Grok-4 Heavy 拿到 100%。训练成本估算约 5 亿美元,用电规模接近一个 4000 人小镇的全年水平。

马斯克给 Grok-4 的定位是:“像物理学家一样从第一性原理思考。”

2026 年 2 月,Grok Imagine 1.0 发布。它能把静态图转成 6 - 15 秒的视频,也能文生 10 秒 720p 视频,并同步音效和对话。上线 30 天,用户生成视频 12.45 亿条。

和 Sora 相比,Grok Imagine 更强调场景物理一致性,不只做像素预测。这条路线和 xAI 的母命题是一致的:理解规律,而不只是复现表象。

Grok 的意义也在这里。它不只是榜单分数,而是能力是否能落到系统里。

打开网易新闻 查看精彩图片

从模型到系统——xAI 的能力边界

打开网易新闻 查看精彩图片

xAI 现在早就不止是一个聊天模型,能力边界已经在往真实世界扩展。

先看模型层。

Grok 的核心优势是实时性。它直接接入 X(Twitter)的数据流,能看到全球用户正在发的每一条推文。2025 年 2 月,xAI 推出了 DeepSearch 功能:每次查询最多触发 10 轮检索,从几十个网页和 X 帖子中提取信息,然后综合成答案。

这与传统大模型形成明显差异。依赖静态训练语料的模型存在知识截止点,而 Grok 的优势在于“时间维度”。很多场景里,差异不在“会不会答”,而在“答得是否及时”。品牌公关、金融交易、选举追踪都吃这一点。

再看物理载体。

2025 年 7 月 12 日,Grok 正式上车。特斯拉软件版本 2025.26 开始推送,Model 3、Model Y、Model S、Model X 和 Cybertruck 都能用。

这是大模型第一次真正进入量产汽车的座舱。

在车内,Grok 的意义并不只是“更聪明的语音助手”。传统语音助手基于预设指令匹配,而 Grok 属于生成式 AI,它理解语义、生成回应,并能够在对话中保持上下文。

你可以和它连续交流,追问细节,模糊表达也能得到回应。这种交互方式,本质上改变了车内的人机协作逻辑。

这样说你可能没有直观的感受,如果看过我们在美国实测 Grok 的视频,就能理解它到底有多强。

目前 Grok 还不能直接控制车辆。它的定位是「对话伙伴」,还不是「车辆控制助手」。

但这条边界在移动。

马斯克已经确认,Grok 会成为 Optimus 机器人的「声音和大脑」——Optimus 负责移动和操作,Grok 负责理解环境和响应指令。2025 年 9 月,Optimus V2 已经集成了 Grok 语音 AI。

未来你和 Optimus 交流,不需要专门的 App 或者预设指令,直接说话就行。

FSD 未来也会接入 Grok。特斯拉的自动驾驶系统需要理解复杂的交通场景:前车在减速,可能要右转;右边有行人在犹豫要不要过马路;施工路段需要临时改道。这些判断需要对物理世界的因果推理能力——正是 Grok-4 在训练的方向。

马斯克说,未来 FSD 在遇到复杂场景时,可能会「询问」Grok 来辅助决策。

当 xAI进入车端、机器人,甚至未来更复杂的物理系统后,它就不再只是信息生成工具,而是马斯克整个体系的“智能中枢”。

打开网易新闻 查看精彩图片

AI 竞争的尽头:能源竞争

打开网易新闻 查看精彩图片

xAI 能力跳升,背后是能源和基础设施的硬堆栈。

回到 xAI 建发电厂的故事。

为什么要自己发电?因为训练大模型需要的电力已经超出了正常基础设施的供给能力。

2024 年 7 月,xAI 在孟菲斯启动 Colossus 超算中心的建设。传统数据中心需要 2 - 3 年,xAI 的目标是几个月。

他们的做法是:边建边装,设备到了就往里塞,电力不够就自己发。从海外买了一座停运的发电厂,拆成 35 台燃气轮机运到美国,420 兆瓦。电网不够用,就用特斯拉 Megapack 储能削峰填谷。

122 天后,第一期上线:10 万张 H100 GPU。这个速度打破了所有行业记录。

2025 年 6 月,扩张到 20 万张 GPU:15 万张 H100,5 万张 H200,还有 3 万张 GB200。92 天翻一倍。

2026 年 1 月,55.5 万张 GPU。投资 180 亿美元。全球最大的单体 AI 训练集群,没有之一。Meta 最大的集群大约 5 万张 H100,Colossus 是它的 11 倍。

功耗呢?目前大约 300 兆瓦,目标是 2 吉瓦——相当于两座核电站。为了给冷却塔供水,孟菲斯电力公司(MLGW)专门在建一座灰水处理厂,预计日用水量超过 500 万加仑。

环保组织曾指控 xAI「没有拿到排放许可就开始运营」。马斯克的回应是:继续扩张。目标是 100 万张 GPU,2026 年底。

这是一种什么心态?

传统公司的逻辑是:先拿许可,再建设施,按部就班。xAI 的逻辑是:速度就是一切,流程是障碍,绕过它。

但地球上的电力快撑不住了。所以马斯克的下一步是太空。

2026 年 2 月 SpaceX 收购 xAI 之后,计划浮出水面:在轨道上建数据中心。

SpaceX 已经向 FCC 提交申请,计划发射 100 万颗卫星,部署在 500-2000 公里的轨道上。这些卫星不只是通信节点,而是分布式计算节点。太阳能在轨道上 24 小时可用,没有云层遮挡,发电效率是地面的数倍。散热靠辐射——太空本身就是 3 开尔文的冷源。

如果能做到年发射 100 万吨卫星,按每吨 100 千瓦算力计算,每年能给全球 AI 算力增加 100 吉瓦。

马斯克把这叫「迈向卡尔达肖夫 II 型文明的第一步」——利用恒星的全部能量。

当然,太空数据中心的工程难度极高。

宇宙辐射会破坏芯片,导致数据错误和硬件退化。散热只能靠辐射,每千瓦需要 2-4 平方米的散热器面积,结构成本很高。如果真的发射 100 万颗卫星,凯斯勒效应的风险会急剧上升——太空垃圾连锁碰撞,可能让整个轨道带变得不可用。

目前在轨卫星总数约 1.18 万颗,其中 7000 多颗是 Starlink。再加 100 万颗?不敢想象要怎么管理。

但这不是重点。

重点是马斯克在用一种「先开枪再瞄准」的方式重新定义竞争规则。当其他公司还在算 ROI 的时候,他已经把基础设施的门槛拉到了一个荒谬的高度。

打开网易新闻 查看精彩图片

对中国公司的关键一课

打开网易新闻 查看精彩图片

xAI 的故事,对中国汽车和机器人公司最大的启发,不是“复制马斯克”,而是看清下一阶段真正比什么。

第一,AI 大模型是核心,不是配件。

看看马斯克在做什么。Tesla 的逻辑是「AI 系统 + 汽车作为载体」,Optimus 的逻辑是「AI 大脑 + 机器人作为躯体」。Grok 不是单一产品,而是一层能复用到多个终端的底层能力。

这个趋势在中国也能看到。

2026 年 1 月,理想汽车做了一次关键的组织架构调整:研发体系重组为三个团队——基座模型、软件本体、硬件本体,并正式启动人形机器人业务。

李想在全员会上说得很直接:「2026 年是所有想成为 AI 头部公司上车的最后一年。最晚 2028 年,L4 一定能落地。全球能同时布局基座模型、芯片、操作系统、具身智能的公司不会超过三家,理想要成为其中一家。」

AI 大模型的重要性被提到了新的高度。

同一时期,千里科技也在今年开启了自己的 AI 战略,和阶跃星辰合作,用大模型赋能智能驾驶和座舱,完成“AI + 车”的战略版图。

谁掌握了大模型,谁就掌握了两个市场的入口。

第二,算力基建是硬仗,能源是胜负手。

为了建成 10 万张 GPU 的集群,xAI 自己买发电厂,自己装电池,边建边干,最后仅用时 122 天。

这个做法指向了一个核心问题:算力竞争最终是能源竞争,而基建则是这场竞争的胜负手。

这方面中国有自己独特的优势,西部有丰富的风电、光伏和水电资源,自然冷却条件好,电价低。早在几年前政府就提出了「东数西算」的思路,把算力搬到能源富集的地方,而不是把能源送到算力中心。

但执行层面还有很多问题。电力和算力的协同调度能力够不够?跨省电力输送的损耗怎么解决?数据中心的审批流程能不能加速?

但是时间不等人,谁能更快、更便宜地把电变成算力,谁就占据先机。

第三,垂直整合是终局。

xAI 的护城河不只是模型,而是「数据 + 算力 + 能源 + 载体」的闭环。

X 提供实时数据,Tesla 提供车端和机器人场景,Megapack 提供能源缓冲,SpaceX 提供未来算力外延。xAI 在中间做模型、推理和调度,把四条线拧成一条系统能力曲线。

它最难复制的,不是某个模型更强,而是“模型-数据-算力-能源-场景”被放进了同一个闭环。中国企业要学的,不是照抄马斯克,而是把这个闭环拆开补齐。短期内不可能拥有 X、Tesla、SpaceX 的全套资源,但可以先把关键齿轮咬合起来。

首先是组织重构。模型、智驾、座舱、机器人不能继续各自为战。理想把基座模型单列出来,本质是把 AI 从“功能部门”升级为“公司底座”。谁统一模型路线、谁管理数据标准、谁调度算力资源,必须有明确的一号位。

其次是做真正的数据闭环。很多公司数据并不少,缺的是高价值数据的回流效率。线上问题能否快速完成采样、标注、训练、验证和部署,决定了模型是“持续进化的产品”,还是“停在演示里的能力”。

最后是把算力和能源放在同一张战略表。算力采购只是起点,训练上限最终由电力接入、储能、冷却和运维稳定性决定。

未必需要照搬 xAI 的激进做法,但必须承认:后半场的 AI 竞争,本质上是能源系统能力竞争。

“垂直整合是终局”并不等于都要变成马斯克帝国。它真正的含义是:企业必须对关键链路拥有足够控制力。即便不做全栈自研,也要在基座模型、数据闭环、算力调度上建立主导权。

这条路并不轻松。组织重构、数据闭环、算力与能源协同,任何一环都需要高投入和长期执行。但中国企业也有自己的优势:完整制造业体系、丰富应用场景、以及持续推进的算力与能源基础设施。

xAI 领先的是起跑身位,不是终局结果。最后谁能胜出,现在还远没有定论。

打开网易新闻 查看精彩图片

结语

xAI 的冲击不在于“又发了一个模型”,而在于它把 AI 竞争从软件竞赛拉进了重工业竞赛。

在这个维度里,参数能追平,功能能复制,人才会流动;但系统能力很难速成。组织怎么协同,数据怎么闭环,电力怎么保障,算力怎么调度,场景怎么反哺模型,都要靠时间和纪律。

对中国车企来说,问题已经不是“要不要接入大模型”,而是“要不要把自己重构成一家 AI 基础设施公司”。

谁更早完成这次重构,谁就更有机会在下一轮汽车与机器人融合竞争里拿到先手。