AI从业者每天写提示词、调API,却很少有人追问:这些"智能"到底跑在什么上面?

一位工程师用交互式可视化工具,把AI系统的物理底座一层层剥开。看完你会发现,我们对"构建AI"的理解可能完全偏了。

打开网易新闻 查看精彩图片

正方:软件思维足够用

主流叙事里,AI是代码的艺术。

提示词工程、模型微调、API编排——这些构成了从业者的日常工具箱。技术社区充斥着"如何用300行代码搭建XX"的教程,仿佛算力是无限供应的水电煤。

这种视角有个隐含假设:底层硬件已经"被解决"了,工程师只需关注上层逻辑。

对很多应用层开发者来说,这确实够用。调用闭源模型的API,关注输入输出,硬件细节被彻底封装。

但当模型规模突破某个临界点,这种黑箱思维开始付出代价。

反方:硬件才是决定性战场

原作者抛出一个尖锐判断:现代AI根本不是运行在"代码"上,而是跑在一套庞大的物理硬件栈上。

这套系统从硅片一直堆到数据中心:

• 芯片层:GPU/TPU/定制ASIC的架构选择
• 互联层:机架内NVLink、机架间光纤拓扑
• 存储层:高带宽内存与分布式存储的配比
• 设施层:电力、散热、机房选址

每一层都能成为瓶颈。原作者的观察是:「这个栈不是在一个地方建成的,没有一个国家控制完整的系统。」

更反直觉的是,算力本身已不再是主要约束。真正的卡点转向了:

• 芯片间通信带宽
• 电力基础设施容量
• 先进制程的地理集中度

当训练一个模型需要调动数万千瓦电力、跨越半个地球协调供应链时,"软件工程师"这个标签显得过于单薄了。

判断:工程认知需要一次范式迁移

原作者的结论是:「我越深入AI,越觉得它不像软件工程,而像供应链管理与物流。」

这不是修辞,而是工作内容的实质变化。

软件工程的典型问题是:如何设计模块化、可测试、易维护的代码。AI系统工程的典型问题是:如何在台湾拿到足够CoWoS封装产能,如何在内华达州找到3吉瓦的清洁能源,如何设计一个数据中心让10万块GPU的故障率可控。

对从业者的直接影响:

如果你是应用层开发者,理解硬件栈能帮你做出更务实的架构决策——什么时候该用API、什么时候该考虑私有化部署、为什么某些延迟优化在物理层面不可行。

如果你是基础设施从业者,这套可视化工具揭示了一个被低估的事实:AI竞赛的护城河正在从算法向物理世界迁移。拥有芯片设计能力、能源合同、地缘谈判筹码的玩家,正在重新定义游戏规则。

原作者的系列还在持续,下一个主题可能是训练动态或推理优化。他用交互图表而非文字墙来呈现复杂系统——这个选择本身就在印证他的核心观点:看见,才能重新思考。