重磅消息！这家公司要颠覆英伟达，AI算力格局彻底变天？

风风顺

2026-02-23 14:38 ·重庆

一个消息让我彻夜难眠，不是英伟达又发布了什么超级芯片，而是一家叫Taalas的新公司，干了一件看似“疯狂”却可能颠覆整个AI硬件格局的大事：

它直接把Llama 3.1这样的大模型，“烧”进了芯片里。什么意思？传统GPU跑AI，就像CPU从硬盘里不断调取数据，速度再快也受限于“内存墙”。

而Taalas的做法，相当于把模型变成了芯片本身的一部分——内存带宽限制？直接物理消灭！结果就是一组让整个行业窒息的数据：

在这块专用芯片上，Llama 3.1的推理速度达到 17,000 token/秒

对比之下：英伟达最强H200只有 230 token/秒

英伟达最新超级芯片B200，也仅 2,000 token/秒

这不是领先，这是降维打击。

一、首先三个“恐怖”的优势

我仔细研究了它的技术路径，发现这三个指标足以让亚马逊、谷歌、微软这些算力消耗大户心动到失眠：

1. 快：比英伟达最牛芯片快50倍

50倍是什么概念？

当你还在用ChatGPT逐字输出时，Taalas已经给你吐完了一整篇文章。有人实测了他们的demo网站chatjimmy.ai，反馈就一个字：“瞬”。

2. 便宜：成本只有英伟达的二十分之一

当算力成本下降两个数量级，现在的所有AI商业模式都可以重做一遍。

3. 省电：风冷搞定，水冷再见

功耗低到用风扇就能压住，数据中心运营商看了要流泪——电费账单直接膝盖斩。

致命的“缺点”，在某些领域却是“神技”。当然，这种路线有一个巨大 trade-off：每次升级都得换硬件。

打个比方：GPU就像任天堂Switch，想玩《塞尔达》插卡，想玩《马里奥》换卡。

Taalas相当于直接把《塞尔达》烧死在主板上。想玩《马里奥》？对不起，整台机器扔掉，买一台出厂就烧好《马里奥》的新机。

对于消费电子，这简直是噩梦。但对于某些场景，这个“缺点”反而是最大的护城河：

军事：硬件级的绝对安全

军事装备需要的就是固化、无法被篡改的功能。

芯片为特定作战模型定制，等于变成了一个硬件黑盒——外部无法写入、无法注入病毒。在现代网络战中，这比任何软件加密都安全。

自动驾驶：看见就是反应

现在的自动驾驶从感知到决策，再快也有几百毫秒延迟。

而Taalas这种速度，基本是摄像头看见的瞬间，刹车已经下去。这种“膝盖反射”式的响应，可能正是L4/L5规模化落地的最后一块拼图。

机器人：延迟消失，行为可控

机器狗在战场上最大的问题就是反应慢。

而当AI推理速度快到超越人类神经传导（很快将突破22,000 tokens/s），延迟概念将彻底消失。

更重要的是：只跑一个模型，功能焊死，行为100%可预测。这对工业机器人和自主武器系统来说，是真正的刚需。

成本：机器人终于不用背服务器了

当芯片功耗低一个数量级、成本只有二十分之一，机器人就不用再驮着昂贵的服务器满街跑。

当芯片便宜到能当消耗品用，机器人才能像手机一样遍地开花。

二、投资逻辑推演：谁受益？谁焦虑？

英伟达的战略部门一定在失眠。

因为Taalas证明了一件事：如果愿意放弃通用性，能把成本和功耗打到这种地步。

而云巨头每天跑的推理任务，恰恰是高度重复、高度专用的。

对算力产业链的影响：

1. 算力层：ASIC路线再次证明价值。博通、Marvell这类定制芯片概念可能重估。

2. 应用层：当推理成本下降50倍，现在的AI应用毛利空间会大得惊人。SaaS+AI的逻辑彻底跑通。

3. 端侧AI：这种“模型即芯片”的思路天然适合终端。如果能把主流模型固化进手机、汽车、机器人的主控芯片里，边缘计算会真正爆发。

需要警惕的是：

这不是通用计算路线的替代，而是专用计算对通用计算的降维打击。

就像GPU当年取代CPU做渲染一样——一开始只是特定场景，最后吃掉了大半江山。

三、最后的思考

有人说，摩尔定律已死，硅芯片制程快到头了。

但Taalas告诉我们：即使没有新的制程突破，用“模型即芯片”的思路，依然可能把AI算力再往前推一大步。

现在的AI底层几乎被英伟达锁死，任何敢于挑战的玩家都值得高看一眼。

也许很快，我们会看到这样一种局面：通用训练用英伟达，专用推理用Taalas。

而当后者的生态足够大，天平就会开始倾斜。你对这种“把模型烧进芯片”的路线怎么看？

评论区聊聊。

（本文不构成投资建议，市场有风险，投资需谨慎）

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴