前言

小策最近刷到很多半导体行业的朋友在吐槽,说一夜之间行业像是被泼了冷水。当地时间3月24日,谷歌研究院推出一款叫TurboQuant的压缩算法。

消息一出,全球存储芯片板块集体大跌,不少人慌了神,纷纷问AI硬件是不是要凉了,内存真的会被革命吗?

打开网易新闻 查看精彩图片

算法解析

要搞明白这次半导体大跌的来龙去脉,首先得弄清楚,谷歌这款新算法到底做了什么。很多朋友可能听过“AI记忆缓存”这个说法,小策先跟大家通俗解释下,咱们平时跟AI聊天,它能记住咱们之前说的话,靠的就是这个缓存。

以前这个“工作台”空间有限,就像一张小小的办公桌,堆满了草稿纸,一旦纸放满了,AI就记不住更多内容,没法跟咱们聊太长的天。

打开网易新闻 查看精彩图片

这也是之前很多AI聊久了就“断片”的原因,核心就是这个缓存不够用,占用的内存太多,限制了AI的长文本对话能力。

而谷歌这次推出的TurboQuant算法,就相当于给这张“办公桌”做了一次智能整理,用了一种特别聪明的压缩方法,能把原本占地方的缓存空间大幅缩小。

打开网易新闻 查看精彩图片

根据谷歌官方公布的信息,这款算法能在不影响使用效果、不损失准确性的前提下,把AI缓存的内存占用压缩到原来的六分之一,推理速度最多能提升8倍。

可能有人会问,这么厉害的压缩,会不会影响AI的反应和回答质量?其实不会,谷歌用了两种关键方法,先通过一种极坐标变换技术捕捉AI对话的核心内容,完成主体压缩,再用一种技术,消除压缩带来的微小偏差,解决了以前压缩算法会额外占用内存的问题。

打开网易新闻 查看精彩图片

而且在实际测试中,这款算法在NVIDIAH100高端显卡上,4比特版本的注意力对数计算速度比没压缩的32位版本快了8倍,不管是开源的AI模型,还是咱们平时用的对话模型,都能适配,也不用额外训练就能直接用。

这里小策必须跟大家澄清一个关键问题,很多人以为这款算法会取代芯片、内存,其实完全不是这么回事。它只优化了AI聊天时的“临时工作台”,也就是推理环节的键值缓存,跟AI训练时需要的算力没关系,更不涉及现在行业里特别紧缺的高端内存。

打开网易新闻 查看精彩图片

举个大家都能懂的例子,这就像家里的冰箱保鲜技术变好了,剩菜能放更久,你可能会少买两个保鲜盒,但绝对不会因为保鲜技术好,就不买冰箱、不买食材。

AI的缓存压缩也是一样,它只是优化了内存的使用效率,不会减少对芯片、高端内存的需求,更谈不上颠覆整个半导体行业。

打开网易新闻 查看精彩图片

市场迷思

既然这款算法只是优化了缓存使用,没有颠覆半导体的核心需求,那为什么全球存储芯片板块会集体大跌。

小策跟大家说句实在的,这款算法只针对AI推理环节的缓存,而半导体行业的需求,远不止AI推理这一块,还有AI训练、数据中心、消费电子等多个领域。

打开网易新闻 查看精彩图片

富国银行的分析师AndrewRocha也明确表示,市场对这件事的担忧存在过度解读,接下来市场会重新评估AI内存的需求,这款算法只针对推理环节的特定缓存,并不会导致整体内存需求下降,大家没必要过度恐慌。

说到底,这次的恐慌更像是一场“乌龙”,很多人没搞懂算法的具体作用,就跟风看空半导体,导致板块短期大跌,并没有实际的行业逻辑支撑。

打开网易新闻 查看精彩图片

真相拆解

在市场一片恐慌的时候,摩根士丹利等多家权威机构第一时间站出来表态,明确说市场的反应过度了,大家完全没必要担心这款算法会对半导体行业造成负面影响。

这些机构表示,谷歌的TurboQuant算法,对比的是以前老旧的32位模型,而现在整个行业早就已经普遍采用4位量化压缩技术了,所以这款算法的实际性能提升,并没有宣传的那么夸张。

打开网易新闻 查看精彩图片

而且更关键的是,这款算法不影响高端内存的需求,也不涉及AI训练环节的算力,根本不会减少半导体的核心需求。

小策在这里跟大家分享一个很实用的规律,叫杰文斯悖论,简单来说就是,技术越高效,用的人就会越多,总的消耗反而会变大。

打开网易新闻 查看精彩图片

举个例子,以前燃油车的油耗很高,大家开车会很节省,后来省油的技术出来了,大家反而更愿意开车,总的耗油量反而增加了。

放在AI和半导体行业也是一样的道理,这款算法把内存的使用成本降低了6倍,以前因为内存太贵、成本太高,没法落地的一些应用,比如超长文本对话、手机本地AI模型、复杂的AI代理等,现在都能顺利落地了。

打开网易新闻 查看精彩图片

这些应用落地之后,会带动更多的AI需求,而AI需求增加,必然会需要更多的芯片和内存,反而会推动半导体行业的发展。

Cloudflare的CEO,把这次谷歌发布TurboQuant算法,称为“谷歌的DeepSeek时刻”。他表示,之前DeepSeek发布的时候,市场也出现过一次恐慌,大家都担心会影响半导体需求,结果后来AI应用爆发,反而推高了硬件需求,这次也一样,算法的突破只会带动行业发展,不会造成冲击。

打开网易新闻 查看精彩图片

摩根士丹利还重申了对美光、闪迪等企业的“增持”评级,认为这款算法会重新调整AI部署的成本,长期来看,对半导体硬件的影响是中性偏正面的,不会出现需求大幅下降的情况。

还有一个行业规律能佐证这一点,就是内存帕金森定律,简单说就是,算法节省下来的内存,不会被闲置,反而会被更长的对话、更复杂的AI推理需求消耗掉。

打开网易新闻 查看精彩图片

比如以前AI只能记住1000句话,现在能记住6000句话,大家就会用AI做更多的事情,需要的内存反而会更多,半导体的需求自然也会跟着增加。

所以小策觉得,这次的算法突破,根本不是半导体行业的危机,反而可能是一个机遇。它降低了AI应用的落地门槛,能带动更多的AI场景落地。

打开网易新闻 查看精彩图片

而这些场景最终都会转化为对半导体的需求,推动整个行业长期发展。那些因为恐慌而抛售股票的投资者,很可能是错过了一个长期布局的机会。

可能还有朋友会问,那半导体行业真正的风险是什么?小策觉得,不是技术太强导致需求减少,而是技术太弱,没法打开更多的AI应用场景。

打开网易新闻 查看精彩图片

如果AI技术一直没有突破,很多应用没法落地,半导体的需求才会真正受到影响,这才是大家需要担心的问题。

结尾

总结一下,这次全球存储芯片板块的短期大跌,其实就是市场对谷歌TurboQuant算法的误读,加上短期的情绪宣泄,并不是整个半导体行业的逻辑发生了逆转。

打开网易新闻 查看精彩图片

小策认为,这款算法不仅不是半导体行业的利空,反而能通过降低AI部署门槛,带动更多应用落地,为行业长期发展铺路。