新 闻1: 谷歌 TurboQuant 引爆存储芯片崩盘:AI 内存占用锐降至 1/6、推理狂飙 8 倍

3 月 26 日消息,谷歌研究院昨日(3 月 25 日)发布博文,推出全新极端压缩算法 TurboQuant,有望重塑 AI 运行效率并解决大模型键值缓存(KV Cache)的内存瓶颈。

向量是 AI 模型理解和处理信息的基础,但高维向量会消耗海量内存,从而在键值缓存(KV Cache)中引发严重的性能瓶颈。

IT之家注:键值缓存是大语言模型生成文本时使用的一种高速缓存机制,通过存储历史计算结果来避免重复计算,但极易造成内存瓶颈。

传统的高维向量量化技术虽然能压缩数据,却常常因为需要为微小数据块计算和存储量化常数,引入了额外的“内存开销”。这种额外负担部分抵消了压缩原本带来的优势,导致 AI 大模型在处理长文本或大规模搜索时依然受限。

谷歌研究院为彻底解决这一难题,推出了全新压缩算法 TurboQuant。同时,研究团队还公布了支撑该算法的两项核心底层技术:量化 Johnson-Lindenstrauss(QJL)和 PolarQuant(将亮相 AISTATS 2026)。

这三项技术协同工作,为高度依赖数据压缩的 AI 与搜索业务带来了全新解法,能够在完全不牺牲 AI 模型预测性能的前提下,大幅削减键值缓存的内存占用。

在运行机制方面,TurboQuant 分为两个关键步骤。首先,它利用 PolarQuant 方法进行高质量的主体压缩。该方法打破常规,放弃了传统的笛卡尔坐标系,转而将数据向量转换为极坐标。

这种转换将数据映射到边界已知的固定“圆形”网格上,免去了昂贵的数据归一化步骤,彻底消除了传统方法的内存开销。

打开网易新闻 查看精彩图片

随后,TurboQuant 利用 QJL 算法处理第一步遗留的微小误差。QJL 仅需 1 比特的残差压缩算力,就能像数学纠错机一样消除偏差,确保模型计算出精准的注意力分数。

研究团队在 Gemma 和 Mistral 等开源大模型上进行了严格的基准测试。实验数据表明,TurboQuant 无需任何预训练或微调,就能极其高效地将键值缓存压缩至 3 比特,并在“大海捞针”等长上下文测试中实现零精度损失,同时将内存占用降低至 1/6。

此外,在 H100 GPU 加速器上,4 比特 TurboQuant 的运行速度比未量化的 32 比特基准提升了高达 8 倍。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

谷歌 TurboQuant 压缩算法搅动万亿市场,存储芯片板块遭遇「黑色时刻」,巨头股价全线飘绿,截至收盘,美光科技下跌 4%,西部数据下跌 4.4%,希捷下跌 5.6%,闪迪更是重挫 6.5%。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

原文链接:https://m.ithome.com/html/932786.htm

一条旧闻,但看到最近的消息我还是决定拿出来再给大家看一下。

上个月月底,谷歌TurboQuant压缩算法横空出世,根据谷歌介绍,能大幅压缩AI大模型对存储的需求,不少玩家认为这是“内存崩盘”的末日号角,一些存储厂商的股价以及存储产品的市场价格也是应声而跌,看起来谷歌TurboQuant就是内存救世主了……吗??

新 闻 2: 谷歌 TurboQuant 算法遭质疑,中国博士后指其论文存在严重问题

3 月 28 日消息,谷歌研究院 3 月 25 日推出全新极端压缩算法 TurboQuant,有望重塑 AI 运行效率并解决大模型键值缓存(KV Cache)的内存瓶颈,据称可以使 AI 内存占用锐降至 1/6、推理狂飙 8 倍。

然而,3 月 27 日晚上 10 点,苏黎世联邦理工学院博士后、RaBitQ 算法的第一作者高健扬公开表示:“TurboQuant 论文在描述 RaBitQ 时存在严重问题,包括不正确的技术声明和误导性的理论、实验对比 —— 而这些问题在投稿前就已向作者指出,对方承认了,但选择不修正。”

打开网易新闻 查看精彩图片

原文链接:https://m.ithome.com/html/933679.htm

从来就没有什么救世主,很快的,就有领域大佬、苏黎世联邦理工学院博士后、RaBitQ 算法的第一作者高健扬公开表示质疑。事实上,质疑并不是发生在论文发布之后,而是在发表之前就已经指出,而谷歌方面并未修正,且在发布后投入大量资源宣传,对市场、业界以及消费者都造成了极大的误导,不知道谷歌是否故意为之……难道谷歌是为了抄底内存?

新 闻3: TrendForce:消费型内存 (Consumer DRAM) 2026Q2 还将涨价 45~50%

4 月 7 日消息,TrendForce 集邦咨询今日表示,在三大原厂逐步淡出的 DDR4 及更早世代 Consumer DRAM 消费型内存市场,均价将在今年一季度上涨 75~80% 后二季度还将续涨 45~50%。

打开网易新闻 查看精彩图片

▲ 图源:TrendForce

Consumer DRAM 主要是面向消费电子产业领域的利基型内存。一方面,三星电子、SK 海力士、美光正逐步关停 DDR4 产线;另一方面,南亚、华邦等体量较小的成熟制程 DRAM 供应商扩产速度相对有限。这导致市场恐慌情绪未能及时化解供小于求还有愈演愈烈的态势

机构认为,2026 年 3 月 Consumer DRAM 的价格涨幅主要集中在 4Gb 及以下的小容量产品,如 DDR4 4Gb 单季度涨价 20%;而由于产能再分配等因素,DDR3、DDR2 各容量产品的均价在 3 月出现了 20~40% 不等的上调。

原文链接:https://m.ithome.com/html/936651.htm

所以,当TurboQuant这柄悬在存储厂商头上的“达摩克利斯之剑”存疑甚至可能被证伪的情况下,此前一度收缩的存储价格又进一步开始膨胀了。不光是价格,其实前文中股价受到影响的几家存储厂商也是很快的反弹了,谷歌这次真的是让人哭笑不得啊……

买电脑讨论群:386615430

二手硬件回收微信号:diannaobapingceshi

文章转载自网络(链接如上)。文章出现的任何图片,标志均属于其合法持有人;本文仅作传递信息之用。如有侵权可在本文内留言。

引用文章内容与观点不代表电脑吧评测室观点.