大语言模型面临一个问题:它们太大了。西班牙初创公司Multiverse Computing正在通过压缩模型来解决这个问题,旨在缩小前沿模型功能与企业实际部署能力之间的差距。
秘密武器是CompactifAI压缩技术
其核心技术是CompactifAI,这是一项受量子计算启发的压缩技术,这家巴斯克公司将其应用于OpenAI发布的模型。从今日起,开发者可以在Hugging Face上免费访问Multiverse的HyperNova 60B模型的新版本。该公司还计划在2026年开源更多压缩模型,以支持更广泛的用例。
据Multiverse介绍,其模型更小,但几乎同样强大和准确。HyperNova 60B仅为32GB,大约是其源模型OpenAI的gpt-oss-120b的一半大小,同时拥有更低的内存使用量和更低的延迟。更新版本名为HyperNova 60B 2602,现在还更好地支持工具调用和智能体编程,这些场景的推理成本通常较高。
欧洲AI公司的竞争与合作
Multiverse声称HyperNova 60B击败的竞争对手之一是Mistral Large 3,这是法国独角兽公司Mistral AI发布的模型之一。但除了技术竞争之外,这两家欧洲AI公司也有很多共同点。
像Mistral一样,Multiverse已经扩展到了本国之外,在美国、加拿大和整个欧洲都设有办事处。两家公司都拥有企业客户。就Multiverse而言,其客户包括伊维尔德罗拉、博世和加拿大银行。
融资传言与主权AI定位
虽然Multiverse尚未正式成为独角兽,但现在传言它正在以超过15亿欧元的估值筹集5亿欧元的新一轮融资。在与TechCrunch分享的声明中,该公司确认正在与潜在投资者就新一轮融资进行积极讨论,但补充说现阶段评论估值或融资规模还为时过早。Multiverse也拒绝对其年度经常性收入在1月份达到1亿欧元的报告发表评论。
如果得到证实,这仍然只是OpenAI 200亿美元年度经常性收入的一小部分;但与Mistral的收入相差不远,后者的年度经常性收入飙升至超过4亿美元,部分原因是对美国科技替代方案的需求不断增长。同样,Multiverse在其最新新闻稿中将自己定位为一家能够"在AI技术栈中提供主权解决方案"的公司。
这些地缘政治因素最近帮助Multiverse与西班牙东北部阿拉贡地区政府建立了合作关系。西班牙技术转型机构也参与了这家AI初创公司去年2.15亿美元的B轮融资。自成立以来,Multiverse还受益于巴斯克地区的支持——该地区很快可能迎来第一家独角兽公司。
Q&A
Q1:CompactifAI技术是什么?它有什么特别之处?
A:CompactifAI是Multiverse Computing开发的一项压缩技术,受量子计算启发。该技术能够大幅压缩大语言模型的大小,同时保持近乎相同的性能和准确性。例如,HyperNova 60B模型仅为32GB,约为源模型OpenAI gpt-oss-120b的一半大小,但拥有更低的内存使用量和延迟。
Q2:HyperNova 60B模型相比其他模型有什么优势?
A:HyperNova 60B模型的主要优势包括:体积更小(32GB),内存使用量和延迟更低,同时保持接近源模型的性能。新版本HyperNova 60B 2602还增强了对工具调用和智能体编程的支持。Multiverse声称该模型在性能上超越了法国Mistral AI的Mistral Large 3模型。
Q3:开发者如何使用Multiverse的压缩模型?
A:开发者现在可以在Hugging Face平台上免费访问Multiverse的HyperNova 60B模型新版本。该公司还计划在2026年开源更多压缩模型,以支持更广泛的用例,为开发者提供更多选择和更低的部署成本。
热门跟贴