AI大模型生成1000万token的输出,在现有硬件上可能要花一个月。英国创业公司Fractile说,他们能把这压缩到一天。
这家公司刚刚完成2.2亿美元(约15.8亿人民币)B轮融资,由Accel、Founders Fund和Factorial Funds领投,Gigascale、Conviction等机构跟投。资金将用于加速首款芯片的开发和交付,并在英国、美国、台湾三地扩招团队。
打开网易新闻 查看精彩图片
Fractile成立于2022年,专注解决一个被低估的问题:推理(inference)。训练模型很烧钱,但让模型真正跑起来、产生结果,才是AI落地的最后一公里。随着大语言模型输出规模膨胀到1亿token级别,内存带宽和推理速度已成为硬性瓶颈。
Fractile的打法是从底层重构硬件架构,而非在现有框架上修修补补。他们覆盖从基础研究到工艺创新的全栈,目标同时降低推理的延迟和成本。今年2月,公司宣布三年内向英国业务投入1亿英镑,扩建伦敦和布里斯托办公室,并在布里斯托新建硬件工程中心。
英国AI事务部长Kanishka Narayan对此评价:"这是英国AI的强心剂。尖端企业既能吸引全球资本,又能把高价值岗位留在本土。"目前英国科技产业估值已达1万亿美元,政府正推动该国成为全球AI与数据基础设施枢纽。
Fractile的融资时机微妙。英伟达垄断训练芯片,但推理市场格局未定。多家初创公司正试图用专用架构切入,Fractile是其中资金最充裕的欧洲玩家之一。能否把"一天处理一个月工作量"的承诺变成产品,将是下一轮考验。
热门跟贴