私募机构做的“AI镰刀”，秒杀大厂，雷军也动手了|小米|幻方|知名企业|私募机构|阿里云|雷军

本文由无冕财经（wumiancaijing）原创发布

作者：谭嘉琳

编辑：陈涧

设计：岚昇

2024年底，国内AI界出了两件大事儿。

一是小米被曝出要以千万级别的年薪，从名为“DeepSeek”（深度求索）的大模型团队挖角一名“天才少女”，这被视为小米发力大模型军备战。

二是国内一款大模型面世，性能上赶超国际巨头Open AI的GPT-4o，还因为极低的训练成本被称为“大模型届的拼多多”，一时成为惊艳硅谷的“神秘东方力量”。

而这款大模型，就叫做DeepSeek-V3。

这样一来，原本名不经传的DeepSeek团队一下被推到聚光灯下。更令网友震惊的是，这么顶尖的大模型，竟然不是出自天天砸钱高呼“All in AI”的互联网大厂，而是来自私募机构幻方量化。

“炒股”机构做出来的AI，是怎么跑赢一众大厂的？

AI“天才少女”，出自私募机构

去年12月23日，业内传出95后AI“天才少女”罗福莉被雷军以千万级年薪挖角，或将领导小米的大模型团队。

一时间，主人公众多标签被网友扒出：北大硕士毕业、一年发8篇顶级会议论文、毕业后横扫BAT最顶级硕士offer……

▲罗福莉的个人简介。图片来自其知乎个人首页。

不过，消息被炒热后，据红星新闻2024年12月31日报道，罗福莉对于是否要跳槽到小米，目前还在犹豫，还发声希望不要被过度关注。

而像罗福莉一样“闷声干大事”的，还有她背后的公司幻方量化。

幻方量化成立于2015年，专注于量化投资，也就是通过数学、统计、人工智能等方式取代人工决策进行投资。

但作为私募机构，让幻方在国内外最“出圈”的，不是投资产品，反而是以“超绝性价比”著称的大模型产品。

2024年5月，幻方旗下的开源大模型DeepSeek-V2横空出世，将推理成本降低到每百万token仅1块钱，仅是当时行业领先的GPT-4 Turbo的七十分之一。去年12月26日，DeepSeek再发布DeepSeek-V3，训练成本仅550万美元，约为GPT-4o的二十分之一。

而在性能方面，DeepSeek-V3 技术报告称，其在英语、代码、数学、汉语以及多语言任务上表现十分出色。国外独立AI测评机构评道，“DeepSeek-V3超越了迄今为止所有开源模型”。

震惊硅谷的同时，DeepSeek也把国内公司杀了个措手不及。

虽然幻方曾向暗涌Waves透露，DeepSeek大模型目前还没有商业化的计划，只专注于技术创新；但如此高性能搭配极低成本，可想而知，一旦DeepSeek发力，将引发一轮“血战”。

这不，去年5月份DeepSeek-V2问世，立马引起各大模型警觉，掀起一阵价格战。

独角兽智谱AI第一个跟进，在5月11日宣布将其入门级模型GLM-3 Turbo的API降价为1元/百万tokens；15日，字节跳动发布豆包大模型，定价低至0.0008元/千Tokens，比行业降低约99%。随后，阿里云、腾讯云等也宣布将其下大模型降价，百度、科大讯飞等甚至决定将几款轻量级大模型免费开放。

就在去年12月31日，DeepSeek-V3发布后5天，阿里云还宣布开启第三轮大模型降价，其下通义千问视觉理解模型全线降价超80%。