本文由无冕财经(wumiancaijing)原创发布
作者:谭嘉琳
编辑:陈涧
设计:岚昇
2024年底,国内AI界出了两件大事儿。
一是小米被曝出要以千万级别的年薪,从名为“DeepSeek”(深度求索)的大模型团队挖角一名“天才少女”,这被视为小米发力大模型军备战。
二是国内一款大模型面世,性能上赶超国际巨头Open AI的GPT-4o,还因为极低的训练成本被称为“大模型届的拼多多”,一时成为惊艳硅谷的“神秘东方力量”。
而这款大模型,就叫做DeepSeek-V3。
这样一来,原本名不经传的DeepSeek团队一下被推到聚光灯下。更令网友震惊的是,这么顶尖的大模型,竟然不是出自天天砸钱高呼“All in AI”的互联网大厂,而是来自私募机构幻方量化。
“炒股”机构做出来的AI,是怎么跑赢一众大厂的?
AI“天才少女”,出自私募机构
去年12月23日,业内传出95后AI“天才少女”罗福莉被雷军以千万级年薪挖角,或将领导小米的大模型团队。
一时间,主人公众多标签被网友扒出:北大硕士毕业、一年发8篇顶级会议论文、毕业后横扫BAT最顶级硕士offer……
▲罗福莉的个人简介。图片来自其知乎个人首页。
不过,消息被炒热后,据红星新闻2024年12月31日报道,罗福莉对于是否要跳槽到小米,目前还在犹豫,还发声希望不要被过度关注。
而像罗福莉一样“闷声干大事”的,还有她背后的公司幻方量化。
幻方量化成立于2015年,专注于量化投资,也就是通过数学、统计、人工智能等方式取代人工决策进行投资。
但作为私募机构,让幻方在国内外最“出圈”的,不是投资产品,反而是以“超绝性价比”著称的大模型产品。
2024年5月,幻方旗下的开源大模型DeepSeek-V2横空出世,将推理成本降低到每百万token仅1块钱,仅是当时行业领先的GPT-4 Turbo的七十分之一。去年12月26日,DeepSeek再发布DeepSeek-V3,训练成本仅550万美元,约为GPT-4o的二十分之一。
而在性能方面,DeepSeek-V3 技术报告称,其在英语、代码、数学、汉语以及多语言任务上表现十分出色。国外独立AI测评机构评道,“DeepSeek-V3超越了迄今为止所有开源模型”。
震惊硅谷的同时,DeepSeek也把国内公司杀了个措手不及。
虽然幻方曾向暗涌Waves透露,DeepSeek大模型目前还没有商业化的计划,只专注于技术创新;但如此高性能搭配极低成本,可想而知,一旦DeepSeek发力,将引发一轮“血战”。
这不,去年5月份DeepSeek-V2问世,立马引起各大模型警觉,掀起一阵价格战。
独角兽智谱AI第一个跟进,在5月11日宣布将其入门级模型GLM-3 Turbo的API降价为1元/百万tokens;15日,字节跳动发布豆包大模型,定价低至0.0008元/千Tokens,比行业降低约99%。随后,阿里云、腾讯云等也宣布将其下大模型降价,百度、科大讯飞等甚至决定将几款轻量级大模型免费开放。
就在去年12月31日,DeepSeek-V3发布后5天,阿里云还宣布开启第三轮大模型降价,其下通义千问视觉理解模型全线降价超80%。
▲阿里云发布的降价公告。图片来自阿里云公众号。
私募机构做AI,还“吊打”了一众大厂。听起来不可思议,但放在幻方倒也合理。
都知道私募是替有钱人干活的,炒股的眼光必须毒辣;而幻方从一开始,就瞄准了AI辅助——不仅要炒,还要用机器学习精准炒股。
早在2008年,幻方就开始使用机器学习探索全自动量化交易;2017年,幻方就开始全面应用深度学习技术进行交易。
到了2023年4月,ChatGPT问世一周月,大模型正是科技圈的必争之地,幻方也抓紧组建成立子公司DeepSeek,令西方AI界惊叹的“东方神秘力量”也就此诞生。
AI炒股,“镰刀”会更锋利吗?
事实上,DeepSeek的大模型一出世,也曾引起外界质疑——私募机构要是搞起了AI炒股,普通股民哪里比得过?有的网友甚至把大模型比作“核动力镰刀”,要割倒一片“韭菜”。
不过,DeepSeek已经向外界澄清,自己做AI大模型跟金融无关,纯纯是对科技创新感兴趣。更何况,以幻方最近的业绩来看,AI量化助攻确实作用不大。
截至去年12月20日,幻方量化共有65只基金公开披露净值,其中有29只基金年内涨幅超过10%,其余36只基金均在年内下跌。另外,据深蓝财经,此前幻方旗下多只收益率达100%-400%的产品,到2024年后大多都降至10%左右。
曾经管理规模达到千亿的幻方,如今已经降到200亿-300亿元规模。而放眼百亿级私募业绩整体,数据显示,截至11月底,年内百亿级私募旗下产品平均收益超17%。如此比较,幻方反而掉队了。
不过,既然是“最牛大模型”,DeepSeek用不到炒股上,但还是很有“钱”途的。凭借技术创新得来“超绝性价比”,DeepSeek不愁市场地位。
据凤凰网科技,目前最新的DeepSeek-V3的定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中)、输出每百万tokens 8元,性价比很高。据AI咨询公司semianalysis测算,DeepSeek-V3的毛利率达到70%以上。
虽然DeepSeek对外公布还没开始全面商业化,但其创始人梁文锋向媒体透露,DeepSeek已经在成本之上开始盈利。
而另一边,大厂们还得烧钱补贴价格战,才能与之匹敌。据科技新知,2024年5月DeepSeek-V2发布前,国内大模型推理算力毛利率高于60%,和国际同行基本一致,但在5月接连降价后,毛利率直接跌至负数。
未来DeepSeek想做的,还是大模型产业的最上游。用梁文锋的话说,“我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek的基础上构建toB、toC的业务”。
即使不做“镰刀”,但可以料想,DeepSeek足以在大模型界刮起腥风血雨。
热门跟贴