免责声明:本网发布此文章,旨在为读者提供更多信息资讯。文章观点仅供参考,所涉及内容不构成投资、消费建议。为提高文章流畅性,文章可能存在故事编译,读者请自行辩解!如事实如有疑问,请与有关方核实。

东方AI神秘力量登场

2025年初,DeepSeek突然火了。

美国开发者在论坛里刷屏求邀请码,苹果应用商店下载量三天就超过了ChatGPT。

《黑神话:悟空》制作人冯骥发朋友圈说这是“国运级科技成果”,连硅谷的工程师都在猜背后是谁。

谁也想不到,这个让OpenAI连夜开会的AI,不是出自谷歌或Meta,而是曾靠炒股赚了千亿的私募大佬梁文锋搞出来的。

打开网易新闻 查看精彩图片

出租屋走出千亿量化天王

85后湛江小伙梁文锋,数学拔尖的浙大高材生,2008年放着大厂offer不要,揣着8万块跑到成都出租屋搞量化投资。

别人炒股靠感觉,他靠数学模型算K线规律,硬是把几万块滚到5个亿。

2015年创办幻方量化,2021年管理规模就破了千亿,成国内量化私募“四大天王”之一。

2019年还砸2亿建了AI超算“萤火一号”,悄悄给AI布局埋下伏笔。

打开网易新闻 查看精彩图片

转型AI颠覆炒股逻辑

2019年他悄悄砸了2亿建AI超算“萤火一号”,当时没人知道这是在为AI铺路。

2023年突然宣布成立DeepSeek,把量化那套思维直接搬了过来:用模型抓语言规律就像抓市场规律,像抠炒股成本一样砍AI成本。

别人拼参数堆算力,他偏要搞架构创新,说“参数不是万能的,规律才是”,把在股市里练出的“找规律、控成本”本事全用在了AI上。

打开网易新闻 查看精彩图片

AI界拼多多成本砍十分之一

梁文锋把量化里“精准计算每一分成本”的本事用到了AI上。

DeepSeek搞出的“混合专家架构(MoE)”,就像公司只在需要时请对口专家干活,平时不用养闲人——模型里藏着8个“专家模块”,输入不同问题只激活2个,算力浪费直接砍到八分之一。

就靠这招,DeepSeek-V3训练成本压到557万美元,仅是GPT-4的二十分之一;API价格更狠,每百万token只要1块钱,是GPT-4的百分之一。

打开网易新闻 查看精彩图片

最离谱的是性能,2025年1月发布的R1模型,推理能力跟OpenAI的o1打得有来有回,成本却只有对方十分之一。

硅谷工程师扒代码时发现,他们连训练时的显卡利用率都算到小数点后两位,网友笑称这哪是搞AI,分明是“用炒股的抠门劲儿干科技”,活脱脱成了“AI界拼多多”。

打开网易新闻 查看精彩图片

开源让贵族技术变白菜价

不光把模型代码、训练细节全开源,还搞出手机能跑的mini版——以前只有大厂砸几百万才能玩的AI技术,现在个人开发者下载个压缩包,用笔记本就能调参。

《黑神话:悟空》团队直接拿DeepSeek跑游戏剧情生成,冯骥在行业会上说这是“知识平权”,把AI从“技术贵族”的玻璃柜里拽出来,变成程序员桌面上的“白菜价工具”。

连国外大学实验室都在转发他们的开源文档,说“第一次不用求着大厂要API额度了”。

打开网易新闻 查看精彩图片

中国年轻人的团队密码

DeepSeek的139人团队里,没有一个海外AI大佬,全是90后、95后应届生。

梁文锋给的工资比大厂高30%,公司里没KPI没层级,工位随便坐,开会不用举手。

他自己每天泡在代码里,跟应届生一起读论文改模型,说“经验是包袱,创新得靠没被框住的年轻人”。

这群没出过国的中国年轻人,用国产算力跑模型,靠本土数学人才优化架构,硬是把技术做到了全球顶尖,打破了“中国AI只会模仿”的老偏见。

打开网易新闻 查看精彩图片

中国科技的别样未来

梁文锋现在身家330亿,DeepSeek估值早破千亿,他用这套打法证明:中国团队不用跟着欧美砸钱追参数,靠数学挖规律、成本控差异、开源推平权,照样能站到全球AI第一梯队。

以前AI是大厂专利,现在个人开发者用手机跑mini版就能调参,国内大厂不得不跟着降价,AI技术门槛一下被拉低了。

他说要“让AI像水电一样便宜”,现在看来,这不是口号——把技术贵族拉下神坛,靠本土算力和中国年轻人,真的能让科技普惠照进现实。