雷军重金挖角背后:小米大模型的奋起直追。

在如今这个科技竞争白热化的时代,AI 大模型成了各大科技公司眼中的香饽饽,小米也不例外。

打开网易新闻 查看精彩图片

这不,雷军亲自下场,花大价钱挖来了 DeepSeek 开源大模型的关键开发者罗福莉,据说给的薪酬高达千万元级别,就为了让她来领导小米的大模型团队,这事儿在业内引起了不小的轰动。

打开网易新闻 查看精彩图片

罗福莉可是个厉害的 95 后姑娘。她出生在四川的一个普通家庭,上大学前对电脑都不太熟悉,进了北师大计算机专业后,靠着自己的天赋和不懈努力,成绩一路飙升,还保研进了北京大学计算语言学研究所。

打开网易新闻 查看精彩图片

读研期间,她在国际顶会 ACL 上一口气发表了 8 篇论文,其中 2 篇是第一作者,一下子就在学术界出了名,被大家称为“95 后天才少女”“AI 萝莉”。

毕业后,她先后在阿里达摩院和 DeepSeek 等公司大展身手,积累了丰富的经验和技术实力。

打开网易新闻 查看精彩图片

那小米为啥这么着急挖人呢?

说来也简单,小米在大模型领域的发展,和其他竞争对手比起来,确实有点慢半拍。早在 2016 年小米就组建了 AI 团队,小爱同学也早早地被大家熟知,可在大模型的研发和推广上,却落后了一步。

2023 年 vivo 率先发布了蓝心大模型,2024 年荣耀在发布会上展示了手机 AI 的强大功能,而小米呢?在自家手机的 AI 能力宣传上,一直比较低调,小米 15 的新品发布会上,对大模型的介绍也只是寥寥数语。 不过,小米也有自己的优势。

打开网易新闻 查看精彩图片

它拥有庞大的 AI 入口和丰富的应用场景,全球最大的 IoT 设备制造商可不是吹的,旗下海量的设备可以和“小爱同学”智能体相连,收集信息并实现场景联动。

再加上自研的澎湃 OS 系统以及“人车家”全生态布局,一旦在大模型技术上取得突破,就能借助这些场景快速反哺大模型,提升其性能和上限。

打开网易新闻 查看精彩图片

这次雷军亲自挖人,就是想在大模型领域迎头赶上。罗福莉的加入,或许能给小米带来新的活力和技术突破。一方面,她在自然语言处理领域的深厚造诣,正好契合小米手机、电脑、车机等设备的日常应用需求;另一方面,她参与研发的 DeepSeek-V2 模型性价比超高,这也符合小米一直以来注重性价比的产品理念。

而且,罗福莉身上的光环和话题性,说不定还能在宣传上给小米带来意想不到的效果。 目前来看,小米已经在行动了。

打开网易新闻 查看精彩图片

据界面新闻报道,小米大模型团队在成立时就有 6500 张 GPU 资源,现在还在着手搭建 GPU 万卡集群,准备在大模型领域大力投入。同时,小米也在积极招聘相关人才,北京地区就有多达 59 个大模型相关岗位在招人,从这些动作不难看出小米的决心。

打开网易新闻 查看精彩图片

但小米要想在大模型领域真正崛起,也不是一件容易的事。竞争对手们都在拼命奔跑,技术研发的道路上充满了挑战和不确定性。

不过,小米有自己的底蕴和优势,再加上雷军的果断决策和大力投入,未来在大模型领域的表现还是值得期待的。至于能不能成功,就让我们拭目以待吧,说不定哪天小米的大模型就能给我们带来全新的、超乎想象的智能体验。

打开网易新闻 查看精彩图片