聚焦

印度要不要自己的大模型?Sarvam AI 给出的答案是“要”,但当它真的发布了 Sarvam-M 之后,质疑声也接踵而至。

240亿参数、支持10种印度本土语言、权重开放、面向全社会……这些听起来本应代表技术突破的关键词,却在发布两天后仅收获了334次下载。相比韩国大学生开发的模型两天20万次的下载量,这一成绩令不少业内人士“感到尴尬”。

这一对比迅速引爆社交网络,印度AI圈随即陷入一场围绕“本土大模型是否必要”的热烈争论。而这场争议背后,实则是印度AI生态发展阶段、使用习惯、数据基础与算力条件之间的多重现实碰撞。

01

Sarvam-M发布了什么?

从国家使命走向冷启动,Sarvam-M到底发布了什么?

Sarvam AI 是印度国家AI战略 IndiaAI Mission 早期扶持的代表企业之一,由前 UIDAI 技术负责人 Vivek Raghavan 和 AI4Bharat 联合创始人 Pratyush Kumar 于2023年成立,目标明确——打造“主权AI栈”。

Sarvam-M 是他们最新发布的开源大语言模型,具备以下特点:

  • 构建基础为 Mistral Small(法国开源模型);

  • 参数规模为 240亿,支持 印地语、孟加拉语、古吉拉特语、卡纳达语、马拉雅拉姆语等 10种本地语言

  • 强调为印度语境优化,支持多场景、多领域适配;

  • 模型权重开放,并在 Hugging Face 上提供使用。

这被视作印度AI自主化进程的重要一步。Sarvam 联合创始人 Raghavan 表示:“Sarvam-M 是印度迈向主权AI的重要基石。”

但理想与现实之间存在明显落差。上线两日仅 334 次下载,最新数据也不过 1200 次,引发外部投资人、开发者和评论者的普遍质疑。

02

核心争议是什么?

1

批评的核心在于价值定位

这场质疑最具代表性的声音来自 Menlo Ventures 投资人 Deedy Das。他的观点可总结为三点:

  1. 产品缺乏明确需求:“没有人在等一个稍微好点的 24B 印度语言模型。”

  2. 投入与产出不匹配:“Sarvam 已经获得 4100 万美元融资,成果却过于保守。”

  3. 替代性强,竞争力弱:“Google 和 TWO.ai 的产品性能更强,价格更低。”

更具争议的是,Das 将 Sarvam-M 与一款由两位韩国大学生开发的模型对比,后者在 Hugging Face 上两天获得近 20 万次下载,而 Sarvam-M 的冷启动成绩则被形容为“embarrassing”。

2

印度AI有自己的节奏

面对质疑,印度AI开发者群体迅速展开回应。

  • Lightspeed 合伙人 Hemant Mohapatra 强调,Sarvam 的用户规模在上月增长了10倍,并覆盖了4%的成年人口,体现出其在印度本土的落地能力。

  • AI4Bharat 社区开发者表示,Sarvam-M 的真正意义在于构建范式,而非短期指标。它不仅公开了模型,还分享了微调流程,为印度AI从业者提供可复制的路径。

  • Sarvam 内部员工指出,部分评论者并未亲自测试模型,就开始下结论。有人称这是“一种对印度AI生态缺乏理解的表现”。

更有开发者强调,模型的使用场景包括 小商户语音问答、农业助手、法律文书辅助等,服务的是 Bharat(印度非英语、农村与中小城镇人口),不是精英市场。

03

主权模型是否值得构建?

回到根本问题:为什么要构建印度自己的基础大模型?它值得吗?

这一问题不能简单用“下载量”回答,而需从三大结构性现实出发理解:

01

算力门槛高,训练成本极大

Sarvam-M 虽由 Mistral Small 微调而来,但 Sarvam 的中期目标是训练 70B 参数模型,预计投入约 4000–5000 万美元。这对印度本土算力环境而言,是一项挑战。

在 DeepSeek 成功用 H800 GPU 低成本训练模型之后,印度是否也能复制“国产AI硬件+本地训练”的路径,尚未可知。

02

多语言语料难收集,模型适配复杂

印度有超过 20 种主要语言,90%以上人口的数字行为以本土语言为主。大模型若不能精准服务本地语言习惯,将难以落地。

Sarvam 的一个核心任务,就是完成大规模 Indic 语言数据的清洗与组织,这部分工作对外界而言是“不可见的壁垒”。

X上的用户评论

03

产品场景分发链条尚未完善

很多开发者指出,Sarvam-M 面向的是那些 尚未形成明确AI使用习惯的用户群体。基础设施、终端使用体验、语言理解模型、语音识别系统缺一不可,这要求产品能力与生态组织能力并重。

这使得 Sarvam 既要当“基础设施建设者”,又要当“应用产品开发者”。

不是热度问题,而是生态构建问题

这场关于 Sarvam 的争议,最终折射出一个行业普遍性问题:

一个开源大模型的价值,应如何衡量?

如果从“社交媒体热度”出发,Sarvam-M 显然不够热度;但如果从“基础工程搭建”的视角观察,它代表了本土AI生态一次踏实的起步。

正如谷歌研究员 Raj Dabre 所言:“Sarvam-M发布前,大家抱怨没有印度大模型;发布后,又说它不够好。这暴露的是我们对‘自主AI’的认知缺失。”

在冷启动之后,真正的问题才刚刚开始

Sarvam-M 并不是一款完美的产品,但它开启的是印度AI从“用户国”迈向“建设国”的技术自主路径。

这不仅是对产品功能的考验,更是对战略方向、产业组织能力与基础生态的系统性检验。

Sarvam 的争议并不奇怪,它面临的是任何试图自建AI基础设施国家都会遇到的问题——从0到1的成本高、回报慢、不确定性极强。

这也是为什么我们不应以一时的热度去评判它,而应关注其长期的价值沉淀:是否能支撑起真正意义上的“印度AI技术栈”。

毕竟,属于印度的AI,不一定要从硅谷出发。