打开网易新闻 查看精彩图片

在人工智能竞争的全球版图中,印度正以一种越来越不容忽视的姿态宣示自己的存在。就在新德里AI峰会召开的同一天,印度本土AI明星创业公司Sarvam AI正式发布了两款旗舰语言模型,分别是参数规模达300亿的Sarvam-30B和参数规模达1050亿的Sarvam-105B。

这是印度迄今为止在基础模型层面最具分量的一次技术发布,也是Sarvam在经历过去一年高速成长之后,正式宣告进入全球AI主流赛道的关键节点。

Sarvam-30B和Sarvam-105B都被官方定位为多语言基础模型,目标是在印度22种官方语言上实现超越现有模型的表现,其中包括印地语、泰米尔语、泰卢固语、马拉地语和孟加拉语等主要语言。在多项公开基准测试中,Sarvam的模型据称在印度语言理解和生成任务上优于Meta的Llama系列和谷歌的Gemma系列。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这个方向的选择并非偶然。印度的数字用户群体中,相当比例的人口更习惯用本地语言而非英语与系统交互,而现有的主流大模型普遍在印度本地语言上表现不稳定,理解深度和自然度都有所欠缺。Sarvam创始人维韦克·拉加万在发布活动上表示,"真正服务印度用户,意味着要从语言的根部开始建设,而不是在英语模型上贴一层翻译膜。"

Sarvam此前已推出面向开发者的Sarvam-1系列,并在印度政府主导的国家AI使命框架下获得了重要的战略背书。此次新模型的规模跃升,意味着其技术路线已从服务垂直场景向构建通用基础设施迈进了一步。

Sarvam的崛起,既折射出印度初创生态的成熟,也离不开印度政府在AI层面日益明确的战略意志。印度政府推出的IndiaAI使命计划目前已批准了超过1万个GPU的算力资源部署,专门用于支持本土AI研究与产品开发,而Sarvam正是这一计划的重要受益方之一。

与此同时,谷歌、Meta等全球科技巨头也在印度市场上加速布局,谷歌在同一场峰会上宣布了支持70种语言的实时翻译模型,其中不乏与Sarvam直接竞争的印度语言场景。面对这样的竞争压力,Sarvam的差异化策略清晰可见:与其跟随国际大厂在全球通用模型上正面交锋,不如深耕印度本地语言、本地数据和本地文化理解,构建一道巨头难以复制的护城河。

从更宏观的视角来看,Sarvam-30B和Sarvam-105B的发布,是印度AI从"应用层追随者"向"基础模型参与者"身份转变的重要标志。这场从南亚次大陆升起的AI力量,能否在未来数年内真正改写全球语言模型的竞争格局,眼下还无法定论,但答案的轮廓,已经开始变得愈发清晰