本文共计:2982字,6图
阅读预计:8分钟
DeepSeek震惊印度
最近科技圈的大热新闻应当要属AI界的“后起之秀”DeepSeek了。这个来自中国的AI产品自打横空出世,就成为了全球AI界的又一颗新星。印度各界对此也反应强烈。
政界首先老生常谈地祭出“中资忧虑论”。
据路透社的报导,印度财政部已要求其员工避免使用包括DeepSeek在内的AI工具用于官方用途,理由是它们可能对政府文件、数据的保密性构成风险。
除了所谓的“国家安全”议题外,AI涉及的版权问题也一直是印度舆论关注的焦点。
目前仍在审理中的一桩相关诉讼就频上热搜。诉讼的被告方是OpenAI,另一方则是印度首富穆克什·安巴尼等人控制的印度最大媒体巨头。
后者认为前者侵犯了自己的版权,但OpenAI对这一指控提出了反驳,并认为其在印度根本没有服务器,印度法院就不该审理这起官司。
虽然此事事发时DeepSeek还没有引起广泛关注,但若此案OpenAI败诉,势必对所有AI工具产生同样的影响。
在“限制”之余,中国在AI领域如此迅速的突破也让印度各界感到了深深的“震惊”。
印度政府已经表示,印度的国产版DeepSeek竞品也即将问世。
政府目前正向初创公司、大学和相关研究人员提供数千块高端芯片,以便在“不到10个月”的时间内开发出类似的产品。
印度在AI领域“超中赶美”的野心似乎不难理解。
印度本身就有不错的IT基础。OpenAI首席执行官Sam Altman今年2月也表示,印度目前是OpenAI的第二大用户市场。
这证明印度对AI的市场需求也十分强劲——算算经济账,在印度搞AI不可能不赚钱。
没钱搞AI?
但即便这几年AI之风劲吹,可似乎世界的焦点始终徘徊在中美两大国。印度好像一直就分不到一杯羹。
这其中一个重要的原因十分残忍:没钱。
据BBC的调查,在2010年至2022年期间,中国和美国分别获得了全球AI专利总量的60%和20%,而印度获得的专利仅仅不到0.5%。
2023年,印度AI初创企业获得的私人投资,同它们的美国和中国同行所获投资相比,仅仅占一小部分。
募集不到民间资本,或许是因为民间确实没钱,或许是因为投资者意识不到AI的巨大获利空间。
但是,政府呢?印度政府总不至于没钱?
其实政府也确实做了些事情,比如前文提及的给大家“发芯片”,另外印度也给一些AI相关项目提供了10亿美元的支持。
听起来也不算少了,但再看看中美两国。
特朗普为“星际之门”计划(一项在美国建设大规模AI基础设施的计划)拨出的金额高达5000亿美元;
中国则宣布要在2030年前成为AI中心,计划投资1370亿美元。
相比之下,印度政府的这个扶植力度就让人贻笑大方了。
但DeepSeek的成功似乎还是让印度企业看到了一丝希望。
科技从业者们注意到了一个事实:DeepSeek以相对低廉的600万美元预算,做出了能够与ChatGPT这样的尖端模型相媲美的产品。
尽管有声音认为DeepSeek“背后的资金要多得多”,但它毕竟证明了,AI模型也可以在相对老一些的、便宜一些的芯片上运作。
这肯定是个好消息。毕竟就在几个月前,AI项目还被印度各界认为实在太烧钱,真的没法搞——GPT这只巨大的吞金兽让现金流普遍不够的印度公司感到望尘莫及。
印度官方也对此表示了肯定。
印度信息技术部长1月时称赞道,中国初创公司DeepSeek凭借其较低成本的AI产品震撼了业界,并将其“节俭”的做法引为印度政府努力构建本土化AI模型的楷模。
这番表达的意思是,想要政府出大钱是不可能了,但如果能“花小钱办大事”,政府还是十分乐见其成的。
多语言的困扰
花小钱能办大事固然最好,但别人成功的经验也未必全能随便复刻。印度打造本土化AI模型首先要面临的一个巨大挑战,是多语言环境。
众所周知,AI之所以能那么“像个人样”,关键是因为它被通过技术手段“喂”了一堆人类的语料。
然而,《印度教徒报》就发文表示,这件事在印度挺麻烦的。因为要“创建一个适用于印度语言的基础大型语言模型”仍是一个艰巨的任务。
几十种语言并用的印度,不像“美国、中国、日本和韩国等主要为单语”的互联网社会。由于各种语言的内容实在太过博杂,竟没有任何一种语言有绝对的代表性。
该文章说,在上述国家,“人们能够自由互动”,因为本国的开发者愿意首先为自己所在的社会开发产品,可是“我们根本没有解决这个问题。 我们仍然不愿意解决这个问题。”
换言之,这是印度社会自使用互联网时起就面临的一个老问题:印度的“互联网”真的不太“互联”。
客观来看,尽管已经取得了一些技术进步,比如说谷歌翻译等服务对印度各语言的翻译质量已明显有所提高,但印度业内人士依然认为,二者的可比性不大——翻译是一项针对既有内容的“转换性”技术,其挑战并不在于创建新文本,以及用特定的语言去解决问题。
要创建本土AI需要进行的数据收集,主要取决于印度各语言网上语料的“可用性”,而这就要求用户能够在网上发布更多的各类印度语言内容。
道理很简单:各种语言的“料”不够多,怎么“喂”AI呢。AI无饭可吃,又怎么表现得像个人?
印度技术界表示,虽然印度各大社交媒体上各类文本的数量正在增加,但训练基础AI模型所需的内容仍低于临界值。
有技术人士指出,即便是名义上的官方语言印地语、在国内地位举足轻重的马拉地语和泰米尔语,目前都被认为“缺乏足以训练AI模型所需的高质量数据”。遑论那些更小众的语言了。
但这一现象也同印度网络的普及率有直接关系。据印度互联网和移动通信协会的一份报告,41%的印度人不经常使用互联网,而在农村地区,这一比例高达51%。
这一群体很可能与非英语使用者重合。因此,也许在未来,他们能够以某种方式参与进AI的训练中。
但这显然尚需时日。
人才向外跑
另外一个对印度AI构成严重打击的原因是印度人才的流失。
其实印度的人才基础并不差。印度是全球知名的IT大国,这一点早已人尽皆知。
在AI人才方面,印度也走在世界前列。据BBC的估计,全球16%的AI工作者都来自印度,印度是世界第二大AI人才储备库。
根据2024年的斯坦福人工智能指数,印度在AI技能普及方面排名全球第一,得分为2.8,超过美国(2.2)和德国(1.9)。
此外,印度的AI技能渗透率为2.8——全球最高,表明其人工智能劳动力在人工智能相关能力方面的技能比全球平均水平高出2.8倍。
根据斯坦福大学的另一份统计数据,在2016年至2022年期间,世界几个主要经济体的人工智能人才库均大幅扩充。
印度的人工智能人才增长最多,增幅高达263%。
但为何拥有这么多人才却依然出不了好成果?原因很简单,人才跑了——越来越多的AI人才选择离开他们的祖国。
同样据斯坦福大学的统计,印度正在经历全球最大的AI人才外流,每10000名拥有AI技能的印度技术人才,净移民率为-0.76。
这一情况比以色列、韩国、意大利等同样“往外送人才”的国家都要严重得多。
高层次领军人才的流失,使印度大量的IT从业者“群龙无首”,自然转型艰难,只能固守低端赛道。
如班加罗尔的IT外包行业规模达2000亿美元,拥有数百万程序员,它本应成为孵化印度本土AI的前沿阵地。
然而现实情况是,IT公司们从未真正将它们的业务重点从廉价的服务工作转移到开发IT技术上。
综合这种种“AI起不来”的原因,其实不难看出,科技创新是一项全局工程, 科学精神、经济投入、人才储备、人文环境等都发挥着重要因素。
有印度专家就表示,印度其实已经具备了搭上AI快车的关键因素,但如果不对教育、研究和国家政策等进行基本的结构性调整,印度还是无法发挥出其优势,成为一流的AI大国。
本文为印度通原创作品,任何自媒体及个人均不可以以任何形式转载(包括注明出处),免费平台欲获得转载许可必须获得作者本人或者“印度通”平台授权。 任何将本文截取任何段落用于商业推广或者宣传的行径均为严重的侵权违法行为,均按侵权处理,追究法律责任。
>> 热文索引 <<
热门跟贴