作者:bnl 编辑部

据法新社报道,智利推出了Latam-GPT——首款专为拉丁美洲设计的开源AI语言模型,旨在减少该地区对美国和中国技术的依赖,并消除现有AI系统中的文化偏见。

该项目由智利国家人工智能中心协调,还得到八个国家60多家机构和近200名专家的支持。据组织者称,这标志着拉丁美洲从仅仅是AI基础模型的消费者,转向主动构建和塑造AI基础模型。

该模型拥有700亿参数,基于Meta的Llama 3.1架构开发,主要使用西班牙语和葡萄牙语进行训练,并计划最终纳入土著语言。与ChatGPT或Google Gemini等商业聊天机器人不同,Latam-GPT被定位为基础性基础设施:一种供政府、大学、初创企业和公司调整并加以利用的公共产品。

智利总统加夫列尔·博里奇在2月10日国家电视台的发布会上表示:"人工智能是近代最伟大的技术革命,从拉丁美洲和加勒比地区出发,我们参与其中,既具战略意义,又十分紧迫。"他援引欧洲历史事件与拉丁美洲里程碑之间可用信息的差异,作为该项目旨在解决的信息代表性不足的证据。

该倡议针对开发者认为现有大型语言模型存在的结构性弱点——这些模型主要依赖英语数据进行训练,未能充分捕捉该地区的语言、文化细节和现实语境。这样一来,在地区特有知识上表现更差,偏见风险更高,而且国家层面使用AI时,政策上的掌控力也会被削弱。

开发Latam-GPT涉及处理超过8TB的数据——也就是几百万本书的量——包括私有数据源和为填补现有信息空白而创建的合成数据集。这项工作由CENIA的预算和拉美开发银行(CAF)提供了55万美元的资金支持。

初期训练用了亚马逊云服务的基础设施,但后续版本将运行在智利北部塔拉帕卡大学正在安装的一台价值450万美元的超级计算机上,预计于2026年上半年投入使用。

CENIA主任Álvaro Soto表示,其他地方构建的模型包含的关于拉丁美洲的信息相对较少,所以在拉美本地应用时效果不太好。他说:“目标是给出更准确、更贴合当地文化的结果,反映拉美地区的真实情况。”

参与该项目的乌拉圭共和国大学工程学教授路易斯·奇鲁佐将其描述为“拉丁美洲一个非常重要的里程碑”,使该地区能够以自主方式参与人工智能技术。

该开放获取模型专为公共行政和服务领域常见的文字处理密集的日常流程而设计,包括文档起草与摘要、翻译、知识检索和客户支持。早期商业用户之一是智利公司Digevo,该公司正在为航空公司和零售商构建能够理解地区方言和本土表达的AI驱动的客户服务工具。

索托表示,该模型可以打造符合当地需求的数字解决方案,例如为面临物流难题或资源分配问题的医院提供工具。

然而,智利大学的学者亚历杭德罗·巴罗斯警告称,由于经济资源和基础设施的巨大差异,Latam-GPT根本不可能和那些全球大模型竞争。

虽然这个模型打着主权建设的旗号,但初期开发依赖商业云,这让人们对它长期能不能独立和可持续打了个问号。

Latam-GPT和其他区域性AI项目一样,比如东南亚的SEA-LION和非洲的UlizaLlama,都是为了让发展中地区能搞出符合自己文化和语言特色的AI能力。