(记者 安子修)日前,在2024上海世界移动通信大会(MWC上海)上,华为展示了通信大模型的最新突破。作为当前我国数字领域的真正核心,大模型训练工作一直是数字领域热门议题,许多科技型企业都投身到这场群“模”之战中。

大模型,也称基础模型,是指具有大量参数和复杂结构的机器学习模型,其智能程度决定了最终产品的“聪明”与否。因此,坚持推动大模型的自主研发、训练工作,有助于促进其质量迭代升级,并拉动整个人工智能领域相关产业的协同发展。

群“模”之战如火如荼

让我们把时间的指针拨回2022年末,ChatGPT的横空出世,带动了成百上千个大模型如雨后春笋般涌现,随后开启“群模”乱战,应用产品数量井喷:阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo;零一万物发布千亿参数规模的Yi-Large闭源大模型;OpenAI发布了迄今最像“人”的AI大模型GPT-4o;谷歌召开开发者大会,全线更新Gemini;就在同一天,字节跳动发布了包括多模态大模型在内的豆包大模型家族……

除了大模型的数量呈迅猛增长态势外,其开发者、训练者的量级也在持续不断增加中,这实际上侧面反映了我国人工智能领域有着充足的人力资源储备。如科大讯飞推出的讯飞星火大模型,其开发者生态目前正加速增长,生态开发者数量从598万增至702万,海外开发者数量从34万增至40万,大模型开发者数量从39万增至57万。

此外,统计数据显示,2023年我国人工智能核心产业规模为5784亿元,增速达13.9%,可见群“模”之战对产业的推动作用之巨大。而在表面的营收数据外,大模型训练也拉动了上游产业的优化迭代:只有更加科学、智能的终端设备才能承载大模型的投产实践,这也是其另一重积极意义。例如大模型数据的实体载体——芯片,就得到了持续发展。据《2024-2029年中国半导体材料专题研究及发展前景预测评估报告》显示,2023年我国半导体材料市场规模约979亿元,而2024年内预计最终将达1011亿元。

大模型应用范围不断拓展

随着大模型训练的不断持续进行,以及适配于各个产业进行深度融合实践,如今的大模型应用,早已不再局限于ChatGPT的文本问答形式,而是真正地运用智能化的优势,影响着人们现有的生产方式。

例如,由海尔集团旗下的工业互联网平台卡奥斯自主研发的专业大模型——卡奥斯天智工业大模型,正在积极影响着生产车间的工作效率。在模具工厂的注塑车间,技术人员只需通过AI助手给大模型下达生产口令,大模型便能够根据口令调取数百个工艺参数,并自动指挥车间内的注塑机开始工作,仅需几十秒就能完成单个产品的注塑过程,而产品之间的所产生的误差也不超过头发丝的粗细。据悉,像这样的产品生产过程,如果交由工艺师来进行人工处理,如此数百个参数,光调试就需要去掉1个多小时。更重要的是,如今大模型的引入也降低了调试成本。车间的负责人表示,在过去,由人工生产出来的不合格产品只能进行报废处理,造成了不小的资源损耗。而现在有了大模型,则很大程度上降低了材料和产品的浪费。

再比如近日发布的蜜度文修智能校对大模型3.0版,就在出版业务的实际应用场景中给予从业者极大帮助。例如一本多达20万字的书稿,文修大模型仅需90秒即可完成校对工作,有效辅助编辑发现差错,而一段90分钟的视频,则仅需5分钟即可完成全流程的内容审核工作,显著提升了文本编辑领域的工作效率,也提高了媒体行业的整体生产力。

此外,极越汽车机器人基于百度大模型生态赋能,在高阶智驾方面提升了动静态检测、时序跟踪、实时建图、场景理解等能力,再度提升极越纯视觉高阶智驾能力上限,使得智能汽车真正具有了会思考、会反馈的“大脑”,从驾驶体验到安全保障方面都完整地强化了使用者的智能感受。

坚持自研,应对开发训练挑战

打开网易新闻 查看精彩图片

(图片来源:摄图网)

当前,大模型与AI技术仍处于中美科技竞争的焦点,我国在过去几年已经取得了惊人的进步,但未来仍面临一些发展困境。业内人士表示,我国在基础算法创新、底座大模型训练数据、公共算力占比等方面仍存在一定差距,需要尽快补足。

首先,要建成更加智能的大模型,应继续加大日常训练所需数据量,这里就需要更多的使用者参与度。实际上,“人”工智能的领域并不代表完全不需要“人”,恰恰相反,如前文所提及,在当今AI时代的开发前期,各种训练者和企业都能提供相当宝贵的数据,甚至广大用户也能为大模型上传足量的反馈结果,而这些都会影响到整个模型的最终精确度。也正因此,许多公司都主动开源自己的大模型,以便全民参与训练。

其次,应积极推动基础技术创新,用足够强大的硬件来支持大模型的研发、训练和生产运用环节,以此避免今后可能出现的技术瓶颈问题。这就需要科技型企业联合运营商,充分发挥云网融合优势,让更多的大模型“上云”,多方实时共享运算数据成果。此外,还需坚持不断夯实智算中心和数据实验室等硬件地基,使得大模型开发工作得到良好的数据支持。

最后,国产自研大模型工作不是闭门造车,更不能固步自封。要与友商及终端公司充分合作,互换训练数据成果,更要与国内外优秀人工智能企业保持交流,才能让国产大模型在保质保量的同时,积极走向世界市场。