群“模”之战如火如荼　自研能力是取胜之钥|人工智能|大模型|自研能力

（记者安子修）日前，在2024上海世界移动通信大会（MWC上海）上，华为展示了通信大模型的最新突破。作为当前我国数字领域的真正核心，大模型训练工作一直是数字领域热门议题，许多科技型企业都投身到这场群“模”之战中。

大模型，也称基础模型，是指具有大量参数和复杂结构的机器学习模型，其智能程度决定了最终产品的“聪明”与否。因此，坚持推动大模型的自主研发、训练工作，有助于促进其质量迭代升级，并拉动整个人工智能领域相关产业的协同发展。

群“模”之战如火如荼

让我们把时间的指针拨回2022年末，ChatGPT的横空出世，带动了成百上千个大模型如雨后春笋般涌现，随后开启“群模”乱战，应用产品数量井喷：阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo；零一万物发布千亿参数规模的Yi-Large闭源大模型；OpenAI发布了迄今最像“人”的AI大模型GPT-4o；谷歌召开开发者大会，全线更新Gemini；就在同一天，字节跳动发布了包括多模态大模型在内的豆包大模型家族……

除了大模型的数量呈迅猛增长态势外，其开发者、训练者的量级也在持续不断增加中，这实际上侧面反映了我国人工智能领域有着充足的人力资源储备。如科大讯飞推出的讯飞星火大模型，其开发者生态目前正加速增长，生态开发者数量从598万增至702万，海外开发者数量从34万增至40万，大模型开发者数量从39万增至57万。

此外，统计数据显示，2023年我国人工智能核心产业规模为5784亿元，增速达13.9%，可见群“模”之战对产业的推动作用之巨大。而在表面的营收数据外，大模型训练也拉动了上游产业的优化迭代：只有更加科学、智能的终端设备才能承载大模型的投产实践，这也是其另一重积极意义。例如大模型数据的实体载体——芯片，就得到了持续发展。据《2024-2029年中国半导体材料专题研究及发展前景预测评估报告》显示，2023年我国半导体材料市场规模约979亿元，而2024年内预计最终将达1011亿元。

大模型应用范围不断拓展

随着大模型训练的不断持续进行，以及适配于各个产业进行深度融合实践，如今的大模型应用，早已不再局限于ChatGPT的文本问答形式，而是真正地运用智能化的优势，影响着人们现有的生产方式。

例如，由海尔集团旗下的工业互联网平台卡奥斯自主研发的专业大模型——卡奥斯天智工业大模型，正在积极影响着生产车间的工作效率。在模具工厂的注塑车间，技术人员只需通过AI助手给大模型下达生产口令，大模型便能够根据口令调取数百个工艺参数，并自动指挥车间内的注塑机开始工作，仅需几十秒就能完成单个产品的注塑过程，而产品之间的所产生的误差也不超过头发丝的粗细。据悉，像这样的产品生产过程，如果交由工艺师来进行人工处理，如此数百个参数，光调试就需要去掉1个多小时。更重要的是，如今大模型的引入也降低了调试成本。车间的负责人表示，在过去，由人工生产出来的不合格产品只能进行报废处理，造成了不小的资源损耗。而现在有了大模型，则很大程度上降低了材料和产品的浪费。

再比如近日发布的蜜度文修智能校对大模型3.0版，就在出版业务的实际应用场景中给予从业者极大帮助。例如一本多达20万字的书稿，文修大模型仅需90秒即可完成校对工作，有效辅助编辑发现差错，而一段90分钟的视频，则仅需5分钟即可完成全流程的内容审核工作，显著提升了文本编辑领域的工作效率，也提高了媒体行业的整体生产力。

此外，极越汽车机器人基于百度大模型生态赋能，在高阶智驾方面提升了动静态检测、时序跟踪、实时建图、场景理解等能力，再度提升极越纯视觉高阶智驾能力上限，使得智能汽车真正具有了会思考、会反馈的“大脑”，从驾驶体验到安全保障方面都完整地强化了使用者的智能感受。

坚持自研，应对开发训练挑战

（图片来源：摄图网）

当前，大模型与AI技术仍处于中美科技竞争的焦点，我国在过去几年已经取得了惊人的进步，但未来仍面临一些发展困境。业内人士表示，我国在基础算法创新、底座大模型训练数据、公共算力占比等方面仍存在一定差距，需要尽快补足。

首先，要建成更加智能的大模型，应继续加大日常训练所需数据量，这里就需要更多的使用者参与度。实际上，“人”工智能的领域并不代表完全不需要“人”，恰恰相反，如前文所提及，在当今AI时代的开发前期，各种训练者和企业都能提供相当宝贵的数据，甚至广大用户也能为大模型上传足量的反馈结果，而这些都会影响到整个模型的最终精确度。也正因此，许多公司都主动开源自己的大模型，以便全民参与训练。

其次，应积极推动基础技术创新，用足够强大的硬件来支持大模型的研发、训练和生产运用环节，以此避免今后可能出现的技术瓶颈问题。这就需要科技型企业联合运营商，充分发挥云网融合优势，让更多的大模型“上云”，多方实时共享运算数据成果。此外，还需坚持不断夯实智算中心和数据实验室等硬件地基，使得大模型开发工作得到良好的数据支持。

最后，国产自研大模型工作不是闭门造车，更不能固步自封。要与友商及终端公司充分合作，互换训练数据成果，更要与国内外优秀人工智能企业保持交流，才能让国产大模型在保质保量的同时，积极走向世界市场。