上海大模型从业者为何要去北京这条马路多走走？|上海市|人工智能|北京市|大模型从业者|算法|语料库

摘要：拥抱瞬息万变的大模型产业，需要“诚心诚意、真金白银、扬长补短”。

从年头到年尾“高质量语料短缺”始终是讨论人工智能大模型时的热点议题。临近年末，业界对“解题之道”似乎已有推进结果。

在12月5日举行的2024科创大会“‘模速’赋能空间共塑”分论坛上，在AI大模型的关键三要素“算力、算法、数据”层面，三个领域的代表企业围绕今年政府工作报告中提到的“加快发展新质生产力”提出了一番真知灼见。

高质量语料比“高质量人类”更难培育？

当天论坛上发布了来自上海库帕思科技有限公司的“库帕思语料终端”及其联合体，华为、商汤、兆芯、联想、东海、浪潮信息等行业头部企业成为首批成员。

大模型的“语料”，广义上理解就是人们常说的“数据”。但在库帕思首席执行官黄海清看来，眼下，大模型语料领域面临诸多行业挑战，具体可总结为“行业没标准、安全没保障、生态不协同、部署太复杂、技术不解渴、语料低质量”。

挑战纷繁复杂，但并非无解。尤其针对“语料质量低”这一大模型领域日渐“老生常谈”的问题，黄海清把英文“VALID有效的”拆解为“Vividness鲜活度”“Authenticity真实性”“Large Sample大样本”“Integrity完整性”“Diversity多样性”以及“High Density Knowledge高知识密度”，从行业角度为高质量语料进行了定义。

不过，如何同时解决六大挑战，就不只是下定义这么简单。当天发布的库帕思语料终端“小库”是全国首个语料终端产品，其标准版使用场景可满足200人并发使用的部门级应用需求，旗舰版一个机架则能容纳4个终端，同时满足1500并发的企业级应用需求。

不仅如此，“小库”的模型区还配置了“书生”“千问”“商汤日日新”“阶跃”“智谱”等几乎当下所有最主流的基础大模型。语料区则包含了行业垂类语料库、向量数据库和语料加工工具。算力区囊括了来自壁仞、天数、寒武纪、华为、登临、燧原、沐曦、阵量等主流算力供应商的服务。

“语料终端的诞生，是希望为‘0-1’阶段的种子企业挨过最艰难的时期，与‘1-3’发展阶段的灯塔用户共同打磨产品，最终为‘3到无限大’发展阶段的各类企业服务，让大模型真正实现赋能千行百业的愿景。”黄海清说。

算力和算法“代表”怎么看

华院计算技术（上海）股份有限公司董事长宣晓华最近观察到，大模型领域一系列算法创新正在为不同行业提升效率添砖加瓦。例如，语言领域的智能问答已经是走在最前列的大模型应用场景；医疗领域的辅助诊断也有大模型广泛应用的身影。

相比之下，工业领域的大模型应用相对滞后，原因在于传统工业的数字化尚显不足，其本身又对知识水平有较高要求。

在探索工业领域大模型应用的过程中，宣晓华梳理出算法研究领域目前存在的挑战。最明显的就是如何把“大”模型“变小”，用尽量小的算力成本，生成最有效率的大模型应用。这一议题目前是国内外业界共同关注的焦点。

事实上，不仅传统企业、AI初创企业关注如何降低大模型的研发成本，头部企业同样关注成本控制。商汤科技联合创始人、大装置事业群总裁杨帆表示，无论是算力、算法还是语料数据，降低研发成本、少走弯路都需要很强的专业能力在背后供给。

“最近有人问我，如果时间倒退至五年前，作为国内最大整机厂商，我们是否会选择做芯片，答案或许还是坚持我们当时的选择，专注做整机。”浪潮集团副总裁郭强表示，目前市面上常见的算力来源包括先进算力、合规算力以及国产自主可控的芯片产品。三种算力多元共存，衍生出算力出海、算力入关、算力购买等不同的应用模式。

在大模型行业总体欣欣向荣的趋势下，作为算力企业的代表，郭强也提出了几点建议。

其一是大模型企业应坚持“发展”和“底线”两种思维，了解自己应该生成怎样的大模型应用，来支撑当下我国的数字化转型战略，同时兼顾技术的自主可控。其二是当数据的作用和能量越来越大，企业应该把80%以上的精力放在非算力上，不要盲目扩大算力支出。其三是选择算力时，应当综合考虑性价比，包括能耗、稳定性、安全性等，“持有算力设备和用好手中的算力，其实是两码事。”

大模型社区重塑区域产业空间

过去人们会问，“为何没有互联网大厂在上海。”如今这个问题似乎开始“过时”。

圆桌讨论环节，主持人在介绍全国首个大模型创新生态社区“模速空间”一年多来的建设成果时，上海大模型生态发展有限公司（模速空间）总经理陈海慈现场“校准”了数据：目前，模速空间三期总计交付3万平方米，集聚104家大模型企业，上海通过备案上线的34款大模型中，模速空间所在的徐汇区占到了22个，占比高达65%。

记者发现，过去一年来，每隔一段时间参与此类科技论坛，模速空间的“成绩单”都有动态变化的增量，侧面反映出大模型产业的发展速度。在陈海慈看来，拥抱瞬息万变的大模型产业，徐汇区和模速空间的具体举措可用“诚心诚意、真金白银、扬长补短”来概括。

“本周，模速空间就将发放完毕今年第三批算力补贴，今年累计已达1亿元；预计到四季度结束，全年为入驻企业发放的算力补贴将达1.5亿元。”陈海慈表示，北京、上海和深圳被视为中国三大“大模型之城”，其中上海正用“真金白银”的算力补贴支持大模型产业发展。在此过程中，上海正积极发挥在营商环境、市场环境、金融中心建设等方面的优势，规模达225亿元的上海三大先导产业人工智能母基金已于今年8月正式落地徐汇区。

“上海的大模型行业从业者可以经常去北京的中关村东路走走，那里集聚了清华、北大、人大，是创新浓度高度集聚的地方。”陈海慈说。

在创新策源力上“补短”，上海已经迈开了步子。眼下，包括上海人工智能实验室、国家人工智能学院、上海交通大学人工智能学院等高校和新型研发机构均已落地徐汇区。上述机构均位于模速空间15分钟车程之内，助力模速空间打造垂直向的高浓度创新容器。

当天论坛现场，徐汇区还同步启动了“科创绣带”系列项目，其中包括了“央视听媒体大模型体育技战术分析系统”、大模型语料“超级工厂”等一批新项目。记者了解到，未来，徐汇区将整合科创成果、机构、人才、资金等资源，提供更优质的成果转化全周期服务。

上海大模型从业者为何要去北京这条马路多走走？

热搜

热门跟贴