每经记者:杨弃非 每经编辑:杨欢
图片来源:摄图网_402624474
短短一年时间,国内大模型从“百模大战”,到如今被认为格局渐成。而“牌桌”上仅剩“大模型五虎”和互联网大厂等少数“牌手”。越来越多的人开始发问,有关大模型竞争的“下半场”是否正在逼近?
在今日(9月19日)由成都市政府港澳办主办的“智汇天府AI启航”蓉港澳三地交流活动上,电子科技大学(深圳)高等研究院执行院长汤志伟在接受《每日经济新闻》记者采访时,对此论断的态度显得较为谨慎。在他看来,从技术上讲,现有大模型并不够成熟、且仍在快速发展,相关技术还需要不断创新,难论“下半场”的出现。
但反观应用层面,一些改变确实正在发生。“前期更多出现的是通用大模型,无所不能,但缺乏深度无法满足具体需求。因为预期缺少回报,市场对通用大模型的投资越来越谨慎,但同时越来越看好在具体领域的发展,因此,所谓‘下半场’的重心应该在垂直大模型,比如医疗、教育、交通或者某个制造业垂类。”而在他看来,这也将是我国在大模型领域能够快速产生价值的重要方向。
垂直领域大模型是我国优势所在
自ChatGPT3.5问世以来,国产大模型层出不穷,有人统计,至少有300余个国产大模型已对外发布。但从话题度上看,似乎尚未出现绝对超越ChatGPT的国产大模型。
汤志伟指出,在通用大模型领域,美国优势较为明显,我国还处于跟随和学习阶段。但在垂直大模型领域,因为我国场景更加丰富,有助于对大模型进行垂直场景训练,更好地促进大模型的性能评估和部署落地。
他格外强调“实体经济”的价值。“大模型最终目的是要为大家解决实际问题,它不仅要能推动经济转型,还要能带来收益。因此,应用场景对于大模型来说十分重要。因为我国非常强调实体经济和数字经济的深度融合发展,且实体经济是我国的强项,因此,在这一点上,我国拥有其他国家难以比拟的优势。”
向垂直大模型深入,也有助于解决企业智能化改造过程中面临的成本问题。
汤志伟特别提到了去年国内的“百模大战”。在他看来,通用大模型领域,主要仍需靠世界级的顶尖龙头企业进行突破,并向外开源共享。
而对于大部分面向行业细分应用场景的小型公司来说,无须重走高成本研发的道路,更多资源可以投向训练垂直大模型,使其能符合企业独特的发展需要。从这个意义上说,不同企业能开发出大量的行业垂直大模型。这一思路能降低企业使用大模型的成本,政府也应出台相应政策鼓励这类行业垂直大模型的开发。
垂直大模型的发展还将推动国内大模型行业形成新的格局。在今天活动上,来自港澳的专家均提到对于推进与成都在人工智能领域的科研和产业合作的期望,大模型也是双方关注的焦点。
如汤志伟所说,基于超算中心的平台优势,成都算力水平在全国名列前茅,而成都万亿级电子信息产业中,不少环节与人工智能发展紧密相关,多所高校也为当地积累了大量电子信息领域的人才。更重要的一点是,不同于港澳金融服务业的比较优势,成都在发展实体经济上明显更胜一筹,双方合作可以推动大模型的快速发展。
提升算力需整体性思路
但同时,大模型发展也面临多重掣肘。
无论是通用大模型还是垂直大模型,都需要强大算力支撑。而汤志伟提到,尤其是我国芯片面临“卡脖子”以后,算力资源的获得难度进一步增大。目前,国内已经有公司进行科技攻关和市场转化,提升算力供给能力,但一来其与国外相比差距仍然不小,二来也需要进一步提升芯片性能、降低价格,让更多实体经济企业“用得起、用得上”。
而在聚焦解决芯片“卡脖子”问题的基础上,他还提醒,要注意整个生态的完善。
“计算芯片不是孤立的,与之相关的还有相应的软硬件驱动、软件开发框架、操作系统、数据库、硬件环境等关键技术。”他指出,目前,我国对各环节的突破并不同步,部分器件不匹配当下所需,而各环节之间也存在不匹配的问题。因此,即便相关芯片单看性能或许已经接近甚至达到国际一流水平,但生态缺失导致整体效应和系统效应不足,很多环节还是以进口为主。
这还可能造成一种“恶性循环”。如汤志伟分析,通过数十年的使用,这些主要依赖进口的环节得以创新迭代并实现发展,相比之下,国产化环节则刚起步,同样需要经历创新迭代的过程。我们在环境“倒逼”下可能缩短周期,但无论如何要“先用起来”。
总而言之,软硬件驱动、软件开发框架、操作系统、数据库和其他硬件环节的突破也应同步推进。而若放在信创产业下来讲,同样需要一种整体性的思路,“现在是部分局部问题解决了,但只有整体问题解决了,才能算是真正解决问题。”
而当谈及国产大模型的迭代时,汤志伟还提到数据方面的难点。他指出,大量高质量训练数据是提升大模型准确性和广泛适用性的关键因素。我们在准备高质量数据的时候,既要保证数据本身的准确性,还要考虑数据的多样性和代表性。这样才能更好地消除大模型普遍存在的偏见问题。
在国家“数据二十条”基础上,2024年1月,国家数据局出台的《“数据要素×”三年行动计划(2024—2026年)》明确提出了数据要素的放大、叠加、倍增作用,以及带动数据要素高质量供给、合规高效流通,这为各行各业的发展提供了坚实的数据政策支持。汤志伟认为,这对于我国数据规模和质量的提升均将起到重要作用,也将是推动大模型快速发展的又一关键利好。
热门跟贴