怎样的大模型才能真正成为企业持续发展的引擎,怎样的合作关系才是大模型时代的首选?

文|赵艳秋

编|游勇

“百模大战”的头部厂家,已进入生态战阶段。相比于大模型开发的技术比拼,生态战更是一个庞大繁复的体系之战。

业界认为,未来10年AI是最大的机会。但当下大模型在国内To C市场的应用和普及相比国外有不小差距,这也导致对大模型进化的整体催化不足。在To B市场,行业被大模型重塑已不可逆,但碍于大模型性能、算力、收益风险未知等因素,对大模型应用的投资、行业场景研究都不足。

如何推动行业生态和客户拥抱大模型,构建商业闭环,将大模型转化为生产力工具,是当下全球大模型竞争的关键。前一阶段,华为云与各行业中对场景有研究、手握丰富数据资源的伙伴,密集建立合作关系,开展联创。在11月22日举办的华为云盘古大模型主题论坛・深圳站上,华为云公布了其中一些合作的落地进展。

随着一些应用在未来一段时间的普及使用,业界认为将有阶段性里程碑出现。

华为云Marketing部部长董理斌在会议上系统化介绍了华为云盘古大模型生态体系。业界观察,盘古大模型生态也是一个有着明显行业属性的大模型生态,将在To B、To G市场中扮演开拓者角色。

01

“每个行业都有‘超脑’”

今年,在西部最大的一座变电站中,广州高新兴机器人与华为云联合攻关,商用落地了电力巡检机器人。这个变电站有1万多个巡检点位,其中包含数千个表计,人工巡检压力巨大。有些仪表离地面很远,人工巡检难度大。“工作量不小。”广州高新兴机器人董事长柏林告诉数智前线,巡检机器人将让人们从繁复的工作中解放出来。

之前不少变电站也有巡检机器人,受限于一些当时技术的发展,未能真正实现常态化巡检,经常需要人来保障机器人。大模型的出现,为机器人打开了能力跃迁之门,高新兴机器人与华为云携手,经过近一年的攻关打磨,解决了“长期稳定工作、快速部署”的问题。现在,高新兴正通过华为盘古大模型,来加速巡检机器人的智能进化

“机器人看似智能,但它的智能是人定义出来的。”柏林说,比如在落地部署时,就要对机器人进行精心调教,做大量配置,部署周期以半月计。“如果通过大模型,把任务下发到机器人,它能自动生成配置,就能降低落地成本。”柏林说,这也是当下大模型非常火热的领域——具身智能。

更复杂的运算往往都放在云端。巡检机器人怎么更懂行?巡检如何更高效?这些探索将非常有行业价值。“我更看重华为在行业上的理解力。”柏林说,他期望在电力行业与华为云盘古大模型展开深度合作。

大模型要靠用,一是人来用,一是机器人来用。机器人也在不断生成大量数据,既需要大模型给机器人AI赋能,同时也能反哺大模型,这样就能在电力领域逐渐形成行业超脑。”

在知识类大模型领域,11月22日,同方知网党委委员、副总经理柯春晓展示了与华为云联创的中华知识大模型(简称华知大模型)及其阶段性应用成果。此前,双方联合建立了人工智能联合创新实验室。

同方知网大数据知识管理事业部总经理周永告诉数智前线,华为云盘古大模型“不作诗,只做事”引起了他们的共鸣。“大模型不能只做参数,还要面向行业发展创新服务。”中华知识大模型是基于知网高质量语料+华为云盘古大模型的知识增强型大模型。

“围绕科研变革、技术创新需要打造自主可控的知识大模型。”周永说。知网拥有的科技文献、会议论文、研究报告、专利、标准等高质量语料和数据标注能力形成平台基础。

中华知识大模型支撑了AI科研助手、AI智能写作等应用场景落地。在此次发布前,已开始邀测。“我们发现客户试用体验需求量很大。”周永介绍,比如他们为某研究机构新能源汽车智联网的研究与落地调研,快速形成了上万字的报告,以往这需要一个团队长时间的资料收集分析。

现在,利用中华知识大模型,企业和科研单位在信息情报收集分析、数据挖掘、科学决策效率上有极大提升。

会议期间,从事企业知识智能管理服务的云问科技,也公布了最新进展。云问私有化知识模型基于华为云盘古大模型,在能源、工业、政务、金融行业,打造了企业级专属大模型。

云问科技联合创始人茆传羽告诉数智前线,云问科技为某大型工业集团做了数字员工项目。如今,在这家企业通讯录中有了20多位数字员工,它们分属HR、财务、IT运维、产品助手等岗位。员工遇到相关问题,可向这些数字员工提问咨询。

云问科技也为某机构做了应急处置项目,当相关人员遇到某类突发事件,可根据智能助手提供的建议,着手进行处理。

不过,大模型仍有幻觉问题,它每次对知识处理的数量级也比较有限。茆传羽告诉数智前线,如果这几个问题被逐步解决,大模型对企业知识管理会有颠覆性改变。“知识生产、加工将变得特别简单,知识的消费形式会变得更多样,比如用数字员工替换人工的一些环节,企业知识管理就能真正被用起来。”

更多的行业场景在被发掘,更多的大模型落地应用也被展现。

在花卉之乡云南,云南省农业科学院花卉研究所在国产花卉新品种、新技术和标准数上位居首位。年轻的花卉研究所助理研究员、生物科学工程博士金春莲与团队,联合华为云,基于盘古大模型,打造了花卉AI育种大模型

专注于Social领域自主创新商业大模型“SocialGPT”的数说故事,与华为云盘古大模型联合共建了“社媒实时大模型”,探索社媒营销与舆情感知的“未来式”。

网智天元用千亿高质量实时金融大数据,结合华为云盘古大模型,通过千亿规模时序知识图谱打造大模型行业底座,建设金融行业的大模型基础设施

加推与华为云合作,共研企业销售大模型。而用AI来实现销售,是不少企业的真切需求。

在论坛的签约环节,华为云还与东信云、慧科集团、易路、加推、汉得信息、云楼科技、玄武云等7家客户、伙伴进行了合作签约。未来,大家将基于昇腾AI云服务和盘古大模型进行联合创新,进入更多行业,打造专属大模型。

02

“一个比较完备的生态”

不少伙伴选择华为云盘古大模型,是看重它“比较完备的生态体系”。“它从底层算力到上层大模型,包括前端积累的一些场景,相对来说可以形成一个闭环。”茆传羽说。

尤其今年AI算力极度紧张,一位互联网算力平台负责人称,业界整体面临算力从哪来的问题。根据相关数据统计, 未来10年AI算力将增长500倍。虽然行业早有“百芯大战”之说,但不少伙伴坦承,当下华为云昇腾AI云服务,几乎是企业在GPU算力之外,唯一可用的替代。

今年9月,华为云在贵安、乌兰察布、芜湖3大AI云算力中心,上线了昇腾AI云服务,对外提供服务。

软通动力华为云智能服务总经理魏建勋接触的很多企业,对昇腾AI云服务有实实在在的需求。“华为云在加紧迭代,而业界期望它更快。”魏建勋认为,底层的昇腾AI云服务与上层的大模型是软硬一体的,经过打磨和适配,对计算效率提升有差异化竞争力。

除了底层算力,大模型生态的开放性,也是伙伴重点考量的。

“我们创业公司考虑生态合作,首先得考虑大厂对我们这块业务的态度。”茆传羽告诉数智前线,“如果大厂什么都想自己做,连产品应用都想全部吃掉,肯定我们是不愿意的。”

当华为云推出盘古大模型5+N+X三层解耦架构时,包括5个基础大模型、N个行业大模型以及X个细化场景的模型,茆传羽关注到,华为云特别强调了分层解耦和行业模型的概念,这是一个开放合作的框架,他认为这很重要。

业界一些人士认为、华为云盘古大模型并未强调今年的热点——生成式大模型,但茆传羽认为,大模型并不一定要纠结于技术概念,应该考虑这个理念是不是方便伙伴做行业落地

“5+N+X是从落地性和行业应用性角度进行了整体规划。”云问科技也通过微调,在自己专注的企业知识智能管理领域,推出了专属模型。

魏建勋也观察到,在最初一些大市场政务、煤炭、气象等推出行业大模型后,华为云正进一步联合或推动伙伴,在更多行业细分市场做专业化模型,来进一步赢得行业市场空间。他称,这也是大模型行业化必走的路。

“我更看重华为在行业上的理解力和穿透力。”柏林告诉数智前线,2022年,华为成立了电力数字化军团,它在电力行业提供的方案从过去偏重于ICT,转变为偏重于系统级解决方案,助力行业数智化转型。“这很不一样,现在要做电力的‘超脑’。”柏林说。

在与华为云合作探索中,柏林认为,要干好电力行业智能化运维这件事,离不开大模型的加持,如华为云有预测大模型,可对故障诊断预测,高新兴要与华为云联创机器人,还涉及NLP、CV、多模态大模型等,解决机器人繁琐的配置部署问题,以及像人一样的交互及任务分解和执行问题。这一过程中,懂行很重要。

柏林还看重安全性。“大模型涉及行业安全,一旦操作出了问题或被黑了怎么办?”柏林说,不少行业大模型不能出内网,如果训练了它,却泄露了情报,这是行业不允许的。“华为有硬件,有通信网络,现在大模型是跑在上面的软件,这有一个天然的可信任。”他透露,下一步与华为云的合作,也期望与包括欧拉操作系统在内的技术合作。

在11月22日的华为云盘古大模型主题论坛・深圳站上,华为云Marketing部部长董理斌介绍了华为云以盘古大模型为核心,持续全栈技术创新向下,有昇腾AI云服务为企业提供AI算力;向上,以联创方式进行场景创新,激发丰富的解决方案

在全栈技术的基础之上,华为云提出3大全流程工具链、2种应用模式(API直接调用、定制联创)、1个全域协同生态体系、1个全球化推广策略。这涉及算力、模型、工具链、三类伙伴、社区、云商店,以及全球化。

魏建勋注意到,华为云正在快速开放API服务,并在持续调优中。华为云昇腾AI云服务百模千态专区已经上线,包括了Llama、Llama2、GLM、百川等,预计年底会有50多款业界主流的开源大模型上线。“模型、API、插件的进展,都是大家非常关注的。”魏建勋介绍。

云问科技今年已将自己的AI产品迁移到华为昇腾平台上,当时做了不少工作。而在这次推出的工具链中,也有算力调优工具链,昇腾AI云服务已沉淀1400多个高性能算子,“现在,深层的适配越来越好,迁移的工作量也会降下来。”

03

演进中的生态

一位企业管理软件资深人士最近与农业、电子以及供应链行业客户探讨大模型的应用。“我们发现这里的空间非常大,在很多点上可以提高效率,这种提高甚至不是线性的,可能是指数级的。”他告诉数智前线。

但现实的情况是,业界在行业场景上的研究投入还很不够,比如供应链哪些环节可以用、怎么用?针对医疗、教育行业属性,大模型该做些什么?

“我看到很少的有实力的厂商去梳理,我们在实际研究中也遇到了不少困难。这导致目前大模型落地,似乎集中在两类场景上:一类是智能客服,另一类是文案和图片生成。”这种应用现状,与国外差距很大。

为什么大家不去投入行业场景?这其中有大模型的性能演进,也有投入产出、收益风险未知的因素,“现在这是生态中比较困难的地方”。

国内C端的应用还不成熟,对大模型进化的整体催化还不足,也导致整个市场对大模型应用的投资都不足。”茆传羽对数智前线说,“企业端对于大模型落地也有很多限制,包括算力不足,企业投资预算有限。”茆传羽希望国内客户和大厂,能给创新项目更多空间。

茆传羽也建议华为云可发布一些他们判断比较核心的场景,大家一起来共创。“比如华为云可以举办一些比赛,发布场景,让大家都知道这个行业大概的方向。”茆传羽认为这些场景对伙伴会很有价值,“因为我相信华为发布的场景肯定是基于客户需求判断的”。

在场景的研发中,现在业界探索多于实际落地。“不要太概念化地去理解大模型。”柏林说,他期望围绕电力行业跑通华为的行业云+大模型+机器人,这样就可以复制到其他行业。因此,现在合作不仅仅是探索,要更具象化,“完成几个规定动作”

我们期望有阶段性的里程碑出来,做好用、易用、实用的机器人一直是我们的产品理念。”柏林对大模型有着期待,他期望大模型实现降本增效,比如部署成本降低了,实用性变高了,也更好用了,这是可以量化出商业价值的

除了对场景的开拓,大模型底层技术也要随之进化,毕竟场景的创新,离不开大模型能力的支撑。比如幻觉问题的解决,大模型在训练技术和成本上的变革。

“我们很多甲方客户的算力不足。”茆传羽说,除了算力的进一步加速支持外,大模型能否在更小的算力要求上运行、推理甚至训练?能否在尽可能小的算力消耗上跑出更大参数量的模型来?

不少伙伴提到了高质量数据,期望华为云利用自身的生态影响力,开放出更多的行业高质量的数据集。伙伴也在思考一些模式,共同贡献出一部分开放性数据,积少成多,实现共赢。

“2023年接近尾声,回顾这一年,最大的行业热点莫过于大模型。相信大家都在思考,怎样的大模型才能真正成为企业持续发展的引擎,怎样的合作关系才是大模型时代的首选。”董理斌说。观察华为云盘古大模型在ToB、ToG市场的动作,也将给业界带来启发。

在会议中,董理斌介绍了华为云盘古大模型在一些行业市场的进展。如在政务领域,今年7月华为云发布了盘古政务大模型,在与深圳福田区的联合实践中,让盘古政务大模型获得了升级,未来可在多地推广。

深圳福田政数局基于盘古大模型,对福田区超过20万条政务数据进行精调,复杂事项政务问答准确率超过95%。在城市治理方面,华为云将摄像头、充电桩、燃气表等城市上百类感知源每天产生的几千PB数据,接入到盘古大模型,通过NLP与CV大模型的多模态融合训练,不仅能发现事件,还能理解事件,将城市治理的效率提升50%

在这一过程中,华为云联合具备行业Know-how的伙伴一起,实现大模型的适配优化、交付实施、辅助运营、咨询与集成,解决大模型交付难的问题。此外,伙伴将自身的解决方案组件,与盘古政务大模型衍生的L2场景化模型集成,让大模型快速与应用场景结合,实现城市政务全流程智能化。

这次会议中,华为云也发布了基于盘古大模型打造的三大基础解决方案,以及AI出海计划,AI算力服务、盘古自然语言、视觉、多模态、科学计算、预测等大模型能力,以及调优的开源大模型将陆续部署到海外节点。

实际上,不少伙伴也提及了出海。比如,云问科技在2022年4月在香港成立公司,目的是与华为云一起出海。软通动力已开始与华为云在海外展开一些合作。几乎所有伙伴都表示,要做全球市场,先要在国内把产品打磨好。

而如何在toB和toG市场上,将场景与大模型结合,做深做透,实现价值,将是华为云及伙伴在行业市场上不断开拓的方向。