随着数字经济的蓬勃发展,大模型产业的持续升温,算力产业进入高速发展的新阶段,并成为推动经济社会发展的关键要素。为打破地域限制,实现算力资源优化配置和高效利用,同时推动数字经济与实体经济深度融合,为国家治理体系和治理能力现代化提供有力支撑,推动全国一体化算力网建设是重中之重。

早在2021年,我国就已经开始规划东数西算工程,并于2022年初正式启动。今年的政府工作报告则明确提出,适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。

在这个过程中,人工智能云厂商也在迎来更多的机遇。

6月21日,在由21世纪经济报道、21世纪新质生产力研究院主办的“高端智库看新质生产力之一体化算力建设闭门研讨会”上,百度智能云混合云生态合作总监余晨认为,随着人工智能技术的发展,全国算力一体化建设也更加精细。由于场景模型算法的固定,带来算力解决方案的个性化。

余晨还指出,在全国一体化算力网的趋势下,作为投入人工智能技术超过10年的头部的科技企业,百度在芯片、框架、模型、应用四层有全栈布局,成为全球为数不多的全栈布局的人工智能公司。与此同时,百度智能云手握场景、数据与客户,也正在迎来前所未有的新机遇。

围绕场景展开算力网

2022年2月“东数西算”工程正式启动。至今随着各部门持续推进对算力协同、算力租赁等一体化调度方面的完善工作,以“东数西算”为代表的跨区域数据流动和应用正加速渗透到各类场景中。

在此过程中,“东数西算”工程在全国层面对算网相关基础设施,如数据中心间的跨地域和跨网络交互、算力统筹和智能调度等,通过系统化统筹实现相关能力提升。不过,随着大模型技术的持续演进,全国算力网建设也迎来了新的趋势。

围绕主场景形成算力一张网,从而实现效率与商业化的能力,便是其中之一。“算力一张网需要分场景,在基础层面是互联的,但落归到真实的场景训练中,可能是一张大网中有许多小网。”余晨表示。

余晨认为,在过去人工智能应用过程中,算力、存储、网络等基础设施均会影响兼容性参数,但由于场景不固定,导致算网存的集群效应不明显,也很难出现商业化的杀手锏应用。“大家都是你建你的,我建我的,但集群之间如果配置不合适,集群性能反倒会大幅下降,从而影响商业化应用。”

这个问题由于过去场景过于松散而并未被有效关注,业界对于底层基础设施也从未进行精细化运营。但近一年来,由于国家层面的推动及产业链上下游合作伙伴的共同努力,围绕场景进行精细化运营开始成为趋势。

余晨指出,在当前算力互联互通的大背景下,异构算力解决方案参与方会开始提供相应的标准化接口,算力解决方案也开始能够围绕不同场景、模型及推理训练而变。“我们设想的是,后续随着算力与算法的融合,能够针对不同场景进行算力等基础设施的交互与互联,同时以主要场景出发形成算力一张网。”

与此同时,余晨还关注到,当前存储、算力、网络的融合也来到了可能的爆发节点。原因有二:其一在于,当前用户终端侧已形成了重点场景,其二在于,考虑到当前算力仍是基础设施主要成本项,存储与网络资源也应随之而动,形成“贴身服务”,因此存算网融合的方案更容易、也更精细地纳入算力一体化中。

云厂商的机会空间

目前我国一体化算力体系建设正高速推进,涉及到不同的区域与上中下游产业链,带来了巨大的发展和投资空间。

在“东数西算”工程正式推出前后,国内包括云服务商、超算中心、通信运营商在内的多个产业链角色,已经在围绕西部区域或一线城市周边,逐渐建设相关数据中心或智算中心并推动应用落地。

作为人工智能云厂商,百度也正在迎来前所未有的新机遇。据介绍,目前百度自建机房分别落地在阳泉、保定定兴、徐水、北京亦庄等地,相应主要为“文心一言”、百度搜索、移动生态业务等自有业务提供算力支持。

不过在参与全国一体化算力网的过程中,百度也有侧重。余晨介绍称,百度的优势在于手握场景、数据和客户。目前底层基础设施中百度拥有自研的“昆仑芯”同时也愿意与设备厂商、IDC厂商深化合作形成一云多芯的开放算力平台,从而更有效地服务客户定制化场景需求。

“我们把客户的需求带过来,与上下游产业合作伙伴共同提供更具性价比、更高效的算力解决方案,与上下游紧密联动,将业务需求与硬件配置、技术能力进行有效结合。”余晨表示。

相较于底层基础设施而言,包括模型层、框架层在内的中间层则是以百度为代表的云厂商所具备的优势。“我们线上跑的客户都是几万台、几十万台的集群,他们在业务运行过程中如何使用算力、后续如何维护等,其实对异构云管平台提出了更高的要求,”余晨指出,“这不光是资源的管理调度,更是与上层业务的呼应,这一层云厂商有大量积累。”

在框架层,百度手握自主可控的飞桨平台;在模型层,百度则拥有包括以文心大模型为基础的各类行业大模型。这也意味着,投入人工智能超过十年的百度,在芯片、框架、模型、应用四层有全栈布局,在关键核心技术攻坚上,百度是全球为数不多的全栈布局的人工智能公司,在四层架构都有自主研发的领先产品和技术,因此可以进行端到端的优化,迅速提升大模型训练和推理的效率。

“从去年开始,我们在模型层也可以更多地参与到全国一张网的算力建设中,得益于大模型在整个技术架构和方向性的突破,我们依靠大模型能力,在接触客户业务的过程中也更能够凸显出优势。”余晨表示。

据介绍,目前百度搭建了一套混合云方案,可以满足全国异地、异网、异构条件下的算力网络体系建设。从底层资源纳管、调度、再到大模型能力提供、以及基于大模型之上,构建所需模型和应用的一套完整工具链体系,是百度在云边端分布式网络资源管理上做的探索。

这一切最终将落归于应用。“作为云厂商,我们要保持对各个行业的敬畏之心,深入到每个行业中,与各个行业龙头企业研究与分析,在整个芯片层、框架层和模型层趋于技术统一的背景下,更好地去服务各个行业的应用。”余晨表示。