21世纪经济报道记者 赵娜 上海报道

“非常荣幸,在基流创业的成长路上有众多良师益友的鼎力相助,使基流有机会参与建设超级系统,有机会见证中国通用人工智能落地。”基流科技CEO胡效赫感慨地说。

胡效赫毕业于清华大学,师从李军研究员,曾在网络安全实验室做了十年高性能网络系统研究。作为访问学者赴加州大学伯克利分校期间,他师从于Scott Shenker院士,后者是SDN网络的提出者。

专注大规模计算机系统的建设,是胡效赫创业之初就定下的目标。今天基流科技正在开发的,正是针对人工智能设计的分布式GPU系统,也被称为算力集群。

近期的访谈中,胡效赫透露,创业一年半以来,基流科技建设了国内最大的私有化单体算力集群。

光速光合在今年年初完成对基流科技的Pre-A轮领投。“AI大模型的快速发展,对高性能算力的诉求日益增加,但大规模集群算力搭建壁垒高。”光速光合合伙人朱嘉道出看好基流科技的原因,即,国内目前有千卡以上大规模集群搭建技术能力的团队已很少,“基流科技作为中大型算力集群的解决方案提供商,累计建设和调优十余个集群,拥有万卡集群落地经验,这在国内非常稀缺。”

打造高算力超级系统

1967年,IBM公司计算机架构师吉恩·阿姆达尔提出一个经验公式,表明系统性能提升的潜力受到系统中可并行化部分的限制,即使并行处理器的数量无限增加,整体性能提升的上限也受到很大程度的制约。

简单来说,算力集群的计算速度并不能随着GPU数量的增长而无限叠加,就像1个人10天可以盖一栋房子,10个人只需要1天,但100个人仍然需要1天的时间——其他90个人可能因为挤不进工地只能闲着。

训练大模型也是这样。据Gartner的报告, GPT-3.5的训练过程中,使用了由一万个英伟达A100 GPU组成的高性能算力集群,在GPT-4上则提高到了约25000个A100 GPU,但其算力利用率仅为32%至36%,算力浪费严重。

基流科技的工作就是设计出一套系统,能够组织几千人,甚至上万人尽可能快地盖好更多房子。

胡效赫表示,基流科技的产品主要面向三个维度,包括算力管控调度平台、算力调优运维平台和高速互联硬件。目前,公司除了整套算力集群建设解决方案外,在集群管理、计算引擎和高速网络三个层次上都进行了产品化并有逐步落地,帮助AI企业将GPU合理地组织起来,并尽可能地提高交付效率和 GPU利用率。

目前,基流科技的算力集群方案可以为GPU集群提升超20%的性能,帮助客户在千卡环境中节省成本上千万元,在万卡环境中节省数亿元。

超前布局千亿市场

在人工智能爆发的时代,算力的重要性不亚于工业时代的煤炭和石油。在数字化时代,在互联网上传输的是信息流,是算力对数据进行粗加工后的结构化抽象;在智能时代,在互联网上传输的是智能流,是算力对数据进行深度加工与精炼后的模型化抽象。

但算力和算力之间也是有区别的。胡效赫提到,基于传统互联网服务对算力的需求,和人工智能对算力的需求之间有很大的差别,因此需要重新设计网络架构,相关技术还处于初级阶段,在分布式计算、可扩展性甚至硬件方面还有很大的想象空间。

在他看来,“人工智能在我们看来是一个十年、二十年的发展机遇,算力基础设施和模型的发展都才刚刚开始,市场认知会在一段时间后慢慢收敛、统一。”

根据信通院测算的结果,2022年我国计算设备算力总规模达到302 EFlops,全球占比约为33%,连续两年增速超过50%,高于全球增速。智能算力需求呈现爆发式增长态势,在算力规模中的比重将越来越高,未来五年复合增长率达52.3%。

对算力的巨大需求造就了急速膨胀的市场规模。IDC数据显示,2022年中国数据中心服务市场规模达1293.5亿元人民币,预计2027年市场规模将突破3000亿元,其中用于推理的服务器的市场份额将达到62.2%,市场规模预计突破1800亿元。

走向通用人工智能

随着算力市场的爆发式增长,基流科技将发展的重点放在了项目的具体落地上,积极参与中大型计算集群的建设和运维,尝试将前期积累的工具变成更标准化的产品,同时探索国产化硬件适配和出海。

朱嘉关注到,基流科技主打的基于开放生态的高性能算力网络系统已具备高性能和低综合成本的优势。公司成立仅一年多,产品就获得多家落地客户的验证,发展速度很快。

“AI算力比拼的不光是单卡、单GPU芯片的能力,AI算力的核心背后体现的是由GPU形成的网络集群能力。基流科技的产品可以使一个大规模的计算集群能高效地运营,解决GPU算力上的瓶颈问题。”他表示,期待公司能不断迭代成长,成为全球AI最重要的基础设施提供商。

记者了解到,在基流科技成立的一年半的时间里,项目已落地一线厂商生产环境,为多个数据中心进行算力集群的设计、建设、调优和运维,服务包括智谱AI、商汤科技、银盾云、世纪互联等厂商累计多个千卡到万卡的算力集群,同时也推出了十万卡的解决方案。

“做科研需要我们沿着一个大方向,在关键点上进行突破;创业也要寻找一个大方向,在领域内建立自己的优势,拿出企业需要的解决方案和产品。”在胡效赫看来,无论是科研还是创业,“‘Talk is cheap,Show me the code’才是最重要的。”

谈及未来,他说,基流科技将沿着高性能算力网络方向砥砺前行,支持国产大模型落地,与国内头部大模型厂商一起走入通用人工智能时代。