火山引擎入局大模型之战，却为何不走寻常路？|大模型|方舟|火山引擎|百川|算法

导语：

火山引擎以一种新的姿态加入了大模型赛道的竞争，那就是基于开放的大模型服务平台模式。

可以想见的是，目前已经有如此多的企业聚焦大模型，可以说在供给侧，未来的大模型能力会和水、电、煤一样俯拾皆是。

所以，对于用户来说，不用担心没有大模型可用，反而要担心如何解决选择困难症；而对于大模型企业来说，要担心的则是推广难、获客难。

而火山引擎推出的“火山方舟”大模型服务平台，不仅为诸多大模型提供了渠道、服务链路和平台，也非常适合企业采用轻量级、多尝试、易解耦的策略，广泛的尝试多家大模型提供商不同的大模型服务，让时间和实践成为最后选择的指导，让大模型生态更加自然而健康的生长。

1. 火山引擎&大模型，另一种形态的爆发

时间进入炎热的7月，大模型赛道的热度仿佛叠加了气温，更加的炙手可热。

既有王兴接盘自己老队友的初创大模型企业这样的业内轶事，也有6月28日V-Tech体验创新科技峰会上，火山引擎推出名为“火山方舟”的大模型服务平台的重磅行业新闻。

不过笔者发现，很多读者在激动之下，很容易犯一个错误——把大模型和大模型服务平台弄混。

大模型和大模型服务平台，完全是两码事。

前者好比是一块CPU或GPU，解决的是一个核心部件的功能、性能问题；后者好比是一个商城，在这里你可以选择不同的模型以及相关的精调、评测、推理等一整套服务。

一个强大的零部件和一套完整的服务，商业价值上有巨大的差距。

比如在数字时代里，虽然我们每个人理论上都拥有一块或几块CPU，乃至我们的每一次触碰和点击，都要用到CPU。但是实际生活中，我们都是通过使用iPhone这样的整机来间接的使用CPU的。

所以某种程度上，一个解决方案的完全体，比核心零部件提供商的商业想象空间更高——全球CPU霸主英特尔的市值是1300亿美金，炙手可热的GPU霸主英伟达的市值是1万亿美金。

但苹果公司的市值却是3万亿美金。

说回这次火山方舟的发布——其实，火山引擎在今年的春季Force原动力大会上就明确表示不会做大模型了，解答了“不做什么”的问题。

而这次火山方舟的发布，解答了“做什么”的问题。

简而言之，就是火山引擎发布的大模型服务平台“火山方舟”，它面向企业提供模型精调、评测、推理等全方位的平台服务（MaaS，即Model-as-a-Service）。

它最大的特点，就是把各家的百花齐放、各具特色的大模型，集合到自家的平台上，基于独特的多模型架构，让应用企业可同步体验、尝试、应用多个大模型，进而选用更适合自身业务需要的模型组合。

仅仅在邀请测试阶段，火山方舟就集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。

某种程度上，这等于把这七家企业的大模型，一下子提速到了马上可以落地应用的阶段，大模型服务平台的产业价值，也骤然彰显。

2. 头部赛道的差异化打法

虽然在6月28日这天，火山引擎并没有推出自研的大模型，但就凭火山方舟的创新服务模式，火山引擎成为了目前国内大模型赛道的最大变量之一，把自己拉到了中国“模型即服务”的第一阵营。

作为全球AI唯二的创新源地，国内目前的大模型赛道可谓“群模乱舞”，但能够进入第一阵营的只有区区几家而已。

例如阿里巴巴，它在中国云计算市场上仍然处于头部优势地位，而“模型即服务”也属于广义云服务的范畴。

由于长达十几年的云计算研发、运营经验，和AI、BigData、cloud三者融合的必然趋势，阿里巴巴在云计算相关的软硬件上都做了广泛深入的投资，技术底蕴雄厚，例如其大模型基于阿里云、达摩院打造的硬件优势，可将大模型所需算力大幅度压缩。

另外，阿里全自研的底层技术优势，也非常有利于构建AI服务的统一底层，这些都属于战略级而非战术级的优势；阿里的通义千问，也是国内第二家发布的生成式大模型。所以可以说，阿里目前已经可以基于自身大模型，向市场提供实际落地的大模型服务。

百度也不可不提。作为国内AI研发的正规军之一，百度应该是国内最早投入AI研发的互联网企业，多年累积投入千亿以上，生态建设全面。包括有深度学习框架—飞桨，有非常适合产生AI的业务——搜索……以及国内首发的生成式大模型——文心一言及其云服务模型“文心千帆”等。

火山引擎总裁谭待并不否认这些头部企业的优势，他指出，目前国内大模型市场的最顶层，还将是几家超级平台支撑的超级大模型并存的格局，这种存在是不可否认的。

图：火山引擎总裁谭待

那么，火山引擎作为相对的后来人，它的战略设计有何独特之处？

在笔者看来，火山引擎的打法，就是坚定走自己“多云多模型”的路，而不是跟着别人的节奏起舞。

所以我们看到，虽然火山引擎不直接做大模型，但通过为大模型企业提供AI基础设施，国内几十家做大模型的企业，多数已经在火山引擎的云上。

又比如，由于大量的服务于大模型企业，也使得火山引擎针对大模型的服务支撑不断强化，并打造了深层次的软硬件一体化能力，如火山引擎的自研DPU，将通信优化的算法直接写到网卡硬件中，以降低延迟、削减拥塞等。

如是的类似技术细节还有很多，但笔者认为，真正关键的不仅仅在于火山引擎的技术，还有它为大模型赛道设计的独特模式和竞争策略。

3. 多云多模型和1+N

从AI到大模型，从大模型到大模型商业化落地，其中最大的堵点，主要不是技术问题，而是商业模式问题。

Chatgpt出现之前，各家企业的AI商业化落地，都磕磕绊绊。其实最大的问题，是没有让用户看到价值，同时也不容易让用户感受到价值。

Chatgpt出现后，大家都对AI的价值看的很清楚了，但问题是，什么样的商业模式才能迅速让大模型的优势得以发挥。

这就涉及到对大模型应用模式的底层逻辑判断。

而谭待告诉笔者，他认为未来大模型应用最核心的两个特征，是“多云多模型”和“1+N”。

所谓的多云多模型，指的是——未来的企业会同时选择不同层次的多个模型和多家企业的云服务，来解决不同层次的问题。

“未来大模型赛道的格局，会是少数几家超级模型+一部分通用大模型+很多垂直领域的细分模型”，谭待说：“这就和企业用工一样，不是所有的问题都要博士毕业的员工才能解决，博士干博士的活儿、硕士、本专科生也都根据自己的能力干力所能及的工作，才是一个相对的最优解。所以未来的大模型赛道也会是，一个企业会同时用到多种模型和多种功能。”

但模型又并不是越多越好，过多的模型增加了试错的成本，增加了技术的复杂性，所以火山引擎的判断是，未来较大的可能是，一个企业选择一个主要的大模型作为主干，同时选择多个专用模型解决不同的问题，也就是“1+N”。

无论是哪一种模式，都面临一个底层逻辑——火山方舟这样的大模型服务平台，要能提供尽可能多的选择、组合，同时提供高水平的服务。

我们可以从用户和大模型提供商的角度，来看这种服务逻辑的优点。

先从对大模型用户的突出优点来看。

第一个优点，是可以快速的“试穿试用”。

火山方舟目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等，未来可想而知的还会集成更多的大模型提供商。在火山方舟的统一支撑下，企业可以灵活选择、低成本试错，不用跨平台就能寻找更适合自己企业的模型服务。

第二个优点，是获得与模型提供商一致的服务。

火山方舟的“模型精调”模式，就是一个实用价值很高的服务。

火山引擎智能算法负责人吴迪指出，从短期看，训练大模型很昂贵，但是从长期看，模型的推理开销会超过训练开销。