麻了！大模型的不可能三角

AI全球总部

2024-10-11 18:49 ·北京

在业界，有个著名的“不可能三角”

甲方乙方都懂的

想要又便宜又快又好的

那就只能做梦了

巧了，今天又看到一个

【大模型的不可能三角】

嘿嘿，风光无限的大模型

也逃不过三角形魔咒呀

成本指的是企业大模型落地的整体费用，包括大模型的训练成本、推理成本以及部署、运维和升级成本等。

企业有时仅关注有形成本：例如GPU购置费用、消耗的电费，或从第三方服务商购买模型服务的费用；而会忽略无形成本：包括为实现大模型服务而配置的人力成本，以及大模型在部署、训练或调试阶段消耗的时间成本等。

核算成本时，需要考量总持有成本，特别是不要忽略无形成本。按成本从高到低，一般为深度研发大模型、微调、RAG、提示词工程、直接调用。

效果指的是大模型生成内容的质量，包括内容的准确性，是否存在幻觉问题，或是否会生成不合适的内容。

大模型效果可以基于“3H”原则进行评价：1）Helpful：内容可用有帮助，不要废话连篇、泛泛而谈；2）Harmless：内容合规无害处，符合伦理规范和监管要求；3）Honest：内容正确无幻觉，不要一本正经地胡说八道，甚至给出错误信息。

通常来说，大模型的参数规模越大，生成效果越好。因此，当业务需求对生成内容质量要求严苛时，应尽量选择参数规模更大的模型。

此外，目前市场上主流商业化模型的效果，大多优于同期同参数规模的开源模型。

性能指的是大模型服务的速度，包括大模型的训练速度，推理时的响应速度、生成速度等。

一般而言，大模型的参数规模越大，则需要的训练时间越长，即训练速度越慢，而其进行推理服务时的需求响应速度和内容生成速度也越慢。

因此，大模型的效果和性能不可兼得，当成本固定时，大模型的选择主要是在效果和性能之间进行平衡和取舍。对于性能要求较高而对效果有一定容忍度的场景，可以选择参数规模相对较小的大模型。

来源：GenAI技术落地白皮书

当然，这个三角很好

让痴迷大模型的甲方们认清现实

更加理性的去选择大模型落地路径

在成本、效果、性能间进行权衡和取舍

这三角不是我杜撰出来的

来自于我今天刚刚读到的一份报告

《GenAI技术落地白皮书》

新鲜出炉，干货不少

这份白皮书是阿里云研究院出品的

但几乎没有夹带任何“私货”

更没有吹自家的通义大模型多NB

而是站在客观立场，从企业视角出发

讲述大模型在企业落地的关键点

包括“选-育-用”三段论

基本上，做好这三步

企业的大模型，就算没白上

比如：在选择阶段

如何评估各种技术路线

如何权衡不可能三角

比如：在培育阶段

如何利用提示词工程、RAG、微调

来进行大模型工程化适配

每种方式的优劣和成本如何考量

比如：在使用阶段

企业的基础设施该如何建设

业务流程如何升级

GenAI时代的DevOps如何运转

大模型的安全与合规问题如何保障

总之，这份白皮书，站在企业视角

从大模型选择、适配、优化、业务整合

再到基础设施搭建、开发运维、模型安全

覆盖了整个生命周期

给出了很多真知灼见

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴