记者 宋笛
豆包即将新增付费订阅方案的消息引起了一次围绕AI大模型商业模式的广泛讨论。
大模型不仅是一项新的技术,也是一个新的产品。在大模型取得突破的4年后,市场仍在不断探索这个“产品”的商业边界和盈利模式。日益高昂的算力投入让这种探索更为急迫。
大模型到底应该怎么盈利?它和互联网经济有和不同?是否应该采用同样的“免费策略”来完成商业化?
就此,经济观察报专访了美国未来产业研究院创始人乔.韦曼,他在2012年首次提出“云经济学”这一概念,还曾在AT&T、惠普和贝尔实验室等企业担任过高管。产业经历让乔.韦曼更关注AI的如何赋能产业、AI如何推进商业化以及传统企业的AI转型。
今年乔.韦曼发布了《颠覆性与有趣的科技:人工智能》报告。乔.韦曼提出了人工智能经济学的几个新范式,包括:AI时代,单位工作成本层面人力持续上升、机器成本不断下降;机器系统在能力、效率、可靠性等维度正超越人力;AI具备可规模化、低波动、零疲劳优势,且能通过持续学习自主优化。
乔.韦曼说,目前AI主要有几种商业模式,第一种是直接付费:按Token计费或订阅制付费,重要工作用前沿模型,简单任务用低成本模型;第二种是广告支持模式,即优先展示广告商赞助的结果;第三种是生态捆绑模式,比如谷歌愿意提供免费(以及付费)的AI服务以留住用户。
乔.韦曼说:“所有的商业模式本质上都一样:你必须卖出一些东西。有一句话很经典‘如果你不付费,那你就是产品’。如果用了大量免费服务,这些免费服务总要面临一个‘清算时刻’”。
|对话|
经济观察报:数据规模对大模型的性能很重要,但在商业领域,大模型的客户规模是否同样重要?
乔.韦曼:这个问题很复杂,让我以自动驾驶举个例子。AI非常聪明,但AI无法预见每一种可能的场景,目前还不具备人类处理“边缘情况”的通用能力——也就是那99%正常高速驾驶之外的极端情况。比如一架飞机突然发生故障,迫降在你前方的高速公路上。“天哪!这种情况我该怎么办?”在这个例子里,客户规模就至关重要,因为执行全自动驾驶的AI是从所有客户的驾驶数据中学习的,客户规模足够大,意味着能够更多覆盖这“1%”的情况。
在商业角度,客户规模同样重要。对企业来讲,使用者越多,就越能发现问题、降低单位成本。对于大公司,还有一个优势:它们在整个产业链上下游都有布局,可以实现垂直整合。现在,大型AI公司也在整个产业链上下游布局,包括自己设计芯片、设计云基础设施、提供多类服务。
有个词汇被用来描述这种现象,叫“极致协同设计”,大型AI公司能够在所有层面做这种协同设计,因为他们知道新的AI模型训练算法是什么样的,因此可以专门设计芯片来执行这种训练。
经济观察报:与用户规模相关的是付费模式,目前开源模型大部分是免费的,但也有一些规模非常大的模型开始尝试收费,你认为AI模型在C端的商业模式可能是什么?
乔.韦曼:所有的商业模式本质上都一样:你必须卖出一些东西。有一句话很经典“如果你不付费,那你就是产品”。如果我为某项在线服务付费,那就是正常的商业关系。但我也用了大量免费服务,这些免费服务总要面临一个“清算时刻”。
现在有几种主要模式。第一种是直接付费:按使用的Token付费,重要的工作用前沿模型,简单任务用低成本模型。
第二种是广告支持模式。这个延续了搜索的思路,搜索服务是免费的,但返回的结果里包含付费广告。现在很多大模型的提供商也开始在结果中植入广告。有学术研究表明,你以为你的大模型在为你的最佳利益服务,但实际上它的回答并不是最优答案,取决于谁在赞助它。
第三种是生态捆绑模式。一些大企业为了让用户留在生态中,会免费提供大模型,这里赚一点,那里亏一点,整体算下来还是值的。
谷歌是一个典型案例,用户用谷歌做大部分事情,Gmail、谷歌地图、Gemini,谷歌从搜索广告中赚了足够多的钱,所以愿意提供免费AI,让客户留在生态中。中国也有“超级App”,比如微信,这类“超级App”也可以把AI服务打包进入生态,保持整个生态的吸引力。
经济观察报:和搜索服务不同的是,随着AI智能体的出现,AI是有可能变成最终执行人的,这意味着大模型领域的广告可能不只是广告,而会变成真实的购买行为,这会带来什么变化?
乔.韦曼:回顾商业历史,数千年前消费者来到市集,摊主打招呼、介绍商品,消费者自己做决定买什么。一百三十年前出现了购物目录,消费者翻目录、做决定,然后通过电话下单;在互联网时代,互联网提供了大量商品,但最终还是消费者来决定。
现在出现了两个层次的变化。第一是AI赋能搜索,即所谓的GEO(生成式体验优化),搜索结果不再只是一堆链接,而是经过AI综合处理后的答案,比如“以下是三个优质供应商”之类。第二个更大的变化是智能体。它可能会帮消费者做出决定。
这意味着这个智能体要非常可信:它要足够了解你。理想中的AI是你的经纪人或者配偶一样了解你,比如知道你喜欢棉质衣物而非人造纤维,知道你的尺码,知道你上次买的衣服过紧。同时,它还要能代表你的利益,值得信任。
这个智能体可以通过类似A2A(Agent-to-Agent) 或MCP这样的技术协议和商家的智能体进行一系列复杂的博弈和沟通:是什么品牌、在卖什么、值得信任吗、有哪些尺码、何时交货?
在理想情况下,我有一个始终维护我最佳利益的智能体,我可以放手让它在我睡觉的时候做所有决定。但如果这个智能体实际上是某家公司的代理、而那家公司接了广告商的钱,那就变成了商家的代理,而不是我的代理。这情况下,消费者没有能力评估何时可以信任这个免费的、有广告的智能服务。
经济观察报:你提到的信任问题很关键,从这一点出发,你认为如何形成你所说的智能体之间的博弈和制衡?如何建立一个更合理的商业模式,能够有效地形成这种博弈,保护消费者的权益?
乔.韦曼:这里有两个问题:一是我们能否信任智能体,二是智能体之间沟通与协商的动态机制是什么。
对于第一个问题,创造性与可预测性之间存在张力。如果智能体不遵循硬编码的程序逻辑,而是依赖LLM(大语言模型),那就意味着智能体的行为从根本上说是不可预测的。然而,创造性正是智能体(无论是人类智能体还是AI智能体)的一个优点。如果你让一个旅行代理为你购买从纽约到北京的机票,它可能不是你通常乘坐的航班,但人类旅行代理这样做可能有其理由,比如里程奖励,或者增加您转机成功的可能性。
在软件智能体中,人们正在使用多种方法来降低出现不良结果的可能性,例如使用“harness”(驾驭工程)和文档化的规则。我们一提到智能体总会想到龙虾,但这些相同的技术也被用于全自动驾驶。例如,NVIDIA的Halos端到端架构使用深度学习系统,将摄像头等传感器融合输入转化为对转向、加速和制动系统的指令。然而,对于不可预测的边缘情况,系统会默认回退到可预测的逻辑。通过这种方式,像飞机降落在高速公路上这样的意外情况也能得到处理。
最终,这些可信智能体将与我们如何将权力委托给可信赖的人类(如房地产经纪人、律师)并无不同。我们不了解合同或房屋价值的细节,我们只是信任我们雇佣的个人是有能力的,并且是在为我们代理。经济学家称之为“委托-代理”关系。
然而,如果双方的利益发生偏离,就会出现问题。例如,一个欠别人钱的房地产经纪人可能会接受一个很低的房屋报价,仅仅是为了尽快成交从而更早拿到佣金。事实上,如果智能体受到其创建者的某种影响或“腐蚀”,例如AI智能体开发者得到了某个广告商的赞助,或者遭受网络攻击(如提示注入攻击),同样可能出现这种潜在问题。
此外,独立协商的智能体将面临与博弈论中任何抽象参与者相同的困境,例如囚徒困境——这不是AI的问题,简单的纸上游戏也会导致囚徒困境。
因此,如果两个自主智能体代表两个人类行事,可能会出现三个问题:一是基于代理失当的委托-代理关系缺陷;二是由于“创造性”导致的、虽是对代理请求的合理回应但委托人事后反思并不偏好;三是由于选项本身的特性而导致次优结果的博弈论问题。
解决的方法会非常复杂,我认为简短的答案是:第三方在影响行为方面发挥着作用。如果一个智能体持续表现不佳,独立的评测机构或社交媒体上的第三方评论会有助于将不良行为者排除出系统。
经济观察报:互联网的一个特点是,随着用户增长,产品的边际成本会下降,甚至变得可以忽略不计。这使得移动互联网能够通过“免费”服务在短时间内吸引海量用户,从而获得压倒性的竞争优势。然而,AI面临某些刚性的成本约束,比如Token,使得通过规模效应降低成本变得困难,这种特性是否会催生AI采取与互联网完全不同的商业模式?
乔.韦曼:这个问题中包含的假设不一定成立。我认为“AI”与“互联网”非常相似。两者都有很高的固定成本,在很多情况下,成本的类别完全相同。对于互联网而言,建设有线和移动网络需要巨大的固定成本,例如:挖沟铺设光缆、建造手机信号塔和回传网络、发射卫星、建立互联“会面点”机房、内容分发网络等。对于AI训练来说,建设千兆级数据中心需要巨大的固定成本,包括昂贵的计算设备、建筑、供电和冷却系统。两者的边际成本都极低。对于互联网,发送一个比特的边际成本接近于零,对于AI,处理一个Token的边际成本也接近于零。客户可以拥有自己的边缘基础设施,比如家庭Wi-Fi路由器,或者本地LLM或智能体。
成本趋势也相似:随着同一基础设施(如光纤电缆)采用密集波分复用等技术从现有设施中“榨取更多”容量,发送比特的成本一直在下降;而推理成本也因针对推理优化的计算架构以及混合专家模型和微型递归模型等高效方法而大幅下降。两者都受益于规模效应,包括统计复用效应,因为你发送电子邮件的时间可能与我不同,我们可以共享网络基础设施;同样,你请求推理的时间可能与我不同,我们可以共享AI基础设施。
当然,两者之间既有明显也有微妙的差异。目前,高端AI设备的折旧、过时周期远短于许多通信设备。每一次AI推理往往都是独特的,因为即使相同的问题,基于上下文窗口等因素也可能给出不同的答案。每封电子邮件也是独特的,但对于缓存内容(如TikTok视频),有些内容是相同的(针对特定设备上特定分辨率的单一版本),而另一些则是不同的(从视频服务器到用户设备的单播流)。
一个关键区别在于两个行业所处的发展阶段,特别是在发展可行且可持续的商业模式方面。谷歌的创始人最初避免广告,认为提供赞助结果会降低PageRank算法提供的纯粹答案的质量。最终,风险投资和商业经济的残酷现实迫使他们开始销售广告。同样,OpenAI的CEO Sam Altman多年来坚决反对广告,但最近却被迫在ChatGPT中引入广告。
事实是,无论固定资本投资与持续运营支出之间的平衡如何,企业都需要收入。这些收入必须来自用户、广告商、相关服务等。没有“免费”的服务,如果某项服务对消费者免费,那就意味着消费者就是“产品”。因此,无论是互联网服务还是AI服务,要么需要“支付”——通过订阅、按使用量/按Token付费、观看广告、点击跳转、免费增值模式,或者通过使用公司其他相关服务。
经济观察报:目前我们看到市场中的AI商业模型是否能够支撑如此庞大的资本开支?这些成本的开支未来将会如何反映在AI使用成本中,并塑造AI使用的场景和方式?
乔.韦曼:就AI而言,大量投资分布在多家公司之间,这些公司拥有不同的现金水平和获取债务融资的能力,这进一步分散了风险。尽管有一些知名的初创公司即将进行IPO,但许多参与者是资金充裕的超大规模云服务商,它们有能力进行大额投资,而且拥有强大的相关业务,这些业务将从AI应用中受益。
所以,问题本质是:会有人愿意为AI付费吗?答案显然是肯定的,因为AI能为企业和用户带来好处,例如通过增强产品来增加收入,或者通过提高生产率来降低成本。
因此,为AI付费具有正的投资回报率,我们已经看到大量消费者和企业正在为AI付费,或者使用由广告商“买单”的“免费”服务。
此外,从成本方面看,随着技术进步和学习曲线效应的显现,AI公司能够以更少的投入做更多的事情。DeepSeek就是一个完美的例子,但绝非唯一。推理成本不仅是在下降,而且是以巨大的指数级速度下降。
经济观察报:目前AI存在泡沫吗?
乔.韦曼:投资者对某只股票的操作可能与未来现金流的理论模型有关,也可能无关。铁路和互联网公司都曾经出现过泡沫,然而现在我们拥有无处不在的通信基础设施和互联网。因此,展望未来,AI将变得越来越好,同时成本越来越低,这将进一步加速使用量的增长。人们和企业为手机付费,为交通付费,为工厂设备付费等等,他们也会以某种方式为AI付费。
话虽如此,在AI上过度支出并非明智的商业举措。一些企业激励员工“最大化”Token使用量,这个过程被戏称为“Token内卷”(Token maxxing)。他们设置“排行榜”来显示谁在使用最多Token方面获胜。坦率地说,我不理解这一点。你不会去最大化电力、水或原材料的使用。明智的企业应该希望最小化资源使用,同时最大化利润以及产生这些利润的产出。
我们现在看到了一些反弹,因为那些公司意识到“等一下”,我们不想最大化资源使用,而是希望更明智地使用资源,以优化公司的财务业绩。
热门跟贴