从“赔本赚吆喝”到“赚钱”，AI应用离盈利越来越近|ai应用|kimi|大模型|模态|视频生成模型

巨头们通过降价甚至免费抢占生态制高点时，下游创业企业真的会因成本大幅下降而驶上发展的快车道吗？

服务成本骤降

AI应用赚钱成为可能

大模型降价，中小企业及AI应用开发企业将成为短期内最明显的受益者。

国内的中小企业及AI应用开发企业更多的是通过API接口调用大模型的算力。头部厂商宣布大模型降价，有点类似于网络运营商将流量费用降低，有利于下游企业对大模型应用的深入开发，这样一来就能够尽量避免企业在大模型底层硬件、软件层面的重复建设，推动整个行业向下游应用端发力。

早期受限于模型推理成本较高，AI应用普遍面临较大的成本压力。以OpenAI GPT 4 Turbo为例，其价格是：输入0.01美元/K token，输出0.03美元/K token，而一个汉字约等于2 个token。

假设用GPT4 Turbo总结一篇 5000 字的文章，生成的总结是500个汉字，则意味着输入输出成本合计0.01×输入 token 数/1000 + 0.03×输入 token 数/1000 = 0.13美元，也就是9毛钱。这样的“阅读理解”意味着用户每一次让AI应用帮忙总结一篇文章，平台方就需要烧掉1元左右的成本，每天都会有海量用户提出类似要求，可见对C端免费时，AI应用运营方压力有多大了。

无问芯穹发起人汪玉曾用公开数据做了一次针对算力成本数量级的测算，假设GPT-4Turbo每天要为10亿活跃用户提供服务，每年的算力成本可能超过两千亿，这还不包括模型训练的投入。

绝大多数创业者、初创企业很难负担这样的成本，即便是kimi这样的现象级应用，看似创造了“创业一年估值25亿美元”的奇迹，但其同样迫于成本压力推出打赏体系。据了解，礼物有“送Kimi一朵花（5.2元）”“给Kimi加鸡腿（9.99元）”“请Kimi喝咖啡（28.8元）”“给Kimi充充电（49.9元）”“请Kimi吃顿饭（99元）”“和Kimi一起登月（399元）”这6个选项，高峰期的优先使用权限天数分别为4天、8天、23天、40天、93天、365天。

对于打赏功能，月之暗面表示该业务目前在小范围灰度测试阶段，后续会对Kimi持续扩容和优化。除本身商业化需求外，通过打赏为用户提供差异化的服务，多少能降低kimi运营压力。

事实上，主打200万字长文本的Kimi并未对所有用户开放，普通用户只有20万字上下文窗口。根据目前输入1元/100万Tokens、输出2元/100万Tokens的成本推算，Kimi对普通用户提供的仅是20万汉字（不是20万Tokens）的上下文窗口，其成本仅需0.06元。用户的起步充值是5.20元，只能优先使用4天。那么，4天内用户如果没有消耗掉1733万汉字，Kimi就赚了。

无论是kimi还是其他商业模型，当下大模型近乎“免费”的降价极大地降低了其运维成本，一方面是在积累了一定用户量后，商业变现盈利成为可能，另一方面则是极大地降低了AI应用开发成本，大模型厂商有机会吸引更广泛的企业用户群体，从而进一步平衡收入和成本。此外，更多C端用户有望免费使用基础AI应用，庞大的访问量有助于企业进一步提升模型服务能力，完成良性循环。

低价还需优质

需要满足个性化的大模型

国内外巨头开启价格战的背后，2024年作为大模型商业化落地的元年，应用落地成为行业竞争焦点。阿里云智能集团公共云事业部总裁刘伟光曾公开表示，“AI推理的成本只有以每年10倍甚至百倍地下降，才能推动各行各业AI应用的爆发，预计未来大模型API的调用量会有成千上万倍增长。”

对开发者和企业而言，大模型大幅降价甚至免费，将很大程度解决大模型落地的成本问题，能够让开发者以更低的成本实现大模型在各个场景的落地，也加速了大模型技术的普及和商业化进程。

这样的大方向本身没有问题，但需要注意的是当下下游企业对于大模型的依赖度并不算高，基于不同大模型的特性，用户在不同的使用场景就会调取相应的模型，让大模型混用成为AI终端应用企业当下的状态。以金山WPS AI为例，其研发过程中，就轮流尝试了MiniMax、智谱A1、文心一言、商汤日日新、通义千问等大模型能力，通过了解各家大模型的优势来搭建自己的平台。

AI文档阅读分析工具司马阅创始人宗栗在接受《电脑报》采访时也明确表示——“我们司马阅聚焦精准处理各类文档（智能文档），为个人和企业提供AI文档分析、AI知识库服务，我们有自研核心底层技术，并结合了部分大模型能力，不过我们不过分依赖哪一个大模型，哪家好用就用哪家，价格还不是最主要因素。”

在提及“大模型降价有望带动终端应用的井喷，相当于应用端的初创企业能以极低的门槛进入市场，会对市场格局产生怎样的影响”时，宗栗表示“大模型降价可能带动终端应用的增多，是否井喷我倒认为不一定，关键还在于大模型技术本身的迭代升级，比如大模型的推理能力更强、幻觉更少、token限制更少……这才是能极大打开更多应用场景的关键因素。”

除了价格，下游应用企业更多关心的还是大模型特性同自身应用的契合度，从文档内容到影音图像，“一专多能”显然是最理想的大模型发展状态，可即便是巨头愿意付出“ 预训练成本 + 推理成本”，也需要足够的训练时间才能让大模型成长起来，大模型混用恐怕会在很长一段时间里成为下游AI应用的状态，而大模型和应用间的合纵连横也会频频发生。

不久之前，月之暗面（Moonshot AI）和字节跳动就正式宣布强强联合，Kimi智能助手的大模型将搭载进Coze扣子平台。这次跨界合作，将使Kimi智能助手得以触及更广泛的用户群体，并快速集成到更广泛的生态系统中，扣子作为开发平台，也能更方便地孵化多样化的AI应用。

感知用户情绪

多模态有望快速落地

随着大模型价格的持续走低，多模态技术的发展动力将进一步增强，推动AI解决方案在各个行业中的广泛应用，如OpenAI发布的GPT-4o模型能够接受文本、音频、图像和视频的任意组合作为输入，并生成相应的输出，这种多模态能力将在降价后的市场中得到更广泛地应用。

多模态AI结合了自然语言处理、计算机视觉、语音识别等多个领域的技术，具有更高的表征能力和智能化水平，能够应用于语言理解、图像识别、多模态推理等多个方面，进而颠覆终端市场消费者对AI应用的感受。

在虚拟助理系统中，用户可以使用语音、文本或手势与系统交互，如京东智能客服利用迁移学习、反向翻译和噪声处理等人工智能技术，注重利用多模态技术感知用户需求，不仅可以回答日常问题，还可以实时感知客户的情绪和需求。而阿里云推出的通义晓蜜产品提供一站式全渠道多模态的企业智能服务平台，统一接入电话、IM、视频等多种渠道，这种全渠道联络中心不仅提高了客户服务的效率，还确保了客户体验的一致性。

通义晓蜜具备自然语言处理和机器学习的能力，可以与用户进行智能对话，并提供各种信息和服务

然而，多模态应用也面临一些挑战。例如，有些用户反馈称，尽管多模态大模型在某些方面表现优异，但仍会出现错误和“幻觉”现象，而多模态系统想要在稳定性和准确性上得到优化，而无论是图像还是音频，多模态编码最终都会转换成token，这就需要大量的数据和强大的计算能力来支持。

期待超级应用的孵化

场景落地提速

“谁也甩不开谁，谁也拿不出杀手锏，降低推理成本、降低售价成了现在每一家的高优先级任务”。猎豹移动董事长兼CEO傅盛认为，大模型降价的目标不是为了用户直接使用，而是为了吸引开发者。

大模型厂商最大的价值就是得有用户使用，但问题是，用户需要应用层公司来链接，才能为大模型源源不断地提供训练语料。在训练大模型的过程中，需要计算和准备足够数量的高质量、多样性的Token，例如，BERT原始的training Tokens是0.4B，加入extend数据之后的training Tokens是5.4B。本轮大模型Tokens骤降价格之后，让终端应用企业在构建自己的大模型时“放开了”训练，进而有望在一些细分赛道孵化出类似kimi的现象级应用。

从这个角度来看，阿里、腾讯、百度一类既拥有算力基建、大模型又布局终端应用的企业，在孵化超级大模型的赛道上有着得天独厚的优势，“模型即服务”为这类巨头打开了新的商业模式。

以阿里为例，阿里云贴着开发者生态的场景需求，升级了AI Infra平台百炼2.0，百炼 2.0依托阿里云AI基础设施，同时对模型开发、应用开发和算力底座等工具进行了升级，引入更多模型，还率先兼容LlamaIndex等开源框架，企业可自由替换能力组件来适配自身系统。

而同时，阿里旗下大模型通义千问2.5，根据权威基准OpenCompass的测评结果，其得分追平了GPT-4 Turbo，成为AI应用市场上耀眼的明星。类似的还有百度AppBuilder、字节Coze等平台产品，通过生态的力量推动大模型应用的落地，随着大模型生态构建的完善，GPT、BERT等大模型架构，有望成为AIGC时代的“操作系统”。而Jasper、Waymark、月之暗面等AI公司就是基于它开发的应用，提供各种不同的AI生成能力，进而推动整个终端应用市场的变化。

除前面提到的电商服务领域外，医疗诊断是当下AI应用落地的重要赛道。AI大模型可参与到疾病筛查、医学影像分析、诊疗等工作当中，提升服务效率。在制药上AIGC主要在药品研发环节有所应用，药品研发涉及药物的探索、设计、临床研究等环节，AI可进行靶点的发现、药物的生成筛选、临床受试者筛选等工作。此外，AI还可以通过强大的数据分析能力提高医疗数字化的程度。

同时，在最容易变现的金融服务领域，AI大模型同样在智能客服、运营助手、信用评估等领域快速落地，如农行和工行分别上线鸟类ChatGPT的大模型应用ChatABC和基于昇腾AI的金融行业通用模型，华为也发布了四大AI创新解决方案，帮助金融客户构建安全、可靠、开放的AI数据基础设施，为企业及用户提供便利的同时也实现自身技术变现。

总体而言，性价比更高的大模型对整个AIGC应用端会带来长久而持续的优化，目前终端市场大量AIGC应用产品以聊天机器人为核心，以降低使用门槛、提高生产效率为目的，产品体验的提升高度依赖大模型性能优化。同时，大模型调用成本降低是AIGC商业模式成熟的前提。

AIGC产品的可变成本主要是大模型推理的算力消耗，与 API 调用成本呈正相关，大模型Tokens大幅降价有望驱动 AIGC产品价格下降，从而提升用户的付费渗透率，最终实现AIGC应用的变现和用户消费心智培养。