·在产业化背景下,模型并非越大越好,模型越大能力越强,但使用成本也更高。因此从企业角度讲,要在满足一定效果之下尽可能降低成本。大模型价格降低有利于产业普及和推广,如果价格低于企业实际成本将扰乱市场。大模型企业应通过技术提升降成本,而不是仅仅为了占领市场。

5月21日,阿里云宣布通义千问GPT-4级主力模型Qwen-Long降价,输入价格从0.02元/千 tokens降至0.0005元/千 tokens,直降97%。降价后,1元最多购买200万tokens。这似乎是在回应上周字节跳动掀起的价格战。

一元钱可能买不到一个包子,但可以创作10000条350字的小红书文案,或是让模型读三本《三国演义》。国内大模型已从参数规模、性能指标“卷”到了token价格,从以分计价发展到以厘计价。

社交平台Soul首席技术官陶明日前在接受澎湃科技(www.thepaper.cn)记者采访时表示,To B市场的游戏规则一直没有改变,大模型“卷”价格是必然,哪家便宜就薅哪家的羊毛。卷完价格就会卷服务,卷完服务市场格局基本形成,模型效果好、价格低、服务好的企业就会胜出。

北京智源人工智能研究院院长王仲远则认为,大模型卷价格是一把双刃剑,价格降低有利于产业普及和推广,但如果价格低于企业实际成本,将扰乱市场。他建议大模型企业通过技术提升和改革降低成本,而不是仅仅为了占领市场而降价。

打开网易新闻 查看精彩图片

大模型计费单价。

大模型价格进入“厘时代”

在大模型中,token代表模型可以理解和生成的最小意义单位,可以是一个词、一个数字或一个标点符号等,它将原始的自然语言文本转换为模型可以处理的形式。对于中文文本来说,1个token通常对应1.5-1.8个汉字;对于英文文本来说,1个token通常对应3-4个字母。不同大模型企业的token计量并不完全统一。

大模型B端应用可以按调用量收费,按照调用量定价的大模型又可以分为token计费以及按照查询次数收费。例如MiniMax的abab6.5s大模型价格0.01元/千tokens,谷歌轻量化模型Gemini 1.5 Flash提供0.35美元每百万tokens。百川智能Baichuan2-Turbo模型调用价格为0.008元/千tokens,Baichuan2-53B在00:00-8:00的价格为0.01元/千tokens,8:00-24:00的价格为0.02元/千tokens。

打开网易新闻 查看精彩图片

百川智能通用大模型调用价格说明。

当前,国内大模型已从参数规模、性能指标“卷”到了token价格,大模型掀起价格战。

打开网易新闻 查看精彩图片

通义千问降价。

在通义千问之前,5月15日,字节跳动推出豆包大模型家族的当日宣布,豆包主力模型在企业市场的定价只有0.0008元/千 tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。以豆包通用模型pro-32k版为例,模型推理输入价格仅为0.0008元/千 tokens。火山引擎是字节跳动旗下云服务平台,火山引擎表示,市面上同规格模型的定价一般为0.12元/千 tokens,是豆包模型价格的150倍。根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万tokens,大约是200万个汉字,相当于三本《三国演义》。

火山引擎总裁谭待表示,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。大模型“卷”价格,将助力企业以更低成本加速业务创新。

就在谭待发布上述态度的4天前,国内另一家大模型公司智谱AI(即北京智谱华章科技有限公司)宣布,其大模型开放平台部署有智谱大模型全家桶,新注册用户赠送额度从500万tokens提升至2500万tokens,其中包含2000万入门级额度和500万企业级额度。个人版/入门版GLM-3 Turbo模型调用价格由5元/百万tokens降为1元/百万tokens,相当于0.001元/千 tokens,而0.001元就相当于1厘。使用入门级大模型创作10000条350字的小红书文案,仅需大约1元。

游戏规则从未改变

“To B市场最开始卷排名、卷打榜、卷模型规模,到后来卷价格。”针对当前的大模型价格战,Soul首席技术官陶明对澎湃科技(www.thepaper.cn)表示,相对于C端发现用户需求进而开发和完善产品,To B市场的游戏规则一直没有改变,大模型“卷”价格是必然,“B端市场从来没有形成付费的良好习惯,哪家便宜就薅哪家的羊毛,最终搞得大家都不赚钱,就像云计算,你不降价,客户就会跟着别人跑。”

在陶明看来,去年上半年,大模型行业还是蓝海,如今已是红海。B端市场将大模型视作提质增效的生产力工具,大企业的资源更丰富,打价格战卷的是行业里的中小企业。

他认为,B端市场的下一步是卷模型服务。B端市场的一个痛点是面向不同客户,服务难以标准化。“如果一个B端客户向大模型企业提出一个需求,大模型企业需要几个月的响应时间,这是难以容忍的。卷完价格卷服务,也许会出现带着团队和机器驻场部署,提供VIP服务。卷完服务,市场格局基本形成,模型效果好、价格低、服务好的企业就会胜出,落后的企业就没有什么机会了。”

“我们看到最近各个大模型厂商在发布时都开始卷单价了,火山引擎的价格大幅降低,对于推动产业化有非常大的促进作用。”王仲远表示,中国用户数量庞大、场景多样,有利于国产大模型生存和发展,促进AI行业繁荣。但大模型卷价格是一把双刃剑,价格降低有利于产业普及和推广,但如果价格低于企业实际成本,将扰乱市场。他建议大模型企业通过技术提升和改革降低成本,而不是仅仅为了占领市场而降价。

价格战背后的模型演变

在王仲远看来,未来大模型行业会往两个方向发展,一是最顶尖的大模型。AI研究者都在追逐圣杯——AGI(通用人工智能),顶尖大模型的算力、数据、参数量还会进一步扩大。二是大模型能够改变各行各业,但在产业化背景下,模型并非越大越好,模型越大能力越强,但使用成本也更高,因此从企业角度讲,最重要的是在满足一定效果之下尽可能降低成本。

王仲远表示,越来越多的企业利用技术将模型做成小规模并达到同样水平的能力,一些国产大模型用千亿级参数就能逼近OpenAI万亿参数的GPT-4的水平。“如果将来能够在AI手机或AI PC(AI电脑)上运用,那么参数量还需进一步压缩,所以像十亿级别的参数模型,如果性能能够尽可能逼近GPT-4,有可能使用效果会更好。”

“降价的基本逻辑是,我们有信心用技术手段降低成本,市场也需要更低价的大模型。”谭待表示。模型结构、训练方法可以持续改进,业界关注的MoE(混合专家模型)就是优化推理成本的解决方案。工程上,大模型的调用量越大,优化推理成本的空间也越大。以前的模型采用单机推理,大模型采用分布式推理,如果能把各种各样的底层算力用得更好,推理成本就会大大降低。

陶明表示,降低推理成本一方面涉及算力,拿到更便宜的芯片有利于降低成本,另一方面,模型框架层面的优化也可以降低成本,例如工程上优化算子等。