长江证券：豆包UltraMem架构推理成本降低83% AI应用加速落地|ultramem|推理|豆包|长江证券

事件描述

2025年2月12日，字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2-6倍，推理成本最高可降低83%。此外，DeepSeek-R1凭借其优秀的性能以及开源免费的特性在AI平权时代异军突起，大量厂商纷纷接入DeepSeek模型，其中包括腾讯、百度等大厂以及阅文集团、易点天下、中文在线等企业。

长江证券发表评论：

豆包大模型团队全新超稀疏架构UltraMem显著优化推理速度和推理成本。GPT-5时刻有望年内到来。1）UltraMem架构参考PKM架构的设计，针对PKM的3个缺陷予以补充，以实现更高效的访存、更优质的value检索，能够有效解决传统MoE架构推理时面临的高额的访存问题，推理速度较MoE架构提升2-6倍，推理成本最高可降低83%。同时，在性能方面，随着模型容量的增加，在相同的参数和计算量情况下，UltraMem超过MoE，具有更强的扩展能力，为更高效和可扩展的语言模型提供了一个有希望的方向。2）GPT-5将“整合大量Open技术”，包括o3，有望年内发布，并应用于ChatGPT和API。GPT-5将整合语音、画布、搜索、DeepResearch等功能。ChatGPT的免费版将获得标准智能设置下对GPT-5的无限制聊天访问权限。

DeepSeek异军突起，各家厂商纷纷接入，AI进入平权时代。1）大厂接入DeepSeekR1助力自身产品发展，拓展C端业务。其中，继ima接入DeepSeek-R1后，腾讯元宝接入满血版DeepSeek-R1，形成“双模型+可联网搜索+整合微信公众号、视频号”的产品。同时，微信搜索亦接入DeepSeek-R1当前处于灰度测试阶段。此外，腾讯、阿里、百度等大厂纷纷在云平台接入DS利于下游厂商开发部署。2）部分厂商接入DeepSeek，用以赋能原有业务。阅文集团宣布旗下作家辅助创作产品——作家助手集成DeepSeekR1模型，在智能问答、获取灵感和描写润色三方面显著升级，将提供更智能的创作辅助服务。同时，易点天下也完成DeepSeek-R1私有化部署，将其融入旗下KreadoAI、数眼智能、zMaticoo ADX多款核心产品中。3）中文在线、引力传媒等公司利用DeepSeek开源模型训练原有模型。中文在线基于DeepSeek-V3与R1提出的技术路线，研发并训练升级版“中文逍遥”，以进一步提升该大模型的创作能力。此外，引力传媒宣布完成DeepSeek-R1本地化部署，以训练符合数字营销和AIGC业务的全新模型。

豆包模型全新超稀疏架构大幅降低推理成本，各厂商纷纷接入开源便宜还好用的DeepSeek-R1，AI应用落地提速进行时。豆包UltraMem架构有望提高AI应用运行速度与响应速度、降低成本以及拓展应用场景。DeepSeek开源模型凭借其优秀的性能以及开源免费的特性有望颠覆传统大模型付费订阅商业模式，各公司间AI产品差异化将更体现在数据&场景。