2026年4月27日,利欧数字完成了重要系统级升级——CubSwarm 营销多智能体系统率先探索接入 deepseek-v4-pro,开始多智能体协同内部测试。利欧数字 AI 一体化平台接入 deepseek-v4-flash 服务全员日常任务。这意味着利欧数字的人工智能广告基础设施,从推理引擎到应用层,第一次跑在具备自主可控能力的技术栈上。
自发布至今,CubSwarm 已经跑过了完整的一周,系统在现有模型底座上已交出了首份令人欣喜的真实运营成绩单。架构已被验证,数据已经说话。本周接入 deepseek-v4-pro,不是从零验证一个新方案,而是在已经成立的系统上如虎添翼。
01 国产化路径的真正打通
过去谈“AI 国产化”,绕不开一个现实:模型再强,推理还是跑在海外芯片和生态里。
4月24日,DeepSeek 发布 deepseek-v4-pro 版本——1.6万亿总参数、49B 激活参数、100万 token 上下文窗口、MIT 开源协议。在 Agentic Coding 基准 LiveCodeBench 上得分 93.5%(开源第一),SWE-bench 得分80.6%,Codeforces 评分 3206。利欧数字的 CubSwarm 团队在发布后 72 小时内即启动接入评估,成为国内首批探索将万亿参数开源模型应用于广告应用智能体(Agent)系统的团队之一。
DeepSeek-V4 系列模型改变了国产化的前提。它的混合注意力架构(CSA+HCA)将百万词元(Token)上下文下的 KV Cache 压缩至传统方案的2%——同等显存下,可承载的上下文长度提升约50倍;单次推理算力需求降至上一代的27%。推理对高端显存的依赖被大幅降低,国产高性能芯片第一次成为大模型推理的现实选项,而非远期规划。
利欧数字自研的 CubSwarm 多智能体协同系统 + DeepSeek 国产开源大模型 + 未来的国产芯片和并行计算模型架构的私有化部署规划,将构成一条全栈国产“AI +广告”应用技术链。对于服务大量国内品牌的数字营销集团而言,国产模型底座和基础设施意味着客户敏感数据无需出境——在金融、汽车等行业的营销项目中,这不是加分项,而是刚需。
从芯片到推理框架到大模型,人工智能基础设施自主可控的技术路径,走通了。
02 OPD 后训练范式与多智能体架构的共鸣
DeepSeek-V4系列模型的后训练采用 OPD(On-Policy Distillation)范式:先独立培养数学、代码、智能体、指令遵循等领域专家,再通过在线策略蒸馏将所有专家能力统一整合到一个模型中(DeepSeek官方原文:“independent cultivation of domain-specific experts, followed by unified model consolidation via on-policy distillation”)。
这和 CubSwarm 的多智能体设计高度同构——CubSwarm 同样由多个专项智能体(创意策划、素材生成、版式排布、品牌合规)分工协同完成复杂广告任务。
广告任务并不是单轮问答,而是跨角色、跨轮次、跨素材版本的持续协作。一个策略判断如果不能被后续创意、设计、合规环节继承,效率就会在重复解释中被消耗。OPD 所体现的“专家能力统一编排”思路,恰好对应了利欧数字在多智能体协作中的工程目标:不是简单堆叠多个智能体,而是让不同专业能力在同一任务链路中连续传递、彼此补位。
我们正在将这一思路进一步延伸:通过 SharedContext 机制,让各智能体的判断与推理链形成跨专家的经验传递,而非每次任务都从零开始。deepseek-v4-pro 的加入,将为这一机制提供更强的推理引擎。
03 三重推理模式 × 上下文解放:精确匹配任务复杂度
DeepSeek V4 系列提供三档递进的推理模式——Non-think(直觉)、Think High(逻辑分析)、Think Max(极限推理)。CubSwarm 据此可以根据任务类型动态分配推理预算:品牌合规检查走毫秒级直觉,创意策略走深度推理链,成本精确可控。
同时,百万级词元(Tokens)上下文加上极致压缩的注意力架构,将打开 CubSwarm 此前最大的工程瓶颈:广告设计的多轮迭代流程(品牌简报→创意候选→客户反馈→改稿→再反馈)可以全量保留在上下文中,不再需要有损的摘要压缩,品牌细节不再在流程中丢失。
这一能力并不只意味着“上下文更长”,更意味着任务复杂度可以被精细匹配。CubSwarm 首周运营数据已经预示了这一点:人均日均输入约219万 词元,输出约2.5万 词元,输入输出比达 86.8:1。对广告代理业务而言,真正昂贵的从来不是词元的天量消耗,而是理解任务、继承上下文和减少返工。deepseek-v4-pro 接入后,“理解”这一端的能力上限将被进一步打开。
CubSwarm 同时保持“多模型协同”架构——系统通过统一编排层灵活调度多个主流大模型。客户购买的不是“某个模型的调用权”,而是“持续最优的 AI 生产力”——本周接入 deepseek-v4-pro,正是这一架构灵活性的最佳注脚。
04 氛围式营销(Vibe Marketing):从“一个人+一个工具”到“一个人+一支智能体团队”
CubSwarm 自4月15日内部发行以来,已在多个业务 BU 上线。首周数据(4月20日至26日,对应接入 deepseek-v4-pro 之前的运营状态)显示,系统活跃使用已表现出较高密度:人均周均协作任务数达18.4个,日均约2.6个;人均单周输入约1,534万词元。这意味着 CubSwarm 并非停留在“尝鲜式”调用,而是开始嵌入真实的日常工作流。
把数据放回业务现场去看,它揭示的不是调用频次,而是工作方式的变化。86.8:1的输入输出比说明系统承担了大量上下文理解工作——把对品牌、项目、历史版本和客户反馈的消化留在机器侧,把更稀缺的判断与决策留给人。部分实际业务中,从需求沟通到初稿交付的周期较传统方式缩短约60%。
这背后是一个正在成型的新范式——氛围式营销(Vibe Marketing):通过多智能体协作重构代理商从策略到执行的完整作业链路,人的角色从执行者变成判断者和决策者。策划不再是一个人对着空白文档写简报,而是和一组各司其职的智能体们共同完成从洞察到成品的全链路;优化师不再逐条手工调整素材,而是在多智能体提供的候选矩阵中做选择和判断。
人机协作的单位,从“一个人+一个工具”变成“一个人+一支多智能体团队”。
多模型协同架构 + 渐进式记忆协议 + deepseek-v4-pro 接入,构成了一个“自我强化”的增长飞轮:更多使用 → 更多场景 → 更多模型接入 → 更强能力 → 更多使用。飞轮一旦转起来,CubSwarm 的竞争壁垒会随时间推移增厚,而非被技术迭代稀释。
结语
需要客观指出:DeepSeek V4 系列模型发布时间仅三天,在 CubSwarm 的实际业务场景中尚未经过系统性验证。目前的接入策略是“探索性集成”而非“全面替换”,务实的态度是让 deepseek-v4-pro 跑出真实数据,再做更大范围的调度切换。
人工智能广告基础设施的自主可控,不是一个口号,而是一场需要在整个产业链条上积跬步以至千里的技术长征。CubSwarm 首周数据证明了架构本身的生产力,deepseek-v4-pro 的接入则为这套系统注入了新的动能。不是推翻重来,是在已被验证的地基上加盖新楼。
热门跟贴