利欧数字接入 DeepSeek-V4：AI 广告基础设施迈向全栈国产化|deepseek|上下文|大模型|推理|智能体

2026年4月27日，利欧数字完成了重要系统级升级——CubSwarm 营销多智能体系统率先探索接入 deepseek-v4-pro，开始多智能体协同内部测试。利欧数字 AI 一体化平台接入 deepseek-v4-flash 服务全员日常任务。这意味着利欧数字的人工智能广告基础设施，从推理引擎到应用层，第一次跑在具备自主可控能力的技术栈上。

自发布至今，CubSwarm 已经跑过了完整的一周，系统在现有模型底座上已交出了首份令人欣喜的真实运营成绩单。架构已被验证，数据已经说话。本周接入 deepseek-v4-pro，不是从零验证一个新方案，而是在已经成立的系统上如虎添翼。

01 国产化路径的真正打通

过去谈“AI 国产化”，绕不开一个现实：模型再强，推理还是跑在海外芯片和生态里。

4月24日，DeepSeek 发布 deepseek-v4-pro 版本——1.6万亿总参数、49B 激活参数、100万 token 上下文窗口、MIT 开源协议。在 Agentic Coding 基准 LiveCodeBench 上得分 93.5%（开源第一），SWE-bench 得分80.6%，Codeforces 评分 3206。利欧数字的 CubSwarm 团队在发布后 72 小时内即启动接入评估，成为国内首批探索将万亿参数开源模型应用于广告应用智能体（Agent）系统的团队之一。

DeepSeek-V4 系列模型改变了国产化的前提。它的混合注意力架构（CSA+HCA）将百万词元（Token）上下文下的 KV Cache 压缩至传统方案的2%——同等显存下，可承载的上下文长度提升约50倍；单次推理算力需求降至上一代的27%。推理对高端显存的依赖被大幅降低，国产高性能芯片第一次成为大模型推理的现实选项，而非远期规划。

利欧数字自研的 CubSwarm 多智能体协同系统 + DeepSeek 国产开源大模型 + 未来的国产芯片和并行计算模型架构的私有化部署规划，将构成一条全栈国产“AI +广告”应用技术链。对于服务大量国内品牌的数字营销集团而言，国产模型底座和基础设施意味着客户敏感数据无需出境——在金融、汽车等行业的营销项目中，这不是加分项，而是刚需。

从芯片到推理框架到大模型，人工智能基础设施自主可控的技术路径，走通了。

02 OPD 后训练范式与多智能体架构的共鸣

DeepSeek-V4系列模型的后训练采用 OPD（On-Policy Distillation）范式：先独立培养数学、代码、智能体、指令遵循等领域专家，再通过在线策略蒸馏将所有专家能力统一整合到一个模型中（DeepSeek官方原文：“independent cultivation of domain-specific experts, followed by unified model consolidation via on-policy distillation”）。

这和 CubSwarm 的多智能体设计高度同构——CubSwarm 同样由多个专项智能体（创意策划、素材生成、版式排布、品牌合规）分工协同完成复杂广告任务。

广告任务并不是单轮问答，而是跨角色、跨轮次、跨素材版本的持续协作。一个策略判断如果不能被后续创意、设计、合规环节继承，效率就会在重复解释中被消耗。OPD 所体现的“专家能力统一编排”思路，恰好对应了利欧数字在多智能体协作中的工程目标：不是简单堆叠多个智能体，而是让不同专业能力在同一任务链路中连续传递、彼此补位。

我们正在将这一思路进一步延伸：通过 SharedContext 机制，让各智能体的判断与推理链形成跨专家的经验传递，而非每次任务都从零开始。deepseek-v4-pro 的加入，将为这一机制提供更强的推理引擎。

03 三重推理模式 × 上下文解放：精确匹配任务复杂度

DeepSeek V4 系列提供三档递进的推理模式——Non-think（直觉）、Think High（逻辑分析）、Think Max（极限推理）。CubSwarm 据此可以根据任务类型动态分配推理预算：品牌合规检查走毫秒级直觉，创意策略走深度推理链，成本精确可控。

同时，百万级词元(Tokens）上下文加上极致压缩的注意力架构，将打开 CubSwarm 此前最大的工程瓶颈：广告设计的多轮迭代流程（品牌简报→创意候选→客户反馈→改稿→再反馈）可以全量保留在上下文中，不再需要有损的摘要压缩，品牌细节不再在流程中丢失。

这一能力并不只意味着“上下文更长”，更意味着任务复杂度可以被精细匹配。CubSwarm 首周运营数据已经预示了这一点：人均日均输入约219万词元，输出约2.5万词元，输入输出比达 86.8:1。对广告代理业务而言，真正昂贵的从来不是词元的天量消耗，而是理解任务、继承上下文和减少返工。deepseek-v4-pro 接入后，“理解”这一端的能力上限将被进一步打开。

CubSwarm 同时保持“多模型协同”架构——系统通过统一编排层灵活调度多个主流大模型。客户购买的不是“某个模型的调用权”，而是“持续最优的 AI 生产力”——本周接入 deepseek-v4-pro，正是这一架构灵活性的最佳注脚。

04 氛围式营销(Vibe Marketing)：从“一个人+一个工具”到“一个人+一支智能体团队”

CubSwarm 自4月15日内部发行以来，已在多个业务 BU 上线。首周数据（4月20日至26日，对应接入 deepseek-v4-pro 之前的运营状态）显示，系统活跃使用已表现出较高密度：人均周均协作任务数达18.4个，日均约2.6个；人均单周输入约1,534万词元。这意味着 CubSwarm 并非停留在“尝鲜式”调用，而是开始嵌入真实的日常工作流。

把数据放回业务现场去看，它揭示的不是调用频次，而是工作方式的变化。86.8:1的输入输出比说明系统承担了大量上下文理解工作——把对品牌、项目、历史版本和客户反馈的消化留在机器侧，把更稀缺的判断与决策留给人。部分实际业务中，从需求沟通到初稿交付的周期较传统方式缩短约60%。

这背后是一个正在成型的新范式——氛围式营销（Vibe Marketing）：通过多智能体协作重构代理商从策略到执行的完整作业链路，人的角色从执行者变成判断者和决策者。策划不再是一个人对着空白文档写简报，而是和一组各司其职的智能体们共同完成从洞察到成品的全链路；优化师不再逐条手工调整素材，而是在多智能体提供的候选矩阵中做选择和判断。

人机协作的单位，从“一个人+一个工具”变成“一个人+一支多智能体团队”。

多模型协同架构 + 渐进式记忆协议 + deepseek-v4-pro 接入，构成了一个“自我强化”的增长飞轮：更多使用 → 更多场景 → 更多模型接入 → 更强能力 → 更多使用。飞轮一旦转起来，CubSwarm 的竞争壁垒会随时间推移增厚，而非被技术迭代稀释。