打开网易新闻 查看精彩图片

在AI垂直的B端应用中,「平庸的智能」一文不值。

作者 /Soren、Oriana

打开网易新闻 查看精彩图片

90分的门槛

90分的门槛

Manus被收购的消息,是在一个再普通不过的清晨传开的。

赵欢醒来后,手机里多了几条来自同事、前同事和朋友的消息——“Manus被收购了”。他并不意外。“他们把一件事做得很扎实。”他说。那是一种偏工程师的评价方式,没有情绪起伏,也没有行业式的判断。

在那之前的一段时间里,赵欢和Noumena(物自体科技)的团队,正处在一种相似的状态里:系统开始在真实环境中给出稳定反馈,AI第一次在营销这样高压、真金白银的场景中,做出了超出预期的判断。“我们内部其实也很兴奋,”他回忆,“因为我们看到了一些信号。”

这些信号来自每天持续的营销投放。Agent开始能够理解多轮决策、长程任务,开始在复杂约束下维持效果。当技术经验与商业现实在这个节点交汇,赵欢看到了更本质的竞争法则:在垂直领域,平庸的智能一文不值。通用大模型只能提供60分的基线,而头部客户只为90分以上、能直接创造价值的卓越智能买单。谁能持续突破这个“平庸引力”,谁就掌握了定价权——这正是他选择All in的原因。

Noumena成立于2023年,从一开始就选择了营销这个最现实、也最不宽容的切入口。预算、ROI、平台机制和竞对策略同时存在,任何判断都会迅速得到验证。具体而言,Noumena 的核心是通过AI原生增长智能(Growth Intelligence)系统帮助品牌在内容社交平台实现智能增长。

此前,我们曾与CEO裴沵思进行过一次对谈,探讨Noumena从小红书起步后,向抖音与Tiktok拓展的爬坡之旅,围绕战略方向、产品与商业路径。这一次,我们把视角推进到技术层面,尝试理解一个问题:营销垂类Agent如何生存?

赵欢并不是一个容易被标签化的角色。

2012年,他加入只有二十多人的字节跳动,参与今日头条、内涵段子早期的数据团队建设;随后在清华做科研助理,2014年进入香港科技大学读博,系统研究推荐系统与神经网络。2017年前后,他所在的团队较早将图学习引入推荐系统,并逐步成为工业界的“标准实践”。博士后期,他与阿里巴巴合作,将研究成果落到电商推荐的真实业务中。

2019年,他加入第四范式,负责前沿AI算法的研究与落地,带队从0到1推动AutoML与图学习结合的技术路线AutoGraph的研究与落地,不仅发表了10多篇AI顶会论文,这套方法随后在制药、材料、制造业等多个行业落地,包括某顶级医学研究院的基因组学分析以及中国商飞的大飞机三维零部件检索与推荐系统。到2023年,大模型浪潮全面到来,他又完整经历了从预训练、SFT到偏好对齐的一整轮实践,对模型能力边界有了更直观的认识。

真正促使他做出选择的,并不是某一次技术突破。

“我一直比较喜欢做从0到1的事情。”赵欢说。从字节、博士阶段,到第四范式,这条偏好反复出现。2023年前后,当大模型开始吞噬几乎所有技术资源,裴沵思是在那个时间点找到他的。两人讨论的核心聚焦在营销这样的垂直领域:如何让AI真正进入业务流程,在有ROI约束的环境中持续学习。赵欢几乎没有犹豫。“无论是推荐系统、大模型,还是营销里的检索、排序和决策逻辑,本质上都和我过去十几年的积累高度重合。”

与他在第四范式并肩作战过的老同事中,有人走向了更通用的方向——比如Manus的季逸超;也有人选择继续在系统与业务交界处深挖。赵欢选择了后者。

在Noumena,他负责整体产品与算法,团队把Agent“送去上班”:引入专家经验,搭建数据基建,让AI在真实投放中反复试错、修正和进化。“你把这些上下文、数据和反馈都给到它的时候,模型能做到的事情,已经远远超过通用场景。”

赵欢对垂类Agent与通用Agent的竞争本质有着自己坚定的判断:“这是一场关于‘智力进化加速度’的竞赛。”他认为,真正的壁垒在于垂类Agent进化速度能否远超通用模型的迭代——否则终将沦为平庸的包装层。

赵欢搭建的核心班底,是过去从第四范式时期就开始在实验与项目攻坚中反复磨合过的“00后天团”。这些成员拥有顶尖的学术或工程背景——如被称“腾讯AI Lab本硕博”、超过十年NLP研究经历,为创业申请博士休学的俊哥,以及先后放弃微信和Kimi offer、用两周搭出产品原型的“气球哥”,还有拥有分子制药方向的AI顶会论文,内部称为销冠,从算法工程师转为AI Native的产品经理旭哥。这群习惯与代码对话的年轻人之所以追随赵欢,是他们相信赵欢对垂类Agent的本质判断。

更为关键的是他在创业首日就明确的规则:所有技术人员必须下场做业务。

这意味着团队要走出舒适区,拥抱实打实的一线业务,转型为投手与策划,去广告公司驻场,学习与流量和客户直接交锋。这一决定并未遇到阻力,因为团队同样警惕“离业务太远”。

于是,这支队伍在一年内淬炼成矛盾的结合体:既是“最懂营销的AI技术人”,也是“最懂AI的营销操盘手”。

Manus的故事,让市场再次意识到Agent的潜力;而在另一条路径上,赵欢和Noumena试图回答的是另一个问题——当 AI 不再停留在能力展示,而是被放进一个高频、复杂、持续变化的现实业务中,它会变成什么。

以下是新物种与Noumena联合创始人兼首席科学家赵欢的对谈,欢迎进入一段关于垂类Agent如何“活过大逃杀”的讨论。

01.把AI扔进最卷的「营销」试炼场

01.把AI扔进最卷的「营销」试炼场

新物种:当时听到Manus被收购的消息,你的第一反应是什么

赵欢:应该是半夜发生的,我那会已经睡了。第二天早上醒来,收到一堆同事、前同事、包括第四范式的朋友发来的消息,说Manus被收购了。

我其实并不意外,反而挺为他们高兴的。他们在基础设施和操作层面确实做得非常好。

更有意思的是,那段时间我们内部其实也非常兴奋。因为我们自己在营销领域,看到了AI做出了一些让我们感到惊艳的结果。有点像当时季逸超他们内部第一次发现Manus能自己操作浏览器、完成之前没人想到的任务时的那种感觉——你会意识到:这件事成了

新物种:你觉得你们和Manus在技术判断上,有什么相似之处?

赵欢:我觉得是在对AI能力的理解和产品设计思路上。我们都意识到:产品一定要最大化释放AI的能力。不管是引入专家、搭建重数据基建,还是让AI真金白银地下场“上班”,本质上都是在为AI创造一个更完整、更真实的环境,让它充分发挥能力。但在我们这个场景里——每天真金白银地做投放——你让一个通用模型来直接干,是一定干不好的。所以必须针对场景做非常深的设计。

新物种:你们和Manus从一开始就选择了不同方向,这个分叉是怎么形成的?

赵欢:在我创业之前,大概2023年9月前后,其实我们有过一些交流。季逸超也很明确,他更想做ToC、做海外,他也坦率地说,ToB做了几年比较辛苦。

对我来说,我更在意的是:能不能把研究成果、算法能力,用在一个单点上,把智能水平做到行业里的Top Tier。所以我们一开始就在想,如果要创业,切入点应该是什么。最后我们判断,应该从垂类领域入手,思考能不能把专家的经验,用更低成本、更规模化的方式复制出来。垂类中我选择了营销,国内的内容营销领域具有先发优势,比北美至少领先5年,所以就先从国内这个场景切入了。

在实际推进过程中,我们发现这不仅仅是“复刻专家”。在专家和Agent协作、一起干活的过程中,双方都会共同进化,最终形成一套新的能力体系,帮助客户在一个极度内卷、持续变化、平台算法不断调整的环境中,持续活下去,甚至赢下来。

新物种:你们一开始就选了最卷的美妆领域,这是基于什么考虑?

赵欢:一开始其实是判断。美妆是小红书最卷的营销场景,头部更卷。只要Agent能在这种环境里学到足够多的专家判断和真实业务反馈,它很快就能超过普通代理公司的水平。我们当时投流训练的一套简单算子,就已经能明显超过人类投手。所以我们选择从最残酷的地方开始,才有机会把垂类营销智能水平的上限拉高。

新物种:相较于其他AI应用领域,营销场景的技术适配难点在哪里?

赵欢:内容营销这件事,本身就是一个非常困难的问题。

第一,平台变量太大。你看我们以前在字节、阿里做推荐平台,平台是庄家,算法很强,而且是黑盒。很多广告策划只能靠刷小红书、靠经验去理解平台规则,再想办法去fit这个算法。

第二,它是一个充分竞争、极度内卷的模式。你一旦在某个策略上投得好,竞争对手很快就会抄。一个有效的方法,可能只能持续一周、一个月。

而且平台的推荐算法还在持续更新。你上个月对平台的理解,这个月可能就不work了。所以这件事天然不确定性很强。经验当然有用,但又没那么稳定。一个做了十年的老策划很懂网感,但平台一直在变。

新物种:如果策略难以复用,那规模化从哪里来?

赵欢:上一代也有人用AI技术来做营销:抓数据、清洗、打标、做聚类分析。但受限于当时技术的泛化能力,每个行业都要单独训练一套模型,规模化很难。

变化的核心在于大模型。

一是泛化能力。以前每个行业都要重新训模型,现在更多变成数据基建加prompt和上下文工程,适配成本被大幅拉低。二是世界知识。大模型看过互联网上大量人类知识,它对人群和偏好天然就有理解。你问它“一线城市女性喜欢什么”,它一上来就能给到六七十分。

所以我们的做法是:站在通用大模型的基础上,把最难的任务交给它——把它放到真实投放场景里,让它像我们的技术人一样去做投流、做决策。通过真实行为、真实反馈和专家互动,让Agent在营销场景里快速长到八九十分。

新物种:在具备规模化能力之后,垂类Agent的核心竞争力会体现在哪?

赵欢:我觉得核心只有一件事:你能不能持续把这个垂类的“智能上限”往上推。在B端,平庸的智能是没有价值的。通用大模型已经能给到一个大概60分的水平,这个分数对大多数人来说已经“看起来不错”,但对真正付钱的客户来说远远不够。

头部客户买的不是“能用”,而是“能直接带来确定收益的判断”。比如在营销里,他们愿意为90分、甚至接近专家水平的决策买单,但不会为一个“看起来挺聪明”的通用能力付费。所以在垂类里,竞争的本质就是:谁能最快、最稳定地突破这个60分的平庸区间,谁就掌握了定价权。

02.先做投手,再做Agent

02.先做投手,再做Agent

新物种:你们创业早期是一个以技术为班底的团队,但你提出“所有人都要下场做业务”,这个要求是怎么落地的?

赵欢:我们刚创业时一共9个人,其中6个都是以前一起训大模型的技术团队。我当时有一个明确要求:所有人都得下场做业务。大家其实都放弃了原来可能年薪百万以上的工作,很多人是纯技术背景,但要去做投手、做媒介、做策划,去跟客户比稿,甚至跟MCN学业务怎么玩。我们不是“摸一下”就回去接着写代码,而是真的要做到能按MCN给客户交付的标准去做。

新物种:你什么时候意识到,“坐在办公室研究营销”是不够的?

赵欢:最早我们以为,营销的卡点在选题。我们从KOC切入,想用AI给他们做一套选题和创作系统。

那段时间我们买了很多营销相关的书,也和很多博主、自媒体人聊,大家都说选题重要。但真正做下来半年,我们发现和现实差距很大。真正会做号的人,网感很强;而大量KOC最大的问题,并不是选题好不好,而是能不能每天坚持发。这才是最大的卡点。

后来我们意识到,再怎么在北京“认真研究”,也还是浅。于是做了一个决定:去上海。在营销上,上海比北京领先一到两代。而且我们当时也上不了甲方的桌,只能从代理公司开始。我们和一家广告公司、MCN深度合作,从WeWork到直接驻进他们办公室,跟着一起见客户、跑投流、做媒介,几乎把营销链条里能干的事都干了一遍。

但很快我们又看清了一件事:工具卖给代理公司,是挣不了大钱的。代理本身是低毛利的人力服务,抽点可能只有10%,还会随着平台成熟度和竞争持续降低。

新物种:那你们是怎么转向品牌侧的?

赵欢:我们决定自己去找品牌谈,哪怕一开始免费做也可以。切入点是投流,而且是我们自己人下场做。比如我们产品经理旭哥,本身是算法工程师,但就真的跟投手一起跑投流。客户那一季的反馈是:“你们来了之后,这个投手怎么这么准?”投流这件事非常理性,本身就适合用AI去算。等我们把业务真正跑通,产研同学才逐步退回来,把过去一年里在整个营销场景里研发且验证过的工具和Agent整合成一个全链路的系统,我们内部叫AlphaCat。

新物种:你们选择的是最卷、最头部的客户,会担心甲方自己下场做Agent吗?

赵欢:这是一个常见问题,但现阶段甲方很难真正做出来。要训练一个顶级行业智能体,你既需要站在大模型能力之上,也需要同时具备模型、业务和真实投放经验,还要有一套非常重的数据基建,并持续投入。这样一整套能力,对人才、资金和长期投入的要求都非常高。从现实来看,即便是头部客户,也未必愿意、也未必有能力承担这样的成本,这不是一锤子买卖。

03.壁垒不在模型

03.壁垒不在模型

新物种:通用模型能力不断上升,垂类Agent的竞争门槛是什么?

赵欢:我更愿意把它理解为一个“进化速度”的问题。通用模型本身也在不断变强,这是一个客观事实。如果你的垂类Agent的能力提升速度,跟不上通用模型自然进化的速度,那你迟早会被抹平,最后只能变成一个壳。

真正的门槛在于:你有没有办法,让自己的系统获得比通用模型更高的“智力加速度”。这个加速度通常来自两件事:一是私域业务形成的闭环;二是高质量专家的持续反馈。

当你通过真实业务、真实决策和专家参与,获得的反馈密度和质量,远远超过通用模型在公域里能自然学到的东西时,你才可能拉开差距。否则,时间一长,能力一定会被“平权”。

新物种:如果放到其他一般的垂类场景里,Agent要真正变“聪明”,关键该从哪里下手?

赵欢:我自己的体会是,真正的关键不在于选哪一家大模型,而在于你如何重构Agent所处的外部系统。第一层,是环境。通用环境对AI来说其实是非常贫瘠的。你不能指望把一堆原始数据直接丢给模型,它就能理解业务。垂类必须为Agent搭建一套高信噪比的上下文结构:把杂乱的数据清洗、重组,变成AI一眼就能理解的“业务情报”。这一步,本质上是在帮模型节省认知成本。

同时,这个环境一定要足够残酷。真正聪明的Agent,往往不是在实验室里长出来的,而是在真实交易、真实博弈中被逼出来的。环境的复杂度,基本决定了智能的上限。

第二层,是用户。B端场景天然复杂,很难一次性把事情交给AI完成。更现实的做法,是设计一种人和AI深度协作的机制。关键不在于“替代专家”,而在于让系统和专家在业务流中形成闭环:当任务模糊时,系统懂得反问;在关键节点,主动引入专家判断;同时,把专家的每一次修改、取舍和决策,都当成高价值数据来积累。当AI在帮专家提效的同时,专家的反馈也持续反哺系统,这个系统才会真正进化。

新物种:具体来看,你们是怎么做的?

赵欢:我们基本也是从环境和用户两层同时入手。在环境层,我们做的是一件事:尽可能给Agent一个接近“上帝视角”的认知环境。内部我们把这套体系叫“曼哈顿计划”。本质上是非常重的社媒数据基建:通过解析大量内容、评论和趋势,把混乱的公域信息压缩成结构化情报,让Agent在做判断时有足够完整的上下文。

同时,我们没有选择在实验室里慢慢调模型,而是直接把Agent放进最残酷的商业环境里,从头部美妆客户开始。在这里,它要面对的是最“挑剔”的甲方、最激烈的竞争,以及非常明确的ROI结果。这种压力,会逼着系统在稳定性、抗干扰能力和决策韧性上,快速超过通用模型。

在用户层,我们构建的是Thinkflow。我们只和非常资深的专家一起工作,把协作本身当成系统的一部分。Thinkflow的作用有三个:帮助专家把模糊想法转化成可执行的决策;在关键节点引入人机协同;重要的是,通过Skill Evolver,把协作过程中的决策行为沉淀下来。最终的结果不是交付一个工具,而是在高频协作中,沉淀出一套很难被复制的行业智能

新物种:你怎么看当前营销Agent所处的阶段?

赵欢:现在行业热情很高,一个重要原因是通用大模型的阶段性红利已经到位。

一方面是多模态能力。今年Gemini等模型出来后,对内容的理解已经到了一个很扎实的水平,能作为营销的基础能力。另一方面是推理和代码能力的提升,模型对多步决策、长程任务的处理明显变强,而营销本身就是一个不断试错、修正的过程。

在此基础上,再叠加我们的人群图谱、消费者洞察和专家沉淀的think flow,让Agent真正进入企业“上班”,通过真实投放和反馈不断迭代,现在已经进入一个很好的状态。如果放在一年前,Agent更多只能做辅助判断;到今年下半年,随着模型能力、数据基建和协作经验成熟,在单一品牌、单一场景里,Agent已经能明显超过通用模型。

排版运营/Teagan

- End -