过去一年,AI办公赛道最火的那些产品,核心能力都围绕着同一件事:从零生成。
你给它一个提示词,它就能写出文章;描述一下主题,它就能做出PPT,核心卖点都是「你说,我做」。
不管是Manus、Genspark,还是各家大厂的Copilot、开源社区的OpenClaw,大家都在往这个方向发力。
01
资本也跟着往这个方向倾斜,Meta曾愿意花20亿美金收购Manus,Genspark,整个团队20个人,上线45天ARR就冲到了3600万美金,B轮融了2.75亿美金,估值达到12.5亿。
4月27日那天,发改委正式叫停了Meta对Manus的收购;也是同一天,百度个人超级智能事业群PSIG完成了独立后的首次公开亮相,还发布了通用智能体GenFlow 4.0。
同一天发生两件事,指向一个行业命题的不同侧面。
我跟PSIG团队交流时,听到一个挺有意思的数字:用户真正需要从零开始做内容的场景,大概只占所有使用场景的20%。
这个数字值得停下来想一想。剩下那80%是什么?是用户手里已经有东西了。
比如:
上个季度的方案,需要更新数据做成新版本;现场拍的几百张照片,得筛选、修图、配文案,最后打包交付;还有那些旧PPT的风格迭代冯。
这些场景有个共同特点:用户手里有原料,需要AI帮他加工、组合、转化。说白了就是「再创作」。
要是这个判断没错,对整个AI办公行业的影响就很大。
不管Manus和Genspark做得多好,它们解决的也只是20%的问题;调用别人的模型,帮用户从零生成结果,既没有自己的底层模型,也没有用户的私域数据和编辑器。
朱啸虎说过「所有AI应用都是套壳应用」,这话虽然说得有点绝对,但指出的问题很真实。
Agent编排能力确实能值12亿美金、20亿美金,可一旦这种编排能力被开源框架拉平,大家的差异就只剩下工具多少、速度快慢了。这种优势,很容易能被别人追上来的。
而那80%的「再创作」市场,AI要想做好,第一步就得拿到用户的素材。
那素材都在哪呢?
在用户网盘、文库的知识库里,也在大家十几年积累下来的文件夹、照片、视频和文档里。
我在文库网盘活动现场,听到百度集团副总裁及个人超级智能事业群(PSIG)总裁王颖说过一个观点,很有启发。
她说,把Agent搬到数据里,比把数据搬到Agent里更现实。
这话的意思是,与其让用户把自己的数据上传到各种AI工具里处理,不如让Agent直接去数据所在的地方干活。
对绝大多数团队来说,数据都分散在各种工具里,知识没法统一管理和沉淀,还存在不小的安全风险,让Agent走到数据身边,不仅路径更短,也更贴合实际需求。
而百度网盘,刚好是「数据所在的地方」,有10亿用户,还存着大家十几年的各类文件。
PSIG的起点,除在Agent框架上发力,还扎根在数据底座上;从这个视角看,它从一开始就和Manus那些产品不在同一个赛道上。
02
问题是,一开始不一样,那这个底座从什么时候开始打的?
说个有意思的事,2023年,文库做了一个当时看起来跟AI没什么直接关系的决定:把编辑器拆了。
是把整个编辑器全拆成了组件化的样子。不管文字块、图表,还是排版格式、图片位置,每一个元素都做成了能单独调用的模块。
我查了一下,那时行业里还在讨论「上下文工程」,harness engineering这个词要到2026年初才火起来。
文库团队当时的想法很朴素:
如果AI未来要替用户干活,它就得能直接操作编辑器里面的东西;这个判断现在看,好像是理所当然的事,但放在三年前,真不容易做出来。
拆编辑器,相当于把一个已经跑了很多年、用户都习惯了的产品,底层全部重写一遍,风险特别大,而且短期内根本看不到收益。
可没想到,三年后的今天,这一步效果就出来了。
就说GenFlow 4.0的Office Agent,现在能做到的程度真挺惊艳;做PPT不用依赖模板,专业模式能模仿咨询公司那种复杂的排版,创意模式还能把景点的真实照片,融进有风格的页面里。
Excel更方便、Word也有亮点,等等。
问题就出在编辑器的架构上,传统办公编辑器,不管是桌面版还是在线版,都是一个封闭的整体。
AI能做的,是在外面生成一个新文件,然后,扔给编辑器去显示;至于要修改里面的某一页、某一个单元格、某一段文字,AI根本碰不到,只能靠用户自己手动改。
这个问题,全世界都存在。
我大概捋了一下,Microsoft Copilot面对的就是这个困境。Office的编辑器太重了,Word、PPT、Excel各自独立,架构沉淀了几十年。
微软能做的,在旁边加一个AI助手,帮你起草内容、总结要点,可编辑器本身的底层逻辑,当初就不是为了AI调用设计的。
用户用起来的感觉,就是「旁边多了个帮手」。
Notion走了另一条路,它天生是模块化的产品,跟AI结合起来更自然;但Notion的问题在另一边:用户的文件不在它那儿。
你的照片、视频、以前的文档、项目素材,这些东西Notion都碰不到,它只能帮你整理已经存在Notion里的笔记,别的就做不了了。
Kimi也差不多,对话能力很强,但用户数据资产不在它那儿,每次用时,都得重新上传文件、重新跟它说背景信息,特别麻烦。
而PSIG的位置,刚好卡在一个很特别的交叉点上。
编辑器拆成了组件,数据存在网盘里,知识在文库的图谱里,这三样东西都在同一个体系里,放眼全球,能同时做到这三点的玩家,确实没几个。
也正是有了基础,那80%的再创作场景,才有了落地的可能。
说白了,AI能拿到素材、看懂素材、还能在素材上直接操作,每一步,都离不开三年前文库拆编辑器那个决定。
03
不光决定做得早,百度也在真金白银下了重注。
今年1月,百度做了次组织调整,把文库和网盘合并,成立了一个独立的事业群,叫个人超级智能事业群,英文缩写是PSIG。
负责人是王颖,身兼百度集团副总裁,直接向李彦宏汇报,现在百度一共有四个事业群,PSIG是最新的一个。
我查了几个数字,凑在一起看特别有门道:
GenFlow月活已经过了1亿,每个月交付的任务有2亿次,而且文库付费订单里,有80%都是因为AI才付费的。
这个比例能说明一个关键问题:用户现在对文库的付费认知,已经从原来的「找文档」变成了「用AI」,这个转变早就完成了。
还有个细节,团队空间灰度上线才三周,有1万多个组织注册,全是3到10人的小团队,而且压根没做任何推广,我还了解到,虚机资源一上线就被抢空。
这些数字单看,也就是普通的产品指标,放在一起就不一样了:这个事业群能成立,靠实打实的数据验证。
我觉得,现在整个AI行业还在为商业模式发愁的时候,PSIG可能是少数几个,已经跑通「AI原生收入」的团队。
现在行业里常见的AI赚钱模式,也就那么几种。
比如:
卖token、卖API调用,本质上是卖算力,很容易陷入价格战,被卷得没利润。
靠广告变现,跟传统互联网玩法没区别;那些先烧钱拉用户、再想怎么变现的,现在投资人也没那么多耐心了,钱越来越难拿。
PSIG模式不一样,它天生是订阅制的产品;文库和网盘的会员体系已经运转很多年了,用户早就有付费习惯。
AI能力加进去之后,是让原来的会员变得更值,用户更愿意续期。
更关键的是收费逻辑,我了解到,PSIG后续还会推出更多付费方式,比如:按完成的任务来计费,用多少付多少,更灵活。
交流时,王颖说过一句话:我们卖的是附加值,不是水电煤。
这个定位,让PSIG的商业模式和行业里大多数AI公司都不一样,它不依赖云厂商的token分销,也不用靠烧钱拉用户,完全是自供血的状态,而且这份利润,来自用户直接为AI能力买单。
我问过王颖,团队里现在最缺什么,她的回答很直接:
特别好的人,聪明、理解力强,还得行动力强的人;我又问她有没有压力,她的话很实在,我们现在做的,是不辜负组织资源和用户信任。
把这两句话放一起,就能感受到他们的状态:踏踏实实地把事情做好、兑现承诺。
04
可兑现这几个字,落到一个有10亿用户的老产品上,远比说起来复杂,王颖也很清楚,她在交流时提到过一个词:创新者的窘境。
这个词说的问题很具体:
文库和网盘加起来服务着这么大体量的用户,大家对这两个产品的印象早就定死了,一个用来找文档,一个用来存文件。
现在要把它们改成AI工作台,用户一下子未必能接受,甚至可能被吓到。
PSIG做法是分开处理,网盘这边,王颖态度很明确:安全是用户用网盘的核心需求,这个底线绝对不能动。
用户把最要紧的东西都存在这儿,就是网盘最值钱的资产;要是这份信任被伤了,不管加多少AI功能,都挽不回来。
所以,网盘变化会特别慎重,PC端大改版预计之后会上线,到时候会更突出AI的主交互,整体节奏就是一步一步来,不着急。
文库这边就激进多了,原因也很简单,数据已经说明了用户心智的变化,用户早就把文库当成AI产品在用了;既然用户自己都主动接受了,产品自然可以大胆跟上。
我了解到,文库首页改版早就做完了,整个首页都会改成智能体的交互界面,跟现在比完全是两个样子。但直到现在,还没上线。
我特意问了原因,答案挺出乎我意料的:
等GenFlow的能力再强一点,因为要是新首页上线了,用户点进来,发现AI能力跟不上这个交互,反而会适得其反,不如再等等。
这个细节真的值得多琢磨琢磨,现在行业里大多数公司都是先上线抢声量,体验不够再慢慢迭代;PSIG反过来了,先把能力做扎实,再让用户看到。
这种克制,在现在的AI行业里真的不多见。
海外市场就快多了,文库海外版Orient没什么历史包袱,上线之后用户涨得很快;多语言字幕、AI相机、AI笔记这些功能,直接就给到海外用户,大家接受度也很高。
而且现在用户已经破百万了,海外用户的付费意愿明显更强,中东、南美、东南亚这几个区域,跑得尤其快。
把这三条线放在一起看,就能看出很清晰的节奏:
海外没包袱就先冲,文库有数据验证了就敢改,网盘用户心智最重就稳着来。分场景、分节奏地推进。
交流时还有一个逻辑,我觉得特别值得跟大家说说,王颖提到一个观察:
用户做视频类内容的流程,起点和终点其实都是网盘;拍完素材,先存到网盘里;然后用各种工具加工、剪辑、拼接;做完之后,再存回网盘。
要发出去的时候,还是从网盘走,大文件传输这事儿,网盘做得最好。
她当时说:「起点终点都是我,中间的桥梁做好,让它不走就行了。」
这话听着简单,背后是一个很扎实的增长飞轮:
用户数据本来就存在网盘里,AI的加工能力在GenFlow上,加工完的结果,又会重新沉淀回网盘。每用一次,这个循环就强化一次。
这跟Manus那类产品的逻辑,完全不一样。
Manus用户,每做一个任务,数据和结果都散在各处,不会自动沉淀下来,成为下一次任务的基础。
PSIG的飞轮是自动转的,用得越多,数据越全,AI就越懂你,做出来的东西也就越合心意。
这也是为什么我觉得,从零做一个新的AI产品,可能很快就能做起来;要把一个有10亿用户的老产品,改成一个全新的东西,这件事要慢得多,也难得多。
难就难在,你不能为了创新,把用户十几年的信任给弄丢了,可也正是这份信任,让PSIG站在了一个别人根本到不了的位置上。
Manus用一年做到ARR一个亿,4月27日被一纸禁令归零;文库和网盘攒了十几年,同一天,刚刚开始。
热门跟贴