不儿,不儿,

一觉醒来四个好朋友的AI团队都进腾讯了,数据分析,内容编辑,视频拆解,视频生成的坑位都被占了,那我肯定也要来一把。

刚好最近我在狂用AI生成HTML PPT,把整套PPT生成工作流做成了WorkBuddy上Agent Team。

之前我比较苦恼的两个点就是Claude太贵,所以我用的是GPT 5.5。但是GPT 5.5很喜欢在生成这个过程中,把自己的思考过程也塞PPT里,然后就会变成了一大堆你看着很不顺眼的小字。

打开网易新闻 查看精彩图片

还有一个点就是,光用GPT Image2联网生成的图片素材还不是很够。

有的时候页数长了,我就觉得需要点视频素材。

打开网易新闻 查看精彩图片

这是我用guizang-ppt-skill在Codex(GPT 5.5 High)做出来的PPT。

可以看出来,没有用GPT Image2重新生成的图是比例是真的丑,很多时候只有文字,我们需要更丰富的信息载体。这两痛点已经导致我这份PPT翻工了第四次了,

刚好借这个机会,把我正在打磨的一个叫做Humanize PPT的Skill做成Agent,

简单来说,它是一个内容过滤层。

就像大家做前端,做App的时候,会想要参考类似于YC总裁 Garry Tan的Office Hour一样,我在做HTML PPT的时候,也参考了TED上不同人做PPT的共同特点,总结出了一个AST(Audience-State-Transfer|听众状态转移)理论。

打开网易新闻 查看精彩图片

用人话说,就是说在做 PPT 之前,AI需要自己回答清楚两个问题:

  1. 这个PPT的受众是谁?
  2. 在演讲过程中,观众在看上一页和下一页,会产生什么样的改变,他们为什么会继续听下去。

这就是我之前听TED演讲时最深的一个感受,PPT对他们而言,能够起到在关键节点展现信息的作用,同时又不会太抢戏。

也就是说,这样做出来的 PPT是适合演讲的。

以这里为例,

就是让听众从一个完全不会WorKBuddy的人,变成一个知道怎么用WorKBuddy养龙虾的人。

Humanize PPT会根据用户状态的改变来搭建整体目录。这样就不会出现我们给Agent一大堆参考文件后,它只会傻傻地按我给的顺序来输出。

相反,Agent需要把所有资料聚合,重新思考整个过程并进行排列,去掉中间无意义的废话,再把这个梳理好的大纲交给下游的PPTSkill。

所以我跟常用的2个HTML PPT Skill(guizang-ppt-skill和frontend-slides)和Remtion,Hhyperframes两个视频制作skill一排即合,做出了一个Agent团队。

打开网易新闻 查看精彩图片

PS:额外花10s介绍介绍单用这几个Skill能做出来的效果

打开网易新闻 查看精彩图片

guizang-ppt-skill和frontend-slides

Remtion和有图片素材下的Hyperframes

跟我在X上看到的那些比较完善,还带放大缩小和镜头移动效果的视频有点出入,

但这确实是这两个Skill在没有经过任何调优,只靠一句话做出来的真实效果。

它们组合成团队之后做出来的PPT长这样,

打开网易新闻 查看精彩图片

还带说明视频和演讲稿,

我要做的就是把网址以及截了个图告诉他,我想把这个网页里内容A到内容B中间的东西抽成 PPT,就那么简单。

打开网易新闻 查看精彩图片

以前的做法是单个Agent放尽可能多的Skill,然后给它写规则。

比方说在这里做PPT,我就会写,

先用Humanize PPT把现有的材料转成人能看懂的大纲,再用guizang-ppt-skill和frontend-slides做风格探索,选到合适的PPT模版,再用Remtion和Hyperframes生成说明视频才到PPT里,最后上传成网页,生成演讲稿

这样的Workflow有一个缺点,就是做到40页左右的时候上下文限制啥都忘了,

大纲也忘了,风格也忘了。

有了腾讯WorkBuddy的Agent专家团,我完全可以一个skill分给一个Agent。

主Agent就负责拆任务,把任务分配给对应的Skill Agent,其他Agent就同时开始做自己的部分,不占对方的上下文,也就是说,我们PPT生成有了大纲之后,页面生成跟说明视频其实可以同步做了。

打开网易新闻 查看精彩图片

在WorkBuddy上看的话,还可以在左侧看到每个角色的输出。如果你发现有一段不满意的话,我们还可以进行单独的调整。

还能在小程序上直接看进度,

打开网易新闻 查看精彩图片

当然,它现在肯定还不是完美的。

还是会返工,会有视频节奏的部份需要我来调,

但这反而是我觉得真实的地方。

公司里的同事不也这样。

你不会因为一个设计师第一版没做好,就说设计这个岗位没价值了。

你会给反馈,会让他重来一版。

AI团队也一样。

这就是我理解的新一代一人公司。

是一个人开始拥有一套公司级的工作流。

以前你缺设计师,缺剪辑师,缺PM。

现在你可以拥有这些岗位的Agent角色。

额度多到用不完的话,

你还可以拥有一个专门盯着让每页PPT都有视频的同事。

这些判断,过去都被压在我身上,

我都快成7*24核动力驴了,

现在终于可以拆出去一部分了。

如果你对WorkBuddy的新玩法感兴趣,

他们现在都有20多个打包好的团队了,

今天这一轮跑下来,

我有一个很强的直觉。

一人公司这概念还会继续火的。

@ 作者 / 卡尔

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论

如果想要第一时间收到推送,不妨给我个星标

如果你有更有趣的玩法,欢迎在评论区聊聊

更多的内容正在不断填坑中……

打开网易新闻 查看精彩图片