这段时间狂测Agent,

感觉已经想不到还能出什么有意思的Agent了,

结果又让我给挖着了。

一个能自己反思,自己修改,“自己PUA自己”,还能自我分身的Agent:

Agnes

定位是一个办公协作工具,目标是让AI打工人的牛马属性再升一级

打开网易新闻 查看精彩图片

它能自己给自己的产出打分,不满意了重新生成直到做出自己最满意的作品为止。

而且我仔细看了看,Agnes能做的事情非常之多,

DeepResearh、图像设计、视频生成、制作PPT、数据表格、还有Manus的同款Wide Research等等等等,

打开网易新闻 查看精彩图片

迫不及待想看效果了,

话不多说,我们直接开测。

01|Deep Design

我第一次使用Agnes时,让我印象最深刻的就是AI Design里面的Deep Design模式,

这个模式下,AI会给自己打分、反思、修改、再打分,然后选出自己的最高分作品。

这放在职场里,妥妥是老板最喜欢的员工啊。

打开网易新闻 查看精彩图片

比如说,我给出“生成一套5张涉及不同画面内容的图片提示语”,然后在AI Design的模式下运行,

打开网易新闻 查看精彩图片

Agnes会先给出一个包含每一张图片制作方向的设计大纲,确认无误后,选择右下角的“Deep Design”开始生成。

打开网易新闻 查看精彩图片

然后,我们就可以看到它调用多个内部Agent开始生成图片,速度很快很丝滑,

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

它会在过程中自己对图片进行评价,罗列出这张图片在哪里做得好,哪里做得不好,哪里还可以优化,优化方向是什么,

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

然后Agnes会再生成再打分,最后选择出最高分的图片。

打开网易新闻 查看精彩图片

经过Agnes一系列的自我优化后做出的5张图片,每一张都能够对应上最初我给到的需求,而且画面细节做的非常精细,整体构图、颜色、光影都很符合未来城市的设计。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Agnes自己完成的这个自我评估到重建到最终完成作品输出的流程,不就把我日常跟Agent多轮对话的时间进一步压缩了,不需要填问卷、不需要回答问题、不需要蹲在屏幕前,它会先交上自己的满分试卷

原地鼓掌!见证了一个新员工一步步成长最终成为一个成熟牛马,有种自己家孩子终于长大了的感觉。

再回来看 AI Design,

像我们上面看到的一样,它将文本理解、多模态输入、样式迁移与图像微调整合在一个统一的设计画布中,可以完成:

  • 输入需求 → Agnes 拆解要点 → 生成图片和视频,支持通过自然语言微调色彩、排版、细节等,支持多轮对话迭代
  • 可识别用户上传图片或视频的风格特征,进行迁移生成
  • 选区后让Agnes进行和局部优化
  • 可以根据Deep Research直接生图,然后再生成ppt

比如说,我先用Deep Research帮我做出一个巴厘岛7日游的详细攻略,这个报告的结果非常详实,我一个去过巴厘岛的人看完蛮认可,甚至想再去一遍了,

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

然后可以直接根据这个行程进行多轮对话让它生成一个排版精美的攻略PPT,

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

或者我不喜欢这个配色,我直接和它对话修改成一个蓝紫色的主题配色(也是跟风蓝紫了),

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

还可以调整排版、配图等等细节,而且PPT也都是可以在线编辑的。

打开网易新闻 查看精彩图片

甚至我还可以上传图片,让Agnes分析图片的风格特征,然后迁移过来让它生成类似画面风格的视频,

打开网易新闻 查看精彩图片

整体感受就是,

Agnes对于游戏类型的视频制作效果尤其突出。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

02|Wide Research

除了设计,Agnes在调研能力也非常强,它做出了Manus的同款Wide Research功能。

简单说,就是:

你可以一次性调动几十上百个Agent,每个Agent负责不同方向的调研,然后系统会自动合并这些结果、去重、筛选,生成结构化内容。

我的理解就是目前模型的上下文长度受限,单个任务的性能是有上限的,思考多了输出就短了。

简单,那我把任务拆开不就行了,

Wide Research就是这样的解法。

用一个小项目来测试一下,比如给Agnes一个“为某高校设计一套面向高一新生的AI入门课程大纲”的任务,使用Wide Research模式运行,

打开网易新闻 查看精彩图片

运行速度很快,5分钟就干了隔壁部门半小时的活(我很好看你啊,Agnes)

然后我们可以看到,Agnes在整个过程中会先分析任务目标,然后根据任务量的大小来决定要使用多少个Agent来协作完成任务,然后为这些Agent制定任务,并分配它们运行,最终输出一份完整的课程大纲和课程规划。

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

它甚至还帮我想好了教学方法、课程结构和评估方式,这个计划比我想象的还要全面并且有用。

我还尝试了用Agnes一次性生成70张海报图,它会直接建立70个Agent同时给我跑case,速度非常快,这个场面还是蛮震撼的,

 实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要
打开网易新闻 查看更多视频
实测会自我反思会分身的Agent Agnes,深度设计和广度研究它两个都要

70张海报还直接打包可以同时下载,非常方便。

打开网易新闻 查看精彩图片

重点来了,Agnes没有邀请码,上线即全面开放。

谁能想到有一天,

Agent 居然学会了“PUA自己”。

能自我反思,能打分、修改、总结出最优解,就差自己跟自己开一场季度复盘会议了。

而这只是 Agnes 的一部份能力。

如果只看到了一个深度研究 Agent,或者一个设计能力极强的 AI 工作流,那我觉得还是低估它了。它其实更是一套多智能体协作机制,以及一个正在不断自我进化的通用 Agent 框架。

Agnes会质疑、会验证、会规划,

会和你一起把模糊的任务,拆成清晰的路径,再沿着路径把每个结果跑出来。

它愿意在快节奏里慢下来,每个功能都像是在问:

“你真的需要这个结果吗?我们要不要把过程也一起理解了?”

我还蛮喜欢这种感觉的。

习惯了让 AI 越来越快,最好60s给我结果。

偶尔把手里的工作都交给它,

让它自己琢磨出满分答卷,

还挺省心的。

@ 作者 / 阿汤 & 卡尔

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论

如果想要第一时间收到推送,不妨给我个星标

更多的内容正在不断填坑中……

打开网易新闻 查看精彩图片