★ 设为星标 | 只讲人话,带你玩转AIGC。

现在的 OpenAI,越来越像 Anthropic 了,几乎每天都有新东西发布。

昨天晚上除了发布三个新的语音模型之外,他们还上线了一个 Codex 的 Chrome 插件。

这个插件最核心的能力,就是它终于可以直接操作你已经登录好的浏览器了。

Codex 之前本来就内置了浏览器吗,但它没法操作那些需要登录的网站。

比如你的邮箱、小红书、微博、公司后台、会员系统、企业工作台……

这个能力,其实有点像之前很多人用过的 Claude for Chrome,现在 OpenAI 也加上了。

要使用很简单,先更新 Codex,然后到 Plugin 里面安装 Chrome 插件:

打开网易新闻 查看精彩图片

图:安装 Chrome 插件

打开网易新闻 查看精彩图片

图:安装 Chrome 插件

安装完之后,就可以直接在 Codex 里面 @Chrome 来操作了,比如我让它帮我自动发个微博:

打开网易新闻 查看精彩图片

图:Codex 调用 Chrome 自动发微博

然后就看到一条微博自动发好了,内容也都是它自己编辑的:

打开网易新闻 查看精彩图片

图:Codex 自动发的微博

这个例子太简单了,主要是为了要演示一下基本功能。

但说实话,看了昨晚的演示视频,这玩意的上限远不止发个微博这么简单。

视频里提到了几个非常硬核的功能: 首先是“身份共享”。

因为它是以插件形式运行在你的 Chrome 里的,所以它能直接调用你浏览器里的所有 Cookie 和登录状态。

这意味着它不需要你再输一遍账号密码,就能在你的“真实工作环境”里折腾,安全性也比把账号托管给第三方强。

其次是“多标签页并行”。它可以同时监控、抓取好几个网页里的内容,甚至能跨标签页执行任务。

为了展示这个能力,视频里跑了几个更复杂的案例,看得我心痒痒:

第一个是“全自动舆情调研”。

演示里让 Codex 去 OpenAI 的官方社区里逛逛,它不只是扫一眼,而是自己会翻页、抓取最近一周的所有帖子,然后分析哪些用户在吐槽、哪些在夸,最后直接在你浏览器里生成一个表格总结。

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
打开网易新闻 查看更多视频
Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器

这种以前要写爬虫干的活,现在一句话就搞定了。

第二个是“差旅报销闭环”。

这个非常实用,它先去 Gmail 插件里翻找最近的出差收据,把日期、金额全抠出来。

然后,重点来了。

它自动打开了报销网站,把收据 PDF 传上去,顺带把表单里的每一个空格都填好了。

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
打开网易新闻 查看更多视频
Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器

这种跨平台(邮件到网页)的自动流,才是真的解放双手。

最离谱的是最后一个演示,“多代理协同”。

视频里开了四个标签页,跑了四个 Codex 代理去玩一个在线协作绘画游戏。

它们能实时看到对方画了什么,然后商量着一起补全一幅画。

这种“群聊式”的网页操控,给未来的办公协同留足了想象空间。

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
打开网易新闻 查看更多视频
Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器

这个插件是在单独的标签页里面处理这些新任务的,所以它不是完全接管了你的浏览器。

也就是说,你还可以继续在浏览器里干你的事情,而它在后台默默地帮你把那些自动化的事情处理掉。并不是说它在运行的时候,你就不能用浏览器了。

总之,OpenAI 这次补齐了 Codex 最关键的一块拼图。

以后我们用的可能不再是一个聊天框,而是一个能跑在任何网页背后的“数字员工”。