★ 设为星标 | 只讲人话,带你玩转AIGC。
现在的 OpenAI,越来越像 Anthropic 了,几乎每天都有新东西发布。
昨天晚上除了发布三个新的语音模型之外,他们还上线了一个 Codex 的 Chrome 插件。
这个插件最核心的能力,就是它终于可以直接操作你已经登录好的浏览器了。
Codex 之前本来就内置了浏览器吗,但它没法操作那些需要登录的网站。
比如你的邮箱、小红书、微博、公司后台、会员系统、企业工作台……
这个能力,其实有点像之前很多人用过的 Claude for Chrome,现在 OpenAI 也加上了。
要使用很简单,先更新 Codex,然后到 Plugin 里面安装 Chrome 插件:
图:安装 Chrome 插件
图:安装 Chrome 插件
安装完之后,就可以直接在 Codex 里面 @Chrome 来操作了,比如我让它帮我自动发个微博:
图:Codex 调用 Chrome 自动发微博
然后就看到一条微博自动发好了,内容也都是它自己编辑的:
图:Codex 自动发的微博
这个例子太简单了,主要是为了要演示一下基本功能。
但说实话,看了昨晚的演示视频,这玩意的上限远不止发个微博这么简单。
视频里提到了几个非常硬核的功能: 首先是“身份共享”。
因为它是以插件形式运行在你的 Chrome 里的,所以它能直接调用你浏览器里的所有 Cookie 和登录状态。
这意味着它不需要你再输一遍账号密码,就能在你的“真实工作环境”里折腾,安全性也比把账号托管给第三方强。
其次是“多标签页并行”。它可以同时监控、抓取好几个网页里的内容,甚至能跨标签页执行任务。
为了展示这个能力,视频里跑了几个更复杂的案例,看得我心痒痒:
第一个是“全自动舆情调研”。
演示里让 Codex 去 OpenAI 的官方社区里逛逛,它不只是扫一眼,而是自己会翻页、抓取最近一周的所有帖子,然后分析哪些用户在吐槽、哪些在夸,最后直接在你浏览器里生成一个表格总结。
这种以前要写爬虫干的活,现在一句话就搞定了。
第二个是“差旅报销闭环”。
这个非常实用,它先去 Gmail 插件里翻找最近的出差收据,把日期、金额全抠出来。
然后,重点来了。
它自动打开了报销网站,把收据 PDF 传上去,顺带把表单里的每一个空格都填好了。
这种跨平台(邮件到网页)的自动流,才是真的解放双手。
最离谱的是最后一个演示,“多代理协同”。
视频里开了四个标签页,跑了四个 Codex 代理去玩一个在线协作绘画游戏。
它们能实时看到对方画了什么,然后商量着一起补全一幅画。
这种“群聊式”的网页操控,给未来的办公协同留足了想象空间。
这个插件是在单独的标签页里面处理这些新任务的,所以它不是完全接管了你的浏览器。
也就是说,你还可以继续在浏览器里干你的事情,而它在后台默默地帮你把那些自动化的事情处理掉。并不是说它在运行的时候,你就不能用浏览器了。
总之,OpenAI 这次补齐了 Codex 最关键的一块拼图。
以后我们用的可能不再是一个聊天框,而是一个能跑在任何网页背后的“数字员工”。
热门跟贴