梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
你的浏览器,从今天起进化成免费智能体。
谷歌Chrome推出Gemini Skills,一键生成可复用的技能。
举个栗子:你在刷到一个食谱,想让AI分析营养价值。
以前每次都要手动复制一长串prompt,现在保存一次就行,以后在任何食谱页面上敲个斜杠键,直接跑。
免费,默认内置在Chrome里,不需要买任何订阅。
如果你没有收到更新,试试把语言改为“英语(美国)”。
一键把提示词变成技能
Skills,在AI时代的地位相当于手机时代的APP。
但以前要在龙虾或者Claude Code里用,还让人望而生畏。
来到浏览器里,门槛彻底为0了。
以前想让AI重复干同一件事,总结文章也好,分析产品成分也好,对比价格也好,都得重新输入或者复制粘贴一遍prompt。
提示词多了,还得找个地存着。
能忍,但很烦。
现在的解法是把这些prompt存成Skill。
在Gemini聊天框里敲斜杠(/),或者点旁边的加号按钮,选你保存过的技能,一键就跑。
Google还预置了一个技能库,50多个现成的技能,涵盖食谱营养计算、护肤品成分分析、YouTube视频总结等场景。觉得不顺手可以自己改,改完存下来下次接着用。
跨设备也能同步。登录Google账号,你在公司电脑上保存的技能,回家打开Chrome一样能用。
还有一个杀手级能力:一个技能可以同时读取多个标签页。
比如你想对比两个产品的参数,打开两个标签页,跑一个技能,并排对比表就出来了。
But!
凡是涉及日历、邮件这类会产生实际动作的操作,Gemini会先找你确认再执行。
总的来说,这些功能并不新,在Gemini里都能使用,但是整合到浏览器里,离使用场景总归是更近了。
浏览器纷纷Agent化
先是专用的AI浏览器出场。
从Perplextiy的Comet到ChatGPT Atlas。
国内美团旗下光年之外也推出了AI浏览器Tabbit。
现在传统浏览器也坐不住了,纷纷往Agent方向走。
核心变化就是从“帮你展示网页的工具”,变成了“替你完成任务的助手”。
老牌浏览器Opera的Neon版搞了个叫Cards的功能,跟Chrome的Skills几乎一个思路:
把prompt保存下来复用。热门场景包括任务优先级排序、规划电影之夜、找便宜机票。
微软更是被抓包,所谓新出的Copilot App,其实就是Edge套壳,浏览器三个字都快不好意思写在脸上了。
虽然现阶段AI浏览器多多少少都有些不完善,但一定是未来的大趋势没跑了。
仿佛回到了上个世纪90年代的浏览器大战。
上一次,决定了谁掌握互联网的入口。这一次,改变的是人和互联网交互的方式。
只不过问题是:谁是新的Netscape,谁是新的Firefox,Chrome还会是最后赢家吗?
参考链接:
[1]
https://blog.google/products-and-platforms/products/chrome/skills-in-chrome/
[2]
https://x.com/TheBobPony/status/2041112541909205001
热门跟贴