打开网易新闻 查看精彩图片

新智元报道

编辑:艾伦

【新智元导读】Gemini 终于推出桌面客户端了!除了能做网页端的一切,它的杀手锏是能捕捉屏幕上所有窗口,突破浏览器限制,把一切都装进模型上下文,帮你解读一切。

这两年只要聊桌面 AI 助手,大家脑子里先跳出来的,基本都是 ChatGPT 和 Claude。

前者早早把客户端铺进 Mac,后者也早就把桌面入口做出来了。

结果谷歌这边,Gemini 一直挂在网页里,多少有点拧巴。

模型声量很大,桌面存在感却一直差口气。

现在,这个坑终于补上了。

谷歌正式推出 Gemini 的 macOS 原生客户端,支持全局快捷键拉起,也能直接共享当前窗口。

打开网易新闻 查看精彩图片

https://gemini.google/mac/

这件事其实分量很重。

因为网页端再强,终究还是网页端。

你得先开浏览器,找到那个标签页,切进去,问完,再切出来。

整个过程是破碎的,像是临时找人帮个忙。

客户端不一样,它会一直贴在桌面边上,像一个随时能被叫出来的桌宠。

只要这个入口真的常驻,Gemini 后面才有机会突破浏览器的壳,去碰文档,碰表格,碰代码窗口,碰你当下正在处理的那堆东西。

很多朋友可能会觉得,不就是多了个 App 吗,有这么夸张吗。

还真有。

因为今天大家争的早就不是谁会聊天,谁会写个邮件,谁能做总结。

大家争的是谁能离工作流更近,谁能更像一个一直在屏幕边上待命的助手。

Gemini 现在终于也坐到这张桌子上了。

官方到底发了啥,亮点在哪

先看官方公告。

第一,Gemini Mac 版是原生客户端,不是网页壳套个桌面图标糊弄一下。

谷歌官方说,这是原生 macOS 体验。

Gemini 产品负责人 Josh Woodward 也在 X 上透露:一个小团队,不到 100 天,做了 100 多个功能,还是 100% 原生 Swift。

打开网易新闻 查看精彩图片

https://x.com/joshwoodward/status/2044452201947627709

这个表态挺有意思,潜台词很明显,谷歌知道大家对桌面端这件事已经催很久了,所以这次要先把使用体验等基本盘给稳住。

第二,Gemini 终于能从任何界面被叫出来了。

Option + Space,直接拉起迷你聊天窗口。

打开网易新闻 查看精彩图片

Option + Shift + Space,进入完整聊天界面。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

浅色主题挺漂亮的,深色主题也相比网页端更惊艳了,背景从灰色变成纯黑色。

打开网易新闻 查看精彩图片

客户端

打开网易新闻 查看精彩图片

网页端

这个设计有点像把 Gemini 塞进了苹果搜索 Spotlight 那个位置。

你在写方案也好,看财报也好,做表格也好,脑子里突然卡一下,想问个日期、公式、思路、翻译、灵感,手不用离开当前工作区太远,Gemini 就弹出来了。

这种低摩擦感,往往比模型参数更能决定一个产品会不会被高频使用。

第三,也是这次最关键的一点,Gemini 可以直接看你正在看的东西了。

官方给了窗口共享功能。

打开网易新闻 查看精彩图片

需要先授予客户端所需的两个权限。

打开网易新闻 查看精彩图片

你可以把某个窗口分享给 Gemini,它就能基于眼前这块内容给反馈。

打开网易新闻 查看精彩图片

被分享的 ChatGPT 窗口

打开网易新闻 查看精彩图片

Gemini 对被分享的窗口的解读

看一张复杂图表,问它这三个最大结论是什么。

盯着一段代码,问它这里可能哪里有坑。

开着一个文档,直接让它提炼重点。

看一段视频,让它总结视频要点。

打开网易新闻 查看精彩图片

这个动作一旦成立,整个交互逻辑就变了。

过去是你把上下文搬给 AI,现在是 AI 开始主动触及到上下文。

这个变化的影响很大。

再顺着往下看,官方落地页还提到几个细节。

支持所有 Gemini 支持的语言和国家地区;免费提供;要求 macOS 15 及以上;只支持 Apple M 系列芯片;同账号下的聊天记录和记忆可以同步。

网页端能做的,Gemini 客户端统统能做。

这次不是单纯给网页端装了个壳,更像是把 Gemini 整套能力重新嵌进 Mac 工作流。

回到普通用户这边,这些信息最后会落到一个特别朴素的体验上。

少切一次网页、少找一次标签页、少复制一次截图和内容、少打几句前情提要。

你别小看这几个「少」字,很多产品最后能不能留下来,就差在这里。

看起来很美

但 Gemini 离真正的助手还差一点

当然,聊到这里,得泼一点冷水。

这次 Gemini 上 Mac,肯定是好事,而且是迟早要发生的事。

可如果把它放进今天这场桌面 AI 混战里看,现在这版 Gemini,更像一个终于学会常驻桌面的聊天助手,一个更快、更顺手、能看屏幕内容的入口层。

它很重要,但还没有进化到 Claude 和 ChatGPT 那种让人一拍大腿的程度。

差在哪?

差在 Computer Use(电脑操作)这口气还没续上。

Gemini 已经嵌入 Chrome 浏览器并默认开启,读取网页上下文没有问题了。

打开网易新闻 查看精彩图片

Gemini Mac 版现在能做的是从任何界面拉起、共享窗口、基于上下文回答问题,但 Claude 和 ChatGPT 的 Mac 体验早就已经在往更深的电脑操作能力走了。

Gemini 已经从浏览器里走出来了,但离真正能帮你在电脑上连续干活,还差一段路。

这段路很关键。

因为桌面 AI 走到最后,拼的绝对不只是悬浮窗做得漂不漂亮,快捷键顺不顺手。

拼的是它能不能真的读懂你的屏幕,理解你在干嘛,然后跨多个 App 去主动接活,去执行,去把一连串动作串起来。

今天的 Gemini,已经摸到了门把手。

Claude 和 ChatGPT,已经把门推开了一点。

Gemini 后面大概率也会补上这一块的能力。

谷歌官方博客自己都说了,首发版只是开始,接下来几个月还会有更多消息。

窗口共享是第一层,全局快捷键是第二层,跨 App 理解和执行是第三层。

现在谷歌总算把前两层搭起来了。

剩下那层最香的,估计还得等等。

总之,Gemini,总算住进 Mac 了。

参考资料:

https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/

https://gemini.google/mac/