Michael Friedman在博客里写了一句挺有意思的话:「我们正在为一个真正个性化、主动且强大的桌面助手打基础。」这话要是让苹果的人看到,估计会有点微妙——毕竟他们自己的Siri大改版,据说要等到6月的WWDC才能亮相。
一个快捷键,两种打开方式
谷歌这次给Mac做的Gemini应用,核心交互就藏在键盘上。
Option+空格,弹出一个迷你聊天窗口,适合快速问个问题。Option+Shift+空格,打开完整版对话界面。不满意默认设置?去应用里自己改。
这个设计明显在模仿Spotlight的 muscle memory(肌肉记忆)。苹果用户按Command+空格找文件的习惯,被谷歌直接借用了过去。降低学习成本,就是降低迁移门槛。
但真正有杀伤力的功能,是屏幕共享。
你能把当前屏幕上的任何东西——图片、文档、数据表格、代码——直接丢给Gemini问问题。甚至不用局限在「正在看的」,整个网页都能传过去分析。配合Nano Banana做图像生成、Veo做视频生成,这个应用已经从「聊天工具」往「生产力中枢」挪了一步。
系统要求卡得挺死:macOS 15(Sequoia)或更新版本。谷歌没解释为什么,但Sequoia的窗口管理和权限框架确实比前代更开放,可能是为了屏幕读取的稳定性。
为什么现在?为什么Mac?
时间线值得细品。
周二发Windows版,周三发Mac版,这种节奏不像临时起意。更关键的是,Friedman说的「未来几个月还有消息」——这几乎是在预告WWDC之前的抢跑。
苹果和谷歌的关系在这里变得复杂。一方面,苹果自己的AI功能(Apple Intelligence)底层用的是Gemini模型;另一方面,谷歌现在直接杀到macOS桌面,把入口握在自己手里。用户最终用的是Gemini,至于包装叫Siri还是叫Gemini App,那是品牌层面的博弈。
对谷歌来说,Mac用户是个高价值池子:付费意愿强、生产力场景多、对AI工具的接受度已经过教育。Windows版是覆盖面,Mac版是打渗透率。
一个细节:应用支持Gemini覆盖的所有国家和语言。这比苹果Apple Intelligence的 rollout(逐步推出)节奏快得多。谷歌在用全球化速度,对冲苹果的生态封闭优势。
桌面AI的入口战争
这场竞争的本质,是「谁拥有触发AI的快捷键」。Command+空格属于Spotlight,Option+空格现在属于Gemini。用户的手指习惯一旦养成,切换成本极高。
谷歌的赌注在于:如果我能先让你养成「有事找Gemini」的习惯,那么苹果6月发布的Siri改版,就变成了「另一个选择」而非「默认选项」。这和当年Chrome用速度抢IE用户的逻辑一模一样。
Friedman说的「主动」也值得玩味。现在的Gemini是被唤起的,未来的版本可能会预判——你打开了一份财报,它主动问要不要做数据分析;你停留在某个网页太久,它提示相关背景信息。这种「不请自来」的能力,需要两个前提:深度系统权限,以及用户信任。
macOS 15的门槛,可能就是为了换取前者。
对从业者的实际影响
如果你做AI产品,这个案例有几个可抄的作业:
第一,快捷键即入口。别让用户在菜单里找你的应用,让他们的手指记住你。
第二,屏幕即上下文。能读取用户正在看什么,比能回答通用问题更有价值。这是多模态能力的真正落地场景。
第三,原生体验是信任基础。网页版Gemini早就有了,但谷歌还是要做App——因为系统级权限、离线能力、响应速度,这些才是生产力用户付钱的理由。
至于苹果,压力现在很具体。WWDC的Siri如果不能在「主动」和「深度集成」上给出惊喜,用户可能会用Option+空格投票。
毕竟,快捷键只有一个,手指很忙。
热门跟贴