Google终于给Mac用户发了颗糖——Gemini原生桌面应用上线。但等等,为什么偏偏是Mac先吃,Windows用户还得干瞪眼?

更蹊跷的是,ChatGPT、Claude、Copilot早就跨平台布局了,Google这时候才追上来,窗口共享功能真能成为翻盘筹码?

打开网易新闻 查看精彩图片

我花了一下午深度测试,发现这件事背后藏着Google对"AI工作流"的重新理解。

一、Lance Whitney的测试现场:窗口共享到底怎么用

科技撰稿人Lance Whitney在ZDNET的实测,还原了一个典型场景。

他习惯用Gemini辅助工作,但过去必须中断手头任务——打开浏览器、跳转网站、再切回来。新Mac应用用键盘快捷键(Option+Shift+Space全窗口,Option+Space迷你窗口)解决了这个摩擦点。

但真正让他" prefer the app over the website"的,是窗口共享。

操作路径:点击输入框的加号 → 选择Share Windows → 系统弹出权限请求 → 勾选要分享的窗口。Gemini随即获得该窗口的实时视图,可以总结内容、回答问题、提取信息。

「Need help or information with an app, a file, a web page, or another window open on your Mac? Just ask Gemini via the app.」

Whitney的测试覆盖了多种场景:正在编辑的文档、打开的网页、运行中的应用程序。AI能"看见"这些窗口的内容并即时响应。

这个功能的技术门槛不高——屏幕抓取+多模态理解。但产品设计的微妙之处在于:它把"AI辅助"从"用户主动投喂"变成了"AI被动感知"。

你不需要截图、复制粘贴、上传文件。窗口就在那里,AI自己看。

二、为什么是Mac优先?Google的算盘

这里有个反直觉的事实:Gemini Mac应用要求Apple芯片(M1及以上)+ macOS Sequoia 15。

Windows版本?还没影。

竞争对手早就全平台覆盖:ChatGPT、Microsoft Copilot、Claude、Perplexity,Windows和Mac双端齐备。Google反而在自家ChromeOS和Android生态之外,先拥抱了苹果硬件。

几种可能的解读:

第一,技术债。Gemini的某些功能(比如窗口级别的系统集成)在macOS的统一架构上更容易实现。Apple芯片的神经网络引擎(Neural Engine)提供了本地AI加速的硬件基础。

第二,用户画像。Gemini的高级订阅用户中,创意工作者、开发者、知识工作者占比不低——这群人恰好是MacBook Pro的主力人群。先讨好付费意愿强的群体,ROI更可控。

第三,战略试探。Google在观察:窗口共享这种"系统级AI"功能,用户到底会不会高频使用?Mac用户规模适中、反馈清晰,是理想的试验场。

一个细节值得玩味:应用内置了NotebookLM和Canvas工具。前者是Google的AI笔记/播客生成器,后者是交互式创作空间。这两个工具的目标用户,和Mac重度用户高度重叠。

三、窗口共享的边界:它能做什么,不能做什么

功能上线后,最常被问的问题是:这和截图给AI看有什么区别?

实测差异体现在三个维度:

实时性。窗口共享是动态的——你在文档里新增一段文字,AI能基于最新状态回答。截图是静态快照,需要反复上传。

上下文连续性。Gemini能同时"看到"多个窗口,建立跨应用关联。比如左边是Excel数据表,右边是Keynote幻灯片,AI可以建议"把A列数据做成第三页的柱状图"。

操作流零打断。整个过程不需要离开当前工作界面,键盘快捷键呼出、语音或打字提问、结果浮窗呈现。

但限制同样明显:

隐私红线。系统级窗口访问涉及敏感信息,Google需要用户每次手动授权。企业场景下,IT管理员可能会封锁这个功能。

理解深度。Whitney的测试显示,AI对复杂布局的解析仍有误差——比如多层嵌套的表格、动态加载的网页内容。

生态孤岛。窗口共享目前只限于Mac本地应用,无法直接读取iPad或iPhone上的内容,和Google自家的Android生态反而割裂。

四、行业镜像:桌面AI的三种路线

Gemini Mac应用的上线,让桌面AI的竞争格局更清晰了。三条路线正在分化:

路线一:浏览器即入口。代表是早期的Gemini网页版、Perplexity网页版。优势是零安装、跨平台,劣势是系统能力受限,每次使用都是"中断-跳转-返回"的循环。

路线二:原生应用+深度系统集成。ChatGPT的Mac应用、Microsoft Copilot的Windows集成、现在的Gemini Mac应用,都属于这条线。核心赌注是:AI要融入工作流,必须获得操作系统级别的"驻留权"。

路线三:AI即操作系统。最激进的是Rabbit R1、AI Pin这类硬件尝试,以及微软Copilot+ PC的"Recall"功能(因隐私争议暂缓)。愿景是AI直接调度系统资源,用户甚至不需要打开具体应用。

Google的选择很务实:先走路线二,观望路线三。

窗口共享是路线二的典型功能——不颠覆现有操作系统,而是在其之上叠加AI层。这比路线三安全,比路线一深入。

但风险在于,路线二的护城河很浅。ChatGPT的Mac应用早半年上线,用户体验更成熟;Microsoft Copilot有Windows系统级集成,Gemini追不上。

Google的差异化筹码,可能是多模态能力和Google服务生态的打通——Drive、Photos、Docs的原生调用。但这些优势在Mac平台上反而被削弱,毕竟苹果有自己的iCloud和生产力套件。

五、一个被忽视的信号:键盘快捷键的产品哲学

Whitney在评测中特别提到了键盘快捷键设计,这通常是"效率工具"的核心指标。

Option+Shift+Space = 全窗口模式
Option+Space = 迷你聊天窗

两个快捷键,区分"深度使用"和"快速查询"两种场景。用户可以在设置中自定义。

这个设计透露的产品思路:AI助手不应该是一种"应用",而是一种"随时可用的能力"。

对比ChatGPT Mac应用的快捷键(默认Option+Space),Gemini给了用户更多粒度控制。全窗口模式适合复杂任务、多轮对话;迷你窗口适合即问即走。

更深层的暗示:Google在测试用户的行为模式。哪种使用频率更高?全窗口和迷你窗口的切换规律是什么?这些数据将决定下一代功能的优先级。

六、订阅分层:谁在为窗口功能买单

应用内的模式选择——Fast、Thinking、Pro——对应Gemini的订阅层级。

Fast模式免费,响应快但能力有限;Thinking和Pro需要Gemini Advanced订阅(月费19.99美元,含Google One 2TB存储)。

窗口共享功能本身不限定模式,但复杂任务(比如分析一个50页的PDF窗口、生成代码建议)显然需要Pro模型的支撑。

这构成了一个微妙的商业逻辑:免费用户能体验功能形态,付费用户才能获得功能价值。和ChatGPT Plus的桌面应用策略类似,但Google多了Google服务生态的捆绑。

一个待观察的问题是:窗口共享会不会成为独立的付费点?比如按共享时长、按处理窗口数量计费。目前Google没有释放这个信号,但AI基础设施的成本压力客观存在。

七、Windows用户的等待游戏

评测末尾,Whitney抛出了一个未解之谜:Windows版本何时到来?

Google官方没有时间表。但考虑到Gemini在Android和ChromeOS的深度集成,Windows版本的技术挑战可能不在于"能不能做",而在于"做到什么程度"。

Microsoft Copilot已经内置于Windows 11,Gemini作为第三方应用,能获得多大的系统权限?窗口共享在Windows上是否需要更繁琐的权限申请?

另一个变量是反垄断监管。Google在搜索和浏览器市场的主导地位,可能让其在Windows平台的任何深度集成都面临审查风险。

相比之下,Mac市场体量小、监管压力轻,Google可以更激进地试验。这是Mac优先的隐性逻辑。

但这也意味着,Gemini的"桌面AI"故事目前只讲了一半。Windows用户占全球PC市场的七成以上,Missing掉这个群体,窗口共享的杀手级功能就只能是小众狂欢。

最后的问题

Gemini Mac应用的价值,不在于它比网页版"好多少",而在于它验证了"AI感知用户当前上下文"这个方向的合理性。

窗口共享是第一步。下一步可能是:AI主动识别用户正在进行的任务,预判需求,在合适的时机介入。

但这也引出一个更深的问题:当AI能"看见"你屏幕上的一切,你愿意让渡多少隐私,换取多少效率?Google、OpenAI、Microsoft都在试探这条边界,而用户的选择,将决定桌面AI的最终形态。

你会因为窗口共享功能,把Gemini装回Dock栏吗?还是宁愿继续用浏览器标签页,守住那道看不见的数据边界?