那个你每天要移动几千次的小箭头,四十年来基本没换过样子。它移动、点击、选中、拖拽,偶尔变成转圈加载的焦虑符号。谷歌现在想把这个不起眼的箭头变成笔记本电脑上最强大的AI工具之一——乍一听很荒谬,直到你意识到自己每天要用它多少次。
这家公司为Googlebook(其搭载Gemini的新品类笔记本)发布了Magic Pointer功能。这个特性赋予光标AI能力,让它能理解你指向的内容,并帮你执行操作,无需输入冗长提示词或打开单独的聊天窗口。
在新发布的DeepMind博客中,谷歌解释了如何为AI时代重新设计指针。核心思路是让Gemini精确理解用户所指的网页区域、图片、表格、文档或视频帧。这将光标从基础导航工具变成了整块屏幕的AI遥控器。
到这里,整个概念开始显得奇妙而荒诞。一个指针可以把表格变成图表,对比网页上选中的商品,把PDF总结成邮件要点,或者识别照片中的建筑并调出导航路线。这个曾经只用来点击小按钮的光标,突然被要求理解上下文、意图和操作。
谷歌的灵感来自人们线下的交流方式。你通常不会先描述房间里每个物件再请人移动它,而是直接指着说"把这个挪开"或"修一下那个"。Magic Pointer把这套逻辑搬到了屏幕上:光标告诉Gemini你指的是什么,而"加上这个""合并那些""这是什么意思"这类简短指令告诉它要做什么。
这项新功能将深度整合进Googlebook笔记本,作为该平台的一部分发布。这意味着Googlebook用户能在整个笔记本体验中自由使用,而不局限于单个应用或浏览器窗口。
对其他用户来说,这款AI指针目前仅限Chrome中的Gemini使用。谷歌表示,用户可以指向网页特定部分并提问,比如对比多个选中的商品、总结产品页面的技术规格,或即时转换价格货币。
如果Magic Pointer运行顺畅,日常AI任务可能再也不需要提示词输入框了。
热门跟贴