谷歌Gemini更新推出实时视觉分析功能

实时AI视频功能开始部署

据PhoneArena报道,谷歌于2025年3月24日开始部署Gemini平台的创新实时AI视频功能。该功能使Gemini能够通过用户的设备显示屏或智能手机摄像头解读视觉输入,并提供上下文相关的答案。这一更新是在去年谷歌I/O开发者大会上展示“Project Astra”技术演示后近一年推出的。

新功能首次出现在小米手机上

一位Reddit用户首先在其小米手机上发现了这一新功能,并分享了Gemini分析屏幕内容的视频。这是谷歌在3月初宣布的两项主要功能之一,这些功能将逐步向Gemini高级订阅用户开放。另一项功能则是利用智能手机摄像头处理实时视频流,使Gemini能够理解和回应用户关于周围环境的问题。

Gemini功能扩展

此次更新紧随Gemini Canvas功能之后,该功能帮助用户完成写作和编程任务,同时增加了播客摘要工具。这些新功能展示了谷歌在AI助手技术领域的领先地位,超越了苹果、三星和亚马逊等竞争对手。

未来展望

尽管目前的功能尚未完全实现去年展示的所有特性,如记忆物品位置和标注特定区域以获取更多信息,但Gemini的进步速度令人期待。谷歌计划在今年的I/O大会上展示更多创新成果。

(来源:PhoneArena,2025年3月24日)

参考链接:
https://www.phonearena.com/news/googles-gemini-update-that-can-tell-you-live-what-it-sees-through-your-camera-is-now-rolling-out_id168813