周三下午三点,你刚在纽约曼哈顿找到车位,面对一根杆子上密密麻麻的停车标识——周二周四扫街禁停、装卸区限时15分钟、居民许可区晚8点后解禁。你拍了张照片发给朋友求助,五分钟后收到三个不同答案。这种场景即将成为历史,或者说,即将变成AI的责任。

谷歌在I/O开发者大会上宣布,Gemini将获得视觉能力和移动场景。沃尔沃即将推出的EX60 SUV将成为首批搭载该功能的车型,车外摄像头将向谷歌AI助手开放,实时解读周围环境。这项升级建立在沃尔沃采用谷歌嵌入式Android Automotive作为车载操作系统的基础上。

打开网易新闻 查看精彩图片

谷歌给出的首个应用场景直戳痛点:让Gemini翻译那些令人抓狂的停车标识。公司设想的功能远不止于此——摄像头加持的Gemini将能回忆路牌信息、解读车道标线、甚至回答附近地标或餐厅的相关问题。据谷歌介绍,系统可以告知车主某地点允许停车时长、是否需要特殊许可证、以及其他限制条件。

"未来,Gemini将让你的驾驶更有帮助,让你在行驶中了解更多周围环境信息,"谷歌Android Automotive副总裁Patrick Brady在声明中表示。

这项功能并非仅靠云端Gemini独立完成。EX60搭载的英伟达Drive AGX Orin计算平台提供了本地算力支撑,同时具备OTA软件升级能力。车端处理意味着部分功能可在离线状态下运行,这对网络信号不稳定的停车场场景至关重要。

停车标识解读确实是个真需求——前提是准确率过关。纽约地区的停车标识以复杂难懂著称,多层限制叠加在同一块牌子上是常态。但风险同样明显:若Gemini误读标识导致车主被开罚单,甚至车辆被拖走,信任崩塌只需一次失误。谷歌必须确保这项功能的可靠性,否则车主会干脆关闭它。

视觉能力的加入也让地图导航产生变化。沃尔沃将成为首批获得谷歌地图全新Immersive Navigation功能的汽车厂商之一,该功能以3D渲染路线,图形效果更接近真实世界。结合车外摄像头,谷歌地图将能提供更具对话感的指引,例如"过这个红绿灯,在图书馆处下一个路口左转"——用人能识别的地标替代抽象的街道名称。

从功能设计看,谷歌正在把车外摄像头从安全辅助工具重新定义为环境感知入口。传统车载摄像头服务于碰撞预警、车道保持等驾驶安全功能,而Gemini的介入意味着这些视觉数据将被用于信息查询和决策辅助。这种转变的边界值得关注:当AI开始"解释"物理世界,解释权本身就成了产品核心。

沃尔沃的选择也反映了车企在智能化路径上的站队。采用谷歌原生车载系统而非自研方案,让沃尔沃能快速接入Gemini生态,代价是将数据层和体验层的控制权部分让渡给科技巨头。EX60的硬件配置——英伟达Orin芯片+谷歌系统+Gemini AI——构成了一个典型的"硅谷供应链"组合。

对于车主而言,最实际的考验将在第一批罚单出现时到来。是选择相信AI的解读,还是坚持自己肉眼判断?这个选择本身,就是人机协作新模式的缩影。