打开网易新闻 查看精彩图片

谷歌推出新型AI模型

谷歌于2025年10月7日发布Gemini 2.5 Computer Use模型,该AI具备通过浏览器界面模拟人类操作的能力。据科技媒体The Verge报道,该模型能执行点击、滚动、输入等操作,直接获取非API接口的网页数据。

技术实现与应用场景

该模型基于视觉理解与逻辑推理能力,可完成表单填写等交互任务。谷歌表示其专为缺乏API的界面设计,目前已应用于AI Mode智能代理功能及自主执行购物任务的Project Mariner研究项目。演示视频显示,该模型能完成"玩2048游戏"或"浏览Hacker News热门话题"等指令。

行业竞争态势

此次发布正值OpenAI在年度开发者大会推出新版ChatGPT应用次日。相较竞品,Gemini 2.5仅支持浏览器环境操作,暂未开放桌面系统控制功能,目前提供13种基础交互指令。开发者现可通过Google AI Studio和Vertex AI平台体验该技术。

(消息来源:The Verge 2025年10月7日报道)

参考链接:
https://www.theverge.com/news/795463/google-computer-use-gemini-ai-model-agents