谷歌发布新版AI模型Gemini 2.5 可模拟人类操作浏览器

龙剑秀南

2025-10-08 19:20 ·上海

谷歌推出新型AI模型

谷歌于2025年10月7日发布Gemini 2.5 Computer Use模型，该AI具备通过浏览器界面模拟人类操作的能力。据科技媒体The Verge报道，该模型能执行点击、滚动、输入等操作，直接获取非API接口的网页数据。

技术实现与应用场景

该模型基于视觉理解与逻辑推理能力，可完成表单填写等交互任务。谷歌表示其专为缺乏API的界面设计，目前已应用于AI Mode智能代理功能及自主执行购物任务的Project Mariner研究项目。演示视频显示，该模型能完成"玩2048游戏"或"浏览Hacker News热门话题"等指令。

行业竞争态势

此次发布正值OpenAI在年度开发者大会推出新版ChatGPT应用次日。相较竞品，Gemini 2.5仅支持浏览器环境操作，暂未开放桌面系统控制功能，目前提供13种基础交互指令。开发者现可通过Google AI Studio和Vertex AI平台体验该技术。

（消息来源：The Verge 2025年10月7日报道）

参考链接:
https://www.theverge.com/news/795463/google-computer-use-gemini-ai-model-agents

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴