谷歌正在通过基于其Gemini 3模型的新型自动浏览功能来扩展Chrome在企业生产力中的角色。该功能可以导航网站、收集信息并进行处理,从而减少专业工作流程中的手动数据输入和重复点击。该功能目前作为预览版向美国的付费AI Pro和Ultra订阅者开放,可通过Chrome中的Gemini界面访问。
此举正值超大规模云计算提供商和OpenAI、Anthropic等领先模型提供商正在推动AI深入企业工作流程之际,他们致力于自动化日常任务和流程,以实现可衡量的生产力提升。OpenAI在2024年2月率先展示了能够自主操作设备的软件,Anthropic在同年10月展示了其"计算机使用"功能。自那以后,两家公司都在努力将这些能力整合到更精细的产品中。
谷歌也一直在进行浏览器和基于智能体的自动化实验。该公司在2024年10月推出了Jarvis(现称Project Mariner),以探索更加自主的网络导航和任务执行,这是谷歌推动AI成为企业运营活跃参与者的更广泛计划的一部分。Jarvis已向月费250美元的谷歌AI Ultra服务订阅者作为原型产品提供。
Chrome自动浏览目前在美国作为预览版向AI Ultra订阅者开放,也向月费20美元的AI Pro服务订阅者开放。分析师认为,这一举措将浏览器定位为轻量级生产力层,旨在简化知识工作并让员工摆脱重复性的耗时在线任务。
Avasant公司主要分析师Abhisekh Satapathy对谷歌纳入用户监管功能表示欢迎,他指出Gemini在完成某些操作前会要求确认。Pareekh咨询公司主要分析师Pareekh Jain则关注其在处理复杂工作流程时的易用性。
他表示:"它可以处理复杂的多步骤网络工作流程,如表单填写和导航,企业用例包括费用处理(从门户网站提取收据)、采购报价聚合以及通过SaaS界面更新客户关系管理系统。"他认为开发团队可能会获得生产力提升:"这可以通过零代码自动化释放大幅收益,让人力资源或财务部门的运营团队独立创建迷你自动化,如指导其访问供应商门户、下载一月份发票并保存到特定的Drive文件夹,无需等待开发人员。"他表示,从繁琐工作中解放出来后,"开发人员可以从编写脆弱的网络爬虫脚本转向编写高级智能体指令,将重点从点击转向期望的结果,提升工作流程效率。"
埃弗雷斯特集团实践主任Priya Bhalla表示,Chrome自动浏览可能会对开发人员对用户体验设计的思考产生更深远的影响:"随着时间推移,这可能会改变开发人员对用户体验的思考方式——不仅要为人类用户优化,还要为代表他们行动的AI智能体优化。"
然而,分析师也提醒说,Chrome自动浏览可能不太适合关键业务工作流程。Jain表示,企业系统涉及身份验证层、基于角色的控制、条件逻辑和自定义界面,这些可能是Chrome自动浏览难以应对的领域。他补充道:"它仅依赖浏览器交互,没有深层的应用程序接口或内部系统集成。此外,在易于发生文档对象模型变化的动态网页上可能会变得不稳定。"
通常,智能体使用文档对象模型来导航网页,因为它代表网页的结构以定位要点击的按钮等。在动态网页上,文档对象模型可能会频繁变化,为AI智能体创造挑战。
除了可靠性和集成挑战外,分析师还指出了与将浏览器级别的自主权委托给AI智能体相关的潜在安全风险。Satapathy表示:"这些包括处理已认证的浏览器会话、与不受信任的外部网站交互,以及确保自动化操作不会无意中提交不正确或敏感信息。在受监管环境中,这可能会使审计和合规审查变得复杂。"
Q&A
Q1:Chrome自动浏览功能是什么?它有什么作用?
A:Chrome自动浏览是基于Gemini 3模型的新功能,可以自动导航网站、收集信息并进行处理。它能减少专业工作流程中的手动数据输入和重复点击,支持表单填写、费用处理、采购报价聚合和CRM更新等企业用例。
Q2:Chrome自动浏览有什么局限性?
A:该功能可能不适合关键业务工作流程。它难以应对企业系统的身份验证层、基于角色的控制和自定义界面,容易在动态网页上出现不稳定性,且缺乏深层的应用程序接口或内部系统集成能力。
Q3:Chrome自动浏览存在什么安全风险?
A:潜在安全风险包括处理已认证浏览器会话、与不受信任的外部网站交互,以及自动化操作可能无意中提交敏感信息。在受监管环境中,这可能会使审计和合规审查变得复杂。
热门跟贴