微软公司正在向实现自主人工智能智能体愿景迈进,这些智能体不仅能够聊天,还能执行更复杂的任务。
今天,微软宣布推出Copilot Cowork,这是Microsoft 365平台中的一项新功能,能够处理此前只能在持续人工监督下完成的"长期运行的多步骤任务"。
Copilot Cowork由微软工作AI首席营销官Jared Spataro在博客文章中宣布。他表示,这项新功能通过公司的Frontier项目提供,该项目允许企业在前沿AI功能正式发布前进行测试。
微软的Copilot工具已经存在几年时间,但直到现在主要专注于生成任务,比如总结邮件或起草邮件和博客文章的文本。而Copilot Cowork则是为委派任务而构建的,因此人们不需要在复杂工作流中执行每一个步骤,而是可以描述他们想要的结果,让AI自主完成所有这些任务。
Spataro表示,用户只需告诉Copilot Cowork他们想要完成什么,它就会制定计划并立即执行必要的任务来实现目标,在各种Microsoft 365应用程序和文件之间进行推理。不过人工监督仍然存在。在工作过程中,人类能够监控智能体的进度,并在其偏离轨道时介入"引导"它朝正确方向发展,Spataro说。
该系统基于Work IQ框架,旨在教会Copilot了解组织数据的具体环境,同时确保遵循安全和治理协议。Spataro表示,Copilot Cowork的核心是提高工作效率,消除人类在不同应用程序之间不断跳转的需要。
即使是相对简单的任务,如完成月度预算审查,也需要人类在Excel、Outlook、Teams和SharePoint等平台之间不断切换。需要收集所需数据并与同事协调,然后将所有内容编制成报告。
Copilot Cowork消除了所有这些麻烦。它充当"协调者",执行日常简报和日历管理等任务,无需提示完成每个单独的步骤。
早期采用者Capital Group Companies Inc.的企业技术高级副总裁Barton Warner表示,Copilot Cowork是关于采取实际行动,而不是生成内容和答案。"它连接步骤、协调任务并在日常工作流中跟进执行,"他解释说。
多模型研究
Copilot Cowork最大的优势之一是其多模型方法,同时集成了OpenAI集团的GPT模型和Anthropic的Claude。这在公司新增强的"研究员"智能体中可以看到,该智能体现在通过新的"批评"层利用这两个AI模型。
其工作方式是OpenAI的GPT模型起草回应,然后由Claude审查准确性并确保引用正确。Spataro表示,这种组合使研究员智能体在DRACO基准测试中的得分提高了13.8%。
此外,还可以颠倒角色,让Claude起草回应,GPT进行事实核查。然后,通过新的"模型委员会"功能,用户可以比较每个模型的结果,看看它们在哪里一致,在哪里分歧,在哪里产生独特的输出。这很像让多个研究员在同一个项目上工作。
通过允许不同模型扮演不同角色,一个用于起草回应,一个用于批评,微软正试图构建一个更具弹性的系统,减少困扰早期AI系统的"幻觉"问题。通过允许人类交叉参照不同AI的工作,企业可能能够以更高的信任度扩大AI自动化规模。
Q&A
Q1:Copilot Cowork与普通Copilot有什么不同?
A:普通Copilot主要专注于生成任务,如总结邮件或起草文本。而Copilot Cowork是为委派任务而构建的,能够处理长期运行的多步骤任务,用户只需描述想要的结果,它就能自主完成所有相关任务,无需人工执行每个步骤。
Q2:Copilot Cowork如何保证工作准确性?
A:系统采用多模型方法,集成OpenAI的GPT模型和Anthropic的Claude。一个模型起草回应,另一个进行审查和事实核查。同时保持人工监督,人类可以监控进度并在必要时进行引导,通过"模型委员会"功能还能比较不同模型的结果。
Q3:普通企业如何使用Copilot Cowork?
A:目前Copilot Cowork通过微软的Frontier项目提供,该项目允许企业在AI功能正式发布前进行测试。它基于Work IQ框架,能够学习组织数据的具体环境,同时确保遵循企业的安全和治理协议。
热门跟贴