(关注公众号设为标,获取AI深度洞察)
全文 8,000字 | 阅读约19分钟
【文章核心要点:】
微软CEO纳德拉预测Agent将重塑软件行业格局;
Copilot Studio平台可实现低代码/零代码Agent开发;
Agent应用已覆盖个人、团队、企业三大层面;
银行、税务、法务等多个行业已有成功落地案例;
Agent具备多模态交互、规划推理、记忆管理等高级能力
2025年1月7日,微软CEO萨提亚·纳德拉(Satya Nadella)在班加罗尔的“Microsoft AI Tour ”大会上发表关于AI的主题演讲,勾勒一幅令人震撼的未来图景:AI Agent将彻底重塑软件行业的版图,传统软件开发和使用模式即将迎来终结。
这一预言的分量,不仅来自纳德拉作为科技巨头掌门人的地位,更源于微软已经构建的完整Agent生态系统。从个人助手、团队协作到企业级应用,Agent已经开始渗透到软件应用的每个角落。更令业界瞩目的是,微软推出的Copilot Studio平台让Agent的创建门槛降至前所未有的低点——只需定义任务、连接数据源,任何人都能像制作电子表格一样轻松打造自己的AI Agent。
在企业实践层面,这场革命已经展现出惊人的速度和规模。在银行业,智能Agent已经部署出三层架构:面向新客户的自助服务Agent、负责客户关系管理的客户经理Agent,以及提升内部效率的员工服务Agent。印度的Clear Tax通过Agent实现了退税处理的全自动化,而Persistent公司的合同管理Agent正在重新定义法务流程的效率标准。这些Agent具备多模态交互、自主规划、记忆存储和权限管理等全方位能力,展现出取代传统软件的强大潜力。
需要强调的是这些Agent并非简单的功能替代。它们展示了前所未有的智能水平:能够理解和执行复杂指令、自主规划多步骤任务、记住上下文并学习用户偏好,甚至能够协调多个系统协同工作。这种革命性的变化,标志着软件行业正在进入一个全新的智能时代。
人工智能浪潮下,你准备好了吗? 扫码参与顶尖学府AI人才培养计划,掌握未来竞争力! AI浪潮汹涌而来, 不学习就是在倒退,现在正是提升自己的最佳时机。 我们AI深度研究院正在与复旦大学、上海交通大学、 中国科技大学,联合打造面向未来的AI实战课程, 让每个人都能把握AI红利。 和顶尖专家一起,解锁AI时代的无限可能。 【问卷即将截止!把握最后机会,重磅课程席位有限!】 扫描二维码,提前布局AI时代, 不要让未来的你,遗憾错过现在的机会!这里扫描演讲文稿
大家好!
能够再次回到印度,回到班加罗尔,真是太棒了。每次回来看到这里的活力和热情,都让我感到不可思议。特别是在这样一个时刻,我们可能正在进入下一个阶段——从谈论人工智能,欣赏其新功能(无论是基础设施还是模型),到真正用人工智能做出大胆而重大的事情。这正是我来到这里感受到的空气中的气息,大家对正在发生的事情以及你们所做的事情充满了期待。我想用接下来的半小时时间,向大家讲述我所看到的可能性,以及我们微软在构建平台方面的重点。
对我而言,微软始终专注于两件事情:我们是一家平台公司,也是一家合作伙伴公司。即便在人工智能时代,这依然是真实的。每当谈到这些平台和平台变革时,必须扎根于驱动这些变革的基础性力量。回顾我在技术领域的 35 年经历,一直围绕着一个根本性的力量:摩尔定律。比尔每年都会把我们召集在一起,他会说,内存正在发生什么变化,然后告诉我们将其与软件结合起来。这是当时公司唯一的指导方针,而即使今天也是如此。当前赋能人工智能和预训练的扩展定律再次体现了摩尔定律的威力。从 2010 年的 CPU,到 GPU 的崛起,接着又因为transformer的数据并行效率而再次实现了飞跃。容量每 18 个月翻倍,后来甚至变为每 6 个月翻倍。这就是扩展定律的本质。
当然,对于预训练的扩展定律是否会持续,人们仍有争论。但我们坚信扩展定律仍然有效且强大,尽管随着数据量的增加、参数的增多以及系统问题的复杂化,它们变得更难实现。这些同步数据并行工作负载是全新的工作负载,因此它们将继续发展。但更有趣的是,推理时间或测试时间计算的扩展定律也开始出现。在某种程度上,预训练需要抽样步骤,而这总是围绕如何利用抽样步骤来扩展。因此,能够通过推理时间扩展将其带到一个新水平,这让我感到非常兴奋。
对我而言,“Copilot(协作助手)”是一个能“思考更深入”的工具,这不仅在额外预训练的采样中起作用,也能在推理时间中使用,从而获得更好的结果。这些能力将不断增强,最终实现三件事:
多模态能力:现在成为所有软件的界面。我最近在 iPhone 上设置了一个新的“行动模型”,它就像一个协作助手,和我高中老友聊天一样自然。
规划和推理能力:无论何时启动协作助手工作区,系统都在调用规划和执行计划的能力,作为一个多步骤流程。
记忆和工具使用能力:它能够记住上下文、使用外部工具,以及理解权限设置。这将帮助我们创建丰富的智能代理生态系统,从个人代理到团队代理,再到企业内外的代理。
在微软,我们从未将这些技术视为单独的存在,它们只是实现目标的手段。我们的目标是赋能地球上的每个人和每个组织,实现更多。我们专注于构建三个平台:Copilot(协作助手)、Copilot 人工智能技术栈以及 Copilot 设备。
一、Copilot:AI的用户界面
即便在一个复杂和生成式的世界中,人工智能也需要与我们交互,这意味着需要一个用户界面层。因此,这种组织层次的协作助手在许多代理执行自主工作时显得尤为重要。这是理解人工智能的最佳方式。
1、Copilot嵌入到工作流
一个非常典型的例子是知识工作中高风险的场景。
有一位医生正在为一个肿瘤委员会会议做准备。这是一个高风险的会议。这意味着她需要阅读所有报告,知道每份报告需要花费多少时间,这也意味着制定议程本身就是一项推理任务。于是,人工智能帮助创建了一个议程,明确哪些是更复杂的病例需要更多的时间,然后进入 Teams 会议。
现在,所有医生都在一起讨论这些病例。他们能够专注于病例本身,而不是忙于记录,因为有人工智能在为他们记录详细笔记。会议结束后,这位医生还是一名教学医生,她希望能将肿瘤委员会会议中的讨论内容带到课堂上。这时,她可以将笔记导入 Word,然后转到 PowerPoint,轻松完成讲课。这是医生们在世界各地都在使用的一种简单工作流程。人工智能嵌入到工作流程中,可以真正影响生命。这是一个很好地展示如何将人工智能融入当前工作流程的例子。
2、下一步的方向
通过 Pages 和 Chat,以及 Web 和 Workscope,我们可以重新构想两种类型的工作流程。
首先,我现在可以访问各种信息,无论是网络上的信息还是 Microsoft 365 Graph 中的 Word 信息。我可以一次查询这些数据,将其提升到一个基于人工智能的互动画布中,称为 Pages。一旦数据进入 Pages,我就可以在 Pages 中内嵌使用协作助手(Copilot)对其进行持续修改。
当我与人工智能协作、与同事合作时,这成为了一种新的隐喻。想象一下,这是一种新的工作流程:我与人工智能协作,在 Pages 中提升信息,邀请其他人,进行协作。而且人工智能也在这个画布中实时存在。因此,Chat 和 Pages 将成为新的人工智能枢纽。
就像当初 Word、Excel 和 PowerPoint 改变了我们的工作方式,现在 Chat 和 Pages 将成为一个新的模块,全面增强我们与人工智能的协作方式。
3、我们不会止步于此
下一步是关于扩展性的问题。如何让人工智能实现更广泛的扩展?这从被称为“协作助手动作(Copilot Actions)”的功能开始。对于那些曾经大量使用 Outlook 规则的人来说(我自己就是其中之一,直到复杂性超出控制),可以将其视为“人工智能时代的规则”,但这些规则不是仅适用于单个应用程序,而是适用于整个 Microsoft 365 系统。这就是协作助手动作的美妙之处。
许多工作流程涉及信息的收集和分发,也涉及将人们与其他人或其他资源连接起来,而知识工作本质上就是这些。我可以将这些工作流程设置为协作助手动作,这是扩展性的第一步。当然,您还可以构建完整的智能代理。我们自己就构建了许多具有组级别和流程级别作用的智能代理。
例如,您可以拥有一个项目Agent。我们在 Teams 中有一些Agent,比如翻译员或协调员。这就像多了一个团队成员,帮助您处理团队中的任务。在 SharePoint 中,每个 SharePoint 现在都有一个AI agents,可以将其视为一个内置的智能层。
4、AI agents的一个示例
更令人兴奋的是,您们所有人都可以构建自己的AI Agent,而这正是协作助手工作室的用途所在。我们的协作助手工作室愿景非常简单:这是一个低代码/零代码的工具,用于构建AI Agent。可以将其想象为当年 Excel 帮助人们构建电子表格的工具。
对我们来说,构建AI agents 应该像构建电子表格一样简单。因此,Copilot Studio 的目标是帮助每个人都拥有真正的自主能力,围绕我们的知识工作任务设计和重新设计工作流程。这就是我们希望构建的东西——一个围绕我们工作的AI Agent群,帮助我们完成工作,实现更多的流程体验,减少枯燥乏味。
在 Copilot Studio 中,以现场服务(field service)为例,创建AI Agent的过程非常简单:
首先给出一个提示(prompt),定义Agent的用途和任务。
接下来,将其与知识源对接。在这个案例中,将其指向正确的 SharePoint 数据源。
完成这些步骤后,系统会自动为您创建一个AI agent。
这种能够轻松创建低代码或零代码编程的AI agent的简单性,正是我们在 Copilot Studio 中的努力方向。现在,您已经拥有了人工智能的用户界面(UI),可以通过“动作”(Actions)进行扩展,可以使用内置的agent,还可以构建自己的agent——这形成了一个完整的系统。
二、商业路径选择
接下来的问题是:AI agent投资回报率(ROI)和衡量标准。因为我们想要确保的核心点是激发真正的变革动力。毕竟,我所做的是否不仅提升了自己的生产力,还改善了组织的成果?这就是衡量工具的作用所在。
我们正在构建 Copilot Analytics(协作助手分析工具),让每个人都能看到其工作的影响。这不仅仅是自上而下的过程。例如,一个销售区域经理可以关联输出指标(如提高销售额或收益率)与具体的协作助手功能使用情况,从而实时看到这些功能如何推动业务成果。这种反馈循环可以立即让人们看到更高的使用频率如何带来更大的业务收益。
1、微软内部测试
在微软内部,我们已经看到了惊人的成果。
基本上,在每一个业务流程中,我们的生产力都实现了两位数的大幅提升,包括:
客户服务
人力资源自助服务
IT 应用
财务
供应链
营销
以营销为例,尽管购买流程非常复杂,但在内容创作等方面存在大量效率低下的问题,而我们通过协作助手实现了显著的运营杠杆和效率提升。因此,微软内部的各个场景中都展示了协作助手的巨大潜力。
2、两个典型案例
当然,当我来到印度,见到这里的企业时,这种技术的扩散速度之快令人惊讶。它已经不再需要等待多年才能进入主流市场。我从许多企业部署这些技术的过程中学到了很多。
今天早上,我与 Cognizant 的团队交谈,他们告诉我如何将这些技术部署到整个员工队伍中。早在 90 年代,安迪·格罗夫(Andy Grove)就谈到了“知识转化率”(knowledge turns),即如何快速创造知识并高效扩散,就像零售行业中的“供应链转化率”。这种概念在任何知识行业中同样适用。
另一个例子是 Persistent 公司,他们正在构建合同管理智能代理。在 Persistent 中,无论是合同生命周期管理还是单一变更,这些智能代理都能显著提升效率。例如,通过 Copilot 内的合同人工智能(contract AI),用户可以在整个合同管理过程中随时访问相关内容。这种小小的改进都能带来显著的影响。
这些是企业级部署 Copilot 系统的两个典型案例。
三、Copilot技术栈和AI平台
接下来,我想谈谈第二个平台,即 Copilot 技术栈和人工智能平台(AI Platform)。
1、投资 30 亿美元
对我们而言,我们始终将 Azure 设想为“全球的计算机”。因为我们深刻认识到,人工智能并不是孤立存在的技术,因此我们正在全球范围内构建这一平台。
目前,我们在全球拥有 60 多个区域和 300 多个数据中心。在印度,我们非常兴奋地看到已经建立起来的区域,包括 印度中部、印度南部 和 印度西部。此外,我们还与 Geo 合作,在容量建设方面取得了巨大进展。我们正在进行许多区域扩展,今天我非常高兴地宣布,我们将在印度进行有史以来规模最大的单次扩展:追加投资 30 亿美元,用于扩大我们的 Azure 能力。
昨天,我有机会会见了印度总理。这次会面非常精彩,他分享了许多具体的例子,以及他对推动人工智能使命的愿景。这种愿景结合了印度独有的资源:印度技术栈(India Stack)、国家的创业活力,以及消费者和企业层面的优越人口结构。这一切共同形成了一个良性循环,这也是为什么我们对为下一代人工智能提供核心计算能力感到非常兴奋。
2、基础设施的关键性
现在,谈到基础设施,实际上对任何国家或企业来说,都有一种新的公式。我将其概括为:每美元每瓦的计算能力。 这就是重点。在未来两年、五年、甚至十年,我们将讨论 GDP 增长与这种公式之间的相关性。不论是一个社区、国家、行业,甚至是公司层面,增长的根本驱动力在于他们如何高效地运用这个公式。因此,基础设施需要成为最高优先级,而我们正在每一个层面进行创新。
3、数据中心的创新
在数据中心层面,从数据中心的设计和构建开始,我们优化了专为液冷 AI 加速器设计的基础设施,这是一个全新的工程壮举。我们还在与可再生能源供应商合作,通过电网为我们的数据中心提供负载支持。这些数据中心拥有适当的冷却基础设施,实现零废弃物和零水资源使用。我们从系统层面确保这一切都得到集成。此外,在硅片创新领域,我们正在与 NVIDIA 合作。实际上,我们今天在其中一个数据中心中上线了首个 GB 200 集群。我们对它的潜力感到非常兴奋。同时,我们也与 AMD 合作,构建我们的基础设施,甚至在打造我们自己的硅片。比如,“Meyer”处理了微软网站的大量客户服务流量。
我们正在构建世界级的人工智能加速器基础设施,优化整个系统堆栈,从训练到推理内核优化。这是我们与合作伙伴共同进行的重大投资和创新,我们对此非常激动。我将此视为系统创新的黄金时代。
4、数据的重要性
在拥有基础设施之后,接下来的大问题是数据。今天,我见了许多合作伙伴和客户,他们首先关心的问题是如何整理好他们的数据。数据是创建人工智能的唯一途径。不仅是为了预训练,我们知道在检索增强生成(RAG)中需要数据,后训练(post-training)需要数据,采样、推理计算重训练(inference time compute retraining)也需要数据,数据管道是所有工作的核心。
首先,您需要将数据与云端对接。这就是为什么我们正在构建我们庞大的数据资产体系(data estate),这样您可以将所有数据迁移到云端。不管您使用的是 Snowflake、Databricks、Oracle、我们自己的 SQL,或者其他平台,都可以带到云端。我们拥有卓越的操作型存储(operational stores),能够为人工智能工作流提供支持,比如 Cosmos 数据库、SQL Hyperscale,以及专为分析工作负载设计的 Fabric。
实际上,看看 ChatGPT,Cosmos 数据库就是其最大用户之一。ChatGPT 的所有用户数据状态都存储在 Cosmos 中。因此,对我而言,数据层是一个至关重要的核心层,我们正在尽一切努力帮助客户整理数据,使其可以与模型结合使用并构建模型。
这就是两个关键点:一方面,模型正在基于数据进行训练;另一方面,您可以使用数据执行诸如检索增强生成(Retrieval Augmented Generation,RAG)之类的任务。这就是为什么数据引力(data gravity)具有巨大的重要性,以及数据的本地化(locality)将变得非常关键。
四、AI应用服务器
在拥有基础设施和数据之后,您需要做的第三件事情是构建人工智能应用服务器(A.I. Application Server)。回顾历史,当网络出现时,我们构建了应用服务器;当云计算兴起时,我们开始构建云原生的应用服务器;移动互联网时代也是如此。因此,每一代技术都需要新的应用服务器。这正是我们通过 Foundry 在做的事情。
1、Foundry 的核心是模型。
我们拥有丰富的模型资源,特别是与 OpenAI 的合作及其创新成果。我们对即将到来的 GPT-3.5 和 GPT-4.0 感到非常兴奋。所有这些,包括来自 LLaMA 或其他开源模型的资源,以及针对特定行业的模型,都将被纳入到我们的模型目录中。例如,来自印度的模型正在针对印度的语言和需求进行开发。看到世界各地围绕模型展开的创新是非常令人振奋的。因此,我们希望拥有最丰富的模型目录。一些最受欢迎的模型将以服务形式提供,用户可以通过 API 直接访问。
在拥有模型后,接下来的步骤包括:
部署模型
微调模型
蒸馏模型
对模型进行评估
进行压力测试
确保模型的安全性
所有这些功能,我们将其集成到应用中,而不是分开构建。
2、构建敏捷的应用服务器层
邮件(emails)将成为最重要的领域之一。我给团队的指导很简单:始终站在新模型的前沿,并确保应用服务器层的敏捷性,以便能够随着模型的演变不断进步。这意味着您会使用最新的示例,随后进行成本优化和延迟优化,然后开始针对特定用例(例如邮件)进行微调。这是一个持续循环,这也是 Foundry 的核心理念:简化这一切的流程。
在印度,我们已经看到了巨大的势头。许多客户已经在部署这一技术并使用它,我们也从中获得了许多优秀的反馈。很多人正在探索多代理系统的部署,我们从这些雄心勃勃的尝试中学到了很多。这些反馈帮助我们明确了发展路线图,确保我们未来的进步脚踏实地。我认为,明年我们将不再过多讨论模型本身,而是更多讨论模型编排、邮件以及如何部署这些模型驱动的应用。这将成为整个行业的重大转变。
3、实际应用案例
今天,我拜访了一家银行,他们向我展示了三个方面的成果:
自助服务代理:用于支持新客户。
客户经理代理:为客户关系管理提供支持。
员工代理:为内部员工提供服务。
此外,我还参观了一家名为 Clear Tax 的出色初创公司。他们的系统非常简单:用户只需提交收据,系统就能自动计算退税。我特别喜欢这一功能。
在医疗保健领域,我发现了一个有趣的现象:缺乏标准化的理赔表格。每份表格格式都不同,因此需要人工阅读和处理。我认为,通过改善医疗效率,可以提升经济效率,因为这有助于更好地管理保险理赔。在我的行程中,我还与一个团队会面,他们正在旅行行业中进行高水平的工作。旅行行业是一个复杂的领域,包括酒店、航空和其他交通方式。他们正在开发一个多代理框架,可以部署到整个行业。
令人兴奋的不是只有大型公司或初创企业在应用这项技术,而是技术扩散的速度特别快,尤其是在印度。
五、AI的工具层
微软的起点是一家工具公司,而我们至今依然对工具充满热情。我们在工具开发领域的成果令人振奋。
1、GitHub 的成长
我们现在在印度拥有 7000 万 GitHub 用户,这是仅次于美国的第二大社区。事实上,预计到 2028 年,印度将成为世界上最大的开发者社区。我对此充满期待,因为三年后,印度的开发者数量将超越美国。这是一个令人兴奋的发展。此外,印度对人工智能项目的贡献仅次于美国。在 GitHub 上,与人工智能相关的开源项目中,印度开发者社区的活跃参与展示了巨大的才华和活力。
2、GitHub Copilot 的进步
我们在 GitHub Copilot 上也取得了巨大进展。其中一个让我特别期待的功能是 多文件编辑(Multi-File Edits)。我们从代码续写功能开始,后来引入了聊天功能,将代码续写和聊天结合起来,现在又支持多文件编辑。这非常棒,因为它让我可以在整个代码库层面进行编辑。
3、GitHub Copilot 的三层功能
另一个重要发展是我们在去年 12 月推出了 Copilot 的三层功能,而印度是这个功能扩展最迅速的地区之一。这让我感到非常兴奋,因为这一功能正在被广泛分发。实际上,我第一次看到 GitHub Copilot 是在 2019 年或 2020 年左右,那时我深刻感受到大语言模型(LLMs)的潜力。这种潜力在 GitHub Copilot Workspaces(协作助手工作空间)中得到了进一步体现。当我第一次看到它时,我意识到,我们需要迈出从聊天到真正智能代理(agents)的下一步,而这正是它的意义所在。
4、GitHub Copilot Workspaces 的功能
Copilot Workspaces 是第一个生成式人工智能(Generative AI)原生开发者平台,帮助开发者使用自然语言将创意转化为代码。以下是一个实际案例展示:
六、 Copilot 设备
最后,我想谈谈 Copilot Devices(协作助手设备)。我们谈了很多关于创新和基础设施的事情。从云端的硅芯片开始,现在这一切正在向边缘设备(Edge)发展。我们对与 Qualcomm、AMD 和 Intel 的合作感到兴奋,比如开发下一代的 MPU(多处理单元)。事实上,Jensen 提到了即将推出的下一代 GPU,这些 GPU 将支持运行完整的 NVIDIA 堆栈,而且是本地运行的。因此,我们对 Copilot 在 PC 和传统 GPU PC 上的应用感到非常兴奋。
同时,我们也对基本功能充满期待。例如,当我使用我的 Copilot PC 时,我希望电池续航能够持续一整天,并且内置这些新人工智能功能,例如嵌入的 Copilot 功能。第三方开发者已经开始使用这些功能,比如 Adobe 和 Capcom 等公司。因此,这标志着边缘设备上一个新平台的开始,其重要性不亚于云端的发展。实际上,我们并不认为这是过去的客户端-服务器模式,它并不是关于断开连接的本地模型,而是关于混合人工智能(Hybrid AI)。
这个概念是,您可以构建一些能够在本地 MPU 上运行的应用程序,同时调用云端的 LLM(大语言模型)。任何应用程序都将成为真正的混合应用程序,不再局限于本地运行或完全云端运行。这是我们期待的未来。**
我们希望通过所有这些平台展示三大关键设计决策:
Copilot 作为人工智能的用户界面(UI)。
应用服务器作为构建人工智能应用的平台(如 Foundry)。
数据架构(Data Fabric)。
相比模型本身,这些设计决策更加重要,因为模型每年甚至每月都会变化更新,而用户界面、数据架构和应用服务器是最基础的核心层,能够提供灵活性来适应新模型。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
参考资料:https://www.youtube.com/watch?v=bYgP-tC5BFU&t=890s
来源:官方媒体/网络新闻
排版:Atlas
编辑:深思
主编: 图灵
热门跟贴