文 | 世界模型工场
6月2日,微软办了一场眼花缭乱的Build 2026开发者大会。
自研大模型、系统级安全沙箱、企业数据层、开发者工具、AI硬件……新产品、新功能一口气发了20多个。
但这些产品全都指向一件事:Agent。
在全行业都在拼Agent的当下,微软显然急了。
让企业级Agent放心上岗
如今Agent是AI行业最热的词,但要做好Agent并不容易。
一个真正能干活的Agent,首先要拿到权限。
它需要权限读取你的文件,需要知道你在做什么、和谁协作、有什么待办,需要在帮你发出邮件之前确认不会闯祸。
权限给少了,Agent就只能停留在建议阶段。但权限给多了,风险又会迅速放大。
这不是某一个Agent产品就能解决的问题,尤其是在企业级工作环境中,一个能干活的Agent,需要的是一整套基础设施。
这正是微软Build 2026发布会最值得关注的地方,它在给企业级Agent搭建了一套“上岗”的地基。
此次微软发布的所有东西,本质上都是建设这套基础设施:
底层是芯片和云,往上是模型,再往上是安全执行环境,然后是上下文数据,最上面是用户看得见的Agent应用,每一层都有对应的发布。
丨Agent产品层:用户直接感知和使用。
Scout是本次最核心的Agent产品之一。它可以常驻在Microsoft 365工作流中,并与Teams、Outlook、OneDrive等办公应用协同。
它可以像同事一样接收指令,浏览你的邮件、日历、工作消息,自动处理会议冲突、起草回复、推进任务。
Agent 365则更像企业管理Agent的控制台,用来统一管理Agent的身份、权限、策略和风险。
另外一款Agent产品,是GitHub Copilot发布的全新桌面应用,提供统一的"我的工作"视图,多个编程Agent可以并行运行在独立的代码分支上。
丨上下文层:让Agent知道你在做什么。
Agent要替你干活,前提是它得读懂你的工作环境。
微软发布的Microsoft IQ体系,把Work IQ、Fabric IQ、Foundry IQ等能力串起来,让Agent理解企业里的邮件、会议、文档、组织关系、业务数据和工作流。
丨安全执行层:让企业敢用Agent。
Agent越自主越危险,这是企业大规模部署Agent最大的顾虑。
微软的答案是MXC(Microsoft Execution Containers)。
它是由Windows执行安全边界的Agent运行时/沙箱能力,让开发者和企业管理员可以限制 Agent能访问什么、能操作什么,并把OpenClaw等本地Agent放进受控环境中运行。
Windows 365 for Agents,则是给Agent配了一台受控的Cloud PC,让它可以在云端Windows环境里操作应用、浏览器和企业系统。
丨开发平台层:让Agent从demo走向生产。
有了底层基础设施,下一个问题是,开发者怎么把Agent真正做出来、部署上线、并且持续迭代?
为此,微软推出和升级了Foundry、Microsoft Agent Framework、Foundry Toolboxes、Rayfin、GitHub Copilot App。
企业可以在这里选择模型、接入工具、定义工作流、观察Agent调用了什么、失败在哪里。
丨硬件层:给Agent配上本地算力。
Agent-first硬件原型Project Solara,是这次比较有想象力的发布。
微软展示了两个概念参考设计:
一个是badge device,类似胸牌/可穿戴设备,让Agent跟随用户离开桌面,进入会议、移动办公、免手持场景。
另一个是desk device,类似桌面Agent伴侣设备,强调常驻、环境感知、随时可用。
这表明微软不想让Agent只活在软件里,也想提前卡位AI硬件入口。
丨模型层:为Agent提供自研模型。
这次最值得单独说的,是模型层。以上这些层,都需要一个可控的模型层来驱动。
微软这次推出了七款完全自研的MAI模型,覆盖推理、编程、图像、语音、转录。
其中,最重要的是推理模型MAI-Thinking-1。
微软称,这是Microsoft AI的第一个自研推理模型,拥有350亿活跃参数和256K上下文窗口,面向复杂多步骤指令、长上下文推理和代码生成。
微软还特别强调,自研模型从零训练,未使用第三方前沿模型蒸馏。
这句话是在告诉市场,微软不只是OpenAI的最大渠道商,它也有自己的模型底座。
MAI不一定是为了和GPT、Claude正面硬拼,但可以给微软自己的Agent提供一个成本可控、可调度的模型底座。
微软不可复制的优势
微软一次性发布了这么多款产品,其实就是在回答一个现实问题:
企业到底怎样才能放心用Agent?
微软的答案是,模型要可控,上下文要打通,Agent要有身份,权限要可配置,执行环境要隔离,行为要可审计,硬件入口也要提前布局。
这才是这次Build 2026的真正主线。
对企业用户来说,这套体系解决了他们此前不敢放手使用Agent的核心顾虑。
为什么微软能做得这么彻底?
因为它有一个别的公司很难模仿的优势,就是它已经在企业里了。
微软的Office、Teams、Outlook、GitHub、Azure,这套组合覆盖了全球数亿企业员工和开发者一天里几乎所有的工作界面。
处理邮件在Outlook,开会在Teams,文件在SharePoint,代码在GitHub,身份权限在Entra,设备管理在Intune,云服务在Azure。
微软推Agent,不需要重新找用户,也不需要说服企业换工具,Agent只需要沿着这张已经铺好的网络用起来。
没有哪家公司像微软一样,能同时坐拥企业工作流的每一个关键节点。
这种结构性优势,是后来者无法在短时间内复制的。
企业级Agent竞争激烈
但优势不等于安全,微软同样站在压力之下。
企业级Agent市场竞争非常激烈,OpenAI、Anthropic、Google、Salesforce等厂商,都在往同一个方向涌。
原因很简单,这是AI真正变现的地方,企业愿意为降本增效的工具付钱。
在这场竞争中,微软其实已经晚了。
第一层压力来自OpenAI、Anthropic等模型厂商。
从2023年起,OpenAI、Anthropic就开始推进企业级AI业务。
如今Anthropic的Claude Code在开发者里建立了相当高的心智占有率,Anthropic主导推出的MCP 协议正在成为Agent连接外部工具的事实标准。
更关键的是,OpenAI、Anthropic的模型能力在推理、编码、多步骤任务上仍处于第一梯队,这是企业选择Agent底层的核心考量。
但模型能力是微软始终未能建立的护城河。
对于那些更看重Agent够不够聪明的企业,微软的综合平台优势,并不能完全弥补模型能力上的差距。
第二层压力来自Google。
Google的打法和微软几乎类似,同样靠自己的企业办公生态带Agent入场。
Gemini for Google Workspace已经深度嵌入Gmail、Docs、Drive、Meet,面向的恰好是微软在大企业里最强的那些场景。
Vertex AI Agent Builder让企业在Google Cloud上构建和部署自定义Agent,A2A协议推动多 Agent协作标准化。
但Google还有额外筹码,搜索和实时信息能力可以让Agent读懂世界,没有哪家公司比Google更擅长这件事。
在Google Workspace 的重度用户群体里,微软并不天然占优。
第三层压力来自垂直领域的蚕食者。
Salesforce推出的Agentforce把Agent能力深度嵌进CRM流程,直接在销售、客服、营销这些高频企业场景里落地。
ServiceNow的Now Assist则在IT服务管理、HR流程、企业工单这些内部运营场景里,构建 Agent闭环。
这些SaaS软件平台的威胁,不是正面竞争微软的底座,而是在微软平台覆盖不到的垂直领域,把客户锁定。
等微软的Agent生态成熟时,这些场景的入口已经被占了。
微软在Build 2026上展示的这张蓝图,逻辑上是自洽的,覆盖也足够全面。
但蓝图和落地之间永远有距离,真实企业环境里能跑成什么样,还需要时间验证。
不过有一点是确定的,微软迈出这一步,Agent的可用性在企业和开发者眼里又往前推了一步。
对整个行业来说,这场竞争加速了,对所有人都是好事。
热门跟贴