3月17日,阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。

打开网易新闻 查看精彩图片

据了解,悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。拥有8亿用户的钉钉重写底层代码,进行全面CLI(命令行界面)化改造,让悟空Agent能够原生操作钉钉上千项能力,而非模拟人类点击图形界面,实现“沟通即执行”。

悟空全面支持连接用户在企业中的钉钉账号、安全访问权限和应用系统。同时,阿里生态业务ToB能力将以skills形式逐步嵌入该平台,作为阿里AI能力在企业工作场景的统一出口。

打开网易新闻 查看精彩图片

钉钉CEO陈航(花名:无招)在发布会现场表示:“今天,我们把钉钉打碎,用AI重建,炼出‘悟空’。过去是人用钉钉来工作,未来是AI用钉钉来工作。和市面上所有的龙虾Agent不一样,悟空天然就长在企业组织中,可以在真实的企业环境中安全使用。”

市面上大多数AI Agent还是“个人玩具”——能帮你写文案、搜资料,但放进企业真实业务里,权限管不住、操作查不到、成本算不清。悟空从第一天起就是为企业设计的。它内置企业级运行环境:AI Agent自动继承企业权限规则,所有操作在安全沙箱中运行,token消耗和成本一目了然,像管预算一样管AI开支。

打开网易新闻 查看精彩图片

发布会陈航演讲原文:

欢迎各位朋友们,早上好!今天我们集团CEO也在场,所以搞得我也很紧张。那我们马上开始钉钉AI钉钉2.0我们的钉钉新品发布会,我们来看我们今天给大家带来什么?

今天我们集团CEO也在场,所以搞得我也很紧张。那我们马上开始钉钉AI钉钉2.0我们的钉钉新品发布会,我们来看我们今天给大家带来什么?

我们先回到去年的8月25号AI 1.0发布。我要用视频,我没法在那找找找。当时产品叫Dino,它实际上现在我们可以来揭开它到底是个啥。当时我们说为AI准备这个全新的一个操作系统,它实际上就是现在最火的悟空。啊,它有只“龙虾”在里面,本来是希望为所有企业打造一个AI的一个工作环境,让人的工作电脑和AI的工作量进行分离,呃,保证一个安全、纯净的工作环境。

在这个基础之上,我们在12月23日我们又发布了AI D 1.1。我们进一步的进化,当时是希望把这只“龙虾”变成7只“龙虾”。在这个机器里面有一个PC,还有6台手机电脑,当时是为这个企业准备的一个全新的一个AI工作环境。然后事情发展得非常快,我们想我们应该推出全新的这个AI工作系统,然后。然后最近这个“龙虾”非常火,然后我就天天被挑战说,你当天早一点,为什么不把这个壳给去了,把“龙虾”放出来?那我们早就有“龙虾”了,对吧?那我们来看一下,如果把这个壳干掉,把“龙虾”放出来会怎么样?

大家看到,如果“龙虾”全部放出来,它一定会危害整个生态。它左手抓虾,右手抓鱼,他到处打洞,对吧?实际上如果个人电脑和公司电脑一旦装上,全都是后门,各种木马,各种病毒。那我们是希望为每位企业提供一个安全可控的一个工作环境,让AI的工作也是可追溯的。那怎么办呢?后来我们今天带着全新的产品。

这个悟空就是一个全新的AI Native的Work Platform,为打造一个Native AI延伸的工作系统。

那这个工作平台的话,悟空带着金箍棒,大家都知道它是定海神针,它往地上一戳,所有的虾兵蟹将全部离阵。该干啥干啥,认为不能瞎搞,对吧?都是在有序的环境中进行工作。这样的话,大家都会拿到一个安全稳定的一个AI工作环境。

那我们来为大家展示一下全新的悟空,它长成什么样子。它有PC端和手机端,在PC端上我们装好以后,会打造一个完整的一个AI工作环境,它会通过本机连接公司的工作网络以及公司内部的各种系统,能够在这里安全稳定地进行工作。在手机端通过钉钉可以直连悟空发布任何指令,所以当你不在公司,在你睡觉之前,你可能一个指令,悟空就在你的电脑上24小时为你工作。

那我们来看一下整个系统它是怎么样构成的。我们整个悟空的底层首先是一个Agent的Runtime,这个Agent Runtime会准备的第一是任务推理引擎,AI会根据你的命令来拆解,我到底该怎么执行任务。它有它的记忆系统,有一个AI的工作空间,以帮助AI能够存取和读取数据,有执行工具能帮助它能够调用公司的各种各样的SaaS系统以及网上的各种软件。

但是它有两个最重要能力,在底层第一,它会实现OS Ubiquitous,也就是说不管你今天使用的Windows还是使用的Mac电脑、苹果电脑,还是你使用的Linux的电脑,它都会超越所有的操作系统,独立存在。然后LLM Open等等,我们在模型层面上也实现了独立,也就是不管今天你使用的任何东西,你是公司里面装了千问,还是说你在云端使用我们的最新版的天问3.5 Max等等,都可以跨越所有的模型,调用全球所有最先进的模型来执行你的任务。

在这个Agent Longevity 4上,我们打造了一个Agent的Enterprise Agent空间。在这个Long Time上面,首先第一步是安全体系,这个安全体系会保证所有的AI Agent在一个安全可控的环境中进行。同时在IM层面上执行的企业级的IM能够帮助这个Agent可以和企业的任何的人,任何的系统进行沟通,然后Agent的这个管控体系能够帮助我们对Agent在执行过程中,对人、对团队、对部门,它的执行,它调用的模型调用量、存储空间的使用量等等的来进行管控。然后打造的工作空间,企业级的记忆能够帮助企业在他的个人、团队、项目等等层面上实现共享的空间。

然后因为不仅仅是AI的工作,人和AI要进行协同,所以我们把钉钉的所有的AI原生产品也进行了植入。所以这个AI经济,像AI表格实现数据的自由存取和AI进行协同,AI的搜问,我们的各种各样的产品,包括AI的各种各样的智能硬件,都在这边进行集成。所以在悟空的工作平台上面,我们可以自然的和我们工作,类似公司内部的各种系统进行协同,我们也可以跟网上,互联网上各种软件各种服务进行协同,我们也通过企业内部的AI智能硬件,可以和我们的生产线和我们的工作环境进行打通。

然后我们发布的这个企业市场,可以把各行各业的所有Skill,所有Agent进行发布,所以你需要用什么技能的时候,你这里进行调用,你需要什么Agent的时候,你可以调用。同时我们提供的一个全新的云专家市场。除了AI大部分的通用工作执行以外,如果你要找顶尖的HR、人事、服务、电商专家,云端的专家助力AI可以帮你完成更加复杂的任务,这叫我们的云专家市场。然后云的需求市场是企业在自己的行业,自己的场景中,会有各种各样的新的需求,你只要把你的需求和经验提出来,我要把这个实现AI化。我们的需求市场会让我们的AI工程师在云端为你完成在各行各业所有知识与经验的AI化。这样的话,软件的研发体系,企业的各种问题解决体系,全部是以AI的方式的来进行新的完成。所以未来时代,我们每个岗位的知识与经验的执行,由人的执行逐渐汇算成让模型Token的事情,数字生产力会逐渐再现。

那我们讲了半天,我们来看一下,假设没有今天这个Enterprise Agent的环境,每个人的电脑或者自己公司里面的环境中装上“龙虾”之后,它到底会发生什么?这都是现在正在发生的事情。比如说这是AI科技公司一个CEO,他自己把这个“龙虾”装在电脑上以后,大家会看到在3000人群里面,有的就直接跟他名下进行对话,对话完成之后,他的IP地址、真实姓名、公司的所有信息全部都暴露到群里面去了,因为“龙虾”不知道谁在跟他说话,他把公司里能拿到所有现金都往外面吐出去了。

这个是大家看,我们打上星号,实际上是Meta。大家看到Meta公司的安全总监,他自己把Agent装上去以后,他就尝试用我们“龙虾”,什么结果?他手电脑上面的重要的邮件200多封,全部被“龙虾”删掉,停都停不住了。这也是说明实际上在今天这个时代,如果你把“龙虾”装在自己电脑上,它的AI执行的不可确定性以及各种现在里面可能潜在的各种风险,都会被暴露出来,啊,包括数据泄露。今天你在网上你用扫描软件只要一扫描,你会发现一大堆的裸奔的电脑全是暴露在外面,都在裸奔。

所以看到,大家不知道知不知道中国现在“龙虾”很火,美国“龙虾”上没那么火。中国最火的“龙虾”城市是哪一个?大家知道吗?是杭州啊,杭州“龙虾”是最火的。为什么呢?我怀疑啊,我没有去,没有具体调查,杭州是电商之都,啊,有大量的人在网上要不停的去爬取数据,分析数据,所以他都希望用“龙虾”来搞。那所以搞的“龙虾”特别火,但是安全问题非常大。

技能,现在我们在上面可以下载非常多的Skill,而这些Skill中大家会看到将近15%左右的所有的Skill中都潜藏了各种各样的密码呀,病毒这些东西,它非常像当年我们去,有些人装了很多盗版软件,在盗版软件里面都植入的病毒,实际上你用的软件实际上你自己的电脑也变成木马。啊,这也是我们看到为什么我们当初Real这个机器的壳都放掉,我们要作为一个纯净的、安全的工作环境。

那今天钉钉是怎么解决这个问题的呢?我们在Enterprise Agent的执行环境中,我们导入第一步是DNA的一个权限控制体系。比如说,我在我电脑上装了悟空,装完悟空之后,在底层的验证安全环节,他必须要用钉钉账号进行登录。这个账号一旦登录,我的悟空就具备了我的DNA,然后有人开始要跟这个悟空进行对话。对话的时候,在远端的登录的钉钉也必须用完整的钉钉的安全账号进行登录。登录完成之后,这两者的连接将会进行身份验证。只有当我调用者的身份和我安装的悟空的这个身份一致的时,悟空才会觉醒。用这个方式,你确保你的悟空是你的个人助理,不会被别人随意调用,获取数据。

第二步呢是安全沙箱,我们把这个Agent是放在一个安全的沙箱环境中进行运作的,所以它能执行新的命令,它能调用的资源,它能访问的这些数据都是受到限制和控制,以防止这个Agent随意的执行,获取数据。有些时候它的推理会造成一些不确定性的规。

然后这是专属模型,很多企业在使用这些Agent调用模型的时候,都会担心我的数据会不会模型拿去调,我的数据会不会被泄露?那全新的这个悟空将会支持企业专属的模型,我们在企业Agent的开发环境中给了这个Deep完整的开发环境,然后我们的专属实例,专属的VPC以及专属一体机的这些支持,都能够支持各个企业,比如在云端,你将有自己的专属模型。你的所有的调用链路,你的调用的数据本身都会保证安全,不会汇模型训练,在过程中也不会和数据泄露。

然后,专属的技能就是当企业中使用任何的Agency技能的时候,这些技能都会得到安全验证,只有被企业安全验证后的Skill才能使用,以防止任何的Skill在云上的,网上发布的Skill被植入木马,直接放入公司就产生任何安全危。所以,通过安全认证,以保证企业都使用的安全可靠的技能。

那我们看一下这个整个AI这个在执行任务过程中,它会涉及到非常多的文件的访问,我们来先回顾一下Unix。今天所有的电脑系统都起决(注:应为起源于)来源于1969年当年的Unix之父。他在1969年发明了Unix,有个最基本原则,Make it simple。任何事情听你听起来简单,但But everything is fine/Everything is file,所有事情都是文件。系统之间保持说耦合,这些基本的原则为基础打造的Units成为我们今天Windows、Mac电脑、安卓、iOS的基础。

但是到了将近60年以后的今天,我们这个件系统基本上是为人操作系统而准备的,而这个操作主体正在发生重要的改变。对我们的系统的操作主体正在由人转换成AI,而AI在操作过程中,它会高频的进行读写操作,和人进行不断的打字有巨大区别。我们的文件系统绝大多数是以结果为导向进行存储的,你打开一个Word文件,你写好一个文档,一个保存,你存取的是一个你操作的结果。但是AI操作的是我们的全新系统,我们需要它是一个AI Native的系统。当AI在逻辑推理和执行过程中,它会不断的操作文件,它会不断的出错,它一旦出错,他就要逻辑回滚,它要重新再来一次。这个过程中,AI Native的文件系统将会支持我们的文件中途从人转换成AI,文件将会支持过程导向的保存,而不是结果导向的保存。大家知道,每一次的我们跟AI都是一次会话,而每一次会话AI拿到之后,它会进行逻辑推理,进行执行,而执行的每一步的过程都是AI的知识和经验的生成过程。

AI理解这个物理世界,解决问题的时候,它的过程是在一次一次试错中成长起来。而这些试错需要在文件系统中得到保存,也就我们人类的知识经验存在我们大脑中,我们一次一次的试错,一次一次的记忆。但这一次不断的记忆,AI在记忆过程中,它也需要文件存储,它需要一套完整的为AI设计的,以过程保存为中心的全新的文件系统。所以说我们这个代表Read-Write如“Real Doc”系统,这个系统将全面支持CLI命令行操作,对文件在原子层面上进行操作进行支持。

比如说在文件层面,它对每一个行,每一列具体的一个点进行修改修改。我们的组件系统都会支持它进行完整的、细致的原子层面批量操作。同时每一步操作都会支持高性能的快照保存,每秒钟上千字的版本保存,以帮助AI在执行任务过程中可以迅速回退,迅速执行,再一次继续进行经验整理。这个就是Redo/Rework为AI所准备的全新操作系统,而文件的操作在未来将不再是由人来操作,而是用AI进行操作。

但AI这个Agent,这个悟空和人一旦结合之后,我们的会话当给予命令给到AI,是我们所有任务的一个起点。在这个起点,真金Real Doc系统将会第一次把推理,把会话内容,把他的思考,把他的决策,把他执行问题的上下文全面进行保存。然后在过程中,他会不断的读取文档,产生数据,存储AI表格,它会执行生成代码,执行代码,它会读取图片,生成音视频等等的过程,这些数据全部会在Real Doc系统中进行过程保留。最后它会产生一个决策,产生一个执行,正确与错误,他会理解我们在物理事情中人与人的关系,这些概念,这些关系,这些决策树产生的Ontology本体,都会被AI产生一个知识图谱进行保留。而这个知识图谱的保留就是为我们今天的AI Agent所提供的企业级知识服务,它会反哺AI让AI能够快速的成长,这就是悟空为AI所准备的全新的操作系统。

啊,我讲太快了。谢谢。

然后,我们以这个流量和系统为基础,为所有企业提供的完整的存储管理。比如说它以A级的人员、项目、团队、企业为单位进行存储管理。同时,他会把我们在企业中的各种部门、各种岗位的权限映射到Agent和文件系统之中。同时,每一次的AI的执行都会进行快照保存,以保证AI的行为是可审计、透明的,来支持企业的AI可以准确、确定性的进行执行和调用,带来一个企业级的安全性控制系统。

那人机协作体系逐渐的跟我们刚才说的Real Doc和系统所带来的全新的AI Workspace为基础,我们来看看他们人机协同发生的变化。

我是大学的时候,最开始还用过DOS,可能现在好多90后、我都没见过这个系统,对吧?

从1981年开始到1995年我们主体的电脑操作系统体界面是个DOS。人是用的机器的语言和系统进行交互来执行命令。1995年开始,从Windows 95开始,我们快速进入了GUI时代。进入GUI时代以后,机器开始生成人类可理解的这个画面,用图形画面的形式对人进行交互,来实现机器用人的语言和人进行交互。

从2023年我们看到OpenAI爆火之后,我们看到人机交互界面逐渐进入LUI时代。我们所有的语言基本上是打开一个输入框,用人的语言开始跟AI进行交互,告诉AI你想做什么。这个时候人类发出指令,AI进行执行,但是AI会划很多工具进行外挂。但是它对原生的整个系统,我们人类所呈现创建的各种软件,它缺乏理解,所以它的整个任务执行是受限的。那到今天有了DingTalk CLI系统,我们全新的交互系统界面将进入CLI时代。AI正在成为我们的整个操作的主体,成为生产力的主体。

他将会依据对工具、对环境的理解,对模型的调用,来实现复杂任务的自主决策。而这个自主决策当调入系统的时候,如果用原生的API系统或者我们假设用原来的GUI系统,它将以模仿人的方式来进行操作,这个效率实际下来,耗费大量Token不断的重复往返。我们给到CLI的支持之后,所有的命令被进行了压缩,而压缩本来Compress就代表智能,所以AI可以更加准确的去理解所有工具的能力,更加高效的进行命令调度,来执行各种任务。所以我们看到今天当悟空发布之后,我们的社会就在快速进入CLI时代,所有的界面,所有的系统,所有的服务都将为AI进行开发。

整场发布会陈航讲了2万多字,从该段后几乎全是涉及大量底层技术与架构逻辑,篇幅过长。所以笔者也就截至之此。

不过,在发布会尾声,他抛开技术参数,聊了聊这一年的心路历程,笔者记录了全文,分享给大家:

去年我们在全国调研时,我印象特别深刻。走遍省市县乡村,你会发现大家都在用什么产品?拼多多、短视频、社区团购……当时我就在想,中国互联网当年发生重大变革的最核心原因是什么?其实是人口结构的变化。

尤其是在微信高速发展的时期,中国互联网用户从原来的3-4亿一二线城市人口,迅速扩展到三四五线城市及农村,最终实现了10亿甚至11亿的互联网人口。正是这种人口结构的下沉,催生了后来各种软件的诞生——无论是短视频、拼多多还是水电缴费等本地生活服务。

去年4月1日我们出来创业,一直在思考到底该干什么。后来觉得要改变世界,必须有足够的资源。回到阿里后,我们开始重做钉钉。从4月1日到现在,我们一直在思考:AI时代到底该是什么样子?

后来我们突然想明白了一件事:AI现在最大的变革不是模型本身,而是互联网的主体从“人”变成了“AI”。

如果互联网的执行主体从人变成了AI,代表着整个互联网结构将发生根本性变革:文件系统会变、操作界面会变、硬件交互方式也会变。我们现在看到的所有GUI界面,甚至我妈都能懂的原子结构操作逻辑,都将被重塑。

谁能帮助AI最快速地连接物理世界、理解物理世界、解决物理世界的问题,谁就掌握了未来。

所以我们拼了命在做AI时代的这些事。但你会感受到AI巨大的力量,这种能量是不能随便释放的。每次看到网上那些“小龙虾”文章乱飞,知识博主天天吹捧AI Agent(智能体)时,我就觉得这极不负责任。

如果不加限制,把超级智能体随便放出去扫描,每家公司的电脑、个人PC都会被开后门,变成“种木马”、重运营的灾难。所以我每次听到同学讲这些,我就说:“赶快把壳拆了吧,这是不负责任的。”

因为你面对的是一个比你还勤快的超级智能体。如果没有足够的管理权限控制它,不在沙箱中运行,它最终会反噬你自己。能力越大,责任越大。 当你想改变世界时,必须保证在人和AI共处的未来,技术依然可控。

AI依然要研究,依然要拉平中国4300万中小企业与全球顶级企业之间在AI技术和认知上的鸿沟。这本来就是钉钉最早期的初心,也是激励我们全力以赴打造AI时代工作方式的动力。

前段时间,我半夜回家,同事兴奋地说:“我操,今天屌爆了!我一个晚上写的代码是过去一年的量。”我说怎么搞的?他说:“我现在一个人操纵5、6个‘悟空’(AI Agent)一起帮我写代码。”

有时候我觉得自己确实有点“老灯”了(笑),因为我现在写代码少了,很难再像早期做工程师那样,操作最先进的技术,兴奋得睡不着觉。我很担心自己落后于时代,但也很有幸能和这么多优秀的年轻人在一起,在AI的大潮中幻想未来。

这次“悟空”的全面发布,代表了钉钉过去10-11年沉淀的知识与经验,以及我们服务的2600万客户、2700万组织到8亿用户的积累。

为什么这次重组/发布取名叫“竹”?

源于一次挖竹子的经历。碗口大的竹子砍掉后,桩还在那里。我轻敌了,以为20分钟能挖出来,结果4个人花了3个小时才搞定。挖开后我发现,地上只有一根竹子,地下却有巨大的根系,像竹鞭一样延伸,不断长出竹笋,最终成为一片竹林。

那一刻我感觉到,这就像AI时代的开始——AI的思想和技术正在注入各行各业,像竹鞭一样延伸,诞生全新的时代。这是硅基时代和碳基时代融合的开始。

所以我们取名“竹”,希望以自然法则表达:在AI时代,我们要保持乐观、坚韧,不断解决问题。但初心依然是以人为本。我们希望中国的中小企业,能和全球顶尖企业在AI技术利用、思想理解、模型认知上拉平。只有这样,整个中国乃至全球才能保持持续的创新,每个人才能在AI时代有参与感。

今天发布AI钉钉2.0和“悟空”,我们希望钉钉继续支持所有企业的沟通与协同,不仅在中国,也在全球范围内帮助企业和个人进入全新的AI时代。

最后,感谢钉钉所有小伙伴的全力以赴,也感谢家属们的支持,特别幸运能和大家在一起。