从概念到实践,AI Agent 狂飙的这一年
打开网易新闻 查看精彩图片
从概念到实践,AI Agent 狂飙的这一年

大模型的世界不缺热点。

OpenAI近期发布的Sora无疑成为了科技界的新宠,再次彰显了大模型技术的强大潜力和不断进步。然而,除了大模型技术的飞速发展,过去的大半年里,AIAgent也是行业热议的焦点。

关于Agent的定义,人们的理解并不统一。

尽管存在争议和不同的理解,但AI领域的巨头、平台企业和各类创业公司都积极投入到了Agent的开发和应用中。他们通过推出Agent平台、框架或应用,展现了对这一领域的强烈信心。

在国内,百度、阿里、字节、智谱等企业都推出了各自的Agent平台。同时,一些企业从应用层面入手,如360、实在智能、澜码科技等,他们在安全、财务、人事等场景中探索Agent的实际应用。

那么,为什么Agent会受到如此多的关注和追捧呢?国内企业又是如何切入这个领域的呢?创业公司和平台企业在Agent开发和应用上各有何优劣势?Agent距离真正改变我们的生产和生活还有多远呢?这些问题都值得我们深入探讨和研究。

01百家争鸣Agent

01百家争鸣Agent

2023年年中,当时还是OpenAI联合创始人的AndrewKarpathy在一个开发者活动的发言被广为传播。“如果一篇论文提出了某种不同的训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的AIAgent论文出来时,我们会十分认真且兴奋地讨论”。

也是这一时间段,OpenAI应用研发主管Lilianweng在一篇博文里定义了基于LLM构建AIAgents的框架。她指出,Agent=LLM(大型语言模型)+记忆(Memory)+规划技能(Planning)+工具使用(ToolUse),其中,LLM是智能体的大脑,而记忆、规划和工具使用能力是关键组件。它也成为大模型时代Agent的经典定义。

随着时间的推进,2023年11月,OpenAI推出其官方Agent开发框架AssistantAPI,并预告了即将上线的GPTStore,这一举措进一步推动了AIAgent的热潮。

除了OpenAI及行业巨头的积极参与,硅谷也涌现出众多与AIAgent相关的创业项目和产品,如BabyAGI、MetaGPT、GPTResearcher等。根据Agent中国的持续统计,这些AIAgent涉及开源、闭源、商业智能、通用等101种,详见:盘点全球101款AIAgent产品丨2月更新

02引领变革Agent

02引领变革Agent

众多科技巨头和创业公司纷纷对Agent表示看好,其背后原因主要在于Agent能够扩展大模型的能力。人工智能领域的资深技术观察者指出,Agent技术的核心在于利用大模型作为基石,进一步拓展其能力范围,力求成为解决各类问题的全能钥匙。

有专家将大模型形象地比作大脑,而Agent的能力则为其增添了四肢。实在智能的算法负责人欧阳指出,大模型与Agent的关键区别在于对外部工具的运用。他认为,Agent是大模型走向实际应用的关键环节。尽管大语言模型在理解意图和生成对话方面表现出色,但在企业实际应用中,单纯的对话任务仅占日常工作的一小部分。因此,在执行涉及多个业务系统的复杂任务时,Agent的能力就显得至关重要。

欧阳进一步阐释,在财务、法务等实际应用场景中,大模型虽然具备强大的智能分析能力,但却无法直接进行实际操作。这时,就需要将大模型与各类自动化工具(如实在智能RPA)相结合,形成有效的解决方案。Agent具备与环境互动的能力,能够准确理解目标、分解任务,并调用相应的工具来执行任务。这使得原本难以协调的复杂任务流程变得简单可行。

比尔·盖茨曾预言,Agent将成为未来普遍存在的工具,彻底改变人们使用电脑的方式,甚至有可能颠覆整个软件行业。这一观点得到了众多行业人士的认同:Agent正在引领人与机器互动方式的全新变革。

在这种变革中,不仅大型企业将获得新的平台级机会和入口,众多创业公司也将迎来全新的发展机遇。这也是为何从行业巨头到创业者及投资市场都对Agent技术充满热情的原因。

03盘点国内AIAgent

03盘点国内AIAgent

范式变迁的潜在机遇,促使国内涌现出一大批涉足Agent领域的企业。其中包括大型科技公司、AI专业公司和新兴创业团队等。

从概念到实践,AI Agent 狂飙的这一年
打开网易新闻 查看精彩图片
从概念到实践,AI Agent 狂飙的这一年

从图中明显看出,不同企业在Agent市场的布局各有侧重。

一是平台模式,如阿里和百度推出了智能体开发平台,这些平台既拥有自研大模型,又有云计算业务,因此与培育和完善开发者生态高度契合。

二是借鉴OpenAI的GPTStore模式,面向更广泛的人群推出智能体商店,如昆仑万维、钉钉、智谱AI和字节等。这些企业主要面向泛C端市场,看重的是Agent作为入口的潜力以及对应用生态的变革作用。

三是在头部云厂商中,华为和腾讯也持有自研大模型,并在Agent领域有所动作。它们的技术研究团队分别与大学合作发布了各自的Agent框架。例如,腾讯与德州大学达拉斯分校合作开发的AppAgent项目以及华为诺亚方舟实验室与伦敦大学学院、牛津大学团队提出的盘古Agent框架等都展示了这些企业在Agent领域的研究进展。

四是专注于企业级Agent应用和平台层的开发。例如实在智能、澜码科技等厂商致力于帮助企业构建一站式的Agent设计、使用和管理平台。它们还在一些先行场景中打造标杆Agent应用,以形成示范效应。

发稿前不久,实在智能更是在PC端基础上推出了手机版Agent智能办公助理,实现了在手机上跨应用操控不同APP的便捷操作。

04蓄势待发Agent

04蓄势待发Agent

“大模型能力还在快速发展,Agent目前是个在发展变化的概念,它的形态还在演进中。”一位ToB领域的资深人士表示。

有观点称,Agent本质是模型能力专家化,但当下它更像是AI的角色扮演,一个同质化基础大模型,通过一些Prompt加人设,Agent的行动要满足人设。Zilliz合伙人兼产品总监郭人通此前在一个论坛上表示,后期Agent要成为行业专家,才具备核心价值。

大模型能力本身也对Agent的能力和形态产生影响。智谱CEO张鹏曾言,Agent的本源仍然是大模型的基础能力,大脑的智力水平足够高,才能谈理解、推理、规划和执行这些事。

而除了Agent的各种能力本身,实在智能Agent智能体项目核心算法负责人认为,安全机制的构建也必不可缺,“不仅需要官方定义的那几个能力,还需要安全性和多Agent之间的协同,才能在B端更好落地。目前这也是我们花了很大精力做的工作。”