从概念到实践，AI Agent 狂飙的这一年|agent|大模型|智能体|视频生成模型

大模型的世界不缺热点。

OpenAI近期发布的Sora无疑成为了科技界的新宠，再次彰显了大模型技术的强大潜力和不断进步。然而，除了大模型技术的飞速发展，过去的大半年里，AIAgent也是行业热议的焦点。

关于Agent的定义，人们的理解并不统一。

尽管存在争议和不同的理解，但AI领域的巨头、平台企业和各类创业公司都积极投入到了Agent的开发和应用中。他们通过推出Agent平台、框架或应用，展现了对这一领域的强烈信心。

在国内，百度、阿里、字节、智谱等企业都推出了各自的Agent平台。同时，一些企业从应用层面入手，如360、实在智能、澜码科技等，他们在安全、财务、人事等场景中探索Agent的实际应用。

那么，为什么Agent会受到如此多的关注和追捧呢？国内企业又是如何切入这个领域的呢？创业公司和平台企业在Agent开发和应用上各有何优劣势？Agent距离真正改变我们的生产和生活还有多远呢？这些问题都值得我们深入探讨和研究。

01百家争鸣Agent

2023年年中，当时还是OpenAI联合创始人的AndrewKarpathy在一个开发者活动的发言被广为传播。“如果一篇论文提出了某种不同的训练方法，OpenAI内部会嗤之以鼻，认为都是我们玩剩下的。但是当新的AIAgent论文出来时，我们会十分认真且兴奋地讨论”。

也是这一时间段，OpenAI应用研发主管Lilianweng在一篇博文里定义了基于LLM构建AIAgents的框架。她指出，Agent=LLM（大型语言模型）+记忆（Memory）+规划技能（Planning）+工具使用（ToolUse），其中，LLM是智能体的大脑，而记忆、规划和工具使用能力是关键组件。它也成为大模型时代Agent的经典定义。

随着时间的推进，2023年11月，OpenAI推出其官方Agent开发框架AssistantAPI，并预告了即将上线的GPTStore，这一举措进一步推动了AIAgent的热潮。

除了OpenAI及行业巨头的积极参与，硅谷也涌现出众多与AIAgent相关的创业项目和产品，如BabyAGI、MetaGPT、GPTResearcher等。根据Agent中国的持续统计，这些AIAgent涉及开源、闭源、商业智能、通用等101种，详见：盘点全球101款AIAgent产品丨2月更新

02引领变革Agent

众多科技巨头和创业公司纷纷对Agent表示看好，其背后原因主要在于Agent能够扩展大模型的能力。人工智能领域的资深技术观察者指出，Agent技术的核心在于利用大模型作为基石，进一步拓展其能力范围，力求成为解决各类问题的全能钥匙。

有专家将大模型形象地比作大脑，而Agent的能力则为其增添了四肢。实在智能的算法负责人欧阳指出，大模型与Agent的关键区别在于对外部工具的运用。他认为，Agent是大模型走向实际应用的关键环节。尽管大语言模型在理解意图和生成对话方面表现出色，但在企业实际应用中，单纯的对话任务仅占日常工作的一小部分。因此，在执行涉及多个业务系统的复杂任务时，Agent的能力就显得至关重要。

欧阳进一步阐释，在财务、法务等实际应用场景中，大模型虽然具备强大的智能分析能力，但却无法直接进行实际操作。这时，就需要将大模型与各类自动化工具（如实在智能RPA）相结合，形成有效的解决方案。Agent具备与环境互动的能力，能够准确理解目标、分解任务，并调用相应的工具来执行任务。这使得原本难以协调的复杂任务流程变得简单可行。

比尔·盖茨曾预言，Agent将成为未来普遍存在的工具，彻底改变人们使用电脑的方式，甚至有可能颠覆整个软件行业。这一观点得到了众多行业人士的认同：Agent正在引领人与机器互动方式的全新变革。

在这种变革中，不仅大型企业将获得新的平台级机会和入口，众多创业公司也将迎来全新的发展机遇。这也是为何从行业巨头到创业者及投资市场都对Agent技术充满热情的原因。

03盘点国内AIAgent

范式变迁的潜在机遇，促使国内涌现出一大批涉足Agent领域的企业。其中包括大型科技公司、AI专业公司和新兴创业团队等。

从图中明显看出，不同企业在Agent市场的布局各有侧重。

一是平台模式，如阿里和百度推出了智能体开发平台，这些平台既拥有自研大模型，又有云计算业务，因此与培育和完善开发者生态高度契合。

二是借鉴OpenAI的GPTStore模式，面向更广泛的人群推出智能体商店，如昆仑万维、钉钉、智谱AI和字节等。这些企业主要面向泛C端市场，看重的是Agent作为入口的潜力以及对应用生态的变革作用。

三是在头部云厂商中，华为和腾讯也持有自研大模型，并在Agent领域有所动作。它们的技术研究团队分别与大学合作发布了各自的Agent框架。例如，腾讯与德州大学达拉斯分校合作开发的AppAgent项目以及华为诺亚方舟实验室与伦敦大学学院、牛津大学团队提出的盘古Agent框架等都展示了这些企业在Agent领域的研究进展。

四是专注于企业级Agent应用和平台层的开发。例如实在智能、澜码科技等厂商致力于帮助企业构建一站式的Agent设计、使用和管理平台。它们还在一些先行场景中打造标杆Agent应用，以形成示范效应。

发稿前不久，实在智能更是在PC端基础上推出了手机版Agent智能办公助理，实现了在手机上跨应用操控不同APP的便捷操作。