当 AI agent 需要一个「家」的时候,它们没有住进独立的 App,而是搬进了聊天软件。

2 月春节期间,机器人满天飞的时候,Manus 发布了 personal agent,首发平台选了 Telegram,而非自家的 WhatsApp。

打开网易新闻 查看精彩图片

与此同时,Salesforce 在 1 月宣布新版 Slackbot 正式上线,定位为「你的个人工作 agent」;飞书开放平台上线了 AI Agent 工作流节点和 MCP 工具支持;Discord 社区里,AI bot 的数量和复杂度也在急速攀升。

这当然要拜 OpenClaw 所赐,作为仅一个周末就涨到 10 万 GitHub star、增长最快的 AI 开源项目之一,它的默认交互界面不是网页,不是独立客户端——是 Telegram。

打开网易新闻 查看精彩图片

一个清晰的趋势正在形成:即时通讯工具正在从「人与人的对话」变成「人与 AI 的接口」,聊天软件意外地迎来了它们的「第二春」。

但「第二春」并非平等地降临在每一寸土地上。不同 IM 平台的开放程度、技术架构和治理逻辑差异巨大,它们在 agent 浪潮中的位置也截然不同。理解这些差异,需要一条分析线索——开放性的天平。

为什么是聊天软件?

为什么是即时通讯软件?打开自己生活里最常用的对话框,就可以使唤 AI——这非常符合人类对「科技生活」的畅想。不过,真正的答案,跟 agent 的架构有关。

AI agent 的工作原理并不复杂:监听用户指令,交给 AI 处理,再把结果返回。这个「消息进—处理—消息出」的循环,天然适配即时通讯的基础设施——长连接、实时推送、富文本消息。聊天软件在过去十几年里为人类对话打造的管道,几乎不需要改造就能供 agent 使用。

打开网易新闻 查看精彩图片

更重要的是 human-in-the-loop 的需求。当前的 AI agent 远不到完全自主的程度,它在执行关键操作之前——比如发一封邮件、修改一段代码——往往需要人类点头确认。聊天窗口里的一个回复,比打开一个新的管理后台、登录一个新的 dashboard 要自然得多。IM 天然就是一个「确认/驳回」的界面。

还有一个更决定性的因素:用户已经住在聊天软件里了。不需要下载新 App,不需要学习新界面,agent 就在你每天打开的对话列表里,夹在同事群和家庭群之间。这种零迁移成本,是任何独立 AI 产品都很难复制的优势。对于开发者来说,这意味着获客成本趋近于零——你不需要说服用户安装任何东西,只需要让他们点一下「添加 bot」。

但并非所有聊天软件都平等地受益于这波趋势,决定谁先吃到 agent 红利的关键变量,是平台的开放程度。我们可以沿着一条从「完全开放」到「完全封闭」的光谱,来观察各家 IM 平台的位置和策略。

天平最左端:Telegram

Telegram 之所以成为 agent 浪潮的第一个受益者,不是因为它最大、最好用,而是因为它是所有主流 IM 里开发者门槛最低的。

创建一个 Telegram bot 只需要跟@BotFather 对话几步——起个名字,拿到 API token,就可以开始接收和发送消息。不需要企业认证,不需要审批流程,不需要等待人工 review。整个过程从零到一个能跑的 bot,可以在 5 分钟内完成。

打开网易新闻 查看精彩图片

这种「零摩擦」不仅仅是注册环节的便利。Telegram 的 Bot API 设计本身就非常开发者友好:webhook 机制让 bot 可以实时响应消息,inline 模式让 bot 可以在任何对话中被唤起,支持 markdown 和 HTML 的富文本渲染让 agent 可以返回结构化的输出。

更关键的是,Telegram 对 bot 的功能限制极少——bot 可以创建群组、管理频道、处理支付等一系列操作,最 近的更新还支持了对 bot 的流式输出 。这种「bot 能做的事几乎等于人能做的事」的设计哲学,让开发者有极大的发挥空间。

打开网易新闻 查看精彩图片

OpenClaw 选择 Telegram 作为第一交互渠道,正是因为这种开放性。在 OpenClaw 的官方文档里,Telegram 是第一个被详细说明的频道,配置教程最完整,社区讨论最活跃。一个典型的 OpenClaw 用户,可以在一台 VPS 上部署 agent 实例,绑定自己的 Telegram bot token,然后通过对话窗口让 agent 帮自己完成从信息检索到代码部署的一系列任务。

打开网易新闻 查看精彩图片

Manus 在今年 2 月选择 Telegram 作为首发平台,逻辑类似。Meta 旗下的产品没有选择自家的 WhatsApp——后者有着超过 20 亿的月活用户——而是选了用户量远小于它的 Telegram,足以说明在 agent 早期阶段,开放性比用户基数更重要。 WhatsApp 的通过 Baileys 库,需真实手机号验证,Business API 审核流程复杂、不支持商业大规模部署,对于一个需要快速迭代的 AI 产品来说,摩擦太大了。

但 Telegram 的开放性是一把双刃剑。

同一种让开发者能够零门槛创建 bot 的开放性,也让 Telegram 长期成为灰色产业的温床。安全公司 Bitsight 在今年 1-2 月的扫描中发现了超过 30000 个暴露在公网上的 OpenClaw 实例,最新出现的一个「曝光看板」中,暴露数量来到了惊人的 22 万个,许多实例的 API 密钥和数据库凭证直接暴露在默认配置里,安全形同虚设。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这是一个悖论:让 agent 生态最快繁荣的条件,恰恰也是让安全风险最快积累的条件。而且,这个问题无法通过「加强审核」简单解决 ——因为审核本身就意味着提高门槛,而低门槛正是开发者选择 Telegram 的原因。

天平中间:Slack 与 Discord

如果说 Telegram 代表的是「先上车后买票」的野路子,Slack 和 Discord 则代表了两种不同风格的「有限开放」。

Slack 走的是企业级路线,通过 Bolt 框架,和开发工具深度集成。2026 年 1 月,Salesforce 宣布新版 Slackbot 正式上线,面向 Business+和 Enterprise Grid 用户,定位「your personal agent for work」——支持查找信息、分析文档、管理日程、生成摘要。

打开网易新闻 查看精彩图片

同月,Salesforce 还推出了 Agentforce 在 Slack 中的集成,将 CRM 数据和客户交互直接引入对话流。Slack 对第三方 agent 的态度是开放但可控:所有 bot 需要经过 Marketplace 审核,数据访问有明确的 OAuth scope 限制,企业管理员可以精细控制哪些 bot 能进入哪些频道。

Discord 的 bot 生态同样成熟,但底色更偏社区和创作者。开发者需要在 Developer Portal 注册应用、配置权限(比 Telegram 的@BotFather 多几步),但远不到企业级 IM 的审核强度。Discord 的 agent 优势在于社区场景的密度:Midjourney 从 Discord bot 起家,如今大量 AI 项目仍然以 Discord 作为用户社区和产品交互的双重入口。OpenClaw 本身也在 Discord 上运营活跃的开发者社区。

打开网易新闻 查看精彩图片

两者的共同点是:它们都在开放性上设了一个「限速器」。 Slack 的限速器是企业合规,Discord 的限速器是社区治理。相比 Telegram 的完全放任,这意味着 agent 生态的发育速度慢一些,但系统性风险也低一些。

天平向右:飞书

对于国内用户来说,飞书是一个值得单独拿出来讨论的案例。 它的开放方式,反映了中国 IM 平台在 agent 浪潮中的独特情况。

飞书的开放平台在过去一年里经历了显著的能力升级。2025 年下半年起,飞书陆续上线了 Bot API 的多项增强、工作流(Workflow)中的 AI Agent 节点(目前为 Beta)、以及对 MCP(Model Context Protocol)工具集的支持。在 GitHub 上,飞书官方维护的 lark-openapi-mcp 项目已获得超过 400 颗 star,提供了飞书核心功能的 MCP Server 封装。OpenClaw 也有官方的飞书插件(@openclaw/feishu),支持将 agent 部署到飞书对话中。

打开网易新闻 查看精彩图片

从功能层面看,飞书的 agent 基础设施正在快速追赶——bot 可以读写文档、支持发送带按钮、表单的交互式卡片、触发审批流、创建和管理日历事件,这些都是企业场景下 agent 的高价值能力。

但飞书的开放性有两重限制:

第一重是平台治理。飞书的 agent 生态天然是 B2B 的,而非 Telegram 那种 C2C 加 B2C 的混合形态。飞书的 bot 需要在企业应用框架内运行——开发者需要创建企业自建应用或商店应用,配置权限后需要企业管理员审批。这意味着个人开发者很难像在 Telegram 上那样「5 分钟创建一个 bot」。

打开网易新闻 查看精彩图片

一个直观的对比:一个 Telegram 开发者从注册 bot 到收到第一条消息回复,整个过程不超过 5 分钟;同样的事情在飞书上,光是等待企业管理员审批应用权限就可能需要一个工作日。

企业级管控带来了更高的安全性,但代价体现在开发者体验上:权限配置、调试、上线等环节的摩擦显著高于 Telegram,这种摩擦不是缺点而是特点——但它确实减缓了 agent 生态的自发生长速度。

第二重是生态位。 在中国市场,飞书的主要竞对是钉钉和企业微信。三者都在加码 agent 能力,但路径不同:钉钉倾向于与通义系列大模型深度绑定,企业微信则依托微信生态的用户基数。

打开网易新闻 查看精彩图片

一个有意思的现象是:尽管中国 IM 市场高度碎片化,在 agent 这件事上率先跑出来的既不是用户基数最大的企业微信,也不是市场份额最高的钉钉,而是飞书。

这完全是偶然吗?不一定。

第一,飞书的开放平台不是后来加的一层皮,而是产品基因的一部分——多维表格本身就是可编程的数据层,文档原生支持 API 读写,这些底层设计让 agent 的接入成本比竞品更低。

打开网易新闻 查看精彩图片

第二,字节跳动同时拥有大模型能力(豆包/云雀)和企业协作平台,这种垂直整合让飞书在 agent 场景下的迭代速度更快;相比之下,钉钉和通义、企业微信和混元之间的组织协调链条更长。

第三,飞书的客户画像偏向互联网和科技企业——这批企业本身开发者密度更高、自动化需求更强、对 AI 的接受度也更高,agent 生态更容易在这个群体中形成冷启动。

当然,这也意味着飞书的 agent 故事目前主要是一个「科技公司圈内叙事」,能否向更广泛的企业市场渗透仍然是问号。

这个案例还折射出另一件事:agent 中继不太可能由一个创业公司从零做出来——agent 需要的不只是消息管道,还需要企业内部的数据、权限和工作流,这些是现役 IM 玩家的护城河。

另外,中国市场的 IM 格局更碎片化,agent 开发者需要同时适配多个平台,这增加了生态成形的难度,因此存量优势便很有决定性。

以中国市场来看,IM 的「第二春」不仅取决于开放性,还取决于与本土大模型的集成深度、企业客户的采购逻辑、以及监管环境对 bot 能力边界的定义。 这是一个和全球市场显著不同的竞争维度。

天平背后

开放性的天平,揭示的不只是各家 IM 的策略差异,而是一个 agent 时代的基础矛盾:平台越开放,agent 生态越繁荣,安全风险也越高。

Telegram 是这个矛盾的极端表达。同一种让开发者能够零门槛创建 bot 的开放性,同时打开了创新和滥用的大门。如果监管收紧迫使 Telegram 提高 bot 创建门槛——这并非不可能,被法国警方制裁后, Telegram 已经开始调整部分内容政策——那么会影响到开发者吗?他们又会迁移到哪里?Discord、Slack、还是飞书?

然而,封闭平台面临相反的困境:不开放 API 就错过 agent 红利,但开放了又要承担 Telegram 正在经历的安全和声誉成本。WhatsApp 在技术上,完全有能力做一个类似@BotFather 的轻量工具,但它背后是 20 亿用户,不能不多加考虑。

现在,每个 IM 平台,都需要在这个天平上寻找自己的位置。「第二春」能持续多久,取决于一个至今没有标准答案的问题:在 agent 时代,一个聊天平台应该多开放?

在开放性之争的背后,一个更激进的猜想正在开发者社区成形:当一个聊天窗口可以调用任意 agent 完成从订票、编程到数据分析的任意任务时,它已经不只是一条管道——它正在变成一个超级接口。

要说不说,这个逻辑对中国读者而言,很眼熟啊——这不就是微信吗。

打开网易新闻 查看精彩图片

微信用小程序、支付和政务服务,在一个封闭生态里实现了「一个 App 解决一切」。而 OpenClaw 所代表的模式指向一个镜像式的可能:用开放生态和全球开发者社区,在任意一个 IM 里实现类似的功能密度。

不是再造一个微信,而是用完全相反的路径——开放而非封闭,去中心化而非平台主导——最终抵达一个功能上相似的终点。

当然,这仍然只是一个猜想,而非预言。微信 super app 的成立依赖于中国市场独特的移动支付基础设施和用户习惯,这些条件在全球市场并不通用。更根本的是,开放生态能否在不牺牲安全性的前提下达到那种服务密度,目前没有人能给出答案。

但如果这个方向是对的,那么 IM 的「第二春」就不仅仅是一段插曲,潜在地,这会是一次身份转换的起点:从消息管道,到 AI 时代的通用交互层。谁先在开放性和安全性之间找到那个可持续的平衡点,谁就最有可能定义这个新物种的样子。

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

打开网易新闻 查看精彩图片