在过去的五到十年里,几乎所有的头部企业都将一种名为RPA(机器人流程自动化,Robotic Process Automation)的技术视为数字化转型的灵丹妙药。从财务对账、发票报销到跨系统的订单录入,企业投入数百万甚至上千万资金,雇佣外包团队写下海量的 RPA 脚本,试图用“数字劳动力”替代人工。然而,到了今天,许多 CIO(首席信息官)苦涩地发现:这些曾经高效的系统,现在成了极其脆弱的“瓷娃娃”。系统更新一个按钮,整个自动化流程就会全线崩溃,每年花费在“修复 RPA 脚本”上的维护费,甚至超过了当初节省下来的人力成本。传统 RPA 的本质是“盲目执行”,它只拥有执行的蛮力,却毫无环境感知的智力。随着大模型技术的爆发,企业自动化正迎来一场暴烈的底层范式转移:从基于固定规则的传统 RPA,全面跃迁至基于大模型的Agentic Workflow(智能体工作流)。逐米时代在大量系统重构项目中明确指出:没有自愈能力的自动化,终将沦为企业沉重的技术债。

打开网易新闻 查看精彩图片

图 1:正如工业机械臂需要视觉传感器一样,软件自动化也必须长出“眼睛和大脑”

一、一改像素就崩溃的“伪智能”

要看透传统 RPA 的死穴,我们必须深入其底层的工程实现逻辑。

传统 RPA 软件的工作原理,是高度依赖图形用户界面(GUI)上的确定性坐标(X/Y 轴)静态的 DOM 元素路径(XPath)。当程序员写下一个 RPA 脚本来自动抓取供应商系统里的采购数据时,代码的底层指令实际上是:“在屏幕坐标 (450, 320) 处点击左键,等待 2 秒,然后在 ID 为 `submit_btn_01` 的输入框里填入数据。”

这套逻辑在静态环境中极其高效。但真实的商业世界是高度动态的。

如果下个月,那家供应商把他们的 SaaS 系统升级了,原本在左侧的“提交”按钮被移到了右侧,或者仅仅是因为感恩节活动,系统弹出了一个居中的节日广告弹窗。面对这种微小的环境变化,人类员工只需点击关闭弹窗即可继续工作;但传统 RPA 就像一个盲人,它依然会执拗地去点击屏幕原来那个坐标 (450, 320)。结果就是:代码找不到目标,脚本抛出ElementNotFoundException异常,整个公司的财务自动化对账系统瞬间瘫痪。

传统的 RPA 不是智能,它是将人类的重复动作进行了极其机械的“宏录制(Macro Recording)”。它经不起哪怕一个像素的扰动。

二、从“命令式”到“声明式”的工程范式转移

要彻底解决自动化系统的脆弱性,仅仅在代码里加几个 `If-Else` 判断是无效的。必须在计算机科学的底层范式上,实现从“命令式(Imperative)”到“声明式(Declarative)”的跃迁。

传统 RPA 属于典型的“命令式”编程:你必须事无巨细地告诉系统“如何做(How)”——第一步打开浏览器,第二步输入网址,第三步点击密码框。一旦任何一步的执行条件发生改变,整个链条断裂。

而 Agentic Workflow(智能体工作流)属于“声明式”架构:你只需要告诉智能体你的“最终目标(What)”——“请去供应商系统里,把本月金额大于 5 万的未结算发票导出来”。至于系统界面长什么样、按钮在左边还是右边,由智能体在执行的当下,依靠大模型去实时推理和规划路径。

打开网易新闻 查看精彩图片

图 2:从脆弱的固定轨迹,走向具备“自我纠错与重路由”能力的智能调度

三、具备“自我修复(Self-Healing)”能力的数字员工

Agentic Workflow 之所以能被称为企业自动化的下半场,是因为它引入了多模态大模型(VLM)与动态代码生成机制,赋予了系统前所未有的“自我修复(Self-Healing)”能力。

当一家采用了 Agentic Workflow 的企业面临供应商系统改版时,后台发生的将不再是代码崩溃,而是令人惊叹的智能推演:

智能体在执行任务时,发现原本的“提交”按钮 DOM 节点消失了。此时,它不会直接报错宕机,而是会调用底层的视觉-语言大模型(Vision-Language Model),对当前的网页截屏进行一次重新扫描。

大模型通过对页面布局的图像理解,发现右下角有一个新出现的、写着“Confirm(确认)”的绿色按钮。智能体会根据语义推断:“虽然它的 ID 变了,坐标也变了,但它在当前语境下等同于我需要寻找的‘提交’操作。” 随即,智能体在内存中自动动态生成一段临时的无头浏览器(Headless Browser)操作代码,精准点击了那个新按钮,继续跑通剩余的流程。

这就相当于你雇佣了一个长了眼睛、会自己思考变通的人类实习生,而不是一台只认死理的机械臂。

四、企业如何平滑升级老旧的自动化管线?

对于已经在 RPA 上投入巨资的企业,抛弃旧系统从零开始是不现实的。在真实的商业改造中,我们通常采用一种极具工程实用主义的“非破坏性融合架构”

打开网易新闻 查看精彩图片

图 3:重构自动化系统,不是全盘推翻,而是将旧有的脚本降维成被大模型调用的底层工具

在这套架构中,我们保留了企业耗资百万写下的底层 RPA 抓取脚本,但剥夺了它们做决定的“调度权”。所有的旧有脚本,都被封装成了一个个独立的“工具节点(Tools)”。

当业务员下达复杂指令时,位于顶层的 Agentic 大脑会进行意图拆解。它会根据当前的实际情况,动态决定是去调用那个陈旧的 RPA 脚本,还是直接走新开发的数据库 API 接口。如果 RPA 脚本因为网页更新而报错,智能体会立刻捕获这个错误代码(Exception),放弃这条路,转而尝试另一种方式获取数据。这种将“硬编码流程”解耦为“动态工具调用”的设计,彻底赋予了系统跨越极端异常的韧性。

五、哪些企业必须立刻终止纯 RPA 项目的投入?

如果您所在的企业目前高度依赖自动化,且具备以下任何一个特征,继续往传统的纯 RPA 里砸钱就是将技术债越垒越高:

· 高度依赖外部 SaaS 与电商平台的业务(如跨境电商、多平台分销商):淘宝、亚马逊、海外供应商后台的网页 UI 几乎每个月都在变。传统的 RPA 抓取每天都在崩溃报错,维护团队疲于奔命,必须引入基于 VLM(视觉语言模型)的 Agentic 系统来应对高频改版。

· 处理大量“非结构化数据输入”的金融或保险机构:客户发来的理赔邮件、报销单五花八门,传统 RPA 根本无法从没有固定格式的文本中提取关键字段,必须让大模型作为“数据结构化前置清洗机”。

· 业务流转极其复杂、规则经常变动的央国企与政务大厅:审批流长达十几个节点,涉及各种人工特批和条件退回。线性 RPA 无法处理发散的分支逻辑,需要 Agentic 大脑进行动态任务规划。

结语:给自动化装上大脑,而不仅仅是换一套更快的肌肉

任何没有自我纠错能力的系统,在面对真实商业世界的巨大熵增时,都会不可避免地走向崩溃。企业过去十年在 RPA 领域的探索,完成了“手脚”的数字化;但在大模型时代,我们需要为这些冰冷的机械臂装上一个能够观察环境、理解目标并随机应变的“大脑”。

从死板的脚本到有生命的数字员工,这是软件工程发展不可逆转的洪流。逐米时代在大量的企业老旧系统重构交付中,始终坚守“韧性大于一切”的底线。我们不主张盲目推翻企业既有的 IT 投资,而是致力于通过搭建先进的 Agentic Workflow 中枢,将您散落在各处的脆弱脚本与 API 收编、整合。让系统不再因为一个按键的偏移而全盘宕机,让大模型真正成为驱动企业自动化稳健运转、生生不息的智慧心脏。