说实话,过去这大半年,我们被太多关于大模型的跑分、参数和花哨的聊天界面轰炸了。以至于很多人产生了一种错觉:AI 的进化,就是变得越来越会说话。
但我一直有一个判断:AI 时代的真正拐点,绝不是机器学会了像人一样对答如流,而是机器终于长出了可以在数字世界里自由行走的手脚。
几天前,我看到了 Box 创始人兼 CEO Aaron Levie 的一段长文。作为硅谷最懂企业级软件和工作流的老兵之一,他没有在谈论什么玄乎的 AGI 哲学,而是直接掀开了企业软件世界即将面临的一场超级飓风的盖头。
他的核心观点非常直接:计算机使用能力(Computer use)以及随时随地编写和运行代码的能力,是 AI 代理(Agents)接管知识工作的终极原语(ultimate primitives)。
这段话看似干瘪,但如果你真正理解了企业是如何运转的,就会惊出一身冷汗。Aaron Levie 暴露的根本不是某个单点工具的技巧,而是代理式工作流将如何重写整个商业世界的生产效率、安全边界和软件生态。
这不仅是一场技术升级,这是一场旧秩序的崩塌。
打破应用孤岛:从聊天框到全能程序员
想想我们每天真实的工作状态是什么样的?
绝对不是盯着一个对话框,向它提出一个宏大的问题,然后等待一个完美的答案。真实的知识工作是极其碎片化且充满摩擦的:你需要从一封邮件里提取客户需求,跳到 Salesforce 里查阅历史记录,转头去 Excel 里拉取一份数据报表,最后在 Slack 里向团队同步进度。
工作,本质上是在多个应用系统和海量数据之间反复横跳。
过去的 AI 助手为什么让人觉得智商很高,但能力很弱?问题就在这里。它们被死死地困在那个聊天框里。你给它喂数据,它给你吐文本,但它无法替你跨越那些应用之间的护城河。它是一个极其聪明的参谋,但却是一个没有行动能力的瘫痪者。
但 Aaron Levie 敏锐地指出了正在发生的质变。当 AI 具备了计算机使用能力并且能够动态编写和运行代码时,一切都变了。
这意味着什么?意味着你不再是拥有了一个只会聊天的助理,而是等同于拥有了一个(甚至一群)可以随时为你写代码、调用任何 API 的全栈工程师。
当你需要跨系统处理数据时,这个 AI 代理不需要你手动去导出导入。它会在自己的沙盒里,或者直接在你的电脑上,瞬间写出一段 Python 脚本,通过 API 调取 A 系统的数据,清洗后推送到 B 系统,并自动完成后续的操作。
它不再是等待指令的计算器,而是能够在系统迷宫中自主导航的巡航导弹。
这就是 Levie 所说的终极原语。当 AI 能够像人类一样使用电脑,甚至比人类更懂得利用底层代码和接口去穿透系统时,知识工作的自动化才真正迈出了实质性的一步。
灾难级的安全挑战:谁在替你扣动扳机?
想清楚了 AI 的行动能力方向后,兴奋感通常只能维持几分钟,紧接着就是深不见底的恐惧。
作为一家服务了全球无数大型企业的云存储巨头掌门人,Aaron Levie 太清楚这套新玩法会给企业的 IT 部门带来怎样的噩梦了。当 AI 代理开始在企业内部的网络中狂奔,现有的安全防线几乎是不堪一击的。
我们不妨顺着他的思路,拆解一下这里面的致命冲突。
首当其冲的就是身份与权限的迷局。一个正在跨系统抓取财务数据并生成报告的 AI 代理,它到底是谁?它应该永远以你的名义行事,继承你的所有权限吗?如果它以你的名义误删了核心数据库,或者向全公司发送了机密文件,责任算谁的?
但如果给 AI 代理赋予独立的身份和受限的权限,它又该如何顺畅地完成那些需要高度信任的复杂工作?
更让人头疼的是安全监控逻辑的彻底失效。过去几十年,企业安全系统的一个核心判断标准是行为频率。如果一个账号在深夜突然每秒钟发起上百次数据读取请求,安全系统会立刻警报,判定这是黑客入侵或恶意爬虫。
但现在呢?一个 AI 代理为了帮你完成一份深度调研,一秒钟内调用几百次 API 简直是家常便饭。用防范人类的安保逻辑,去监控不知疲倦的 AI 代理,就像用木栅栏去试图阻挡泥石流。 传统的高频=危险的信号彻底失效了,企业如何在这种海量的机器行为中,精准识别出真正的安全威胁?
还有那个悬在所有 AI 开发者头顶的达摩克利斯之剑:提示词注入(Prompt Injection)。如果你的 AI 代理在自动处理外部邮件时,读取到了一段被黑客精心伪装的恶意指令,导致它叛变并开始执行危险操作,你该如何熔断?
Levie 抛出的这些问题,目前业界根本没有标准答案。但这就是硬币的反面:极度的效率提升,必然伴随着系统复杂度和失控风险的指数级飙升。
无头软件的狂欢:旧商业模式的黄昏
解决了能力边界,看清了安全隐患之后,我们将目光投向更深层的商业战场。这也是 Levie 这段话里最让我感到震撼,也是最冷酷的一个判断。
为了让 AI 代理能够顺畅地工作,软件本身必须发生改变。Levie 使用了一个极其精准的词:Headless(无头化)。
什么是无头化?简单来说,就是剥离掉花哨的用户界面(UI),只保留后端的逻辑和数据接口(API)。
过去二十年的 SaaS(软件即服务)黄金时代,所有的企业软件都在卷一件事:交互体验。谁的界面更好看,谁的仪表盘更直观,谁的按钮设计得更符合人性,谁就能赢得客户。因为过去的软件是给人用的,人是视觉动物,人需要被讨好。
但当工作流的执行者从人变成了AI 代理时,逻辑彻底反转了。
AI 不需要好看的按钮,不需要丝滑的动画,甚至不需要屏幕。AI 只需要干净、稳定、文档齐全的 API。过去的软件是给人看的,未来的软件是给 AI 调用的。
Levie 毫不客气地指出,这将是一些老牌软件巨头(incumbents)极其不适的现实。那些依靠极其复杂的界面把用户死死绑定在自己生态里的软件,那些 API 封闭、动不动就限制调用的系统孤岛,在 AI 代理眼中就是效率的绊脚石。AI 会绕过它们,或者直接抛弃它们。
相反,那些从第一天起就秉持 API 优先(API-first)理念、底层架构极其开放的工具,将迎来一场狂欢。它们将成为 AI 代理最喜欢调用的数字器官。
这不仅仅是产品形态的改变,更是商业模式的颠覆。如果一个企业软件原本是按用户席位(Seat)收费的,现在一个 AI 代理通过 API 默默在后台干了 10 个人的活,你还能按 10 个人的席位向客户收费吗?你的商业模式还能支撑下去吗?
这才是隐藏在AI 代理这个性感概念背后的残酷真相:它不仅在抢人的工作,它还在摧毁旧软件的收费逻辑。
结语:准备迎接狂野的未来
Aaron Levie 在长文的最后说:“工作代理的世界将迎来许多变化,一切将变得相当狂野(pretty wild)。”
我深以为然。
当我们还在为某个大模型今天能不能写出一首好诗而争论不休时,真正的变革已经在底层悄然发生。AI 正在从一个被动的文本生成器,进化为一个主动的系统穿透者。
这场变革的终局,不再是人机交互(Human-Computer Interaction),而是人机解绑。人类只负责定义目标、分配资源和承担责任,而 AI 代理将接管鼠标、键盘、代码和接口,在无头的软件世界里完成所有的脏活累活。
在这个狂野的未来里,企业需要重构安全边界,软件公司需要重写商业模式,而作为个体的我们,也必须重新思考:当机器不仅会思考,还长出了手脚,我们在这个新秩序里的核心价值,到底还剩下什么?
这已经不是一个技术问题,而是一个极其严肃的生存问题了。
热门跟贴