当 AI 真正接管鼠标与键盘：一场颠覆旧秩序的无头革命|代码|工作流|电子表格|调用|键盘|鼠标

说实话，过去这大半年，我们被太多关于大模型的跑分、参数和花哨的聊天界面轰炸了。以至于很多人产生了一种错觉：AI 的进化，就是变得越来越会说话。

但我一直有一个判断：AI 时代的真正拐点，绝不是机器学会了像人一样对答如流，而是机器终于长出了可以在数字世界里自由行走的手脚。

几天前，我看到了 Box 创始人兼 CEO Aaron Levie 的一段长文。作为硅谷最懂企业级软件和工作流的老兵之一，他没有在谈论什么玄乎的 AGI 哲学，而是直接掀开了企业软件世界即将面临的一场超级飓风的盖头。

他的核心观点非常直接：计算机使用能力（Computer use）以及随时随地编写和运行代码的能力，是 AI 代理（Agents）接管知识工作的终极原语（ultimate primitives）。

这段话看似干瘪，但如果你真正理解了企业是如何运转的，就会惊出一身冷汗。Aaron Levie 暴露的根本不是某个单点工具的技巧，而是代理式工作流将如何重写整个商业世界的生产效率、安全边界和软件生态。

这不仅是一场技术升级，这是一场旧秩序的崩塌。

打破应用孤岛：从聊天框到全能程序员

想想我们每天真实的工作状态是什么样的？

绝对不是盯着一个对话框，向它提出一个宏大的问题，然后等待一个完美的答案。真实的知识工作是极其碎片化且充满摩擦的：你需要从一封邮件里提取客户需求，跳到 Salesforce 里查阅历史记录，转头去 Excel 里拉取一份数据报表，最后在 Slack 里向团队同步进度。

工作，本质上是在多个应用系统和海量数据之间反复横跳。

过去的 AI 助手为什么让人觉得智商很高，但能力很弱？问题就在这里。它们被死死地困在那个聊天框里。你给它喂数据，它给你吐文本，但它无法替你跨越那些应用之间的护城河。它是一个极其聪明的参谋，但却是一个没有行动能力的瘫痪者。

但 Aaron Levie 敏锐地指出了正在发生的质变。当 AI 具备了计算机使用能力并且能够动态编写和运行代码时，一切都变了。

这意味着什么？意味着你不再是拥有了一个只会聊天的助理，而是等同于拥有了一个（甚至一群）可以随时为你写代码、调用任何 API 的全栈工程师。

当你需要跨系统处理数据时，这个 AI 代理不需要你手动去导出导入。它会在自己的沙盒里，或者直接在你的电脑上，瞬间写出一段 Python 脚本，通过 API 调取 A 系统的数据，清洗后推送到 B 系统，并自动完成后续的操作。

它不再是等待指令的计算器，而是能够在系统迷宫中自主导航的巡航导弹。

这就是 Levie 所说的终极原语。当 AI 能够像人类一样使用电脑，甚至比人类更懂得利用底层代码和接口去穿透系统时，知识工作的自动化才真正迈出了实质性的一步。

灾难级的安全挑战：谁在替你扣动扳机？

想清楚了 AI 的行动能力方向后，兴奋感通常只能维持几分钟，紧接着就是深不见底的恐惧。

作为一家服务了全球无数大型企业的云存储巨头掌门人，Aaron Levie 太清楚这套新玩法会给企业的 IT 部门带来怎样的噩梦了。当 AI 代理开始在企业内部的网络中狂奔，现有的安全防线几乎是不堪一击的。

我们不妨顺着他的思路，拆解一下这里面的致命冲突。

首当其冲的就是身份与权限的迷局。一个正在跨系统抓取财务数据并生成报告的 AI 代理，它到底是谁？它应该永远以你的名义行事，继承你的所有权限吗？如果它以你的名义误删了核心数据库，或者向全公司发送了机密文件，责任算谁的？

但如果给 AI 代理赋予独立的身份和受限的权限，它又该如何顺畅地完成那些需要高度信任的复杂工作？

更让人头疼的是安全监控逻辑的彻底失效。过去几十年，企业安全系统的一个核心判断标准是行为频率。如果一个账号在深夜突然每秒钟发起上百次数据读取请求，安全系统会立刻警报，判定这是黑客入侵或恶意爬虫。

但现在呢？一个 AI 代理为了帮你完成一份深度调研，一秒钟内调用几百次 API 简直是家常便饭。用防范人类的安保逻辑，去监控不知疲倦的 AI 代理，就像用木栅栏去试图阻挡泥石流。 传统的高频=危险的信号彻底失效了，企业如何在这种海量的机器行为中，精准识别出真正的安全威胁？

还有那个悬在所有 AI 开发者头顶的达摩克利斯之剑：提示词注入（Prompt Injection）。如果你的 AI 代理在自动处理外部邮件时，读取到了一段被黑客精心伪装的恶意指令，导致它叛变并开始执行危险操作，你该如何熔断？

Levie 抛出的这些问题，目前业界根本没有标准答案。但这就是硬币的反面：极度的效率提升，必然伴随着系统复杂度和失控风险的指数级飙升。

无头软件的狂欢：旧商业模式的黄昏

解决了能力边界，看清了安全隐患之后，我们将目光投向更深层的商业战场。这也是 Levie 这段话里最让我感到震撼，也是最冷酷的一个判断。

为了让 AI 代理能够顺畅地工作，软件本身必须发生改变。Levie 使用了一个极其精准的词：Headless（无头化）。

什么是无头化？简单来说，就是剥离掉花哨的用户界面（UI），只保留后端的逻辑和数据接口（API）。

过去二十年的 SaaS（软件即服务）黄金时代，所有的企业软件都在卷一件事：交互体验。谁的界面更好看，谁的仪表盘更直观，谁的按钮设计得更符合人性，谁就能赢得客户。因为过去的软件是给人用的，人是视觉动物，人需要被讨好。

但当工作流的执行者从人变成了AI 代理时，逻辑彻底反转了。

AI 不需要好看的按钮，不需要丝滑的动画，甚至不需要屏幕。AI 只需要干净、稳定、文档齐全的 API。过去的软件是给人看的，未来的软件是给 AI 调用的。

Levie 毫不客气地指出，这将是一些老牌软件巨头（incumbents）极其不适的现实。那些依靠极其复杂的界面把用户死死绑定在自己生态里的软件，那些 API 封闭、动不动就限制调用的系统孤岛，在 AI 代理眼中就是效率的绊脚石。AI 会绕过它们，或者直接抛弃它们。

相反，那些从第一天起就秉持 API 优先（API-first）理念、底层架构极其开放的工具，将迎来一场狂欢。它们将成为 AI 代理最喜欢调用的数字器官。

这不仅仅是产品形态的改变，更是商业模式的颠覆。如果一个企业软件原本是按用户席位（Seat）收费的，现在一个 AI 代理通过 API 默默在后台干了 10 个人的活，你还能按 10 个人的席位向客户收费吗？你的商业模式还能支撑下去吗？

这才是隐藏在AI 代理这个性感概念背后的残酷真相：它不仅在抢人的工作，它还在摧毁旧软件的收费逻辑。

结语：准备迎接狂野的未来

Aaron Levie 在长文的最后说：“工作代理的世界将迎来许多变化，一切将变得相当狂野（pretty wild）。”

我深以为然。

当我们还在为某个大模型今天能不能写出一首好诗而争论不休时，真正的变革已经在底层悄然发生。AI 正在从一个被动的文本生成器，进化为一个主动的系统穿透者。

这场变革的终局，不再是人机交互（Human-Computer Interaction），而是人机解绑。人类只负责定义目标、分配资源和承担责任，而 AI 代理将接管鼠标、键盘、代码和接口，在无头的软件世界里完成所有的脏活累活。

在这个狂野的未来里，企业需要重构安全边界，软件公司需要重写商业模式，而作为个体的我们，也必须重新思考：当机器不仅会思考，还长出了手脚，我们在这个新秩序里的核心价值，到底还剩下什么？

这已经不是一个技术问题，而是一个极其严肃的生存问题了。

当 AI 真正接管鼠标与键盘：一场颠覆旧秩序的无头革命

热搜

热门跟贴

热搜

热门跟贴

相关推荐

不用等官方了！第三方「国产Codex」爆火，一天收割8K个Star

等 DeepSeek 回复的 30 秒，是手机最好玩的半小时

1000 块/年的输入法，我用它习惯了「口喷」，再也回不去打字了 | AI 器物志

Agent中的“爱马仕”来啦：100k+ Star 的开源AI Agent ，正在偷偷给自己升级

在模型厂碾压之前，AI视频Agent产品是否只能挣波快钱？

别急着做新工具的“小白鼠”：AI时代的慢沉淀与大迭代

从爆火到平淡，OpenClaw改变了什么

原生Agent杀入画布！一站式搞定专业创作，全程可控、不抽卡

谷歌招人流程大变，面试环节必须用AI

一句话，AI生成了整个可点击的广州！Flipbook实测太离谱了

AI需要破壁人

豆包和OpenAI，都走在互联网变现的老路上

特斯拉Optimus V3年中量产倒计时，机器人产业迈向“真量产”拐点

以人为本的AI对用户而言才是最有用的AI

编程已死，键盘长草！Claude Code之父对谈Kaparthy，全程爆金句

Claude Code 源码泄露了，有人用Python复刻了一个极简版

三角洲部队内部组织架构！

用Linux玩游戏从未如此简单：新系统彻底告别繁琐配置 安装Steam甚至不用动鼠标！

武汉多人买格力空调还没安装门店关闭，格力让消费者以优惠价格再买一次？多方回应

厂花头发卷入机器小伙一剪竟剪出了爱情

用Linux玩游戏从未如此简单：新系统彻底告别繁琐配置安装Steam甚至不用动鼠标！