xAI “人类模拟器” (Macrohard) 解析
不同于微软、谷歌将 AI 定位为“智能辅助”(Copilot),马斯克旗下的 xAI 正在开发一个更具野心、专注于接管数字劳动的自主代理项目——人类模拟器(内部代号 Macrohard)。
它不再是一个聊天机器人或代码补全工具,而是以“全职虚拟员工”为目标,通过看屏幕、敲键盘、移动鼠标,全面接管白领的数字工作。结合主攻物理实体的特斯拉 Optimus 机器人,xAI 正在拼贴出完整的“虚拟+现实”自动化蓝图。
打开网易新闻 查看精彩图片
1. 曝光与定位
这个高度保密的 B 端项目在 2026 年初意外曝光。前 xAI 工程师 Sulaiman Ghori 在一档播客上提及了数字员工以及利用特斯拉算力等核心细节。随后该工程师疑似被辞退,从侧面印证了项目的高机密度。
在 xAI 内部测试中,这些模拟器已被编入真实的组织架构。员工们通过协作软件给它派发任务,文字沟通过程中甚至很难察觉对方是 AI。相比现存的 RPA(机器人流程自动化)或 API 集成,xAI 真正将其视作填补人手空缺的独立雇员。
2. 核心原理:基于视觉交互的“自动驾驶电脑”
人类模拟器摒弃了对接软件 API 接口的传统思路,直接模拟人类在电脑前的第一人称操作体验。
打开网易新闻 查看精彩图片
- 多模态视觉感知:通过多模态大模型和计算机视觉,AI 能将界面像素化,理解窗口层级、按钮状态、错综复杂的网页甚至是验证码图片,实现了真正的“看屏幕”。
- 模拟物理输入:看懂界面后,系统从系统底层注入光标移动、鼠标点击及键盘敲击指令。只要能用电脑打开的软件——无论是老旧的 ERP 系统、封闭的内网软件还是主流网页,它都能直接操作,避开了系统集成阻碍。
- 自主决策与纠错:由于由类似 Grok 的大语言模型驱动,它抛弃了死板的录制脚本。给它一个宏观指令(如“下载华东区业绩并制作饼图发邮件”),它会自主拆解子步骤。遇到弹窗、加载卡顿或报错,能像真人一样停顿阅读,并自行决定是“取消”还是“重试”。
- 特斯车队提供算力:高精度的识图反应极度消耗算力。马斯克利用北美数百万辆处于闲置状态具备强悍芯片的特斯拉汽车,建立起庞大的分布式计算网络,从而打破算力瓶颈,使百万级数字员工同时在线成为可能。
3. 商业价值落地
一旦推向市场,该项目的首要目标就是接管企业的白领工作流:
- 无差别覆盖:财务对账、客服工单流转、数据录入与清洗、初级软件测试……只要是面对屏幕完成的工作都能被接管。
- 打通数据孤岛:不需要花费重金重构系统,因为模拟器发挥的正是跨软件“人工”搬运数据的角色。
- 极致的人效比:7x24 小时待命,不存在情绪内耗和离职风险,成本仅为普通员工薪水的一个零头。
4. 潜在风险
- 白领失业潮:初、中级知识工作环节受到直接冲击,可能引发剧烈的就业恐慌与社会震荡。
- 高危“操作幻觉”:普通机器人的幻觉最多是胡言乱语,但模拟器的幻觉是瞎操作。它可能因为失误误删数据库或向客户发送灾难性邮件,这要求其具备极其严苛的容错与安全机制。
- 数据红线:由于需要捕获屏幕上的所有信息,它相当于一个最高级别的“间谍软件”。企业的核心资产、客户隐私均有泄露或被滥用的极高合规风险。
- 伦理与透明度:在工作对接中,外部客户甚至内部同事若不知晓沟通对象是 AI,“欺骗感”和机器决策固有的偏见极易引发道德抵触。
5. 结语
打开网易新闻 查看精彩图片
从被动辅助走向完全接管屏幕操作,Macrohard 宣告了 AI 作为“外围工具”时代的结束。对于企业,这是关涉生死的降本增效利器;但对广大白领群体来说,这意味着一场近在咫尺的数字化洗牌。
热门跟贴