MIT黑客松冠军项目让AI控制了人的手，我们和做出它的人聊了聊|lab|mit|operator|人机交互|动作|黑客松

2026 年 3 月，MIT Media Lab 的一场 48 小时黑客松上，六个学生用电极片、Arduino 开发板和 Anthropic 的 Claude API 拼出了一套系统：对着它说一句话，它能通过电流刺激手部肌肉，让佩戴者的手指自动按下正确的琴键。项目取名 Human Operator，拿下了比赛 Learn Track 的冠军（项目地址：https://humanoperator.org/）。

两个月后，这个项目在社交媒体上的传播已经完全失控。有人用它的概念发行了加密货币，有人用 AI 生成了大量脱离现实的二创图片，一些自媒体开始用“AI 夺舍人类身体”来形容它。团队成员吴雨潼试图在社交媒体上传项目的完整版视频，却被平台判定为侵权。

“我们到现在都无法想象这个项目带来的影响力是真实的，”雨潼（Yutong Wu）说。她今年刚从 Wellesley College 毕业，主修计算认知科学和生物。Wellesley 和 MIT 之间有交叉注册制度，她借此在 MIT 上了许多计算机课程，并在 Media Lab 和 Brain and Cognitive Science Department 做了多段研究。

5 月下旬接受我们采访时，她还在处理毕业的各项事宜，还在适应项目走红后涌来的各种消息。有人在 X 上给团队发私信想谈合作，有人想购买这套产品，有人想投资。“甚至还有人把这个项目做成了一个虚拟货币。”

“它其实是一个帮你做选择题的东西”

剥开传播噪音，Human Operator 在技术上做的事情可以拆成五步：用户通过语音发出指令，唤醒词是“Hey AI”；摄像头眼镜捕捉第一人称视角画面；Claude 的视觉语言模型分析场景并生成动作指令；Arduino 控制板将指令转化为电信号；贴在手腕和手指上的 EMS（Electrical Muscle Stimulation，电肌肉刺激）电极片接收信号，刺激对应肌肉收缩。从说完话到手指动起来，延迟在 5 秒以内。

最终演示中，团队展示了几个场景：手指在钢琴上弹出简单旋律，手掌向人挥手致意，手指捏出 OK 手势，还有一个用摄像头引导手写出 MIT Media Lab 标志的演示。每一个动作都不是佩戴者主动发起的。

“可以理解为，它帮你在一个可触及范围内做选择，”吴雨潼说。系统目前只覆盖手腕和手指的微小调控，整条手臂甚至其他身体部位暂时不在考虑范围内。“手部肌肉的研究数据最多，也最容易做。”

团队曾设想过一个更刺激的场景：一颗球从视野侧面飞来，摄像头比人眼更快捕捉到它，系统在人反应过来之前操控手伸出去挡住。但黑客松 48 小时的时间并不够用。调酒的 demo 能做出来，是因为团队里正好有人会调酒；钢琴的 demo 能做出来，是因为有人想学弹琴。数据集全部来自团队成员各自的痛点和擅长的领域。

整个项目的硬件 idea 来自 Peter He，他是康奈尔大学大三学生，也是团队的核心工程师，EMS 与人机交互本就是他的主要研究方向。六个人在黑客松组队群里因为对 EMS 和眼动追踪的共同兴趣走到一起。四个本科生，加上 Cornell 的硕士和 Fluid Interfaces 组的博士生 Valdemar Danry ，构成了一支有硬件能力也有“包装能力”的队伍。

雨潼有摄影基础，Daniel Kaijzer 之前学电影，团队在最后一小时扛着灯跑遍 Media Lab 各个角落拍 demo 视频。“这个项目能这么火，其实也让我们意识到了科技叙事的重要性”雨潼说。

一定程度上来说，Human Operator 所做的事情是将学界已有的几条探索在 48 小时内组合到一起。EMS 技术本身已有数十年历史，项目灵感直接来自芝加哥大学 Pedro Lopes 教授的 Human Computer Integration Lab，该实验室长期研究 EMS 在人机交互中的应用。视觉语言模型和语音接口也都是现成的能力。

团队选用 Claude 的原因也很简单：Anthropic 是这次黑客松的赞助商，给每位参赛者提供了充足的 API 额度。“理论上换成其他 API 也都可以，我们不是很注重它的推理能力，只要把肌肉的 mapping 告诉它，并且它能识别环境，就可以 work，”吴雨潼说。

但组合本身产生了新东西。吴雨潼说，团队在 Lopes 实验室已有研究的基础上，利用黑客松“不是正式 research project”的自由环境，把大语言模型接入了 EMS 的控制链路。“如果是实验室研究，加入 AI 可能会有伦理审查的门槛。”在产品形态上，团队也做出了区别，Lopes 实验室此前的方案使用 Tesla suit，整套设备紧裹在手臂上。

吴雨潼负责了外观设计，用 3D 打印做出了演示视频中那个白色外壳，方向是让穿戴感更日常、更容易被普通人接受。她认为团队最大的创新点之一是 AI 信号接口的设计，即如何让大语言模型的输出在足够短的时间内转化为精确的肌肉刺激序列。

这条路线也正在被学术界正式推进。2026 年 4 月，Lopes 实验室在人机交互顶会 ACM CHI 上发表了题为“Generative Muscle Stimulation”的研究，将多模态 AI 引入 EMS 指令生成，让系统根据用户姿态、位置和周围环境动态产生肌肉刺激方案，不再依赖预编程，论文获得了 CHI 2026 最佳论文奖。

“大脑没有想让手往那走，但它就是动了”

佩戴 Human Operator 是什么感觉？雨潼说团队里每个人体验都不同。她印象最深的是一个微妙的时间差：“有感觉和手伸出去之间，有一瞬间我自己意识不到的 movement。大脑没有真的想让手往这个方向走，但就是条件反射一样动了。”

EMS 的本质是绕过大脑，直接向支配肌肉的运动神经发送信号，引发肌肉运动。刺激强度因人而异，团队为每个使用者设置了电流上下限。从神经科学角度看，只要电流越过激活阈值，单个神经元就会产生反应，“要么有，要么没有”。但整块肌肉的反应是分级的，电流越强, 被激活的运动单位越多, 收缩也越明显，所以找到每个人的肌肉活动舒适区需要一次”边界接触”，过程中可能有被电到的不适感。调好之后，手腕动作比较顺滑，手背部分会有明显刺激感。

如果身体试图做出与电信号相反的动作，会产生疼痛。这也构成了一道天然的安全线：系统不可能在佩戴者强烈抗拒的情况下完成动作。

在社交媒体上，许多评论的担忧集中在同一个问题：如果 AI 能操控人的手弹钢琴，是不是也能操控人做危险的事？吴雨潼表示，理论上，如果有人教系统做危险动作，它也能执行。但她认为系统目前完全不具备自主产生此类意图的能力，“没有一个数据库存着这些动作的 mapping”。

而且当佩戴者的身体试图做出与电信号相反的动作时会产生疼痛，系统不可能在人强烈抗拒的情况下完成操控。团队定位始终是增强工具，最多延伸到帮助偏瘫或残障人士的康复。不过她也承认，一旦涉及医疗场景，美国的 FDA 审批“会特别特别难”。

走红之后，确实有美国 VC 找上门，与他们沟通商业化相关的事宜，但团队内部认为其距离真正产品化还有非常多的障碍需要解决。例如其电极片每次使用都需要更换，佩戴者皮肤不能有太多体毛，每换一个人都需要重新调校参数。“如果材料科学能出现一种可靠的干式电极，不需要每次精准贴合皮肤，我们才真的有可能做成手套一样的消费品，”吴雨潼说。在那之前，这更接近一个漫长工程化道路上的起点。

六个人各有各的下一步。吴雨潼计划今年秋天申请美国高校的人机交互项目，gap year 期间回国探索可穿戴健康设备方向。团队也想继续推进 Human Operator 本身，比如将场景从钢琴扩展到包括古筝在内的多种乐器的的颤音和“摇指”：如果能采集到专业演奏者摇指时的肌肉活动，理论上可以通过 AI 直接传递给从未碰过古筝的人学习如何控制手腕肌肉。

她和 Daniel 也希望进一步拓展 EMS 和视觉模型的交互，这套模型也可以抛开语言的控制，仅凭借眼动追踪指导手应该去哪个方位。吴雨潼说，她个人最想做的是把这类技术用到真正需要帮助的人身上，比如中风，脊髓损伤或残障患者。“我最感兴趣的，是把实验室里的东西运用到真实生活中，哪怕不是一个产品，能帮到一个人就是最大的成功。”

Human Operator 获得的关注远远溢出了一个学生黑客松项目应有的量级。虚拟货币、“夺舍”叙事、AI 生成的离谱二创，这些传播现象指向的与其说是项目本身，不如说是公众对“AI 触及身体”这件事积攒的不安与好奇。它目前能做的事情，不过是让几根手指按对琴键。但人们的反应已经说明，AI 从屏幕走到身体上，哪怕只是一小步，触发的想象和不安也是完全不同量级的。

参考资料：

1.项目地址：https://humanoperator.org/

2.团队联系方式：contact@humanoperator.org

3.吴雨潼联系方式：https://space.bilibili.com/22195772/upload/video；https://xhslink.com/m/ABF6xsf8ojV

4.https://github.com/danielkaijzer/Human-Operator

5.https://www.youtube.com/watch?v=fCLxENGs7CY

6.https://www.founded.com/human-operator-ai-that-can-control-your-body/

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成