Notion官方挑战赛收到一个离谱作品——ShadowOS。不是APP,不是插件,是一套「隐形操作系统」。开发者Samarth CS提交时没写PPT,直接甩了段视频:Cursor里敲代码,Notion里自动长出一篇功能文档。评审群里安静了180秒。
这180秒的沉默,大概等于传统开发团队听完需求评审后的那种窒息感。
01 | 它到底在自动干什么
ShadowOS的监控范围很克制。只抓三类信号:代码文件变更、终端命令执行、浏览器标签切换。不录屏、不截全屏、不碰剪贴板——「只记有意义的,不存噪音」,这是Samarth在GitHub文档里的原话。
AI层做两件事。先理解意图:你刚在`auth.js`里加了密码哈希,系统判断这是「实现认证模块」。再预测下一步:自动生成测试用例清单、边界场景提醒、相关API文档链接。最后通过MCP(模型上下文协议)把结构化数据推进Notion。
整个过程的延迟,视频里演示大概在5-8秒。比你切个微信回消息还快。
有个细节很毒:它不会问你「要不要创建文档」,而是直接建好,把标题和一级目录摆在那儿。你改也行,不改也行——但大多数人会选择改,因为空白文档的恐惧比修改现有内容大10倍。
02 | MCP协议是被低估的杠杆
ShadowOS能成立,核心依赖是Notion今年开放的MCP支持。这个协议简单说就是让AI代理能直接读写你的工作空间,不需要你手动复制粘贴。
以前做类似工具,开发者要啃Notion API的OAuth流程、处理分页、拼JSON结构。现在MCP把这部分抽象成「AI能理解的接口」——Agent看到的是一个能调用`create_page`、`update_database`的工具集,而不是REST文档。
Samarth的架构图里,MCP处于中间层:上游接本地行为监控,下游接Notion工作区。这个位置选得很准。往上再抽象一层,就丢失上下文;往下直接调API,又要处理太多脏活。
GitHub仓库里有个未完成的TODO:「Cursor插件实时集成」。如果做成,意味着你在IDE里的每一次保存都会触发ShadowOS的完整链路——从代码diff到文档生成,零手动。
03 | 开发者的时间账算得过来吗
ShadowOS的宣传口径是「消除文档、整理、记忆的开销」。但真实场景里,这三件事的痛点分布很不均匀。
文档是强痛点,尤其跨团队协作时。但「整理」和「记忆」的需求因人而异——有人用Git分支命名就能记住上下文,有人需要可视化看板。ShadowOS的自动分类逻辑是AI推断的,推断错了反而增加认知负担。
Samarth在视频描述里埋了个预期管理:「系统理解你做了什么,而不是你手动告诉它」。这句话的潜台词是接受一定误差率。问题是,开发者对误差的容忍度极低。一个错误的自动生成的测试用例,可能比重写文档更浪费时间。
目前ShadowOS的开源版本是个人工具定位。团队级功能在Roadmap里排第四,前面还有多Agent系统、学习缺口检测。这个优先级合理——先把单点体验磨顺,再碰权限、冲突解决、知识所有权这些团队场景的硬骨头。
04 | 同类产品都在哪卡住了
行为监控+自动文档不是新赛道。2023年的Pieces、2024年初的Continue.dev都试过类似方向,但大多卡在两个地方。
一是隐私边界。ShadowOS的「只记有意义信号」是个聪明的设计,但「有意义」的定义权在开发者手里。Samarth的默认规则是代码文件+终端+浏览器,用户能不能细粒度关闭某一项?GitHub Issues里还没人提这个问题,但企业场景一定会问。
二是知识沉淀的价值。自动生成的文档如果没人维护,三个月后就变成数字废墟。ShadowOS目前的方案是「持续更新」——每次代码变更触发文档增量修订。这个机制能跑通的前提是你的Notion结构足够稳定,否则AI会不断创建新页面而非更新旧页面。
Notion MCP Challenge的评审标准里有一条「实际可落地」。ShadowOS的演示视频拍得很克制,没有炫技镜头,就是一段真实的Cursor编码+Notion侧边栏自动刷新。这种「无聊」的演示反而增加了可信度。
有个用户评论被Samarth置顶了:「终于不用在『写代码』和『写周报』之间精神分裂了。」这条评论的点赞数是第二名的3倍。
05 | 下一步赌什么
Roadmap里排第一的是Cursor插件。这个选择很产品经理——Cursor是目前增长最快的AI IDE,用户画像和ShadowOS高度重叠。先做插件再做多Agent,是用场景验证需求,而不是用技术堆功能。
多Agent系统的描述是「debugger, planner, reviewer」三个角色。这个分工借鉴了Devin的架构,但ShadowOS的差异化在于「基于真实行为触发」而非「基于用户指令触发」。Planner不会凭空生成任务,而是看到你改了数据库schema才建议迁移脚本。
学习缺口检测是个有趣的方向。ShadowOS可以对比「你实际写的代码」和「项目最佳实践」的差距,比如检测到你没有写单元测试就提交,自动在Notion里插一条待办。这个功能如果做重,会触碰团队管理的敏感地带——谁来定义「最佳实践」?
Cross-platform workflow tracking是长期野心。目前ShadowOS只监控开发行为,但产品经理的设计稿、测试同学的用例执行、运维的告警响应,理论上都可以接入同一套Notion工作流。这个愿景需要Notion MCP支持更多数据源,目前还没时间表。
ShadowOS的GitHub仓库在提交挑战赛48小时内涨了400星。Notion官方账号在视频下留了条评论:「This is the kind of future we imagined when building MCP.」Samarth回复了一个表情,没说话。
如果这套系统真的跑通,开发者的日常会变成什么样?你写完代码关电脑,第二天打开Notion,发现昨晚的改动已经被整理成技术方案草稿、待办清单、甚至给产品经理的变更说明——而你只需要改几个字就能发出去。这种「事后整理」变成「事前预测」的范式转移,是ShadowOS押注的核心。
但有个问题Samarth还没回答:当AI比你更清楚「你昨天做了什么」,你会更信任自己的记忆,还是更依赖系统的记录?
热门跟贴