两天。二十一次代码提交。英文指令进去,合并请求出来。
如果你从中间开始看这篇:第一篇讲了16小时的构建过程——Telegram机器人进去,合并请求出来,端口适配器架构。第二、三篇是随后的bug狩猎,包括一个花了5.84美元却零产出的任务,迫使我们重新思考整个信任链条。这是系统熬过这一切之后的样子。
没有网页界面的开发工具
MissionControl以一个Telegram机器人的形式运行。没有网页界面。没有仪表盘。你发消息给它,它干活,它发消息给你。
每次交互都塞进一个聊天气泡里。遛狗时用手机发任务,到家前收到PR链接。这个限制——所有东西必须装进一条Telegram消息——结果成了特性,不是缺陷。
完整指令集如下:
不用切换上下文。不用浏览器标签页。
20%完成率的真实含义
头48小时,三个项目,二十个任务。
完成率20%。看起来很差。其实不是。任务1到4全部栽在同一个CLI启动问题上——第二篇里的零标准输出bug。同一故障重试四次,我们才搞明白。bug修复冲刺之后,新任务的完成率跳到大概50%。
剩余失败:预算超时,以及新注册项目的权限问题。不是系统性的。
关键数字:四个完成的任务产出了能跑的代码、通过的构建、合并的PR。其中一个——健身训练师仪表盘——是完整的全栈Next.js应用,带认证、数据可视化、PostgreSQL后端。自主构建。成本2美元。
每一层都是因为没做它,然后出事了
预算上限。全局每天50美元。默认每个任务5美元,最高可配到10美元。任务启动前检查,由CLI自己的--max-budget-usd标志强制执行。任务#19——第三篇那个5.84美元零产出灾难——证明光靠预算执行不够。你还得验证代理确实产出了东西。
超时机制。30分钟软限制,然后5分钟宽限期。软限制发SIGTERM。宽限期让代理收尾并提交。宽限过后,SIGKILL。SIGTERM后60秒另设一个杀死计时器,确保没东西挂着。Opus在双核机器上分析大代码库,光是规划就能烧掉15分钟。硬碰硬学来的。
孤儿清理。进程重启时,任何卡在运行状态的任务重置为排队。没这个,单次PM2重启就能冻住整个队列。事后看很明显。凌晨2点时不明显。
提交验证。git rev-list --count main..HEAD——如果为零,任务失败。没有例外。代理的自我评估("我成功完成了任务!")仅供参考,不是权威。我们不信任代理对自己工作的判断。
未提交工作抢救。任何分支清理之前:git status --porcelain。如果有脏文件,git add -A && git commit -m 'WIP: auto-rescue'。捕获代理做了但没提交的工作——超时、崩溃、代理忘了暂存文件。发生频率比预期高。
两天。二十一次提交。英文进去,合并请求出来。
如果你从中间开始看这篇:第一篇讲了16小时的构建过程——Telegram机器人进去,合并请求出来,端口适配器架构。第二、三篇是随后的bug狩猎,包括一个花了5.84美元却零产出的任务,迫使我们重新思考整个信任链条。这是系统熬过这一切之后的样子。
MissionControl以一个Telegram机器人的形式运行。没有网页界面。没有仪表盘。你发消息给它,它干活,它发消息给你。
每次交互都塞进一个聊天气泡里。遛狗时用手机发任务,到家前收到PR链接。这个限制——所有东西必须装进一条Telegram消息——结果成了特性,不是缺陷。
完整指令集如下:
不用切换上下文。不用浏览器标签页。
头48小时,三个项目,二十个任务。
完成率20%。看起来很差。其实不是。任务1到4全部栽在同一个CLI启动问题上——第二篇里的零标准输出bug。同一故障重试四次,我们才搞明白。bug修复冲刺之后,新任务的完成率跳到大概50%。
剩余失败:预算超时,以及新注册项目的权限问题。不是系统性的。
关键数字:四个完成的任务产出了能跑的代码、通过的构建、合并的PR。其中一个——健身训练师仪表盘——是完整的全栈Next.js应用,带认证、数据可视化、PostgreSQL后端。自主构建。成本2美元。
这里的每一层都是因为没做它,然后出事了。
预算上限。全局每天50美元。默认每个任务5美元,最高可配到10美元。任务启动前检查,由CLI自己的--max-budget-usd标志强制执行。任务#19——第三篇那个5.84美元零产出灾难——证明光靠预算执行不够。你还得验证代理确实产出了东西。
超时机制。30分钟软限制,然后5分钟宽限期。软限制发SIGTERM。宽限期让代理收尾并提交。宽限过后,SIGKILL。SIGTERM后60秒另设一个杀死计时器,确保没东西挂着。Opus在双核机器上分析大代码库,光是规划就能烧掉15分钟。硬碰硬学来的。
孤儿清理。进程重启时,任何卡在运行状态的任务重置为排队。没这个,单次PM2重启就能冻住整个队列。事后看很明显。凌晨2点时不明显。
提交验证。git rev-list --count main..HEAD——如果为零,任务失败。没有例外。代理的自我评估("我成功完成了任务!")仅供参考,不是权威。我们不信任代理对自己工作的判断。
未提交工作抢救。任何分支清理之前:git status --porcelain。如果有脏文件,git add -A && git commit -m 'WIP: auto-rescue'。捕获代理做了但没提交的工作——超时、崩溃、代理忘了暂存文件。发生频率比预期高。
两天。二十一次提交。英文进去,合并请求出来。
如果你从中间开始看这篇:第一篇讲了16小时的构建过程——Telegram机器人进去,合并请求出来,端口适配器架构。第二、三篇是随后的bug狩猎,包括一个花了5.84美元却零产出的任务,迫使我们重新思考整个信任链条。这是系统熬过这一切之后的样子。
MissionControl以一个Telegram机器人的形式运行。没有网页界面。没有仪表盘。你发消息给它,它干活,它发消息给你。
每次交互都塞进一个聊天气泡里。遛狗时用手机发任务,到家前收到PR链接。这个限制——所有东西必须装进一条Telegram消息——结果成了特性,不是缺陷。
完整指令集如下:
不用切换上下文。不用浏览器标签页。
头48小时,三个项目,二十个任务。
完成率20%。看起来很差。其实不是。任务1到4全部栽在同一个CLI启动问题上——第二篇里的零标准输出bug。同一故障重试四次,我们才搞明白。bug修复冲刺之后,新任务的完成率跳到大概50%。
剩余失败:预算超时,以及新注册项目的权限问题。不是系统性的。
关键数字:四个完成的任务产出了能跑的代码、通过的构建、合并的PR。其中一个——健身训练师仪表盘——是完整的全栈Next.js应用,带认证、数据可视化、PostgreSQL后端。自主构建。成本2美元。
这里的每一层都是因为没做它,然后出事了。
预算上限。全局每天50美元。默认每个任务5美元,最高可配到10美元。任务启动前检查,由CLI自己的--max-budget-usd标志强制执行。任务#19——第三篇那个5.84美元零产出灾难——证明光靠预算执行不够。你还得验证代理确实产出了东西。
超时机制。30分钟软限制,然后5分钟宽限期。软限制发SIGTERM。宽限期让代理收尾并提交。宽限过后,SIGKILL。SIGTERM后60秒另设一个杀死计时器,确保没东西挂着。Opus在双核机器上分析大代码库,光是规划就能烧掉15分钟。硬碰硬学来的。
孤儿清理。进程重启时,任何卡在运行状态的任务重置为排队。没这个,单次PM2重启就能冻住整个队列。事后看很明显。凌晨2点时不明显。
提交验证。git rev-list --count main..HEAD——如果为零,任务失败。没有例外。代理的自我评估("我成功完成了任务!")仅供参考,不是权威。我们不信任代理对自己工作的判断。
未提交工作抢救。任何分支清理之前:git status --porcelain。如果有脏文件,git add -A && git commit -m 'WIP: auto-rescue'。捕获代理做了但没提交的工作——超时、崩溃、代理忘了暂存文件。发生频率比预期高。
这套系统现在每天还在跑。下一个任务会是什么?
热门跟贴