Anthropic程序员曝Claude Code真玩法|code|万智牌|代码|工作流|程序员|调用

一个7万行代码的桌面应用，2400多个测试用例，跨4个仓库，只有1个开发者。他一边打《万智牌》竞技场，一边让AI在后台自动提交Bug报告。

这不是未来场景，是Anthropic员工Beyang Liu正在做的事。他开发的Manasight是个游戏辅助工具，技术栈混搭得相当典型：Tauri框架、Rust后端、TypeScript前端，再加一个Astro写的官网。传统认知里，这种项目至少需要前端、后端、QA、运维各一人。他用Claude Code全包了。

真正让人意外的不是写代码速度。Liu原本期待的是AI帮他更快敲键盘，实际收获的却是测试和调试流程的重构。

从"写完再测"到"边玩边测"

单人开发者的测试困境很具体：写代码和测代码是两种思维模式，每次切换都要重新加载上下文。游戏辅助工具更麻烦——你没法一边打游戏一边盯Overlay有没有错位。

Liu的解法是把Claude Code的两个功能串起来用。

Slash commands（斜杠命令）是可复用的提示脚本。他写了一系列Markdown文件，定义好工作流：读哪些文件、调什么工具、输出格式长什么样。运行时敲/command-name就行。他做了/debug-game、/triage-feedback、/code-review、/issue-to-pr四个命令，覆盖从调试到发版的全流程。

Agents（后台代理）则是真正改变游戏规则的设计。父对话可以派生独立Claude实例去执行任务，比如"追踪这段代码的执行路径，汇报你发现了什么"。代理干完活自动回报，你不用等。

这两个功能组合的效果，相当于给单人开发者配了一支随时待命的QA团队。

/debug-game的具体用法很直观：启动游戏，打开Overlay，正常打牌。发现卡牌没显示、面板位置不对、有卡顿，直接描述问题或者说"看最新截图"。Claude已经知道截图文件夹在哪，不需要你复制路径。

关键约束：QA会话期间不写代码。Claude会派生多个后台代理并行排查——一个追踪从游戏事件到Overlay的完整代码路径，一个查Manasight的应用日志，一个读《万智牌》客户端的Player.log看原始数据。代理各自独立干活，父对话保持响应，你继续打牌、继续报问题。

一场QA下来，得到一张跟踪表。每条记录带类型标签（Bug/性能问题/UI问题）、严重程度、根因分析、修复建议。Liu说，这相当于把传统QA团队的工作流压缩进一个斜杠命令。

2400个测试的维护成本去哪了

Manasight有2400多个测试，覆盖4个操作系统。手动维护这个规模的测试套件，单人开发者基本不可能持续迭代。

Liu的做法是测试即代码（test-as-code）。不是让AI生成测试然后不管了，而是把测试逻辑本身也纳入版本控制，用斜杠命令管理。

/platform-validate是个典型例子。它负责跑41个测试用例的跨平台验证协议。命令会检查当前分支状态，确认测试环境，按优先级队列执行测试，收集结果，生成报告。整个过程不需要人盯着，你可以去干别的。

测试失败时的处理更关键。Liu设计了/debug-test命令，Claude会自动读取失败日志、定位到具体代码、分析失败模式，然后给出修复方案或标记需要人工介入。他把这比作"给测试套件配了个专职调试工程师"。

测试维护从"负担"变成了"可自动化管理的资产"。

用户反馈的处理也被重构了。Manasight收到的问题报告格式混乱，有Discord留言、GitHub Issue、邮件截图。/triage-feedback命令会统一解析这些输入，提取关键信息（复现步骤、环境、错误日志），分类优先级，生成标准化的内部工单，甚至直接转成带初步分析的GitHub Issue。

Liu统计过，这个流程把反馈处理时间从平均45分钟压到5分钟以内。