编程脚手架狂揽 20 万星，Agent 基础设施成 GitHub 新战场|agent|万星|工作流|编程|脚手架

工程标准定义权的争夺，或许比模型层更加残酷。

作者丨梁丙鉴

编辑丨马晓宁

近日，GitHub Trending 榜首的「obra/superpowers」飙到了 198,582，单日新增 1,422 星，贡献了近期所有 AI Agent 项目中几乎最凶猛的单日增量。

给第一次听说这个项目的朋友介绍一下。在 Coding 任务中，原始提示词和结构化的工程工作流之间，还隔着一道专业的鸿沟。superpowers 瞄准的正是这个环节，它通过预定义的 Skill 文件为 AI 注入行为准则，使 AI 在写下第一行代码之前，能先像资深工程师一样思考、规划和验证。

superpowers 并不是异军突起的编码工具，可以说它和市面上已有的各种 Copilot 产品都不冲突，其存在的意义恰恰是让 Claude Code、Cursor 或 GitHub Copilot 能够遵循结构化、可复现的专业级开发流程，产出更高质量的代码。

那么接近 20 万星的热度，意味着什么？这几乎等价于两个中型开源社区带来的流量，足以让一家中等规模的 AI 创业公司在一周内完成冷启动。而今天博得这份关注的，本质上只是一套 AI 编程脚手架。

我们不禁要问，superpowers 凭什么？

一个「脚手架」项目为什么值 20 万星？

superpowers 的核心是 20 余个经过实战检验的 Skill。用上这套脚手架之后，AI 在编程任务中的表现会高度接近生产级的工程师团队。

它会强制 Agent 先问聪明的问题，生成可读的 spec 供人类审批，然后拆分成精确的 2-5 分钟小任务，每个任务有确切的文件路径、完整的代码需求和验证步骤。此外每个任务都会分配全新的子Agent执行，输出经过两轮审查。一次看是否符合 spec，一次看代码质量。

而在 TDD（测试驱动开发）环节，superpowers 将失败测试、最少代码和重构的过程强制化。对 AI Coding 来说，这有效避免了一口气产出几百行代码，却在 debug 时无从下手的问题。最后是 Code Review 环节，superpowers 同样包含一个按严重级别报告问题的设计。

究其根本，superpowers 的爆火是因为它踩中了两个 AI 开发者们越来越头疼的难题，如何让 AI 写代码的时候不跑偏，以及 AI 写完之后我如何确认它写对了。

这两个问题是在大模型能力趋同的背景下，开发者最急需的工程层方案。它不考虑如何让模型更聪明，而是让模型在工程环境里更可靠。

因此这个项目本质上是一套面向 Claude Code、Codex、Gemini CLI、Cursor 等 AI 编程工具的开发方法论。相较于“如何让模型生成更高质量的代码”，一个更具落地指导意义的问题应该是，“如何让模型正确地连接系统、管理上下文片段，成为一个可协作的工程实体”。

换言之，在模型的智能水平之外，更高效的调度，同样意味着更强的生产力。

你不只能在 superpowers 身上看到这种共识的形成。

GitHub 上的 Agent 基础设施项目已然经历了一轮爆发。OpenClaw 月涨 21 万星只是一众案例中最显眼的那个，事实上 GitHub 整个 2 月月度 Trending 榜单前 20 几乎被 AI 基础设施、Agent 框架和工具链彻底占领。

时至 5 月，agents-best-practices、codex-complexity-optimizer 双双登上 GitHub Trending 榜单，前者用于 Codex、Claude Code 等 AI 编码智能体的运行时框架设计，后者则为 Codex 专属，用于代码库复杂度分析和性能优化，此外亦有多个 Agent 工作流框架同步爆发。

这些项目的涌现并非偶然，Anthropic 和 OpenAI 对开发者工作流的重塑，正在倒逼整个生态重新思考如何用 AI 写代码。而当模型性能逐渐趋同，工程能力就成为了 Agent 落地全新的竞争焦点，Anthropic 和 OpenAI 也同样不能免俗。

5 月 18 日，Anthropic 正式宣布以 3 亿美金收购 Stainless。这家 2022 才成立的初创公司，核心产品能够读取 API 规范并自动生成 Python、TypeScript、Go、Java 等多语言的生产级 SDK，且能随 API 变更自动同步更新。

这起收购被广泛解读为 Anthropic 对 Agent 基础设施的布局，一个重要原因在于，调用外部工具是今天 Agent 最核心的产品逻辑，而实际落地时的稳定性、速度和幻觉率，都取决于 SDK 质量。可以说 Anthropic 对 Stainless 的收购，本质上是在控制 Agent 连接外部系统的底层协议。

OpenAI 则开始发力工作流，14 日 OpenAI 宣布 Codex 正式集成至 ChatGPT 移动端。让用户在手机上写代码，远远不是 OpenAI 全部的野心。集成 Codex 之后的 ChatGPT 移动端真正拥有了成为一个远程指挥中心的潜力，此后用户随时都可以在手机上向 Agent 下达命令、审核执行结果。对 ChatGPT 而言，这意味着从工具到随身助手的质变。

有了这一层认识，superpowers 的 20 万星就不难理解。它为 Coding Agent 提供了一种稳定、可验证的工程接入标准，某种意义上，这不亚于一款更强的模型问世了。

窗口期内的标准卡位战

知乎、掘金、腾讯云开发者社区等平台上，关于 superpowers 的教程在过去两个月间密集涌现。这些帖子介绍 superpowers 的核心卖点高度一致，概括下来，就是“让 vibe coder 也能写出能上线的代码”。

事实上不只是在开发者社区，如何将 AI 整合进复杂工程，对 AI 公司和云厂商们也是一个值得探索的问题。

除了 Anthropic 通过收购 Stainless 对 Agent 基础设施的布局，OpenAI 的产品策略转向，另一个很有意思的例子是微软。后者先是将 AutoGen 和 Semantic Kernel 统一整合为全新的 Microsoft Agent Framework，又在今年 2 月推出了 GitHub Agentic Workflows 的技术预览版。

Agent 如何真正走向生产，是整个行业共同面对的工程化深水区。

在这一考验之前，Anthropic 和 OpenAI 等 AI 公司希望借助模型能力和插件系统定义游戏规则，以微软、谷歌为代表的云厂商则试图通过将 Agent 转化为云原生服务来定义其工程边界。与此同时，开源社区也在用 superpowers 等民间标准争夺着工程范式的定义权。

这似乎是三股此消彼长的力量。当模型能力趋同，竞争焦点就从“谁的模型更聪明”转向了“谁的工程标准更可能被开发者接受”。这个转移是零和的，一旦某个范式被足够多的开发者采用，它就会形成锁定效应，成为后来者很难再改变的行业习惯。

Anthropic 收购 Stainless、OpenAI 推出 Codex移动端、微软整合 Agentic Workflows，还有 superpowers 在开源社区狂揽的 20 万星，这是同一场标准卡位战的四种不同打法。

这场 AI 工程标准之争的期限有多长，暂时没人能说清。但是当范式固化，今天的玩家中当然会有几位成为 AI 时代的 Git、CI 或 CD，而更多选手则会被淘汰出局。

Superpowers 的 20 万星，只是下一场激烈竞争的发令枪。