工程标准定义权的争夺,或许比模型层更加残酷。
作者丨梁丙鉴
编辑丨马晓宁
近日,GitHub Trending 榜首的「obra/superpowers」飙到了 198,582,单日新增 1,422 星,贡献了近期所有 AI Agent 项目中几乎最凶猛的单日增量。
给第一次听说这个项目的朋友介绍一下。在 Coding 任务中,原始提示词和结构化的工程工作流之间,还隔着一道专业的鸿沟。superpowers 瞄准的正是这个环节,它通过预定义的 Skill 文件为 AI 注入行为准则,使 AI 在写下第一行代码之前,能先像资深工程师一样思考、规划和验证。
superpowers 并不是异军突起的编码工具,可以说它和市面上已有的各种 Copilot 产品都不冲突,其存在的意义恰恰是让 Claude Code、Cursor 或 GitHub Copilot 能够遵循结构化、可复现的专业级开发流程,产出更高质量的代码。
那么接近 20 万星的热度,意味着什么?这几乎等价于两个中型开源社区带来的流量,足以让一家中等规模的 AI 创业公司在一周内完成冷启动。而今天博得这份关注的,本质上只是一套 AI 编程脚手架。
我们不禁要问,superpowers 凭什么?
01
superpowers 的核心是 20 余个经过实战检验的 Skill。用上这套脚手架之后,AI 在编程任务中的表现会高度接近生产级的工程师团队。
它会强制 Agent 先问聪明的问题,生成可读的 spec 供人类审批,然后拆分成精确的 2-5 分钟小任务,每个任务有确切的文件路径、完整的代码需求和验证步骤。此外每个任务都会分配全新的子Agent执行,输出经过两轮审查。一次看是否符合 spec,一次看代码质量。
而在 TDD(测试驱动开发)环节,superpowers 将失败测试、最少代码和重构的过程强制化。对 AI Coding 来说,这有效避免了一口气产出几百行代码,却在 debug 时无从下手的问题。最后是 Code Review 环节,superpowers 同样包含一个按严重级别报告问题的设计。
究其根本,superpowers 的爆火是因为它踩中了两个 AI 开发者们越来越头疼的难题,如何让 AI 写代码的时候不跑偏,以及 AI 写完之后我如何确认它写对了。
这两个问题是在大模型能力趋同的背景下,开发者最急需的工程层方案。它不考虑如何让模型更聪明,而是让模型在工程环境里更可靠。
因此这个项目本质上是一套面向 Claude Code、Codex、Gemini CLI、Cursor 等 AI 编程工具的开发方法论。相较于“如何让模型生成更高质量的代码”,一个更具落地指导意义的问题应该是,“如何让模型正确地连接系统、管理上下文片段,成为一个可协作的工程实体”。
换言之,在模型的智能水平之外,更高效的调度,同样意味着更强的生产力。
你不只能在 superpowers 身上看到这种共识的形成。
GitHub 上的 Agent 基础设施项目已然经历了一轮爆发。OpenClaw 月涨 21 万星只是一众案例中最显眼的那个,事实上 GitHub 整个 2 月月度 Trending 榜单前 20 几乎被 AI 基础设施、Agent 框架和工具链彻底占领。
时至 5 月,agents-best-practices、codex-complexity-optimizer 双双登上 GitHub Trending 榜单,前者用于 Codex、Claude Code 等 AI 编码智能体的运行时框架设计,后者则为 Codex 专属,用于代码库复杂度分析和性能优化,此外亦有多个 Agent 工作流框架同步爆发。
这些项目的涌现并非偶然,Anthropic 和 OpenAI 对开发者工作流的重塑,正在倒逼整个生态重新思考如何用 AI 写代码。而当模型性能逐渐趋同,工程能力就成为了 Agent 落地全新的竞争焦点,Anthropic 和 OpenAI 也同样不能免俗。
5 月 18 日,Anthropic 正式宣布以 3 亿美金收购 Stainless。这家 2022 才成立的初创公司,核心产品能够读取 API 规范并自动生成 Python、TypeScript、Go、Java 等多语言的生产级 SDK,且能随 API 变更自动同步更新。
这起收购被广泛解读为 Anthropic 对 Agent 基础设施的布局,一个重要原因在于,调用外部工具是今天 Agent 最核心的产品逻辑,而实际落地时的稳定性、速度和幻觉率,都取决于 SDK 质量。可以说 Anthropic 对 Stainless 的收购,本质上是在控制 Agent 连接外部系统的底层协议。
OpenAI 则开始发力工作流,14 日 OpenAI 宣布 Codex 正式集成至 ChatGPT 移动端。让用户在手机上写代码,远远不是 OpenAI 全部的野心。集成 Codex 之后的 ChatGPT 移动端真正拥有了成为一个远程指挥中心的潜力,此后用户随时都可以在手机上向 Agent 下达命令、审核执行结果。对 ChatGPT 而言,这意味着从工具到随身助手的质变。
有了这一层认识,superpowers 的 20 万星就不难理解。它为 Coding Agent 提供了一种稳定、可验证的工程接入标准,某种意义上,这不亚于一款更强的模型问世了。
02
窗口期内的标准卡位战
知乎、掘金、腾讯云开发者社区等平台上,关于 superpowers 的教程在过去两个月间密集涌现。这些帖子介绍 superpowers 的核心卖点高度一致,概括下来,就是“让 vibe coder 也能写出能上线的代码”。
事实上不只是在开发者社区,如何将 AI 整合进复杂工程,对 AI 公司和云厂商们也是一个值得探索的问题。
除了 Anthropic 通过收购 Stainless 对 Agent 基础设施的布局,OpenAI 的产品策略转向,另一个很有意思的例子是微软。后者先是将 AutoGen 和 Semantic Kernel 统一整合为全新的 Microsoft Agent Framework,又在今年 2 月推出了 GitHub Agentic Workflows 的技术预览版。
Agent 如何真正走向生产,是整个行业共同面对的工程化深水区。
在这一考验之前,Anthropic 和 OpenAI 等 AI 公司希望借助模型能力和插件系统定义游戏规则,以微软、谷歌为代表的云厂商则试图通过将 Agent 转化为云原生服务来定义其工程边界。与此同时,开源社区也在用 superpowers 等民间标准争夺着工程范式的定义权。
这似乎是三股此消彼长的力量。当模型能力趋同,竞争焦点就从“谁的模型更聪明”转向了“谁的工程标准更可能被开发者接受”。这个转移是零和的,一旦某个范式被足够多的开发者采用,它就会形成锁定效应,成为后来者很难再改变的行业习惯。
Anthropic 收购 Stainless、OpenAI 推出 Codex移动端、微软整合 Agentic Workflows,还有 superpowers 在开源社区狂揽的 20 万星,这是同一场标准卡位战的四种不同打法。
这场 AI 工程标准之争的期限有多长,暂时没人能说清。但是当范式固化,今天的玩家中当然会有几位成为 AI 时代的 Git、CI 或 CD,而更多选手则会被淘汰出局。
Superpowers 的 20 万星,只是下一场激烈竞争的发令枪。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
热门跟贴