你下达一个任务——用 TypeScript、Bun 和 SQLite 搭一个 webhook 交付服务。还没等写第一行代码,AI 编程智能体先打开网页搜索,把 Stripe 的签名格式、GitHub 的重试行为、Standard Webhooks 规范全都扒了一遍,然后连问你 9 个澄清问题。这可不是哪个高级程序员的操作,而是 Kilo Code 最近对 Grok Build 0.1 的实战测试场景。
Grok Build 是马斯克旗下 xAI 在 2026 年 5 月推出的编程智能体工具,专为专业开发者打造,直接对标 Claude Code 这类终端编码产品。它通过自然语言控制,能在本地终端自动完成复杂的软件工程项目。这次测试的 0.1 版本,看起来已经有点“老手”的味道。
打开网易新闻 查看精彩图片
整个任务跑下来,Kilo Code 给出的账单是 1.65 美元,约合人民币 11.2 元。他们特意强调:交付过程中零工具调用失败,而且成本比 GPT-5.5 和 Claude Opus 4.7 等模型都要低。对一个能独立拉文档、提问澄清、再动手写代码的代理来说,这价格更像是系统维护的零头。
有意思的是它的工作顺序:不是着急输出代码,而是先搜规范、问清边界。9 个问题过后才开写,结果交付一步到位。这跟很多“先撸再说”的编程习惯刚好相反,反而更像一个经验丰富的老工程师。
马斯克随后转发了这场实战的分享,简短评论“物超所值”。没有列参数、也没有贴 benchmark,但这四个字配上 11.2 元的价格标签,可能比任何技术口号都来得实在。
热门跟贴