封面新闻记者 付文超
7月1日消息,开源 AI Agent 项目 OpenSquilla 近日发布 0.4.0 版本,核心更新是推出编码工作流 coding模式,并首次为 AI 编码引入“自我验证”机制。据悉,AI 不再止步于“我改好了”的口头交付,而是在交回结果前,先用测试为自己跑出一份可复核的、证明“改对了”的证据。
据介绍,这一机制指向 AI Coding 当前最棘手的瓶颈——信任。过去一年 AI 写代码能力突飞猛进,但“能写”不等于“能信”:多数编码 Agent 改完即交,对错仍要人逐行复核,这也是 AI 编码难以真正无人值守、规模化进入生产环境的关键障碍。把验证内化进 Agent 自身,意味着行业评判 AI 编码的标准,正从“它声称改对了”转向“它能否自证改对了”。
其做法是一条独立的“红绿回归证据链”:先写一个注定失败的测试给问题定性、证明它真能抓住 bug,再把功能做好让测试由红转绿,最后跑一遍项目原有测试确认没弄坏别处;三关全过才算交付,任一不过直接打回。配套还有默认的自动修复闭环——不通过就自动重改到通过为止,以及隔离施工——改动只在隔离副本里进行、验收合格才落回源码。
OpenSquilla 主打“提升单位成本的 Agent 智能”,以Learnable Harness为切入点,目标打造性价比最高的Agent产品。在主流 Agent 框架普遍推高模型调用、token 成本攀升的背景下,它通过本地智能路由,按任务复杂度自动选模型、技能按需加载、记忆按需检索、工具结果预处理等方式,在“调用前”就压降成本。
据悉,基元律动创始人王云鹤曾负责头部科技公司大模型研发,CTO 为韩凯。OpenSquilla 上线后数周内 GitHub star 增至数千量级;据公开报道,公司成立仅数月即完成首轮融资,是 Harness和Agent原生模型方向上为数不多的代表性玩家。
热门跟贴