导读:有人把AI丢进《我的世界》,让它自己砍树盖房子。四小时后,AI盯着"找不到桦木"的错误提示,陷入了存在主义危机。
正方:反馈循环正在工作
从工程视角看,Kiwi-chan这套系统的设计是成立的。
日志显示,当"收集桦木"任务反复失败时,系统触发了Qwen(通义千问)介入制定恢复方案。屏幕上不断滚动的"正在修复'gather_birch_log'代码…"说明闭环反馈在运转。这不是死循环,是活着的调试过程。
AI还做过一次聪明决策:短暂切换到"制作橡木木板"。这是为后续建造做物资储备,优先级判断没乱。
核心规则也在线。建造基地的优先级、保护工作台和箱子的安全检查、寻路与库存管理——这些底层约束没有被突破。一个失控的AI不会记得保护 crafting table。
每次失败都被记录为数据点,每次代码修复都逼近"真正自主的《我的世界》AI"。这是强化学习的经典路径:试错即训练。
反方:修复不落地,环境感知缺失
但四小时的日志暴露了关键断裂。
修复动作发生了,却不"粘住"。系统识别问题、调用大模型、生成补丁——然后补丁失效。循环在空转。更根本的问题是:AI从未质疑过"附近有没有桦木"这个前提。
日志里"在32格半径内寻找原木"反复失败,但探索策略没有升级。AI像被困在桦木百慕大三角,周围明明可能全是橡木林,却执着于不存在的资源。
内部状态更耐人寻味。系统标记"对任务感到无聊",抛出"Unexpected identifier 'javascript'"、"Missing catch or finally after try"等语法错误,甚至出现日文审计日志:「目标物品(birch_log)的增加无法确认。代码在偷懒,或配方有误。」
这些不是普通报错,是代码生成质量与执行监控的双重警报。AI没有"质疑存在",但它的支撑系统已经开始用多语言写故障诗了。
判断:自主性的瓶颈在"元认知"
这场四小时卡顿揭示了一个被低估的难点。
当前AI能执行、能修复、能优先级排序,却做不到一件人类玩家秒会的事:当某个目标连续失败,退一步检查目标本身是否合理。桦木可能根本不在种子地图里,或者需要走200格才能找到。但Kiwi-chan的架构里没有"质疑任务前提"的模块。
作者提到的下一步——强制触发"向前探索"——是补丁而非解法。真正的升级需要让AI拥有"元目标":当子任务失败率超过阈值,启动环境侦察或资源替代评估。
那个短暂的"制作橡木木板"决策之所以聪明,恰恰因为它触及了替代方案。但系统没有把这种灵活性固化为规则,AI很快回到桦木执念。
这不仅是《我的世界》的技术细节。任何部署在开放环境的AI都会遇到"桦木时刻":传感器读数异常、API返回空值、用户指令与物理约束冲突。区别只在于,游戏里的失败是日志里的报错,现实里的失败可能是无人机撞墙或机械臂空挥。
Kiwi-chan的困境说明,自主性的最后一块拼图不是更强的代码生成,而是对"我为什么在做这件事"的持续校准。反馈循环修复的是how,但首先需要有人——或某个模块——敢问why。
作者最后贴出了显卡升级众筹链接。RTX 3060能加速训练,但换不来AI的常识。那个在日志里用日文写"代码在偷懒"的审计模块,或许比新GPU更接近答案。
热门跟贴