当大模型开始自己改bug、跑测试、甚至拒绝不合理需求——程序员的角色会被压缩成"监工"吗?

一、GLM-5.1的核心升级:从"生成代码"到"完成任务"

打开网易新闻 查看精彩图片

智谱最新发布的GLM-5.1,主打的是Agentic Coding(智能体编程)。不是给你一段代码就结束,而是能理解需求、自主规划、调用工具、验证结果。

实测中,它可以在多轮对话里保持上下文,遇到编译错误会自己查文档修,甚至对模糊需求会反问确认。这已经不是代码补全工具的逻辑了。

二、三个值得关注的细节

第一,工具调用链变长了。GLM-5.1支持单次请求里串行调用多个工具,比如先读配置文件、再查API文档、最后生成代码。中间哪步出错,它会回溯重试。

第二,拒绝能力。面对明显不合理的需求(比如"用Excel实现操作系统"),它会直接说"这超出合理范围",而不是硬编一段废代码。这点比盲目服从的模型更实用。

第三,测试驱动。生成代码后,它会主动写测试用例跑一遍,通过才交付。相当于内置了一个最小化的CI流程。

三、对开发者的真实影响

初级编码工作确实在加速贬值。但GLM-5.1也暴露了新瓶颈:复杂系统的架构设计、跨模块的依赖梳理、业务逻辑的隐性知识——这些它还不行。

更现实的场景是"人机结对":你定方向,它填实现,你审结果。效率提升是确定的,但"完全替代"还早。

一个尴尬的事实是:很多程序员讨厌写测试和文档,而Agent最擅长的恰恰就是这些。未来 team's 里专门"审Agent产出"的岗位,会不会比纯写代码的更吃香?