国产最强开源Coding模型发布了！！|glm|代码|插件|模型发布|深度思考按钮

这是苍何的第 439 篇原创！

大家好，我是苍何。

讲真的，最近的AI圈太卷了，卷得我都有点麻了。

你还别说，就这两天，DeepSeek 刚发布 V3.2，我屁股还没坐热，Claude 就甩出了王炸 Claude 4.5。

我以为这就完了，大家都能安心过个节了，结果智谱反手又发布了 GLM-4.6。

昨晚发了文章说 GLM 4.6 要来，但我是真没想到会来这么快。。。

好家伙，我群里直接就炸了，很多小伙伴都说这次提升很大，反响非常不错。

于是我也第一时间体验了下，不吹不黑，确实可以称得上是「国产最强开源Coding模型」。

我甚至用 GLM 4.6 重构了废弃的开源项目，效果很 nice。

不过在 show 我的实测 case 之前，有必要来看看一些官方发布的数据。

在 8 大权威基准模型通用能力的评估测试中，GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5，稳居国产模型首位。

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示，GLM-4.6实测超过 Claude Sonnet 4，超越其他国产模型。

官方放出的数据显示，在 token 消耗上表现也是同类模型的最低。

不过，跑分是一回事，实际效果还得测测，下面来看看我的一些测试 case 吧。

先来个简单的，我们让 GLM 4.6 自己介绍下自己吧。

前端 UI上和 Claude 4 基本没差异，不过这个能力，在 GLM 4.5 表现就还不错，但 4.6 给我的感受是，更快更稳了。

比如让它做一个国庆旅游攻略 PPT，出来的速度更快，质量更高了。

下面让它做个 breakout 游戏，一次就能出来这个效果：

而这个是 Claude 4 出来的效果：

这个 case 明显能看出，GLM 4.6 效果好于 Claude 4 。

GLM 4.6 具备视觉理解能力，于是我直接丢了一张比较抽象的手绘原型图。

它很快就给我复刻出前端界面，效果很给力。

不过对于 Coding 能力的拷打，以上 case 都还勉强算是 demo 级别。

接下来，我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中，让它来做一些更复杂的，更偏向实际开发的一些任务。

PS：Claude Code 2.0 最大的更新是搞了个恢复机制，当 Claude Code 搞砸了，可以运行 /rewind 来撤消代码更改，大家可以更新下。

将将 GLM 4.6 放进 Claude Code 也很简单，一共就这么几步：

第一步，获取智谱 API key

第二步，配置环境变量

打开项目，输入以下配置：

export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY

第三步，切换使用模型

手动修改配置文件 ~/.claude/settings.json

{ "env": { "ANTHROPIC_MODEL": "glm-4.6"   } }

这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句，现在 GLM 4.6 的 API可以说是羊毛价了，最低一个月 20 就能痛快使用，我反手就冲了个 Pro。

我的第一个任务是让它做一个监控工具，输入一句话需求：

帮我做个小工具：监控‘黑神话：悟空’在Steam上的最新评价，并把负面评价整理成markdown。你自己去网上搜一下怎么实现。

然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作，它先是自动取搜索 Straem 评价的 API，然后去搜下如何实现了。

运行这个工具，真的就搜集到了最新的评价，并在我本地文件中做记录了。

整个过程很丝滑， GLM 4.6 帮我自动开发完成了这个工具。

要是以前，光是搜索这种方案，然后再编码就得花费不少时间。

最后一个 case，我是真没想到，我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。

这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代，几乎是做轮播图的首选。

它是一个纯粹的 jQuery 插件，代码里充满了典型的上古代码风格。

只是项目已经不维护了，不过很多老项目还在使用。

这个是这个开源项目原本实现的效果：

大家主要看下轮播图，下面，我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。

我现在需要重构下，我希望用Vue来重写，请你帮我重构

可以看到整个重构过程非常丝滑，它先是分析了整个项目，然后开始执行重构操作。

看下重构后的代码，是最新的 Vue3 代码。

然后看下最终轮播图效果，可以说和原先项目效果惊奇的保持了一致。

真的挺麻的，以前重构是一件非常复杂的事情，得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力，居然一次成功了。

好了，今天就到这了。

说实话，最后一个重构的 case 是真的震撼到我了。

重构屎山一样的祖传代码，一直是程序员的噩梦，繁琐、易错，还费时费力。

当 AI 已经能帮你重构祖传代码时，你就应该意识到，它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。

讲真的，从 GLM-4.6 身上，我看到了国产大模型不再是单纯地追赶和对标，而是真正开始在实用性上发力，切实地为我们开发者解决问题。

这波，我站智谱。

国产最强开源Coding模型发布了！！

热搜

热门跟贴

热搜

热门跟贴

相关推荐

大模型最难的AI Infra，用Vibe Coding搞定

重塑软件工程：从Vibe Coding走向Spec Coding

15岁少年养AI龙虾，月入3万美元！智能体黄金时代真来了

让两个大模型在线吵架，跑通全网95%科研代码｜深势Deploy-Master

315曝光的“AI投毒”原理：GEO这样操控大模型推荐

记者实测阿里版“龙虾”JVS Claw 对比OpenClaw的“安全”焦虑，国产版如何破解？

刚刚，阿里All in Token：成立全新事业群，吴泳铭直接负责

DeepSeek、GPT、Qwen,所有大模型架构图都有,Karpathy：宝藏画廊

数字龙虾走出对话框，我们在南京看到从野生到精养的进化路径

大模型解剖图火了，30多个开源模型架构差异一目了然，还可接入AI

刚刚，清华团队养出了一只「龙虾老师」！教育版OpenClaw震撼开源

阿里的“DeepMind时刻”：吴泳铭亲征，Token帝国的黎明

AGI爆发前夜，阿里重兵杀向B端AI应用 吴泳铭亲自下场：创造Token、输送Token、应用Token

马斯克也要造“AI分析师”：xAI大举招聘金融专家训练Grok

拒绝Vibe Coding！大神揭秘8套AI编程模式

32岁程序员家中猝死被认定工伤，生前最后一段画面曝光！妻子：他出事前极度疲惫，去世8小时后仍收到工作

玉米地里有动静，小伙走近了一看，这个编码是？

模型飞机试飞，镜头一转发现事不简单，美女吃了熊心豹子胆

男子分享女友的“奖励机制”，“开心了奖励自己 不开心了也奖励自己”

微软最安全主机神话破灭！Xbox One终于沦陷：任意代码随意跑

AGI爆发前夜，阿里重兵杀向B端AI应用吴泳铭亲自下场：创造Token、输送Token、应用Token

男子分享女友的“奖励机制”，“开心了奖励自己不开心了也奖励自己”