这是苍何的第 439 篇原创!

大家好,我是苍何。

讲真的,最近的AI圈太卷了,卷得我都有点麻了。

你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。

我以为这就完了,大家都能安心过个节了,结果智谱反手又发布了 GLM-4.6。

昨晚发了文章说 GLM 4.6 要来,但我是真没想到会来这么快。。。

打开网易新闻 查看精彩图片

好家伙,我群里直接就炸了,很多小伙伴都说这次提升很大,反响非常不错。

打开网易新闻 查看精彩图片

于是我也第一时间体验了下,不吹不黑,确实可以称得上是「国产最强开源Coding模型」。

我甚至用 GLM 4.6 重构了废弃的开源项目,效果很 nice。

不过在 show 我的实测 case 之前,有必要来看看一些官方发布的数据。

在 8 大权威基准模型通用能力的评估测试中,GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

打开网易新闻 查看精彩图片

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示,GLM-4.6实测超过 Claude Sonnet 4,超越其他国产模型。

打开网易新闻 查看精彩图片

官方放出的数据显示,在 token 消耗上表现也是同类模型的最低。

打开网易新闻 查看精彩图片

不过,跑分是一回事,实际效果还得测测,下面来看看我的一些测试 case 吧。

先来个简单的,我们让 GLM 4.6 自己介绍下自己吧。

打开网易新闻 查看精彩图片

前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,更快更稳了

比如让它做一个国庆旅游攻略 PPT,出来的速度更快,质量更高了。

打开网易新闻 查看精彩图片

下面让它做个 breakout 游戏,一次就能出来这个效果:

打开网易新闻 查看精彩图片

而这个是 Claude 4 出来的效果:

打开网易新闻 查看精彩图片

这个 case 明显能看出,GLM 4.6 效果好于 Claude 4 。

GLM 4.6 具备视觉理解能力,于是我直接丢了一张比较抽象的手绘原型图。

打开网易新闻 查看精彩图片

它很快就给我复刻出前端界面,效果很给力。

打开网易新闻 查看精彩图片

不过对于 Coding 能力的拷打,以上 case 都还勉强算是 demo 级别。

接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。

打开网易新闻 查看精彩图片

PS:Claude Code 2.0 最大的更新是搞了个恢复机制,当 Claude Code 搞砸了,可以运行 /rewind 来撤消代码更改,大家可以更新下。

将将 GLM 4.6 放进 Claude Code 也很简单,一共就这么几步:

第一步,获取智谱 API key

打开网易新闻 查看精彩图片

第二步,配置环境变量

打开项目,输入以下配置:

export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY

第三步,切换使用模型

手动修改配置文件 ~/.claude/settings.json

{ "env": { "ANTHROPIC_MODEL": "glm-4.6"   } }

这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句,现在 GLM 4.6 的 API可以说是羊毛价了,最低一个月 20 就能痛快使用,我反手就冲了个 Pro。

打开网易新闻 查看精彩图片

我的第一个任务是让它做一个监控工具,输入一句话需求:

帮我做个小工具:监控‘黑神话:悟空’在Steam上的最新评价,并把负面评价整理成markdown。你自己去网上搜一下怎么实现。

然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作,它先是自动取搜索 Straem 评价的 API,然后去搜下如何实现了。

打开网易新闻 查看精彩图片

运行这个工具,真的就搜集到了最新的评价,并在我本地文件中做记录了。

打开网易新闻 查看精彩图片

整个过程很丝滑, GLM 4.6 帮我自动开发完成了这个工具。

要是以前,光是搜索这种方案,然后再编码就得花费不少时间。

最后一个 case,我是真没想到,我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。

这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代,几乎是做轮播图的首选。

它是一个纯粹的 jQuery 插件代码里充满了典型的上古代码风格。

只是项目已经不维护了,不过很多老项目还在使用。

打开网易新闻 查看精彩图片

这个是这个开源项目原本实现的效果:

打开网易新闻 查看精彩图片

大家主要看下轮播图,下面,我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。

我现在需要重构下,我希望用Vue来重写,请你帮我重构

可以看到整个重构过程非常丝滑,它先是分析了整个项目,然后开始执行重构操作。

 国产最强开源Coding模型发布了!!
打开网易新闻 查看更多视频
国产最强开源Coding模型发布了!!

看下重构后的代码,是最新的 Vue3 代码。

打开网易新闻 查看精彩图片

然后看下最终轮播图效果,可以说和原先项目效果惊奇的保持了一致。

打开网易新闻 查看精彩图片

真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。

好了,今天就到这了。

说实话,最后一个重构的 case 是真的震撼到我了。

重构屎山一样的祖传代码,一直是程序员的噩梦,繁琐、易错,还费时费力。

当 AI 已经能帮你重构祖传代码时,你就应该意识到,它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。

讲真的,从 GLM-4.6 身上,我看到了国产大模型不再是单纯地追赶和对标,而是真正开始在实用性上发力,切实地为我们开发者解决问题。

这波,我站智谱。