2026开年,中国AI模型的竞争彻底沸腾。智谱GLM-5与DeepSeek在同一天发布新模型,简直像一场火力全开的硬刚盛宴。横评数据摆在那儿:GLM-5在“洗车难题”推理、高端网页设计及3D魔方模拟等前端任务上表现惊艳,甚至逼近Gemini 3 Pro的水平。而在Agentic测试中,它居然只用了20分钟就能自主调用Remotion Skills完成从文章到视频的整个流程。国产模型从“小聪明”进化成“能干活”的智能体,标志着Agent化大任务时代真的来了。

打开网易新闻 查看精彩图片

老实说,前阵子我都快被这波AI热潮“卷”疯了。每天十六个小时泡在AI里,结果一觉醒来,世界已经又变了模样。昨天才在玩Seedance 2.0的导演级视频生成,今天DeepSeek更新了模型,转头智谱又丢出GLM-5。节奏太快,连键盘都开始冒烟。既然大家都扎堆上线,那干脆一口气做个横评。

先上那道经典的“洗车难题”——洗车店离家50米,是该开车还是走过去?DeepSeek和GLM-5在Thinking模式下都建议开过去,但GLM-5还贴心给出了两套方案:人工精洗就把钥匙交给店员,机洗则洗完兜个圈吹干水渍。而关掉Thinking模式后,两者就分成了两派:GLM-5坚持“该开就开”,DeepSeek却提醒“50米开车属无效磨损”。看来深度思考模式还真能拉开差距。

打开网易新闻 查看精彩图片

做信息图是我的日常操作。这回,我让GLM-5和DeepSeek各自用我的资料生成网页。DeepSeek版视觉冲击强,但图标太多有点躁;GLM-5则更克制,排版层次清晰,圆角UI配动态光效,干净又高级。那一刻我真感觉,AI的审美离设计师越来越近。

接着我又让它们为Loopit这个产品做官网展示。GLM-5的结果惊艳到我——首页用了模拟抖音的视觉故障风格,紫调霓虹闪着科技感,板块清晰,甚至不经提醒就识别出了Logo逻辑。DeepSeek那边则实验性更强,页面上随机弹出的图标和文案虽然趣味十足,但距离“上线即用”的官网还差几步。

打开网易新闻 查看精彩图片

到了真正考智商的环节——3D魔方模拟。DeepSeek生成的版本沉浸在自嗨模式里,魔方自己在那儿“玩”。而GLM-5版本不仅能打乱,还能反向求解,全程稳定运行。链接点开后那一幕,我真的有种“它活了”的感觉。

最后压轴的Agentic测试,把文章秒变视频。任务是让Claude Code通过bigmodel.cn连接GLM的API,调用Remotion Skills生成视频。看似简单,其实需要模型具备强执行链管理和工具调用能力。我本以为这可能又是一场失败的试验,没想到GLM-5一步步搭起了完整工程,还生成了可预览、可渲染的视频项目,界面操作感堪比剪映。20分钟后,一支带音乐的短片呈现在眼前,那一刻的震撼感让我真切地意识到:我可以把视频工作流全部托付给它。

打开网易新闻 查看精彩图片

算下来,GLM-5在前端表现、3D推理和Agent执行三大维度上,都展现出惊人的一致性与从容。而DeepSeek虽然稍逊一筹,却在架构瘦身、性能扩容上走出了一条灵巧之路。两款模型都开源,都带着“中国智造”的标签站在国际舞台中央。难怪越来越多海外开发者在X上求体验、求邀请码。

不过,把GLM-5只当成一个“前端强项”的模型,显然是低估了。它背后展现的是Agent智能体生态的雏形。从Claude Code到Skills,从Cowork到OpenClaw,再到今天的GLM-5与即将登场的DeepSeek V4,AI正在从“聊天助手”变成“能干活的搭档”。

打开网易新闻 查看精彩图片

2026年,速度成了行业的底色。昨天闪耀的新闻今天就不再新鲜。AI的每一次版本迭代,就像春风乍起,吹得人眼花缭乱,也让人热血沸腾。国产模型正在以开源的勇气和硬核的技术,接近全球最强阵列。

未来的AI,也许不仅是更聪明的工具,更是与你并肩作战的伙伴。快,是趋势;能干,是未来。而这一切,才刚刚开始。

打开网易新闻 查看精彩图片