Modal 突然放出 GLM-5.1 的免费额度,但并发限制只有 1——这意味着你得跟全国开发者抢一根网线。

「不是不能用,是用起来难」

打开网易新闻 查看精彩图片

实测反馈很真实:频繁报错 {"error": "Too many concurrent requests for this model"}。有人折腾半天接进了 OpenClaw、Hermes,有人直接放弃。

746B(十亿)参数的模型什么概念?比 GPT-4 公开参数规模大一个量级,但 Modal 的限速策略让它变成了「单机版体验」。

为什么平台愿意赔本赚吆喝?

云算力平台的经典打法:先用免费 tier 把你拉进生态,再靠企业级并发收费。Z.ai 作为模型提供方,也需要真实流量来压测。

但 1 并发的设计很微妙——刚好够个人开发者跑通 demo,又逼着想上生产的团队掏钱。

一个观察窗口

青小蛙的建议很实在:等两天热度过去再试。毕竟免费期到月底,现在硬挤等于参加「凌晨蹲点大赛」。

这件事的有趣之处在于:大模型价格战打到 2026 年,「免费」已经不够有吸引力了,「免费且能稳定用到」才是稀缺品。