打开网易新闻 查看精彩图片

Token经济学越来越火了。

搞AI、用模型,每一次调用都是成本,每一轮对话都得计算。

本来指望AI帮我省时间省精力,能肆无忌惮想怎么用就怎么用,结果现在已经开始精打细算。

所以当我看到讯飞星辰MaaS平台的Coding Plan全面升级的消息时,我第一反应不是兴奋,是怀疑。

打开网易新闻 查看精彩图片

3.9元不限量?按请求次数计费?GLM-5.1和Qwen3-Coder-Next都能调?

这怕不是下了血本了。

打开网易新闻 查看精彩图片

https://maas.xfyun.cn/modelSquare?ch=MaaS-jg-kol-G2h6

作为一个从GPT-3时代就开始折腾大模型的开发者,有更好、更便宜的模型渠道,我是一定会用的。

01从Token焦虑到“随便用”,只隔了一个计费模式的距离

先说说最让我头疼的问题,Token计费。

不知道有多少人和我一样,每次调用大模型API的时候,心里都在默算:这个请求发了多少Token,那个响应回了多少Token。一个bug可能要来回改好几次,每一轮都是钱。

Token计费这个模式本身没什么问题,从商业角度讲它是合理的。但对我们这些开发者来说,它带来了一种持续的焦虑感。

讯飞星辰MaaS平台的Coding Plan,这次做了一个在我看来相当大胆的调整:

把计费逻辑从Token计费彻底转为按请求次数计费。

不再用关心消耗了多少资”,只需要关心完成了多少次调用。这就像从按流量计费换成了包月套餐,心理负担完全不一样。

具体来说,升级后的Coding Plan提供了几个套餐档次。

打开网易新闻 查看精彩图片

最让我感兴趣的是那个“无忧版”,3.9元,请求次数不限量。

你没看错,3块9,不限量。

无论是让学生党跑实验,还是独立开发者做项目,这个价格基本上等于白送。

一天之内让AI帮你干多少活、发多少次请求,都不会再因为次数超标被粗暴限流。

当然我也好奇,不限量的话会不会被恶意刷爆?

官方文档里提到了流控策略,用的是5小时滑动窗口加周重置、月重置的多维度机制。

简单说就是:你短期冲刺爆发可以,但长期滥用不行。

这个设计挺聪明的,既保证了正常开发者的使用体验,又防止了被薅羊毛的风险。

我自己实际跑了一个周末的项目重构,大概发了三四百次请求,账单显示就是3.9元。

说实话,在这个价格面前,我确实没什么好纠结的了。

不再需要每次调用前都问自己“这个问题值不值得问AI”,直接问就完了。

随便用就是很靠谱!只觉得,对开发者的心智解放,可能比省下的钱更重要。

02多模型自由调度,才是这套方案的真正杀器

但光便宜是不够的,模型不行,再便宜也是白搭。

Coding Plan让我眼前一亮的第二个点,是它的模型阵容。

它不是一个固定模型的API,更像是个模型超市。

你买一个套餐,可以调用多款模型,在后台点一下配置,1到3分钟就能切换生效。

打开网易新闻 查看精彩图片

目前支持的模型阵容相当能打。

首先是智谱最新发布的GLM-5.1,这款模型最近在AI圈子里讨论度很高。

它最大的特点是能够独立完成长达8小时的长程自治任务,自主规划、执行、迭代,全程不需要人工接管。

有评测显示GLM-5.1在SWE-Bench Pro测试中成绩超越了GPT-5.4和Claude Opus 4.6,在Terminal-Bench 2.0等代码评测中位列国产及开源模型第一。

更夸张的是,有人用它在8小时内构建了一个完整的Linux桌面系统,执行了超过1200个步骤,相当于四名开发人员一周的工作量。

打开网易新闻 查看精彩图片

平台上自带的零代码精调、模型蒸馏、自有模型托管等等,让非技术出身的开发者,也能很清晰直观知道需要干嘛。

甚至有种手把手教你做开发、做模型调试的感觉。

打开网易新闻 查看精彩图片

还有阿里的Qwen3-Coder-Next。

这款模型走的是完全不同的路线——总参数80B,但每次推理只激活3B参数。

这是MoE(混合专家)架构的好处:模型很大很聪明,但跑起来很轻很快。

它的智能体编程性能可以媲美DeepSeek-V3.2、GLM-4.7等更大规模的开源模型,推理成本却仅为同等性能模型的5%到10%。

日常代码补全和轻量调试,用它绝对是首选。

还有Qwen3.5-397B-A17B,一款原生视觉语言模型,覆盖201种语言,在代码生成、智能体推理与多模态理解方面表现卓越。

这套模型组合的含金量在于:不用在选一个最好的模型和承受高昂成本之间做取舍。

打开网易新闻 查看精彩图片

不知道用哪个模型的时候,还可以点左边的模型测评,来对比一下效果。真的很贴心了。

我在实测中感受最深的不是某个模型有多强,而是切换的灵活性。

以前用其他平台,想换个模型得重新配置、重新申请API Key、重新适配接口。

Coding Plan这边,模型切换在后台点一下就行,1到3分钟生效,兼容OpenAI和Anthropic两种协议。

这个体验上的差距,在频繁切换模型做对比测试的时候尤其明显。

03算力之外,Skills我也很期待

聊完了核心功能,我想再说一个让我觉得挺有意思的方向——Skills。

讯飞官方文档里提到,近期他们将超拟人合成、OCR大模型、离线音频转写三个AI能力打包成了Skill。

这就意味着,我不仅能用Coding Plan来写代码,还能让代码调用这些能力来做更复杂的事情。

就好比说,可以用OCR大模型让AI自动读一张发票、识别表格,再整理成结构化数据,省去手动录入的繁琐。

可以用离线音频转写把一段会议录音转写成纪要,甚至自动提炼重点。

也可以用超拟人合成让AI直接开口说话,生成带情绪的语音回复。

这三个Skill只是开始。

如果讯飞持续把更多能力打包成可调用的Skill,Coding Plan就不只是一个AI编程工具了,它会变成一个能力集成的平台。

打开网易新闻 查看精彩图片

代码不仅能调用大模型来生成代码,还能调用各种AI能力来完成任务。

这中间的想象空间很大。

还有个关键的细节:Coding Plan的礼品卡不仅可以抵扣API费用,还能抵扣模型精调训练的费用。

如果想微调一个定制模型,这些权益是可以继续使用的。

对于有定制化需求的开发者和企业来说,这算是一个不小的加分项。

以后养虾更自由,我的虾还能“听、说、看”了!

04从OpenClaw到Cursor,配置过程比我想的简单太多

说了这么多好处,你可能想问:这东西配置起来麻烦吗?

我的回答是:比你想象的要简单得多。

讯飞官方提供了很详细的配置文档,支持的主流工具包括OpenClaw、Claude Code、Cursor和OpenCode。

打开网易新闻 查看精彩图片

我重点试了OpenClaw和Cursor,这两个是我日常用得最多的。

先说OpenClaw。

打开网易新闻 查看精彩图片

配置只需要在~/.openclaw/openclaw.json文件里添加一段配置,把baseUrl设成https://maas-coding-api.cn-huabei-1.xf-yun.com/v2,填上你的API Key,model设成astron-code-latest就行了。

打开网易新闻 查看精彩图片

整个过程五分钟搞定,然后你就可以在OpenClaw里直接调用Coding Plan的模型了。

打开网易新闻 查看精彩图片

再说Cursor。

配置入口是Ctrl+Shift+J,搜索Models,在Override OpenAI Base URL那里填上同一个地址,API Key填上,模型选astron-code-latest。更简单,两三分钟的事。

打开网易新闻 查看精彩图片

Claude Code的配置稍微多两步,需要在~/.claude/settings.json里设置ANTHROPIC_AUTH_TOKEN和ANTHROPIC_BASE_URL,但本质上也是改几个环境变量的事。

打开网易新闻 查看精彩图片

配置文档里有一个细节让我挺喜欢的:

API Key是套餐专用的,每个套餐对应一个独立的API Key,只用于Coding Plan接口。这个设计的好处是隔离清晰,不会和你其他业务的API混在一起,管理起来更省心。

当然配置文档里也提到了一些注意事项。

比如模型切换后需要1-3分钟生效,不是秒级生效的,这点在做实时测试的时候要注意。另外Coding Plan属于订阅产品,不支持退款。这些在官方文档里都写得很清楚,不是什么隐藏坑,但提前知道总比事后发现要好。

整体来说,配置过程比我预想的顺畅。兼容主流工具的配置模板基本上就是复制粘贴的事,不用从头摸索。

05AI编程的下一站,是“随便用”还是“用得更聪明”

写了这么多,我想回到一个更根本的问题:AI编程工具到底应该怎么进化?

多模型自由调度,解决的是工具链割裂。兼容主流工具的配置模板,解决的是接入门槛。

这些都不是什么惊天动地的技术创新,但每一条都切中了开发者的真实痛点。

打开网易新闻 查看精彩图片

分享一下我的邀请码:【MAAS-F28DE43A】

https://maas.xfyun.cn/packageSubscription?inviteCode=MAAS-F28DE43A

而且讯飞这次选择了一个很有意思的时间点。

2026年初,星火X2大模型刚刚发布,采用293B MoE稀疏架构,推理性能相比X1.5提升了50%,在数学、推理、语言理解、智能体等能力上对标国际顶尖模型水平。

更关键的是,星火X2是基于全国产算力训练的,训练效率对标A100已经优化到了85%到95%以上。这个技术底座的升级,为Coding Plan提供了坚实的支撑。

所以我对讯飞Coding Plan的判断是:它可能不是跑分最高的那个,但它可能是目前最懂开发者真实处境的那一个。

在一个“卷模型”卷到天花板的时代,回归到开发者体验本身,解决那些让人头疼的实际问题,可能才是更有价值的差异化方向。

打开网易新闻 查看精彩图片

对于学生和独立开发者来说,3.9元的门槛几乎为零,完全可以当作日常开发的标配工具来用。对于企业用户来说,多模型自由调度的灵活性,加上支持模型精调的能力,也能满足更复杂的需求。

2026年的AI编程工具市场,已经从“有没有”进入了“好不好用、划不划算”的阶段。

在这个阶段,谁能让开发者用得放心、用得痛快、用得没有后顾之忧,谁就能真正赢得市场。

从这个角度看,讯飞这颗定心丸,来得正是时候。