“腾讯云今日发布公告,宣布其DeepSeek-V4正式版原厂直供模型计划于2026年7月中旬在大模型服务平台TokenHub和智能体开发平台正式上线,由DeepSeek原厂直接提供,本次版本将带来多项功能优化与性能提升。”几行正文之外,最让人留意的改动悄然浮出水面:伴随正式版发布,腾讯云同步引入了峰谷定价机制。这一变化,直接把调用大模型的成本拆成了“忙时”与“闲时”两种节奏。
高峰时段的划分并没有玩什么文字游戏,就是每日9:00至12:00和14:00至18:00,北京时间。这两个窗口覆盖了企业办公最密集的上午和下午核心工作时间。在这段时间里调用DeepSeek-V4需支付更高的单次费用,而其他时段则回归较低的平日价格。这次定价调整影响了DeepSeek-V4-Pro和DeepSeek-V4-Flash两个原厂直供版本,具体数字也一并公布。
以推理输入为例,DeepSeek-V4-Pro平日价格为每百万tokens 3元,高峰时段直接翻至6元;推理输出同样从平日的6元跳至12元。即便是更经济的Flash版本,幅度也保持一致:推理输入平日1元、高峰2元,推理输出平日2元、高峰4元。缓存命中场景也遵循同一套翻倍逻辑,Pro版缓存命中平日0.025元、高峰0.05元,Flash版平日0.02元、高峰0.04元。这种定价方式把使用成本的时间弹性第一次摆在了企业决策的台面上。
一位开发者可能会面临的选择题是:要不要把大批量推理任务挪到晚上跑?当一切都在实时交互中推进,挤在高峰时段调用无可避免,那就只能接受更高的定价;但如果企业内部有大量的离线评测、批量数据生成或非即时任务,把作业调度到平峰甚至夜间,就能直接省下一半推理费用。模型参数本身没有变,变的只是调用发生的时间,而成本已然不同。
这次调整也体现在Token Plan企业版的积分抵扣规则上。以广州地域为例,DeepSeek-V4-Pro的缓存命中输入抵扣量,平日为2.5积分/百万tokens,高峰时段变为5积分;未命中缓存输入由平日300积分变为600积分,输出则从600积分解除至1200积分。Flash版本同步拉开差距,缓存命中平日2积分、高峰4积分;未命中缓存输入平日100积分、高峰200积分;输出平日200积分、高峰400积分。积分消耗的“时间差”与现金支付完全对齐,企业需要在预算报表里多加一列时间维度。
腾讯云方面表示,会在定价生效前24小时通过邮件、站内信、短信等方式向用户提前告知,若用户在计费调整后继续使用服务,视为同意调整方案。这个细节放在峰谷定价首次亮相的背景下看,给开发者留出的反应时间或许比定价本身更重要——至少有一次完整的昼夜周期去评估自己的调用模式,决定是调整任务排程、切换模型版本,还是继续留在高峰时段按新的费率付费。
如果把峰谷定价看作一种资源负载的调度手段,它像是一根温和的杠杆:不强迫任何人离开高峰时段,但用价格差牵引一部分非刚性任务流向平峰,从而让整体推理带宽被更均匀地填满。模型能力的升级和原厂直供的上线,叠加这样一套带有时间信号的计价方式,对于需要稳定调用、又关心成本的企业来说,多了一个需要主动管理的技术变量。
热门跟贴