4月8日凌晨,国内领先的AI大模型公司DeepSeek悄然更新了其网页版和App的对话界面,正式推出“快速模式”和“专家模式”的分层系统,并正在灰度测试视觉模式。这一举动被业界普遍解读为DeepSeek应对算力危机、调整免费策略的信号。

打开网易新闻 查看精彩图片

事件经过

据凤凰网科技报道,DeepSeek的这次更新并非普通的功能迭代。自2025年初以来,随着其开源模型GLM-4的发布和生态扩张,DeepSeek一度因算力紧张导致服务中断,甚至出现过宕机长达12小时的情况。此次上线的“快速模式”主要面向日常对话和低延迟响应,而“专家模式”则针对复杂推理和深度任务,但响应速度可能更慢。

打开网易新闻 查看精彩图片

行业背景

DeepSeek的这次“分层”并非个例。上周,Anthropic宣布不再在其订阅服务中包含第三方集成工具,转而采用按需付费模式。数据显示,截至2026年3月,中国AI大模型的日均Token调用量已突破140万亿,较2024年初增长超千倍。在算力供给受限的情况下,过去依赖“烧钱换用户”的免费模式已难以为继。

打开网易新闻 查看精彩图片

分析与影响

业内人士指出,DeepSeek的分层设计旨在通过算力分流缓解峰值压力,为后续的付费体系铺路。这也预示着AI赛道正在经历从“免费”到“算力精细化运营”的范式切换。用户可能会逐渐感受到模型回复的更精简,长文本和高频调用可能面临更严格的限制或分层定价。

打开网易新闻 查看精彩图片

深度洞察

DeepSeek的“深夜抢修”背后,是整个AI行业在解决“Token经济学”的困局。随着Token消耗成为衡量成本的核心指标,算力供需失衡、芯片管制以及巨大的能耗压力让免费策略变得不可持续。这场危机不仅仅是技术问题,更是一场关于商业模式和可持续性的考验。

结语

DeepSeek的分层策略让我们看到了AI从“实验品”向“商品”转变的过程。过去的“免费用不长了”警告,正通过技术手段变成现实。对于普通用户而言,未来的AI服务可能不再是慷慨的免费补贴,而是更加注重效率和成本控制的精细化产品。