2026 年 6 月 8 日,Google Gemini API 的显式缓存功能被开发者质疑出现计费异常。
开发者 Danilo Oliveira 发文称,Gemini 显式缓存功能疑似存在 bug,导致其账户持续产生约 1000 美元/小时的费用。
他写道,如果这些 Gemini 缓存成本不停止,“我们会破产”。
Google Gemini 技术人员 Logan Kilpatrick 随后在相关回复中表示,“团队正在处理,抱歉,会修复”。
从 Danilo 在 Google AI Developers Forum 披露的情况看,这次异常指向的并非普通模型调用费用,而是显式缓存存储费用。
Danilo 称,费用从 2026 年 6 月 3 日 13:00(巴西时间)开始增长,起初他以为是自己脚本创建缓存造成的正常消耗。但在 6 月 6 日 14:00 关闭脚本,并确认缓存列表为空后,账单仍继续增加。
他导出的 BigQuery 账单显示,到 6 月 6 日 18:00—19:00 区间,累计费用已达到 17,847.2116 巴西雷亚尔(2.3 万元人民币)。
按照 Google 官方文档,Gemini API 显式缓存允许开发者先将一批输入 token 缓存起来,再在后续请求中复用;缓存生命周期由 TTL 控制,若未设置,默认 TTL 为 1 小时,费用取决于输入 token 数量以及缓存保留时长。
官方文档同时提供了手动删除缓存的接口。
但 Danilo 在论坛中表示,自己这边的缓存列表已经返回空结果,因此无法删除所谓仍在计费的缓存。
他怀疑问题出在 Google 后端:本地脚本已经关闭,缓存注册表也为空,但存储费用仍在后台累积。
为了止损,他称已经彻底禁用了 Google Cloud 项目中的 Gemini API 服务,并表示将放弃显式缓存功能。
论坛里也有其他开发者反馈类似情况。
一名用户称,自己此前遇到过所谓“zombie cache”问题:cachedContents API 返回空列表,显示没有活跃缓存,但账单系统仍按 “cached text storage token hours” 持续收费;该用户称,完全禁用 Gemini API 后,账单图表会在数天内逐步回滚异常的“幽灵缓存小时”。
另有用户在 Danilo 帖子下表示,自己也遇到同样问题,并已向账单支持提交情况;还有用户建议,在问题发生后先禁用 Gemini 相关账号,等待系统自动清理,同时在代码层面主动调用删除缓存接口,而不是只依赖 TTL 自动过期。
截至目前,Google 尚未发布正式事故说明,也未公开说明这次费用是否会退款或补偿。
云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。
热门跟贴