谷歌推出 Gemini 3.1 Flash-LITE 极速模型

科讯速报

2026-03-04 11:01 ·福建

谷歌宣布推出 Gemini 3.1 Flash-LITE 模型，面向开发者大规模高频工作负载优化，预览版正式开放。该模型号称 Gemini 系列中速度最快、性价比最高版本，在多项基准测试中超越同类竞品，引发全球开发者关注。

AI生成

官方数据显示，Gemini 3.1 Flash-LITE 首个答案响应时间较上一代提升 2.5 倍，输出速度提升 45%，在 GPQA Diamond、MMMU Pro 等权威测试中表现优异，超过 GPT-5 Mini 等对手。模型支持最长 100 万 Token 上下文窗口，定价为 0.25 美元 / 百万输入、1.5 美元 / 百万输出，适合高频调用、批量处理、实时交互场景。

谷歌表示，新模型专为企业客服、内容生产、代码开发、数据解析等高频场景设计，在保持能力的同时大幅降低成本与延时，推动 AI 从实验走向规模化商用。

随着模型开放，更多应用将迎来速度与成本优化，尤其是 AI Agent、自动化工具、实时交互产品将显著受益。未来，极速轻量模型将成为行业标配，推动 AI 渗透到更多实时性要求高的场景。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴