谷歌宣布推出 Gemini 3.1 Flash-LITE 模型,面向开发者大规模高频工作负载优化,预览版正式开放。该模型号称 Gemini 系列中速度最快、性价比最高版本,在多项基准测试中超越同类竞品,引发全球开发者关注。
打开网易新闻 查看精彩图片
官方数据显示,Gemini 3.1 Flash-LITE 首个答案响应时间较上一代提升 2.5 倍,输出速度提升 45%,在 GPQA Diamond、MMMU Pro 等权威测试中表现优异,超过 GPT-5 Mini 等对手。模型支持最长 100 万 Token 上下文窗口,定价为 0.25 美元 / 百万输入、1.5 美元 / 百万输出,适合高频调用、批量处理、实时交互场景。
谷歌表示,新模型专为企业客服、内容生产、代码开发、数据解析等高频场景设计,在保持能力的同时大幅降低成本与延时,推动 AI 从实验走向规模化商用。
随着模型开放,更多应用将迎来速度与成本优化,尤其是 AI Agent、自动化工具、实时交互产品将显著受益。未来,极速轻量模型将成为行业标配,推动 AI 渗透到更多实时性要求高的场景。
热门跟贴