2026年6月,AI模型发布节奏已从冲刺进入光速时代,眨眼间就能错过三款顶尖新品。以下是关键动态汇总。
头部大模型方面,OpenAI推出GPT-5 Turbo蒸馏版,推理能力与旗舰持平但成本直降三倍、延迟低于50毫秒,在LMSYS编程与数学任务排行榜上强势登顶。Anthropic以Claude 4.5 Opus回击,原生支持50万token以上长上下文且召回近乎完美,被开发者称为“论文耳语者”,可一次性消化整座arXiv档案馆。
打开网易新闻 查看精彩图片
开源领域同样火力全开。Meta发布Llama 4 Ultra(405B参数),全面开放权重并采用MIT许可,多语言基准测试超越GPT-4o,社区微调已呈现百花齐放态势。Mistral Large 2以123B混合专家架构跑在单张H200节点上,推理任务击败Gemini 2.0 Pro,效率惊人。阿里Qwen 3.0(72B)在中英文及多语言任务中登顶,且采用Apache 2.0宽松许可。
小模型革命悄然落地,3B至8B参数成新黄金区间。谷歌Gemma 3(8B)和微软Phi-4(5B)可在手机及边缘设备运行,Phi-4虽小巧至浏览器标签页即可承载,却在MMLU-Pro斩获82%高分。
开发者工具同步升级,Hugging Face推出零配置无服务器GPU推理平台Spaces Pro,Together AI与Fireworks打响价格战,token成本较去年暴跌十倍。综合来看,我们正进入尖端AI既变强又大幅降价的黄金时代,开源与闭源的鸿沟已微乎其微,此刻正是人工智能构建者的最佳时机。
热门跟贴