2025年底,大模型行业的“年终决战”如期而至,全球科技巨头纷纷亮出底牌。在这场万众瞩目的角逐中,Google DeepMind推出的Gemini 3以绝对优势强势突围,横扫多项权威基准测试,凭借“世界最强多模态理解”“交互最深智能体”等硬核表现,刷新了行业对AI能力的认知边界。谷歌CEO桑达尔·皮查伊亲自站台,直言其是“迄今为止最智能的模型”。一时间,整个AI圈沸腾,所有人都在追问:Gemini 3的强悍实力,究竟藏着怎样的秘诀?随着Gemini 3预训练负责人Sebastian Borgeaud在播客中深度拆解背后的实验室逻辑,答案逐渐清晰——这不仅是单一技术的突破,更是AI行业发展范式的全面革新。
一、不只是“更好的训练”:大模型竞争进入“系统战”时代
Gemini 3发布之初,Google DeepMind研究与深度学习副总裁Oriol Vinyals的一条推文引发行业热议:“Gemini 3这么强,核心秘诀就两点:更好的预训练,更好的后训练。”这番看似朴素的表述,却在Sebastian Borgeaud的解读中展现出深层逻辑。在他看来,Gemini 3的跨越式进步并非源于某一项“颠覆性技术”,而是无数细节优化的累积,是数百人团队协同作战的成果。“我们几乎每天都能找到让模型变更好的地方,整个团队都在加速前进。”
更关键的是,Sebastian Borgeaud点出了谷歌AI研发的核心转变:从单纯“做模型”转向“做系统”。这一观点与DeepMind联合创始人兼CEO戴密斯·哈萨比斯不谋而合,后者强调Gemini 3的强大根源在于“研究、工程和基础设施”的深度融合。这种端到端的整合优势在训练硬件上体现得尤为明显——Gemini 3全程基于TPU训练,而非行业主流的英伟达芯片,这种垂直整合能力让研究与工程的边界逐渐模糊,形成了独特的技术壁垒。
二、预训练的核心突破:规模仍重要,但创新更关键
作为Gemini 3预训练负责人之一,Sebastian Borgeaud的研究经历为这项工作埋下了重要伏笔。从Transformer架构到BERT、XLNet,再到DeepMind第一篇大语言模型论文Gopher,丰富的积淀让他形成了独特的“研究品味”——既重视技术突破,更强调团队协作与复杂性管理。在他看来,好的研究不仅要让模型变好,更要能与其他团队的成果高效整合,避免因局部优化拖慢整体进度。
针对行业内“预训练Scaling Law已死”的争议,Sebastian Borgeaud给出了明确回应:“规模依然重要,但架构创新和数据创新的权重已经显著提升,甚至变得更为关键。”这一结论源于DeepMind多年的实践经验,早在Chinchilla项目中,团队就发现:在训练计算量固定的前提下,更快地扩展数据规模比盲目扩大模型规模,能训练出更优的模型。这一规律至今仍深刻影响着模型的推理效率与使用成本,成为企业AI落地的核心考量。
在架构上,Gemini 3采用基于Transformer的混合专家(MoE)架构。简单来说,这种架构将“计算量”与“参数规模”解耦,通过动态路由把计算分配给特定“专家”,既保证了模型能力,又提升了训练效率。而在数据上,Gemini 3从一开始就采用原生多模态数据,融合多种来源的信息,这也为其多模态优势奠定了基础。
三、行业范式转移:从“无限数据”到“有限数据”的挑战与机遇
Gemini 3的成功,也侧面反映了当下AI行业的深刻变革:从“无限数据”的规模化时代,正式迈入“数据有限”的新阶段。这一趋势倒逼整个行业重新思考创新方向,而合成数据、推理轨迹、长上下文等成为关键探索领域。
对于当下热门的合成数据,Sebastian Borgeaud保持着审慎态度。他认为,合成数据的核心风险不是“没效果”,而是“用错了还浑然不觉”——一旦数据分布偏移,模型可能陷入“自嗨”的闭环。为此,谷歌采用“强模型生成+小规模可控消融实验”的稳妥方案,先验证收益与潜在副作用,再逐步推广。而行业普遍关注的“用合成数据训练的模型能否超越老师”这一问题,仍是团队重点研究的方向。
在数据受限的背景下,架构创新的价值更加凸显。Sebastian Borgeaud认为,架构改进的核心目标之一,就是用同样的数据训练出更好的模型,或用更少的数据达到旧模型的同等效果。而长上下文与注意力机制成为当下预训练的重要突破口:“上下文越长,模型推理时可携带的信息越多,能力边界也就越宽。”未来,谷歌还计划将检索与搜索更深地融入训练,让模型把“会检索”变成内生能力,而非上线后再外挂工具。
四、未来方向:持续学习、评估体系与科学赋能
谈及未来的研究热点,Sebastian Borgeaud重点提及了持续学习。当前,基础模型一旦完成预训练,知识就基本定格,无法自动吸收新论文、新发现。行业目前的可行方案是在产品推理侧接入检索,实时获取最新信息,但这只是权宜之计。更远的目标是改变训练方式,让模型能在真实世界的数据流上持续训练,实现真正意义上的“持续更新”。
此外,评估体系被他视为预训练阶段的核心难题。“如果评估体系跟不上,很容易陷入‘看似提升’的假象内耗。”由于外部基准容易被污染,谷歌内部搭建了专属的评估体系,重点攻克两道鸿沟:一是小模型上验证有效的改进能否迁移到大规模模型;二是预训练阶段的优势能否转化为真实可用的能力。同时,随着用户规模扩大,推理预算变得敏感,预训练环节也必须兼顾能力提升与成本控制。
展望未来,Sebastian Borgeaud充满信心。他预测,Gemini将更好地服务于科学研究,甚至有望助力重大发现拿下诺贝尔奖;同时也会更深入地融入普通人的生活,解决各类实际问题。“进步的脚步看不到尽头,至少未来一年,这种加速前进的势头不会放缓。”
结语
Gemini 3的强势突围,不仅展现了顶级AI模型的强悍实力,更揭示了行业发展的底层逻辑——从追求单一技术突破到构建系统能力,从盲目堆规模到重视创新与效率的平衡。在数据受限的新范式下,架构创新、持续学习、精准评估将成为AI行业的核心竞争力。而Google DeepMind的探索,也为整个行业指明了方向:真正的AI进步,从来不是孤军奋战的结果,而是研究、工程与基础设施深度融合的必然。
热门跟贴