WWDC 2026 的主演讲结束后,几位苹果高管留下来做了一场小型交流。软件工程高级副总裁 Craig Federighi 带着 Sebastien Marineau-Mes、Mike Rockwell 和 Amar Subramanya 走上台,聊的东西只有一个主题:苹果自己那套新基础模型,到底是怎么回事。
过去半年,关于“苹果是不是把 Gemini 直接搬过来改了个皮”的猜测没停过。苹果早在 WWDC 前就放风说,Google 在提供 Gemini 技术帮他们开发新模型——话是说了,但细节一个字没多给。于是各种传言开始滚雪球,画出的图景无非是:苹果又掉队了、又慌了、又拿别人的东西应付事儿。
而 Craig 这次给出的回应,比任何时候都直白。升级后的 Apple Foundation Models——也就是驱动新 Siri AI 和整个 Apple Intelligence 的底层模型——是用 Google Gemini 的技术做蒸馏和训练,不是整段搬过来替换。工程师们拿 Gemini 当训练辅助工具,把学到的能力蒸馏进自己的架构里,最终产出的模型,每一行代码、每一个推理步骤,全部跑在苹果自己的软件栈上。
他用一句话钉死了这件事:用户跟 Apple Foundation Models 交互时,碰不到一滴 Google 的代码,碰不到 Gemini 的 agent,也碰不到 Google 搜索。从用户视角看,从头到尾都是苹果的软件在跑。苹果软件,“彻彻底底”。
这套新模型现在拆成了四条产品线,定位分得很清楚。设备端跑的是 AFM Core 和 AFM Core Advanced,其中 Advanced 版本做成了原生多模态,搭配稀疏架构,能在不离开设备的情况下处理更复杂的功能。大到需要服务器接管的任务,交给 Private Cloud Compute 体系里的 AFM Cloud 基础模型去做;涉及到图像生成和编辑,有专门的 AFM Cloud Image 模型。这四款模型全部针对 Apple Silicon 定制训练,喂的是苹果自有的数据集,最后再用借来的 Gemini 模型进行蒸馏微调。
更重头的 AFM Cloud Pro 被留给了 agent 类工具和对算力要求最高的任务。这个模型的定位已经不是“帮你生成一段文字”,而是去执行需要多步决策的操作。它的运行基础设施直接铺在 Google 云服务器和 NVIDIA GPU 上,但苹果强调,这不会打破 Private Cloud Compute 的认证体系——也就是说,外部第三方依然可以独立审查这些服务器,验证苹果到底有没有在 AI 服务器端动手脚、乱用用户数据。认证机制存在的意义,就是让“苹果管不管得住用户数据”这件事,变成一个可以被外部证明的技术问题,而不是靠公关稿承诺。
现场顺带回应了一个绕不开的话题:为什么之前那么多人不相信苹果能把 AI 做好。Craig 没有回避,承认最初 Apple Intelligence 的发布节奏确实栽了跟头。功能承诺给得太多,但 AI 的幻觉率和 Siri 底层那套基于机器学习的架构,根本撑不起那些预期。等到 2025 年初的延迟一出来,外界基本判了死刑——结论就是苹果永远做不出“好的 AI”。
而恰恰是那段时间,整个行业在另一条路上狂奔。其他公司一个接一个地承诺自己的 AI 要改变世界、或是终结世界,这种对比让苹果的克制看起来更像是落后。现在往回看,那些夸张叙述本身也成了故事的一部分。苹果选择的路径不是发布一个惊艳的 demo,而是等到四款定制模型就位、Private Cloud Compute 的可审计架构落成之后,再一次性把技术栈摊开。
WWDC 这场小型交流给出来的方案,本质上就是一次完整的路线交代:蒸馏别人的强模型来加速训练,但推理环节必须跑在自家可控的软件和服务器上,可审查、可验证。至于这条路能不能跑赢那些“世界终结者”,答案还没到揭晓的时候。
热门跟贴