一周AI大事：DeepSeek拼命“省钱”，而字节意在“接管手机”？|cuda|deepseek|智能体|英伟达|谷歌

（图片由AI生成）

作者 | 辰辰

出品 | 网易科技

苹果在短短七天内痛失四位高管，顶尖工程师正成建制地流向OpenAI和Meta，这家即将50岁的科技巨擘从未如此显出疲态。

反观其他玩家，动作却是一个比一个激进：OpenAI还在担忧用户增长被谷歌反超；中国阵营则上演了一场精彩的“双面突围”：DeepSeek V3.2的横空出世，用硬核数据将顶尖模型做成了“白菜价”；字节跳动则剑走偏锋，意图让AI彻底“接管”你的手机系统。至于老辣的黄仁勋，他没有参与模型层的缠斗，而是默默祭出了CUDA 13.1，用软件生态为英伟达修筑了一道更深的技术围墙。

（图片由AI生成）

一、周末要闻：苹果面临“后乔布斯时代”最大危机，英伟达推出20年来最大更新

本周末最令人震动的行业新闻，莫过于彭博社爆料：即将迎来50华诞的苹果公司正深陷一场史无前例的人事动荡。这不仅是简单的职位更迭，更像是一场关于“后乔布斯时代”苹果未来的信任危机。

——高层震荡，核心老将集体谢幕

仅在过去短短一周内，苹果接连失去AI负责人、交互设计掌门人、总法律顾问以及政府事务负责人。这四位直接向CEO蒂姆·库克（Tim Cook）汇报的高管相继离职，打破了苹果管理层十几年来的长期稳定性。更令人担忧的是，一手缔造苹果自研芯片神话的硬件技术高级副总裁约翰尼·斯鲁吉（Johny Srouji） 也被曝出已向库克表达了离职意向。斯鲁吉是苹果硬件护城河的构建者，他一旦离职，对苹果的技术根基造成的打击不可估量。尽管库克正以高薪和“二号人物”的职权极力挽留，但在接班人竞争和管理层老龄化的背景下，这位功勋老将的去留仍悬而未决。

——AI失速，年轻血液流向OpenAI与Meta

如果说高管离职是“自然新陈代谢”，那么AI领域的人才流失则是“失血性休克”。本周，苹果AI负责人约翰·吉安南德里亚（John Giannandrea）因项目进展缓慢离职，但这只是冰山一角。面对谷歌和OpenAI的强势围剿，苹果内部AI团队被曝悉数“崩盘”：负责Siri和ChatGPT竞品项目的工程师入职数周即离职，AI模型负责人庞若鸣率队投奔Meta，代号J595的桌面机器人团队和Vision Pro团队的数十名顶尖工程师更是被OpenAI“挖角”。在硅谷这场残酷的“AI抢人大战”中，苹果似乎正在从曾经的“人才黑洞”沦为“人才输送站”。

在苹果深陷人事泥潭之时，AI霸主英伟达却在技术护城河上再添重磅筹码。本周末，英伟达发布CUDA 13.1，并推出了自2006年CUDA平台诞生以来“最大、最全面的更新”——CUDA Tile编程模型。

简单来说，CUDA Tile是英伟达为AI时代量身定制的“降维打击”工具。

（图片由AI生成）

· 告别繁琐：传统的CUDA编程（SIMT模型）需要开发者对每一个线程进行微操，虽然灵活但难度极高。而CUDA Tile允许开发者以“数据块（Tile）”为单位进行编程，编译器会自动处理底层细节。

· 释放Tensor Core潜能：AI计算的核心是张量（Tensor），英伟达GPU虽然配备了强大的Tensor Core和TMA（张量内存加速器），但调用它们极其复杂。CUDA Tile将这些硬件复杂性进行了抽象，让开发者能轻松发挥硬件的全部性能。

· 兼容未来：基于CUDA Tile IR（中间表示）编写的代码，将自动适配英伟达未来几代GPU架构，大幅降低代码维护成本。

英伟达此举不仅是在升级软件，更是在定义AI编程的新标准。通过CUDA Tile，英伟达进一步降低了高性能AI开发的门槛，使Python开发者和高级库开发者能够像使用NumPy那样轻松调用底层算力。

当竞争对手还在努力追赶英伟达的硬件性能时，黄仁勋已经开始对软件生态进行一次彻底升级。这套全新的编程范式将进一步巩固开发者生态，让英伟达在AI时代的统治地位更加牢固。

二、重磅工具：DeepSeek V3.2凭借超高性价比震撼登场

本周，DeepSeek发布 DeepSeek V3.2 及 DeepSeek V3.2-Speciale 两款具有 6850亿参数 的MoE（混合专家）开源权重模型，在推理和智能体任务上展现出卓越性能，且性价比尤其突出。

其中DeepSeek V3.2-Speciale专攻深度推理，在包括国际数学奥林匹克（IMO）金牌级水平、AIME 96%准确率 和“人类终极考试”30%准确率 等推理基准上斩获SOTA佳绩，在某些基准上甚至力压Gemini 3.0 Pro和GPT-5-High。

标准推理模型DeepSeek V3.2则在强化智能体推理和指令遵循方面表现优异，在SWE-Bench Verified上达到 73.1%，tau-bench（智能体任务基准测试）则达到 80.3%。

DeepSeek V3.2发布后，社交媒体X上反响热烈，众多用户认为此举意义重大，证明开源AI模型完全有能力与目前的领先AI模型竞争。正如一位投资人所言：“它很少浮出水面，但每次浮出都会引起巨大轰动。”

网红科技博主@gm8xx8周末发布长篇评测，称DeepSeek V3.2系列模型的发布，不仅仅是性能榜单上的数字提升，更代表DeepSeek在模型架构和训练理念上的重大突破。他将DeepSeek V3.2能实现“弯道超车”归纳成三点：

1. 架构核心： 稀疏注意力机制与稀疏长文本优化；

2. 训练升级： 强化学习（RL）深度融合；

3. Speciale变体： 将验证机制转化为训练驱动力。

@gm8xx8总结，DeepSeek V3.2系列的核心意义在于完成架构的系统性整合。它将稀疏长上下文、大规模RL、合成智能体以及形式化验证（Math-V2）整合到一个统一的RL框架下，标志着模型架构从外部评估转向验证器指导下的可扩展、自我审计的训练体系。

《连线》则发表评论文章，称DeepSeek的“硬核”模型路线正与另一巨头字节跳动的策略形成鲜明对比，也折射了中国AI产业的分化趋势。

——DeepSeek：向上走（Go High），模型效率为王。

由于受限于芯片供应，DeepSeek从一开始就将重点放在模型效率和成本控制上，致力于打造训练资源占用更少、开发者运行成本更低的开源模型。这代表了中国AI公司在“算力军备竞赛”中采取的另辟蹊径的突围策略，追求技术制高点和极致的性价比。

——字节跳动：向宽走（Go Wide），集成应用为王。

字节跳动则采取了截然不同的策略，通过旗下拥有超1.4亿月活用户的“豆包”抢占操作系统（OS）级的入口。继推出“豆包输入法”后，字节更进一步，发布可集成到手机操作系统中的豆包AI智能体，赋予其控制其他App的能力，目标直指取代苹果Siri，实现“应用内执行”。这表明字节跳动有意避开模型军备竞赛，转而利用其庞大的用户基础，将AI工具深深植入人们的日常生活入口。

（图片由AI生成）

连线认为，这两家拥有相似用户规模（AI应用月活超1.4亿）的中国领军企业，正分别代表了中国AI的两种发展方向：一派主攻最前沿基础大模型的突破和效率优化（DeepSeek），另一派则深耕将AI能力深度集成到现有应用生态中，争夺用户入口和场景落地（字节跳动）。

三、行业要闻：谷歌亚马逊多点开花、OpenAI发布“红色警报”

1. 谷歌Gemini 3 Deep Think上线深度思考模式

本周谷歌迅速向Ultra订阅用户推送Deep Think（深度思考）模式。通过并行推理和长链思维，它在处理多步骤分析任务时精度大幅提升，尤其是在代码生成和复杂逻辑推演上展现了业界顶尖的实力。

X用户@theaimestari直言，这有望改变AI技术准确性的游戏规则。

2. 亚马逊re:Invent大爆发：Nova 2家族全面登场

AWS本周一口气推出Nova 2模型家族，包括Lite、Pro、Sonic和Omni。

· Nova 2 Pro：专为智能体打造，代码理解能力直追Claude 3.5 Sonnet。

· Nova 2 Omni：一款统一支持图、文、语音、视频处理的全能模型，支持100万Token上下文。

虽然行业对亚马逊AWS的大动作持肯定态度，但也有不少用户表达了不同看法。德勤（Deloitte）全球云战略官戴维·林西克姆（David Linthicum）周末在X发文称，亚马逊在re:Invent 2025大会上推出的Nova 2模型家族及其全栈智能体平台（Bedrock、AgentCore），在技术上令人印象深刻，但在战略上却暗藏“隐患”。

林西克姆认为，平台提供的强大模型、原生集成和一站式“前沿智能体”服务，短期内效率极高。但他警告，企业必须警惕未来5到10年被AWS“绑定”的风险。

Linthicum的建议是：

· 战术性地采用Nova 2：在价值明确的场景可以利用其便利性。

· 避免长期绑定：绝不能让任何单一供应商掌控长期智能体架构。

· 投资通用抽象层技术：企业应投资于独立于模型的接口、开放可移植的模式，以及跨云的可观测性，确保未来AI能力由业务战略驱动，而非被单一云服务商的路线图所限制。

3. 谷歌最近一系列大动作直接引发OpenAI的强烈反应。OpenAI CEO奥特曼发出 “红色警报”（Code Red）内部备忘录，以应对谷歌Gemini的快速进步带来的竞争压力，特别是针对其市场份额的蚕食（Gemini用户增长30%，ChatGPT增速放缓至5%）。他要求公司回归核心AI模型的改进和基本功能，减少对非核心功能的投入。

行业报告暗示，OpenAI可能在下周发布GPT-5.2作为竞争回应，据传该模型在整体智能上将超越Gemini 3 Pro。

（图片由AI生成）

ChatGPT团队负责人尼克·图利（Nick Turley）则公开表态，强调要继续提升ChatGPT的能力，使其更直观、更个性化。

四、视频与多模态：可灵AI与Runway Gen-4.5引领潮流

在AI视频生成领域，两家公司本周也相继发布旗舰级更新。

1. Runway推出Gen-4.5视频模型： 这一新的旗舰SOTA模型在Artificial Analysis文本到视频排行榜上名列前茅，超越谷歌Veo 3等竞争对手。其核心特性涵盖增强的运动动态、更好的物理真实感（如物体运动的重量、动量和力量，符合流体动力学的液体流动），以及对电影风格的精细控制。

2. 可灵AI发布多项更新：

· 可灵Video 2.6 首次支持原生音频生成，可实现同步语音和音效，分辨率高达1080p，跻身Veo 3主导的全视听AI生成模型行列。

· 可灵AI还发布O1多模态创意引擎，提供统一界面，简化AI视频创作流，帮助实现角色与物体的一致性及长篇视频内容的制作。

· 推出Avatar 2.0，新增更具表现力的面部动画、唇形同步精度和真实世界相似度，支持生成长达5分钟的长篇视频。

五、业内摘要：微软苹果多款新模型亮相

——模型：

· Mistral：发布Mistral 3模型家族，包括675B参数的MoE模型Mistral Large 3和三个支持本地部署的多模态Ministral 3模型，后者在推理上表现出色。

· Arcee：美国公司发布Trinity系列开源权重MoE模型，包括面向智能体工作流的Trinity-Mini。

· OpenAGI：推出LUX AI智能体，声称在AI智能体计算机操作方面达到SOTA，可控制Slack、Excel等桌面应用。

· 微软：发布开源轻量级语音合成模型VibeVoice-Realtime-0.5B，专为实时应用优化。

· 英伟达：在NeurIPS大会上宣布了面向语音处理、AI安全评估和自动驾驶工作流程的开源AI工具和模型更新，包括首个用于AV研究的开放推理VLA模型DRIVE Alpamayo-R1。

· 苹果：发布首个用于高质量视频生成的端到端归一化流模型STARFlow-V，承诺比基于扩散的方法具有更清晰的帧连贯性和更快的采样速度。