(图片由AI生成)
作者 | 辰辰
出品 | 网易科技
苹果在短短七天内痛失四位高管,顶尖工程师正成建制地流向OpenAI和Meta,这家即将50岁的科技巨擘从未如此显出疲态。
反观其他玩家,动作却是一个比一个激进:OpenAI还在担忧用户增长被谷歌反超;中国阵营则上演了一场精彩的“双面突围”:DeepSeek V3.2的横空出世,用硬核数据将顶尖模型做成了“白菜价”;字节跳动则剑走偏锋,意图让AI彻底“接管”你的手机系统。至于老辣的黄仁勋,他没有参与模型层的缠斗,而是默默祭出了CUDA 13.1,用软件生态为英伟达修筑了一道更深的技术围墙。
(图片由AI生成)
一、周末要闻:苹果面临“后乔布斯时代”最大危机,英伟达推出20年来最大更新
本周末最令人震动的行业新闻,莫过于彭博社爆料:即将迎来50华诞的苹果公司正深陷一场史无前例的人事动荡。这不仅是简单的职位更迭,更像是一场关于“后乔布斯时代”苹果未来的信任危机。
——高层震荡,核心老将集体谢幕
仅在过去短短一周内,苹果接连失去AI负责人、交互设计掌门人、总法律顾问以及政府事务负责人。这四位直接向CEO蒂姆·库克(Tim Cook)汇报的高管相继离职,打破了苹果管理层十几年来的长期稳定性。更令人担忧的是,一手缔造苹果自研芯片神话的硬件技术高级副总裁约翰尼·斯鲁吉(Johny Srouji) 也被曝出已向库克表达了离职意向。斯鲁吉是苹果硬件护城河的构建者,他一旦离职,对苹果的技术根基造成的打击不可估量。尽管库克正以高薪和“二号人物”的职权极力挽留,但在接班人竞争和管理层老龄化的背景下,这位功勋老将的去留仍悬而未决。
——AI失速,年轻血液流向OpenAI与Meta
如果说高管离职是“自然新陈代谢”,那么AI领域的人才流失则是“失血性休克”。本周,苹果AI负责人约翰·吉安南德里亚(John Giannandrea)因项目进展缓慢离职,但这只是冰山一角。面对谷歌和OpenAI的强势围剿,苹果内部AI团队被曝悉数“崩盘”:负责Siri和ChatGPT竞品项目的工程师入职数周即离职,AI模型负责人庞若鸣率队投奔Meta,代号J595的桌面机器人团队和Vision Pro团队的数十名顶尖工程师更是被OpenAI“挖角”。在硅谷这场残酷的“AI抢人大战”中,苹果似乎正在从曾经的“人才黑洞”沦为“人才输送站”。
在苹果深陷人事泥潭之时,AI霸主英伟达却在技术护城河上再添重磅筹码。本周末,英伟达发布CUDA 13.1,并推出了自2006年CUDA平台诞生以来“最大、最全面的更新”——CUDA Tile编程模型。
简单来说,CUDA Tile是英伟达为AI时代量身定制的“降维打击”工具。
(图片由AI生成)
· 告别繁琐:传统的CUDA编程(SIMT模型)需要开发者对每一个线程进行微操,虽然灵活但难度极高。而CUDA Tile允许开发者以“数据块(Tile)”为单位进行编程,编译器会自动处理底层细节。
· 释放Tensor Core潜能:AI计算的核心是张量(Tensor),英伟达GPU虽然配备了强大的Tensor Core和TMA(张量内存加速器),但调用它们极其复杂。CUDA Tile将这些硬件复杂性进行了抽象,让开发者能轻松发挥硬件的全部性能。
· 兼容未来:基于CUDA Tile IR(中间表示)编写的代码,将自动适配英伟达未来几代GPU架构,大幅降低代码维护成本。
英伟达此举不仅是在升级软件,更是在定义AI编程的新标准。通过CUDA Tile,英伟达进一步降低了高性能AI开发的门槛,使Python开发者和高级库开发者能够像使用NumPy那样轻松调用底层算力。
当竞争对手还在努力追赶英伟达的硬件性能时,黄仁勋已经开始对软件生态进行一次彻底升级。这套全新的编程范式将进一步巩固开发者生态,让英伟达在AI时代的统治地位更加牢固。
二、重磅工具:DeepSeek V3.2凭借超高性价比震撼登场
本周,DeepSeek发布 DeepSeek V3.2 及 DeepSeek V3.2-Speciale 两款具有 6850亿参数 的MoE(混合专家)开源权重模型,在推理和智能体任务上展现出卓越性能,且性价比尤其突出。
其中DeepSeek V3.2-Speciale专攻深度推理,在包括国际数学奥林匹克(IMO)金牌级水平、AIME 96%准确率 和“人类终极考试”30%准确率 等推理基准上斩获SOTA佳绩,在某些基准上甚至力压Gemini 3.0 Pro和GPT-5-High。
标准推理模型DeepSeek V3.2则在强化智能体推理和指令遵循方面表现优异,在SWE-Bench Verified上达到 73.1%,tau-bench(智能体任务基准测试)则达到 80.3%。
DeepSeek V3.2发布后,社交媒体X上反响热烈,众多用户认为此举意义重大,证明开源AI模型完全有能力与目前的领先AI模型竞争。正如一位投资人所言:“它很少浮出水面,但每次浮出都会引起巨大轰动。”
网红科技博主@gm8xx8周末发布长篇评测,称DeepSeek V3.2系列模型的发布,不仅仅是性能榜单上的数字提升,更代表DeepSeek在模型架构和训练理念上的重大突破。他将DeepSeek V3.2能实现“弯道超车”归纳成三点:
1. 架构核心: 稀疏注意力机制与稀疏长文本优化;
2. 训练升级: 强化学习(RL)深度融合;
3. Speciale变体: 将验证机制转化为训练驱动力。
@gm8xx8总结,DeepSeek V3.2系列的核心意义在于完成架构的系统性整合。它将稀疏长上下文、大规模RL、合成智能体以及形式化验证(Math-V2)整合到一个统一的RL框架下,标志着模型架构从外部评估转向验证器指导下的可扩展、自我审计的训练体系。
《连线》则发表评论文章,称DeepSeek的“硬核”模型路线正与另一巨头字节跳动的策略形成鲜明对比,也折射了中国AI产业的分化趋势。
——DeepSeek: 向上走(Go High),模型效率为王。
由于受限于芯片供应,DeepSeek从一开始就将重点放在模型效率和成本控制上,致力于打造训练资源占用更少、开发者运行成本更低的开源模型。这代表了中国AI公司在“算力军备竞赛”中采取的另辟蹊径的突围策略,追求技术制高点和极致的性价比。
——字节跳动:向宽走(Go Wide),集成应用为王。
字节跳动则采取了截然不同的策略,通过旗下拥有超1.4亿月活用户的“豆包”抢占操作系统(OS)级的入口。继推出“豆包输入法”后,字节更进一步,发布可集成到手机操作系统中的豆包AI智能体,赋予其控制其他App的能力,目标直指取代苹果Siri,实现“应用内执行”。这表明字节跳动有意避开模型军备竞赛,转而利用其庞大的用户基础,将AI工具深深植入人们的日常生活入口。
(图片由AI生成)
连线认为,这两家拥有相似用户规模(AI应用月活超1.4亿)的中国领军企业,正分别代表了中国AI的两种发展方向:一派主攻最前沿基础大模型的突破和效率优化(DeepSeek),另一派则深耕将AI能力深度集成到现有应用生态中,争夺用户入口和场景落地(字节跳动)。
三、行业要闻:谷歌亚马逊多点开花、OpenAI发布“红色警报”
1. 谷歌Gemini 3 Deep Think上线深度思考模式
本周谷歌迅速向Ultra订阅用户推送Deep Think(深度思考)模式。通过并行推理和长链思维,它在处理多步骤分析任务时精度大幅提升,尤其是在代码生成和复杂逻辑推演上展现了业界顶尖的实力。
X用户@theaimestari直言,这有望改变AI技术准确性的游戏规则。
2. 亚马逊re:Invent大爆发:Nova 2家族全面登场
AWS本周一口气推出Nova 2模型家族,包括Lite、Pro、Sonic和Omni。
· Nova 2 Pro:专为智能体打造,代码理解能力直追Claude 3.5 Sonnet。
· Nova 2 Omni:一款统一支持图、文、语音、视频处理的全能模型,支持100万Token上下文。
虽然行业对亚马逊AWS的大动作持肯定态度,但也有不少用户表达了不同看法。德勤(Deloitte)全球云战略官戴维·林西克姆(David Linthicum)周末在X发文称,亚马逊在re:Invent 2025大会上推出的Nova 2模型家族及其全栈智能体平台(Bedrock、AgentCore),在技术上令人印象深刻,但在战略上却暗藏“隐患”。
林西克姆认为,平台提供的强大模型、原生集成和一站式“前沿智能体”服务,短期内效率极高。但他警告,企业必须警惕未来5到10年被AWS“绑定”的风险。
Linthicum的建议是:
· 战术性地采用Nova 2:在价值明确的场景可以利用其便利性。
· 避免长期绑定:绝不能让任何单一供应商掌控长期智能体架构。
· 投资通用抽象层技术:企业应投资于独立于模型的接口、开放可移植的模式,以及跨云的可观测性,确保未来AI能力由业务战略驱动,而非被单一云服务商的路线图所限制。
3. 谷歌最近一系列大动作直接引发OpenAI的强烈反应。OpenAI CEO奥特曼发出 “红色警报”(Code Red)内部备忘录,以应对谷歌Gemini的快速进步带来的竞争压力,特别是针对其市场份额的蚕食(Gemini用户增长30%,ChatGPT增速放缓至5%)。他要求公司回归核心AI模型的改进和基本功能,减少对非核心功能的投入。
行业报告暗示,OpenAI可能在下周发布GPT-5.2作为竞争回应,据传该模型在整体智能上将超越Gemini 3 Pro。
(图片由AI生成)
ChatGPT团队负责人尼克·图利(Nick Turley)则公开表态,强调要继续提升ChatGPT的能力,使其更直观、更个性化。
四、视频与多模态:可灵AI与Runway Gen-4.5引领潮流
在AI视频生成领域,两家公司本周也相继发布旗舰级更新。
1. Runway推出Gen-4.5视频模型: 这一新的旗舰SOTA模型在Artificial Analysis文本到视频排行榜上名列前茅,超越谷歌Veo 3等竞争对手。其核心特性涵盖增强的运动动态、更好的物理真实感(如物体运动的重量、动量和力量,符合流体动力学的液体流动),以及对电影风格的精细控制。
2. 可灵AI发布多项更新:
· 可灵Video 2.6 首次支持原生音频生成,可实现同步语音和音效,分辨率高达1080p,跻身Veo 3主导的全视听AI生成模型行列。
· 可灵AI还发布O1多模态创意引擎,提供统一界面,简化AI视频创作流,帮助实现角色与物体的一致性及长篇视频内容的制作。
· 推出Avatar 2.0,新增更具表现力的面部动画、唇形同步精度和真实世界相似度,支持生成长达5分钟的长篇视频。
五、业内摘要:微软苹果多款新模型亮相
——模型:
· Mistral:发布Mistral 3模型家族,包括675B参数的MoE模型Mistral Large 3和三个支持本地部署的多模态Ministral 3模型,后者在推理上表现出色。
· Arcee:美国公司发布Trinity系列开源权重MoE模型,包括面向智能体工作流的Trinity-Mini。
· OpenAGI:推出LUX AI智能体,声称在AI智能体计算机操作方面达到SOTA,可控制Slack、Excel等桌面应用。
· 微软:发布开源轻量级语音合成模型VibeVoice-Realtime-0.5B,专为实时应用优化。
· 英伟达:在NeurIPS大会上宣布了面向语音处理、AI安全评估和自动驾驶工作流程的开源AI工具和模型更新,包括首个用于AV研究的开放推理VLA模型DRIVE Alpamayo-R1。
· 苹果:发布首个用于高质量视频生成的端到端归一化流模型STARFlow-V,承诺比基于扩散的方法具有更清晰的帧连贯性和更快的采样速度。
——软硬件:
· 亚马逊:正式发布下一代 Trainium 3 AI芯片,并宣布推出AI Factory,结合英伟达GPU或Trainium芯片提供企业AI集群的本地化系统。
· 雅虎:推出AI系统,可以生成近乎实时的足球比赛回顾,提供叙事性总结。
——市场:
· Anthropic:收购JavaScript运行时团队Bun,用以支持扩展和改进Claude Code,并表示Claude Code的年化使用量已超过10亿美元。
· OpenAI:收购Thrive Holdings股权,拓展其在会计、IT支持和工作流自动化等企业领域的版图。
· 英伟达和Synopsys:宣布建立合作关系,利用加速计算和AI工具来革新工程和芯片设计工作流程。
· 法律诉讼:《纽约时报》对Perplexity提起版权侵权诉讼,指控其AI系统未经授权抓取并转发受版权保护的新闻内容。
热门跟贴