来源:市场资讯
(来源:AI信息Gap)
本周 AI 快讯 | 1 分钟速览
01 DeepSeek 融资直奔 500 亿,梁文锋自掏 200 亿,「V4.1」定档 6 月 :首轮外部融资目标最高 500 亿元,梁文锋个人出资占 40%;估值三周从 200 亿美元飙至近 500 亿;V4.1 将新增 MCP 协议支持和图像音频多模态。月之暗面同周完成 20 亿美元 D 轮,半年融资超 39 亿美元。
02 豆包测试三档付费订阅,标准版 68 元/月起 :加强版 200 元、专业版 500 元,保留免费基础版;4 月日活突破 1.4 亿,月活 3.45 亿稳居国内 AI 助手首位;日均 Token 消耗 120 万亿,两年增长 1000 倍。
03 百度发布「文心 5.1」,预训练成本仅为业界 6% :「多维弹性预训练」将总参数压缩至约 1/3、激活参数压缩至约 1/2;LMArena 搜索榜国内第一、全球第四;AIME26 数学推理 99.6 分。
04 蚂蚁百灵发布万亿参数思考模型「Ring-2.6-1T」,OpenRouter 限时免费 :万亿总参、63B 激活,支持 high 与 xhigh 两档推理强度;PinchBench 87.60 超过 GPT-5.4 xHigh 和 Opus 4.7 xhigh;AIME26 95.83 分。
05 阶跃星辰「StepAudio 2.5」上线实时语音,千问 PC 端新增语音输入 :StepAudio 2.5 通过语调和语速感知用户情绪,开发者可自定义 AI 角色性格;千问语音输入按住说话自动优化文本,双击进入 AI 指令模式可跨应用操作。
06 Anthropic 2000 亿签约谷歌算力,SpaceX 扩容,Claude 入驻 Office :五年 2000 亿美元购入 5GW 谷歌 TPU(2027 年起);SpaceX Colossus 1 提供约 300MW / 22 万块 GPU;Claude Code 五小时限额翻倍;Claude for Microsoft 365 正式上线 Excel、Word、PowerPoint,Outlook 进入公测。
07 「GPT-5.5 Instant」接管 ChatGPT 默认模型,幻觉减少 52.5% :替换 GPT-5.3 Instant,高风险场景幻觉降低 52.5%,回复字数减少 30.2%;AIME 2025 数学评测从 65.4 提升到 81.2;支持跨对话记忆和 Gmail 个性化。
08 Codex 周活 400 万推出 Chrome 扩展,同周发布「GPT-Realtime-2」语音三件套 :Codex 年初至今用户增长 8 倍,Chrome 扩展可操作浏览器标签和 DevTools;GPT-Realtime-2 首个 GPT-5 级推理语音模型,128K 上下文,配套实时翻译和流式转写。
09 Apple iOS 27 将开放第三方 AI,Claude、Gemini、DeepSeek 可替代 ChatGPT :新机制名「Extensions」,用户可在设置中一键切换默认 AI 助手;各提供商拥有独立 Siri 声音;WWDC 2026 于 6 月 8 日揭晓。
10 谷歌 I/O 前夜,Gemma 4 推理提速 3 倍,「Remy」智能体内测 :Gemma 4 系列推出 MTP 起草器,推理速度最高提升 3 倍;内部测试 Gemini 驱动的个人智能体「Remy」,可替用户操作 Gmail、日历等;实验性项目 Project Mariner 正式停运,技术整合至 AI Mode。
01|DeepSeek 融资直奔 500 亿,梁文锋自掏 200 亿,「V4.1」定档 6 月
梁文锋要自掏 200 亿。据多家媒体报道,DeepSeek 首轮外部融资目标最高可达 500 亿元人民币,其中创始人梁文锋个人出资约 200 亿元,占本轮总额的 40%。4 月 27 日他已通过增资将直接持股从 1% 提升到 34%,加上间接持股合计控制约 84% 股权。投后估值可能超过 3500 亿元(约 500 亿美元),三周内从 200 亿美元翻了一倍多。国家人工智能产业投资基金有望成为第二大出资方,多家产业资本同步参与谈判。
融资的核心目的是给员工期权定价。V4 技术报告列出约 270 名研究工程人员,研发期间仅 10 人离职,核心部门离职率不到 4%。据 The Information 报道,V4.1 定档 6 月,将新增对 MCP 协议的支持,并计划同时处理图像和音频。同周月之暗面完成约 20 亿美元 D 轮,美团龙珠领投,投后估值突破 200 亿美元,半年累计融资超 39 亿美元,4 月 ARR 突破 2 亿美元。
02|豆包测试三档付费订阅,标准版 68 元/月起
字节跳动旗下 AI 助手豆包 5 月 4 日在 App Store 更新服务声明,首次披露三档付费方案。标准版连续包月 68 元,加强版 200 元,专业版 500 元,分别面向基础办公、创作者和企业级场景。连续包年折扣后标准版年费 688 元,专业版 5088 元。所有付费功能为增值服务,聚焦 PPT 生成、数据分析和影视制作等复杂任务,基础版保持免费。
豆包官方回应称「相关方案细节还在测试阶段」。根据第三方数据显示,4 月豆包日活突破 1.4 亿,环比增长 21%,月活 3.45 亿稳居国内 AI 助手首位。日均 Token 消耗量突破 120 万亿,比 2024 年 5 月发布时增长 1000 倍。68 元的入门价约合 9.5 美元,与 ChatGPT Go 版的 8 美元基本持平。
03|百度发布「文心 5.1」,预训练成本仅为业界 6%
总参数压缩至约 1/3,激活参数压缩至约 1/2,预训练成本只有业界同规模模型的 6%。5 月 9 日百度正式发布 文心 5.1,核心技术是「多维弹性预训练」,在训练过程中同时生成多种规模的子模型,再从中提取最优子网络,一次训练即可部署多个场景。LMArena 搜索榜上 文心 5.1 以 1223 分拿下国内第一、全球第四,是榜单上唯一入围的国产大模型。
数学推理方面,AIME26 竞赛基准取得 99.6 分,距离 Gemini 3.1 Pro 只差零点几分。百度还强调 Agent 能力已超过 DeepSeek-V4-Pro,但该对比来自百度自测,尚无第三方独立验证。文心 5.1 已在百度千帆模型广场和文心一言官网同步上线。5 月 13 日至 14 日 Create 2026 百度 AI 开发者大会将在北京举办,届时有望公布更多技术细节。
04|蚂蚁百灵发布万亿参数思考模型「Ring-2.6-1T」,OpenRouter 限时免费
万亿参数、63B 激活,专为 Agent 工作流设计。5 月 9 日蚂蚁集团百灵大模型发布 Ring-2.6-1T,引入可调节的「Reasoning Effort」机制,开发者可以在 high 和 xhigh 两档推理强度之间切换。high 模式面向高频 Agent 调用,控制 Token 开销和多步执行效率;xhigh 模式面向数学和复杂逻辑任务,提供更充分的推理空间。上下文窗口支持 262144 个 token。
其中,high 模式在 PinchBench 拿到 87.60 分,超过 GPT-5.4 xHigh 和 Claude Opus 4.7 xhigh;xhigh 模式在 AIME26 取得 95.83 分,GPQA Diamond 88.27 分。Ring-2.6-1T 已上线 OpenRouter,免费体验为期一周,每日 5000 次基础调用额度。蚂蚁百灵 2 月曾开源全球首个混合线性架构万亿参数模型 Ring-2.5-1T,本次是其升级迭代。
05|阶跃星辰「StepAudio 2.5」上线实时语音,千问 PC 端新增语音输入
能通过语调和语速判断你的情绪。阶跃星辰 5 月初发布新一代实时语音大模型 StepAudio 2.5 Realtime,主打「副语言」感知,模型可以从语调变化、说话速度和停顿节奏中捕捉用户情绪状态,动态调整回复风格。开发者可以精细定制 AI 角色的性格、背景和说话方式,官方称目标是打造具有「活人感」的语音交互体验。
同周阿里千问 PC 端也上线了 AI 语音输入功能,设计了两组快捷键。按住快捷键说话,语音自动转文本并优化表达;双击快捷键进入 AI 指令模式,可以跨应用执行信息检索和文档生成,不用切换到千问客户端。阶跃侧重让 AI 听懂情绪,千问侧重让语音替代键盘操作。
06|Anthropic 2000 亿签约谷歌算力,SpaceX 扩容,Claude 入驻 Office
5 年、2000 亿美元、5 吉瓦。据 The Information 5 月 5 日报道,Anthropic 已签约购入谷歌下一代 TPU 算力,合同 2027 年起生效,谷歌 TPU 定价比同类英伟达方案低 40% 到 50%。同一天 Anthropic 宣布与 SpaceX 达成算力协议,接管 Colossus 1 数据中心约 300MW 容量、超过 22 万块英伟达 GPU,一个月内交付。CEO Dario Amodei 在开发者大会上透露 Q1 营收和用量同比增长了 80 倍,「我们只规划了 10 倍」。2000 亿美元的数字双方均未正式确认。
算力到手后第一件事是给用户松绑。Claude Code 五小时限额对 Pro、Max、Team 和 Enterprise 用户翻倍,高峰时段的额外限制同步取消,Claude Opus API 速率也大幅放宽。5 月 7 日 Anthropic 同时发布 Claude for Microsoft 365,Excel、Word 和 PowerPoint 版正式上线,Outlook 版进入公测。与微软自家 Copilot 最大的区别是跨应用上下文,Claude 在四个 Office 应用之间切换时保持同一段对话,Copilot 把每个应用当作独立会话。所有 Claude 付费计划可用,不额外收费。
据《金融时报》报道,Anthropic 正在考虑今夏筹集数百亿美元,估值可能接近 1 万亿美元,如果按这一数字成交将超过 OpenAI 3 月那轮的 8520 亿投后估值。年化收入据报已超 440 亿美元,比去年底增长约五倍。SpaceX 6 月将提交 IPO 文件,把闲置算力租给 Anthropic 每年可带来 30 到 40 亿美元收入。三个月前马斯克还在社交媒体上称 Anthropic「反人类且邪恶」,本周却发帖说对 Anthropic 团队「印象深刻」。
07|「GPT-5.5 Instant」接管 ChatGPT 默认模型,幻觉减少 52.5%
高风险场景下幻觉减少 52.5%,回复字数减少 30.2%。5 月 5 日 OpenAI 将 ChatGPT 默认模型从 GPT-5.3 Instant 升级到 GPT-5.5 Instant,在医学、法律和金融等容易出错的场景中,不准确的回答减少了 37.3%。AIME 2025 数学评测从 65.4 提升到 81.2,多模态推理 MMMU-Pro 从 69.2 提升到 76。OpenAI 还特别提到减少了「不必要的表情符号」和过度格式化。
GPT-5.5 Instant 新增了个性化记忆功能,可以引用过往对话、上传文件甚至 Gmail 内容来定制回复,目前向 Plus 和 Pro 用户的网页端开放,移动端和免费用户将在未来几周跟进。用户可以查看和删除 ChatGPT 用于个性化的记忆数据。GPT-5.3 Instant 对付费用户保留三个月过渡期,之后退役。同周 OpenAI 还向美国广告主开放了 ChatGPT 自助广告平台测试版,支持 CPM 和 CPC 两种计费。
08|Codex 周活 400 万推出 Chrome 扩展,同周发布「GPT-Realtime-2」语音三件套
年初至今用户增长了 8 倍,周活跃突破 400 万。5 月 7 日 OpenAI 为 Codex 推出 Chrome 浏览器扩展,macOS 和 Windows 用户可以让 Codex 在浏览器内操作,包括测试网页应用、读取多个标签页内容和调用 Chrome DevTools,但不会接管用户的当前浏览会话。OpenAI 发现桌面端 Codex 的大多数工作流都发生在浏览器里,Chrome 扩展比桌面端的「电脑操控」模式更精准。欧盟和英国暂时无法使用。
同一天 OpenAI 发布了三款实时语音模型。GPT-Realtime-2 是首个具备 GPT-5 级推理能力的语音模型,上下文窗口从前代的 32K 扩展到 128K,支持 normal、high 和 xhigh 三档推理强度。配套的 GPT-Realtime-Translate 支持 70 多种语言输入、13 种语言实时翻译输出,GPT-Realtime-Whisper 提供流式语音转文本。三款模型面向开发者通过 API 调用,不直接在 ChatGPT 消费端提供。早期用户 Zillow 反馈最难场景下通话成功率从 69% 提升到 95%。
09|Apple iOS 27 将开放第三方 AI,Claude、Gemini、DeepSeek 可替代 ChatGPT
Bloomberg 的 Mark Gurman 5 月 5 日报道,Apple 计划在 iOS 27 中推出名为「Extensions」的新机制,让用户自由选择 Siri 和 Apple Intelligence 背后的 AI 模型。操作方式和选择默认浏览器一样,从 App Store 安装 AI 应用后在设置里打开开关,Siri、写作工具和 Image Playground 的请求就会路由到选定的第三方模型。目前 Anthropic 的 Claude 和谷歌的 Gemini 已进入内测,DeepSeek 和 xAI 的 Grok 也有接入条件。
每个第三方模型会拥有独立的 Siri 声音,与 Apple 自家模型的声音区分开。Apple 还计划声明不对第三方模型生成的内容负责。这套机制和此前曝光的谷歌 Gemini 后端合作并行存在,后者是一个定制的 1.2 万亿参数 Gemini 模型,运行在 Apple Private Cloud Compute 上为 Siri 的摘要和规划功能提供支持,据报每年价值约 10 亿美元。「Extensions」让用户可以绕过这套后端,完全切换到其他模型。WWDC 2026 定于 6 月 8 日开幕。
10|谷歌 I/O 前夜,Gemma 4 推理提速 3 倍,「Remy」智能体内测
5 月 5 日谷歌为 Gemma 4 系列模型发布了多 Token 预测(MTP)起草器,采用推测解码架构,推理速度最高提升 3 倍。MTP 让模型一次预测多个 token 而非逐个生成,主模型再验证并决定保留哪些,相当于用一次小成本预测换取大幅提速。同一天谷歌挂出公告,实验性网页自动化项目 Project Mariner 正式停运,核心技术已整合到 Gemini Agent 和 AI Mode 中。
据 Business Insider 报道,谷歌内部正在测试一款名为「Remy」的 Gemini 个人智能体,目前处于员工试用阶段。与现有 Gemini 的被动问答不同,「Remy」被设计为可以主动替用户执行任务,包括操作 Gmail、日历、Google Docs,甚至代为购物和发消息。谷歌 I/O 大会 5 月 19 日开幕,AI 智能体预计是核心主题。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。
热门跟贴