DeepSeek 融资 500 亿|deepseek|gmail|知名企业|网络信息|融资|谷歌

来源：市场资讯

（来源：AI信息Gap）

本周 AI 快讯 | 1 分钟速览

01 DeepSeek 融资直奔 500 亿，梁文锋自掏 200 亿，「V4.1」定档 6 月：首轮外部融资目标最高 500 亿元，梁文锋个人出资占 40%；估值三周从 200 亿美元飙至近 500 亿；V4.1 将新增 MCP 协议支持和图像音频多模态。月之暗面同周完成 20 亿美元 D 轮，半年融资超 39 亿美元。

02 豆包测试三档付费订阅，标准版 68 元/月起：加强版 200 元、专业版 500 元，保留免费基础版；4 月日活突破 1.4 亿，月活 3.45 亿稳居国内 AI 助手首位；日均 Token 消耗 120 万亿，两年增长 1000 倍。

03 百度发布「文心 5.1」，预训练成本仅为业界 6% ：「多维弹性预训练」将总参数压缩至约 1/3、激活参数压缩至约 1/2；LMArena 搜索榜国内第一、全球第四；AIME26 数学推理 99.6 分。

04 蚂蚁百灵发布万亿参数思考模型「Ring-2.6-1T」，OpenRouter 限时免费：万亿总参、63B 激活，支持 high 与 xhigh 两档推理强度；PinchBench 87.60 超过 GPT-5.4 xHigh 和 Opus 4.7 xhigh；AIME26 95.83 分。

05 阶跃星辰「StepAudio 2.5」上线实时语音，千问 PC 端新增语音输入：StepAudio 2.5 通过语调和语速感知用户情绪，开发者可自定义 AI 角色性格；千问语音输入按住说话自动优化文本，双击进入 AI 指令模式可跨应用操作。

06 Anthropic 2000 亿签约谷歌算力，SpaceX 扩容，Claude 入驻 Office ：五年 2000 亿美元购入 5GW 谷歌 TPU（2027 年起）；SpaceX Colossus 1 提供约 300MW / 22 万块 GPU；Claude Code 五小时限额翻倍；Claude for Microsoft 365 正式上线 Excel、Word、PowerPoint，Outlook 进入公测。

07 「GPT-5.5 Instant」接管 ChatGPT 默认模型，幻觉减少 52.5% ：替换 GPT-5.3 Instant，高风险场景幻觉降低 52.5%，回复字数减少 30.2%；AIME 2025 数学评测从 65.4 提升到 81.2；支持跨对话记忆和 Gmail 个性化。

08 Codex 周活 400 万推出 Chrome 扩展，同周发布「GPT-Realtime-2」语音三件套：Codex 年初至今用户增长 8 倍，Chrome 扩展可操作浏览器标签和 DevTools；GPT-Realtime-2 首个 GPT-5 级推理语音模型，128K 上下文，配套实时翻译和流式转写。

09 Apple iOS 27 将开放第三方 AI，Claude、Gemini、DeepSeek 可替代 ChatGPT ：新机制名「Extensions」，用户可在设置中一键切换默认 AI 助手；各提供商拥有独立 Siri 声音；WWDC 2026 于 6 月 8 日揭晓。

10 谷歌 I/O 前夜，Gemma 4 推理提速 3 倍，「Remy」智能体内测：Gemma 4 系列推出 MTP 起草器，推理速度最高提升 3 倍；内部测试 Gemini 驱动的个人智能体「Remy」，可替用户操作 Gmail、日历等；实验性项目 Project Mariner 正式停运，技术整合至 AI Mode。

01｜DeepSeek 融资直奔 500 亿，梁文锋自掏 200 亿，「V4.1」定档 6 月

梁文锋要自掏 200 亿。据多家媒体报道，DeepSeek 首轮外部融资目标最高可达 500 亿元人民币，其中创始人梁文锋个人出资约 200 亿元，占本轮总额的 40%。4 月 27 日他已通过增资将直接持股从 1% 提升到 34%，加上间接持股合计控制约 84% 股权。投后估值可能超过 3500 亿元（约 500 亿美元），三周内从 200 亿美元翻了一倍多。国家人工智能产业投资基金有望成为第二大出资方，多家产业资本同步参与谈判。

融资的核心目的是给员工期权定价。V4 技术报告列出约 270 名研究工程人员，研发期间仅 10 人离职，核心部门离职率不到 4%。据 The Information 报道，V4.1 定档 6 月，将新增对 MCP 协议的支持，并计划同时处理图像和音频。同周月之暗面完成约 20 亿美元 D 轮，美团龙珠领投，投后估值突破 200 亿美元，半年累计融资超 39 亿美元，4 月 ARR 突破 2 亿美元。

02｜豆包测试三档付费订阅，标准版 68 元/月起

字节跳动旗下 AI 助手豆包 5 月 4 日在 App Store 更新服务声明，首次披露三档付费方案。标准版连续包月 68 元，加强版 200 元，专业版 500 元，分别面向基础办公、创作者和企业级场景。连续包年折扣后标准版年费 688 元，专业版 5088 元。所有付费功能为增值服务，聚焦 PPT 生成、数据分析和影视制作等复杂任务，基础版保持免费。

豆包官方回应称「相关方案细节还在测试阶段」。根据第三方数据显示，4 月豆包日活突破 1.4 亿，环比增长 21%，月活 3.45 亿稳居国内 AI 助手首位。日均 Token 消耗量突破 120 万亿，比 2024 年 5 月发布时增长 1000 倍。68 元的入门价约合 9.5 美元，与 ChatGPT Go 版的 8 美元基本持平。

03｜百度发布「文心 5.1」，预训练成本仅为业界 6%

总参数压缩至约 1/3，激活参数压缩至约 1/2，预训练成本只有业界同规模模型的 6%。5 月 9 日百度正式发布文心 5.1，核心技术是「多维弹性预训练」，在训练过程中同时生成多种规模的子模型，再从中提取最优子网络，一次训练即可部署多个场景。LMArena 搜索榜上文心 5.1 以 1223 分拿下国内第一、全球第四，是榜单上唯一入围的国产大模型。

数学推理方面，AIME26 竞赛基准取得 99.6 分，距离 Gemini 3.1 Pro 只差零点几分。百度还强调 Agent 能力已超过 DeepSeek-V4-Pro，但该对比来自百度自测，尚无第三方独立验证。文心 5.1 已在百度千帆模型广场和文心一言官网同步上线。5 月 13 日至 14 日 Create 2026 百度 AI 开发者大会将在北京举办，届时有望公布更多技术细节。

04｜蚂蚁百灵发布万亿参数思考模型「Ring-2.6-1T」，OpenRouter 限时免费

万亿参数、63B 激活，专为 Agent 工作流设计。5 月 9 日蚂蚁集团百灵大模型发布 Ring-2.6-1T，引入可调节的「Reasoning Effort」机制，开发者可以在 high 和 xhigh 两档推理强度之间切换。high 模式面向高频 Agent 调用，控制 Token 开销和多步执行效率；xhigh 模式面向数学和复杂逻辑任务，提供更充分的推理空间。上下文窗口支持 262144 个 token。

其中，high 模式在 PinchBench 拿到 87.60 分，超过 GPT-5.4 xHigh 和 Claude Opus 4.7 xhigh；xhigh 模式在 AIME26 取得 95.83 分，GPQA Diamond 88.27 分。Ring-2.6-1T 已上线 OpenRouter，免费体验为期一周，每日 5000 次基础调用额度。蚂蚁百灵 2 月曾开源全球首个混合线性架构万亿参数模型 Ring-2.5-1T，本次是其升级迭代。

05｜阶跃星辰「StepAudio 2.5」上线实时语音，千问 PC 端新增语音输入

能通过语调和语速判断你的情绪。阶跃星辰 5 月初发布新一代实时语音大模型 StepAudio 2.5 Realtime，主打「副语言」感知，模型可以从语调变化、说话速度和停顿节奏中捕捉用户情绪状态，动态调整回复风格。开发者可以精细定制 AI 角色的性格、背景和说话方式，官方称目标是打造具有「活人感」的语音交互体验。

同周阿里千问 PC 端也上线了 AI 语音输入功能，设计了两组快捷键。按住快捷键说话，语音自动转文本并优化表达；双击快捷键进入 AI 指令模式，可以跨应用执行信息检索和文档生成，不用切换到千问客户端。阶跃侧重让 AI 听懂情绪，千问侧重让语音替代键盘操作。

06｜Anthropic 2000 亿签约谷歌算力，SpaceX 扩容，Claude 入驻 Office

5 年、2000 亿美元、5 吉瓦。据 The Information 5 月 5 日报道，Anthropic 已签约购入谷歌下一代 TPU 算力，合同 2027 年起生效，谷歌 TPU 定价比同类英伟达方案低 40% 到 50%。同一天 Anthropic 宣布与 SpaceX 达成算力协议，接管 Colossus 1 数据中心约 300MW 容量、超过 22 万块英伟达 GPU，一个月内交付。CEO Dario Amodei 在开发者大会上透露 Q1 营收和用量同比增长了 80 倍，「我们只规划了 10 倍」。2000 亿美元的数字双方均未正式确认。

算力到手后第一件事是给用户松绑。Claude Code 五小时限额对 Pro、Max、Team 和 Enterprise 用户翻倍，高峰时段的额外限制同步取消，Claude Opus API 速率也大幅放宽。5 月 7 日 Anthropic 同时发布 Claude for Microsoft 365，Excel、Word 和 PowerPoint 版正式上线，Outlook 版进入公测。与微软自家 Copilot 最大的区别是跨应用上下文，Claude 在四个 Office 应用之间切换时保持同一段对话，Copilot 把每个应用当作独立会话。所有 Claude 付费计划可用，不额外收费。

据《金融时报》报道，Anthropic 正在考虑今夏筹集数百亿美元，估值可能接近 1 万亿美元，如果按这一数字成交将超过 OpenAI 3 月那轮的 8520 亿投后估值。年化收入据报已超 440 亿美元，比去年底增长约五倍。SpaceX 6 月将提交 IPO 文件，把闲置算力租给 Anthropic 每年可带来 30 到 40 亿美元收入。三个月前马斯克还在社交媒体上称 Anthropic「反人类且邪恶」，本周却发帖说对 Anthropic 团队「印象深刻」。

07｜「GPT-5.5 Instant」接管 ChatGPT 默认模型，幻觉减少 52.5%

高风险场景下幻觉减少 52.5%，回复字数减少 30.2%。5 月 5 日 OpenAI 将 ChatGPT 默认模型从 GPT-5.3 Instant 升级到 GPT-5.5 Instant，在医学、法律和金融等容易出错的场景中，不准确的回答减少了 37.3%。AIME 2025 数学评测从 65.4 提升到 81.2，多模态推理 MMMU-Pro 从 69.2 提升到 76。OpenAI 还特别提到减少了「不必要的表情符号」和过度格式化。

GPT-5.5 Instant 新增了个性化记忆功能，可以引用过往对话、上传文件甚至 Gmail 内容来定制回复，目前向 Plus 和 Pro 用户的网页端开放，移动端和免费用户将在未来几周跟进。用户可以查看和删除 ChatGPT 用于个性化的记忆数据。GPT-5.3 Instant 对付费用户保留三个月过渡期，之后退役。同周 OpenAI 还向美国广告主开放了 ChatGPT 自助广告平台测试版，支持 CPM 和 CPC 两种计费。

08｜Codex 周活 400 万推出 Chrome 扩展，同周发布「GPT-Realtime-2」语音三件套

年初至今用户增长了 8 倍，周活跃突破 400 万。5 月 7 日 OpenAI 为 Codex 推出 Chrome 浏览器扩展，macOS 和 Windows 用户可以让 Codex 在浏览器内操作，包括测试网页应用、读取多个标签页内容和调用 Chrome DevTools，但不会接管用户的当前浏览会话。OpenAI 发现桌面端 Codex 的大多数工作流都发生在浏览器里，Chrome 扩展比桌面端的「电脑操控」模式更精准。欧盟和英国暂时无法使用。

同一天 OpenAI 发布了三款实时语音模型。GPT-Realtime-2 是首个具备 GPT-5 级推理能力的语音模型，上下文窗口从前代的 32K 扩展到 128K，支持 normal、high 和 xhigh 三档推理强度。配套的 GPT-Realtime-Translate 支持 70 多种语言输入、13 种语言实时翻译输出，GPT-Realtime-Whisper 提供流式语音转文本。三款模型面向开发者通过 API 调用，不直接在 ChatGPT 消费端提供。早期用户 Zillow 反馈最难场景下通话成功率从 69% 提升到 95%。

09｜Apple iOS 27 将开放第三方 AI，Claude、Gemini、DeepSeek 可替代 ChatGPT

Bloomberg 的 Mark Gurman 5 月 5 日报道，Apple 计划在 iOS 27 中推出名为「Extensions」的新机制，让用户自由选择 Siri 和 Apple Intelligence 背后的 AI 模型。操作方式和选择默认浏览器一样，从 App Store 安装 AI 应用后在设置里打开开关，Siri、写作工具和 Image Playground 的请求就会路由到选定的第三方模型。目前 Anthropic 的 Claude 和谷歌的 Gemini 已进入内测，DeepSeek 和 xAI 的 Grok 也有接入条件。

每个第三方模型会拥有独立的 Siri 声音，与 Apple 自家模型的声音区分开。Apple 还计划声明不对第三方模型生成的内容负责。这套机制和此前曝光的谷歌 Gemini 后端合作并行存在，后者是一个定制的 1.2 万亿参数 Gemini 模型，运行在 Apple Private Cloud Compute 上为 Siri 的摘要和规划功能提供支持，据报每年价值约 10 亿美元。「Extensions」让用户可以绕过这套后端，完全切换到其他模型。WWDC 2026 定于 6 月 8 日开幕。

10｜谷歌 I/O 前夜，Gemma 4 推理提速 3 倍，「Remy」智能体内测

5 月 5 日谷歌为 Gemma 4 系列模型发布了多 Token 预测（MTP）起草器，采用推测解码架构，推理速度最高提升 3 倍。MTP 让模型一次预测多个 token 而非逐个生成，主模型再验证并决定保留哪些，相当于用一次小成本预测换取大幅提速。同一天谷歌挂出公告，实验性网页自动化项目 Project Mariner 正式停运，核心技术已整合到 Gemini Agent 和 AI Mode 中。

据 Business Insider 报道，谷歌内部正在测试一款名为「Remy」的 Gemini 个人智能体，目前处于员工试用阶段。与现有 Gemini 的被动问答不同，「Remy」被设计为可以主动替用户执行任务，包括操作 Gmail、日历、Google Docs，甚至代为购物和发消息。谷歌 I/O 大会 5 月 19 日开幕，AI 智能体预计是核心主题。