打开网易新闻 查看精彩图片

谷歌和Anthropic在大模型上的追赶让OpenAI产生了危机感。

OpenAI CEO Sam Altman 在当地时间周一向员工宣布进入「红色警报」状态,以应对来自 Google 等人工智能竞争对手的压力,并集中资源提升 ChatGPT 的性能。Altman 表示,公司将因此推迟包括广告业务在内的其他计划。Altman 在内部备忘录中指出,「我们正处于 ChatGPT 的关键时刻」,Google 的 AI 反攻可能带来「短期经济阻力」。作为应对,OpenAI 将优先推出一款新的推理模型,该模型在内部评估中表现优于 Google 的 Gemini 3。

国内的AI眼镜领域也迎来了新玩家。理想汽车宣布将在今天 19:30 举办新品发布会,正式推出其首款 AI 智能眼镜「Livis」。理想汽车表示,此次合作标志着公司从智能汽车制造商向「智能出行生态服务商」的转型。Livis AI 眼镜将作为车机系统的延伸,结合全场景 AI 能力,把「理想同学」的智能交互体验从车内拓展至日常生活。

过去一天,国内外AI行业还有更多热点可以关注,硅基君带你一起看看。

大模型

1)OpenAI 宣布「红色警报」,集中资源提升chatGPT

据 The Information 报道,OpenAI CEO Sam Altman 在当地时间周一向员工宣布进入「红色警报」状态,以应对来自 Google 等人工智能竞争对手的压力,并集中资源提升 ChatGPT 的性能。Altman 表示,公司将因此推迟包括广告业务在内的其他计划。Altman 在内部备忘录中指出,「我们正处于 ChatGPT 的关键时刻」,Google 的 AI 反攻可能带来「短期经济阻力」。

他强调,OpenAI 将优先推出一款新的推理模型,该模型在内部评估中表现优于 Google 的 Gemini 3。

据悉,OpenAI 正计划通过一个代号为「Garlic」(蒜)的新大语言模型进行反击。知情人士透露,OpenAI 首席研究官 Mark Chen 近期向公司内部人员介绍了该新模型,并且 Gartlic 在代码、推理任务中,能够媲美 Google Gemini 3 和 Anthropic Opus 4.5.同时,公司还将加快改进图像生成 AI、提升模型行为表现、优化速度与可靠性,并减少「过度拒答」现象。

Altman 强调,OpenAI 的「红色警报」不仅是防御,更是主动出击。他表示,下周将发布的新推理模型将进一步强化 ChatGPT 的「思考模式」和 Deep Research 功能,以保持在激烈竞争中的领先地位。

2)字节跳动 Seed 推出 GR-RL,机器人首次完成真机穿鞋带

昨天,字节跳动 Seed Research 团队正式发布最新研究成果 GR-RL,在真实机器人平台上首次实现了「连续为整只鞋穿鞋带」的复杂操作。

字节跳动称,这一突破标志着视觉-语言-动作(VLA)模型在精细灵巧任务上的能力边界被显著拓展。

团队指出,主流模仿学习存在两大缺陷:人类演示数据的「次优性」以及训练与推理之间的「执行错位」,导致模型在毫米级精度任务中频繁失败。为此,Seed 团队选择真机强化学习路径,提出了多阶段训练框架,包括离线数据筛选、数据增强以及在线强化学习。在双臂机器人 ByteMini-v2 上,GR-RL 将穿鞋带任务成功率从监督学习基线 GR-3 的 45.7% 提升至 83.3%,失败率减少近 70%。

其中,数据过滤、镜像增强和在线强化学习均对性能提升贡献显著。实验中,模型展现出类似人类的「纠错智能」,在鞋带滑落或摆放位置不佳时能主动调整并重试,体现了对任务物理逻辑的理解,而非单纯轨迹记忆。

团队认为,强化学习经验应进一步蒸馏回基础 VLA 模型,以构建兼具高精度操作与强大泛化能力的通用策略。

3)可灵 O1 生图模型上线,支持多图融合与精准细节控制

昨天,可灵 AI 宣布 O1 图片模型已正式全量上线,定位「一站式创意引擎」,覆盖从基础图像生成到高阶细节编辑的完整流程,旨在让创意实现更加精准与高效。据介绍,该模型具备四大核心优势:

  • 特征全保真:支持多达 10 张参考图的特征提取,能够精准锁定主体轮廓与色调,即便跨图生成也能保持高度一致性;
  • 细节全掌控:用户无需专业修图技能,仅凭文字指令即可实现物品与人物的精准增删改操作,满足影视级创作需求;
  • 风格全复刻:通过多图融合与风格解构,实现全局风格的自然统一与无缝转绘;
  • 创意全融合:支持涂鸦编辑与自然语言指令触发,进一步拓展复杂构想的实现路径。

此外,可灵 AI 宣布,自即日起至 12 月 14 日 24 时,O1 视频生成会员提供限时双周 7.5 折优惠,O1 图片生成铂金及以上会员最长可享 1 年无限使用,全场会员年卡限时 6.6 折。

AI应用

1)理想汽车携手蔡司,AI 眼镜 Livis 今晚发布

昨天,理想汽车宣布与德国光学巨头蔡司达成全球战略合作,并将在今天 19:30 举办新品发布会,正式推出其首款 AI 智能眼镜「Livis」。

理想汽车表示,此次合作标志着公司从智能汽车制造商向「智能出行生态服务商」的转型。Livis AI 眼镜将作为车机系统的延伸,结合全场景 AI 能力,把「理想同学」的智能交互体验从车内拓展至日常生活。产品搭载 MicroOLED 高清显示屏,并借助蔡司在光学领域的技术优化视觉清晰度与场景适配性。

同时,眼镜支持轻量化设计与近视定制功能,提升佩戴舒适度。根据理想汽车官方预热视频,Livis 智能眼镜还具备远程控车功能,可实现打开电动侧滑门、提前开启车内空调及座椅加热等操作。

2)灵光上线两周,闪应用数量突破 330 万

昨天,蚂蚁集团宣布,灵光 App 用户已成功创建 330 万个「闪应用」。

灵光闪应用的核心突破在于极大降低了开发门槛,用户无需编程知识,仅用自然语言即可在移动端最快 30 秒生成一个可交互、可编辑、可分享的小应用。这与传统开发模式形成鲜明对比,推动了大众化的 AI 创作潮流。

灵光 App 首期上线「灵光对话」「灵光闪应用」「灵光开眼」三大功能,迅速成为现象级 AI 产品。官方数据显示,灵光在 6 天内突破 200 万下载,远高于 ChatGPT 首周的 60.6 万和 Claude 的 15.7 万;在突破 100 万下载的速度上,灵光仅用 4 天,也快于 Sora2 的 5 天。

3)千问 APP 接入万相 2.5,视频创作能力再升级

昨天,千问 APP 宣布接入阿里最新视频生成模型万相 Wan2.5,全面升级视频创作能力。该版本在动作精度和肢体协调性方面显著提升,并成为首个支持音视频同步输出的移动端 AI 助手。

万相 2.5 是目前业界少数具备音画同步能力的视频模型之一,支持文本、图像、视频、音频等多模态输入与输出。在权威大模型评测 LMArena 上,万相的图生视频能力位居全球第三,稳居国内第一。

此次接入后,千问 APP 用户只需上传一张照片和一段文字,即可生成肢体动作自然、口型匹配准确的 1080P 高清唱跳视频,最长支持 10 秒。

投融资情报

1)AI语音初创公司Gradium获得7000万美元种子轮融资

TC报道,Gradium 是一家从法国人工智能实验室 Kyutai (由法国电信亿万富翁 Xavier Niel 支持)衍生出来的初创公司,周二宣布从众多知名投资者那里获得了 7000 万美元的种子轮融资。

本轮融资由 FirstMark Capital 和 Eurazeo 领投,Niel、DST Global Partners、亿万富翁 Eric Schmidt 和其他投资者参与。

Gradium开发了音频语言 AI 模型,旨在以超低延迟大规模提供语音服务——本质上,就是能够近乎即时响应的 AI 语音。该公司由 Kyutai 创始成员 Neil Zeghidour 于 2025 年 9 月创立,他曾在 Google DeepMind 担任研究员,积累了丰富的语音模型研究经验。

这家初创公司表示,其目标是为开发者提供更快速、更准确的语音模型。作为一家欧洲初创公司,它一上线就支持多种语言:英语、法语、德语、西班牙语和葡萄牙语,未来还将推出更多语言。

/ 04 /

AI基础设施

1)IBM CEO:AI 数据中心 8 万亿美元投入难获回报

据《商业内幕》报道,IBM CEO 阿尔温德 · 克里希纳在接受「Decoder」播客采访时表示,当前科技巨头在人工智能数据中心上的巨额资本支出几乎没有可能获得回报。

他指出,按照现有成本测算,建设 1GW 数据中心约需 800 亿美元,而全球承诺的总规模已接近 100GW,总投入约 8 万亿美元。克里希纳强调,这意味着企业需要每年约 8000 亿美元利润才能覆盖利息成本,这在现实中难以实现。他同时提到,数据中心内部的 AI 芯片存在快速折旧问题,通常五年后就必须更换,这进一步加剧了成本压力。

在 AGI(通用人工智能)方面,克里希纳持高度怀疑态度。他认为现有大模型扩展路径无法实现 AGI,概率仅在 0–1%。他提出未来可能需要将「硬知识」与大语言模型结合,但即便如此也只是「也许」。

不过,克里希纳仍然看好现有 AI 工具在企业生产力上的价值,认为其有望释放数万亿美元的效率提升。他强调,AGI 的实现需要超越当前大模型路径的更多技术突破。

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。