最全！ OpenAI 12天直播大戏合集（文字+视频）|openai|python|命令提示符|直播大戏|知名企业|编程|谷歌

作者｜子川

来源｜AI先锋官

近日，随着o3模型的压轴出场，OpenAI的年度大秀算是彻底落下帷幕。

还没看过OpenAI直播或以及忘记了发布啥功能的小伙伴，赶紧坐上小编的车，一起来盘点此次OpenAI 12天直播到底都发布了啥？

省流版：

完整版 o1 模型：OpenAI 推出的 o1 模型正式版，具备更强的推理和多模态处理能力。

o1 Pro 模式：o1 模型的高级版本，针对复杂问题提供更深入的分析和更高质量的解答。

ChatGPT Pro 会员：每月 200 美元的订阅服务，提供对 OpenAI 最新模型（如 o1、o1-mini、GPT-4o）和高级语音功能的无限制访问。

强化微调（Reinforcement Fine-Tuning，RFT）技术：允许用户使用少量数据对模型进行微调，以解决特定领域问题，提升模型在特定任务上的表现。

Sora：AI 视频生成工具，可根据文本生成最长 20 秒的 1080P 视频，并提供多种视频编辑功能。

Canvas 升级：OpenAI 的协作平台，支持在文档中提出建议、润色、检查语法、添加表情，并可运行 Python 代码。

0 7

ChatGPT 集成苹果系统：ChatGPT 与苹果操作系统深度集成，提升 Siri 的智能化水平，并引入相机 AI 视觉功能。

高级语音模式增加视觉能力：在高级语音模式中，新增视频聊天和实时屏幕共享功能，提升人机交互体验。

新增圣诞老人语言：在高级语音模式中新增圣诞老人声音。

Projects 功能：在 ChatGPT 中新增“文件夹”功能，帮助用户组织和管理聊天内容和相关资料。

多模态 AI 搜索：进行多模态信息检索，提升搜索效率。

语音搜索：在通话时进行语音搜索，提供更便捷的查询方式。

满血版 o1 API：o1 模型 API 正式发布，降低使用成本，并集成函数调用、结构化输出等功能。

电话沟通服务：通过电话与 ChatGPT 进行通话，扩大 AI 服务的使用场景。

ChatGPT 集成 WhatsApp：在 WhatsApp 上与 ChatGPT 交流，提供更便捷的聊天体验。

Mac 桌面版 ChatGPT 集成多项应用：桌面版 ChatGPT 推出跨应用协作功能，支持与主流开发环境集成，提升工作效率。

o3和o3mini模型：OpenAI 推出的全新推理模型，预计在明年发布，性能超越 o1，在多项基准测试中表现优异。

Day 1：OpenAI发布满血版o1和200美金的ChatGPT Pro会员

满血版o1：比 o1-preview 更智能、更快，支持多模态功能，即将登陆API等功能。

200美金的ChatGPT Pro会员：无限制使用满血版 o1、o1-mini、GPT-4o和高级语言视频对话功能、一个月500次Sora视频生成次数，可以使用比满血版更智能的o1 Pro。

观众评价：许多用户对o1正式版的性能提升表示认可，但对ChatGPT Pro的高定价提出质疑，认为价格过高，不过随着后续ChatGPT功能的发布，也有人认为物有所值。

Day 2：待发布强化学习微调API，把强化学习的门槛打下来了

强化微调（RFT）允许用户基于自己的数据集微调模型，以解决特定领域问题，使其成为特定领域的专家。

强化微调与传统监督微调不同，不仅模仿输入，还利用强化学习算法优化模型推理能力，仅需少量数据即可实现显著提升。

OpenAI 计划在 2024 年初向公众开放 RFT，但目前仅通过强化微调研究计划向研究机构、高校和企业提供有限访问权限。

观众评价：该技术被认为将降低强化学习的门槛，推动AI代理的发展，受到业内人士的认可。

Day 3：OpenAI 正式发布 AI 视频生成工具 Sora

Sora能通过文本直接生成最多20秒1080P视频，这也是全球生成时长最高的视频模型之一。

同时支持文本+图片/视频多种组合生成视频。

除了视频生成，此次发布的Sora还搭载强大的视频编辑功能。

Remix（重混）：可替换、删除或重新构想视频中的元素Re-cut（重新剪辑）：帮助用户选择最佳片段，并向前或向后延伸视频。

Story board（故事面板）：能在时间线上编辑各个时间段不同的视频，最后将它们串联在一起。

Loop（循环）：剪辑并创建首尾无缝衔接的循环视频。

Blend（混合）：将两个生成的视频融合在一起。

Style Presets（风格预设）：用户可以将生成的视频转换为不同的风格。

观众评价：Sora的发布引起了广泛关注，但用户反馈其生成的视频质量不及预期，存在物理规律处理不当等问题，被认为综合实力不如其他同类产品。

Day 4：正式开放 Canvas，支持 Python 编码

可在Canvas中的文档中提出建议、润色文档、检查语法、添加表情。

同时支持运行Python代码并已整合进自定义GPTs功能中。

观众评价：Canvas被视为AI版的Google Docs，集智能写作、代码协作和AI智能体于一体，展示了OpenAI超越聊天机器人的产品野心，受到不少用户好评。

Day 5： ChatGPT 集成到苹果操作系统

Siri智能化升级：Siri可智能判断复杂或需要创意的请求，并交由ChatGPT处理，操作前需确认，充分保障隐私。支持Siri指令直接调用ChatGPT。

相机AI视觉：长按相机控制键启动视觉智能，可提问让ChatGPT分析图像信息

Mac系统级集成：启用Apple Intelligence和ChatGPT扩展后，可在几乎所有应用中使用ChatGPT。

文档处理：打开PDF等文档后，用户可使用Siri提问，ChatGPT将分析文档并回答，还可生成摘要、关键词和图表等。

观众评价：用户对ChatGPT与苹果系统的深度集成表示期待，认为这将提升设备的智能化体验，不过值得注意的是，当天刚集成到苹果系统，OpenAI的服务器就崩了。

Day 6：OpenAI发布高级语音模式新功能,可视频对话和实时屏幕共享

在高级语音模式中，不仅加入了视频聊天，而且还有限定版圣诞老人语音，同时可通过设备共享摄像头摄取到的内容，然后和「Her」实时视频对话！

观众评价：ChatGPT终于睁开眼睛了，可进行更深层次的交互，但也有部分用户担心隐私和安全问题。

Day 7：推出 Projects功能，ChatGPT 交互再升级

ChatGPT上新增“文件夹”功能，通过新建Projects可组织和管理自己在ChatGPT的聊天，如在ChatGPT上快速新建一个Project，然后添加文件或者个性化的指令。

直播过程中，惊现AGI文件夹，就是最后一天推出的全新的推理模型o3。

观众评价：该功能被认为提升了ChatGPT的可用性，不过可能由于漏出的AGI文件夹，纷纷群嘲OpenAI只会营销。

Day 8：优化AI搜索功能，可实时通话搜索

AI搜索速度更快，可搜索出多模态信息，而且还支持在通话时进行语音搜索。

此外，搜索功能开始向所有免费用户推出。

观众评价：不少网友对语音搜索表示强烈的兴趣，认为通过语音搜索将进一步加深与用户的交互。

Day 9：OpenAI 开放满血 o1 模型 API，成本暴降 60%

o1模型API正式发布，实时API支持WebRTC功能。

新版API集成了强大功能：函数调用、结构化输出、开发者消息管理以及推理工作量控制等。

与之前的预览版本相比，o1模型API的思考成本降低了60%，并附带高级视觉处理能力。

此外，GPT-4o的音频处理成本下降60%，o1-mini版本价格暴降10倍，性价比直线上升！

全新偏好微调方法同步上线，通过直接偏好优化算法，大模型可精准掌握用户偏好风格。

观众评价：开发者的福利局，特别是o1满血版API的发布，不过有人吐槽为什么不和满血版o1一起发布。

Day10：新增电话服务功能，老年机也可以用ChatGPT

可使用美国电话拨打1-800-242-8478与ChatGPT进行通话，同时全球用户都能在WhatsApp上和ChatGPT进行交流。

观众评价：与我无瓜，大概很少人会打电话给ChatGPT。

Day11：桌面版ChatGPT推出应用协作功能

跨应用协作能力：通过快捷键快速调用ChatGPT，与当前使用的应用程序无缝连接。例如，与Warp终端集成，直接生成代码命令；在Notion中，根据文档上下文智能生成内容。

代码与IDE深度集成：全面支持主流开发环境（如Xcode、VS Code、JetBrains、MATLAB等），帮助开发者生成、优化和调试代码，做你的编程助手。

新增高级语音模式：引入语音交互功能，用户可通过语音与ChatGPT协作，处理文档、编辑内容或优化工作流程。

观众评价：开发者的福音，大部分都是和编程应用写作，不过目前能协作的应用相对较少。

Day12：OpenAl推出全新推理模型o3，实力远超o1

推出全新推理模型o3和o3mini，预计明年一月份发布o3mini，o3随后。

在多项基准测试中，o3再次刷新SOTA，就数学、代码、软件工程等领域，完全超越了o1！

同时在ARC-AGI和最难数学测试的EpochAI Frontier Math，取得目前大模型领域最好成绩。

o3-mini 则在保持智能的同时优化了性能和成本，和mini系列一样追求性价比。

同时引入低、中和高推理功能，在编程、数学、博士级科学等基准测试上，不输o1模型。

观众评价：能力超级强大，同时不少人认为o3模型已经达到AGI，但是不少人持反对意见。

OpenAI的年度直播刚刚落下帷幕，推出了一系列新功能，包括我们期待已久的Sora、完整版o1，以及在最后一天压轴出场的o3模型。

但整个的直播热度从一天开始就开始持续走低，甚至快要哑火了，如果不是最后一天放出o3，小编有理由觉得这场马拉松式的直播完全就是没火硬整。

反观有活的是隔壁的Google，在这十二天可正是动作不断，有超快超强的Gemini 2.0 Flash Thinking模型、直接碾压Sora的Veo 2、以及智能体项目Project Astra。

与此同时，今天OpenAI被爆出GPT-5两次训练均以失败告终。

面对快速崛起的Google和在编程领域一直领先ChatGPT的Claude，OpenAI的王者地位似乎岌岌可危。

更有人坦言：全球最大的AI初创公司似乎快要没有护城河了。

扫码邀请进群，我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型，顺便学一些AI搞钱技能。

往期文章回顾

最全！ OpenAI 12天直播大戏合集（文字+视频）

热搜

热门跟贴

热搜

热门跟贴

相关推荐

传OpenAI即将上新:自动搞定餐厅预订和旅行规划

微软AI模型MatterGen能根据需求生成新材料

小白商业观丨当国产AI叫板OpenAI：看见软件创新的价值

狂砸3.6万亿组建巨鳄联盟！OpenAI猛虎下山，谁赢麻了？

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

为什么只有AI编程成功落地？

12名工程师，估值190亿，AI黑马的梦幻故事

无直接数据可用，AI怎么学会干活？微软揭秘AI从语言到行动的进化

零基础入门Python机器学习，复现多个顶刊案例！

项大师一眼就看出来，黄仁勋不懂人工智能应用，最多是个小作坊

国产大模型DeepSeek V3一夜之间刷屏，训练成本仅需280万GPU小时

UC伯克利等提出具身智能「动作Tokenizer」，效率飙升5倍！

2025商业新愿景｜金山办公CEO章庆元：让AI成为每个企业的中枢神经

钛媒体科股早知道：全国首个异构人形机器人训练场正式启用，开启具身智能新篇章

百度亮出多模态AI创作大招，背靠文库9000万月活，瞄准AI杀手级应用

科氪 | 解放平面设计师生产力，WHEE推出“AI中文海报“

Momenta曹旭东：智能驾驶竞争，两年内定格局｜36氪专访

数据整合与应用是具身智能走向产业的关键

抢票软件到底好不好用？加速包真好使吗？这些风险要留意

打赢这一仗TikTok还有很多仗上 #tiktok #特朗普 #美国