作者|子川
来源|AI先锋官
近日,随着o3模型的压轴出场,OpenAI的年度大秀算是彻底落下帷幕。
还没看过OpenAI直播或以及忘记了发布啥功能的小伙伴,赶紧坐上小编的车,一起来盘点此次OpenAI 12天直播到底都发布了啥?
省流版:
01
完整版 o1 模型:OpenAI 推出的 o1 模型正式版,具备更强的推理和多模态处理能力。
02
o1 Pro 模式:o1 模型的高级版本,针对复杂问题提供更深入的分析和更高质量的解答。
03
ChatGPT Pro 会员:每月 200 美元的订阅服务,提供对 OpenAI 最新模型(如 o1、o1-mini、GPT-4o)和高级语音功能的无限制访问。
04
强化微调(Reinforcement Fine-Tuning,RFT)技术:允许用户使用少量数据对模型进行微调,以解决特定领域问题,提升模型在特定任务上的表现。
05
Sora:AI 视频生成工具,可根据文本生成最长 20 秒的 1080P 视频,并提供多种视频编辑功能。
06
Canvas 升级:OpenAI 的协作平台,支持在文档中提出建议、润色、检查语法、添加表情,并可运行 Python 代码。
0 7
ChatGPT 集成苹果系统:ChatGPT 与苹果操作系统深度集成,提升 Siri 的智能化水平,并引入相机 AI 视觉功能。
08
高级语音模式增加视觉能力:在高级语音模式中,新增视频聊天和实时屏幕共享功能,提升人机交互体验。
09
新增圣诞老人语言:在高级语音模式中新增圣诞老人声音。
10
Projects 功能:在 ChatGPT 中新增“文件夹”功能,帮助用户组织和管理聊天内容和相关资料。
11
多模态 AI 搜索:进行多模态信息检索,提升搜索效率。
12
语音搜索:在通话时进行语音搜索,提供更便捷的查询方式。
13
满血版 o1 API:o1 模型 API 正式发布,降低使用成本,并集成函数调用、结构化输出等功能。
14
电话沟通服务:通过电话与 ChatGPT 进行通话,扩大 AI 服务的使用场景。
15
ChatGPT 集成 WhatsApp:在 WhatsApp 上与 ChatGPT 交流,提供更便捷的聊天体验。
16
Mac 桌面版 ChatGPT 集成多项应用:桌面版 ChatGPT 推出跨应用协作功能,支持与主流开发环境集成,提升工作效率。
17
o3和o3mini模型:OpenAI 推出的全新推理模型,预计在明年发布,性能超越 o1,在多项基准测试中表现优异。
Day 1:OpenAI发布满血版o1和200美金的ChatGPT Pro会员
满血版o1:比 o1-preview 更智能、更快,支持多模态功能,即将登陆API等功能。
200美金的ChatGPT Pro会员: 无限制使用 满血版 o1、o1-mini、GPT-4o和高级语言视频对话功能、一个月500次Sora视频生成次数,可以使用比满血版更智能的o1 Pro。
观众评价:许多用户对o1正式版的性能提升表示认可,但对ChatGPT Pro的高定价提出质疑,认为价格过高,不过随着后续ChatGPT功能的发布,也有人认为物有所值。
Day 2:待发布强化学习微调API,把强化学习的门槛打下来了
强化微调(RFT)允许用户基于自己的数据集微调模型,以解决特定领域问题,使其成为特定领域的专家。
强化微调与传统监督微调不同,不仅模仿输入,还利用强化学习算法优化模型推理能力,仅需少量数据即可实现显著提升。
OpenAI 计划在 2024 年初向公众开放 RFT,但目前仅通过强化微调研究计划向研究机构、高校和企业提供有限访问权限。
观众评价:该技术被认为将降低强化学习的门槛,推动AI代理的发展,受到业内人士的认可。
Day 3:OpenAI 正式发布 AI 视频生成工具 Sora
Sora能通过文本直接生成最多20秒1080P视频,这也是全球生成时长最高的视频模型之一。
同时支持文本+图片/视频多种组合生成视频。
除了视频生成,此次发布的Sora还搭载强大的视频编辑功能。
Remix(重混):可替换、删除或重新构想视频中的元素Re-cut(重新剪辑):帮助用户选择最佳片段,并向前或向后延伸视频。
Story board(故事面板):能在时间线上编辑各个时间段不同的视频,最后将它们串联在一起。
Loop(循环):剪辑并创建首尾无缝衔接的循环视频。
Blend(混合):将两个生成的视频融合在一起。
Style Presets(风格预设):用户可以将生成的视频转换为不同的风格。
观众评价:Sora的发布引起了广泛关注,但用户反馈其生成的视频质量不及预期,存在物理规律处理不当等问题,被认为综合实力不如其他同类产品。
Day 4:正式开放 Canvas,支持 Python 编码
可在Canvas中的文档中提出建议、润色文档、检查语法、添加表情。
同时支持运行Python代码并已整合进自定义GPTs功能中。
观众评价:Canvas被视为AI版的Google Docs,集智能写作、代码协作和AI智能体于一体,展示了OpenAI超越聊天机器人的产品野心,受到不少用户好评。
Day 5: ChatGPT 集成到苹果操作系统
Siri智能化升级:Siri可智能判断复杂或需要创意的请求,并交由ChatGPT处理,操作前需确认,充分保障隐私。支持Siri指令直接调用ChatGPT。
相机AI视觉:长按相机控制键启动视觉智能,可提问让ChatGPT分析图像信息
Mac系统级集成:启用Apple Intelligence和ChatGPT扩展后,可在几乎所有应用中使用ChatGPT。
文档处理:打开PDF等文档后,用户可使用Siri提问,ChatGPT将分析文档并回答,还可生成摘要、关键词和图表等。
观众评价:用户对ChatGPT与苹果系统的深度集成表示期待,认为这将提升设备的智能化体验,不过值得注意的是,当天刚集成到苹果系统,OpenAI的服务器就崩了。
Day 6:OpenAI发布高级语音模式新功能,可视频对话和实时屏幕共享
在高级语音模式中,不仅加入了视频聊天,而且还有限定版圣诞老人语音,同时可通过设备共享摄像头摄取到的内容,然后和「Her」实时视频对话!
观众评价:ChatGPT终于睁开眼睛了,可进行更深层次的交互,但也有部分用户担心隐私和安全问题。
Day 7:推出 Projects功能,ChatGPT 交互再升级
ChatGPT上新增“文件夹”功能,通过新建Projects可组织和管理自己在ChatGPT的聊天,如在ChatGPT上快速新建一个Project,然后添加文件或者个性化的指令。
直播过程中,惊现AGI文件夹,就是最后一天推出的全新的推理模型o3。
观众评价:该功能被认为提升了ChatGPT的可用性,不过可能由于漏出的AGI文件夹,纷纷群嘲OpenAI只会营销。
Day 8:优化AI搜索功能,可实时通话搜索
AI搜索速度更快,可搜索出多模态信息,而且还支持在通话时进行 语音搜索。
此外,搜索功能开始向所有免费用户推出。
观众评价:不少网友对语音搜索表示强烈的兴趣,认为通过语音搜索将进一步加深与用户的交互。
Day 9:OpenAI 开放满血 o1 模型 API,成本暴降 60%
o1模型API正式发布,实时API支持WebRTC功能。
新版API集成了强大功能:函数调用、结构化输出、开发者消息管理以及推理工作量控制等。
与之前的预览版本相比,o1模型API的思考成本降低了60%,并附带高级视觉处理能力。
此外,GPT-4o的音频处理成本下降60%,o1-mini版本价格暴降10倍,性价比直线上升!
全新偏好微调方法同步上线,通过直接偏好优化算法,大模型可精准掌握用户偏好风格。
观众评价:开发者的福利局,特别是o1满血版API的发布,不过有人吐槽为什么不和满血版o1一起发布。
Day10:新增电话服务功能,老年机也可以用ChatGPT
可使用美国电话拨打1-800-242-8478与ChatGPT进行通话,同时全球用户都能在WhatsApp上和ChatGPT进行交流。
观众评价:与我无瓜,大概很少人会打电话给ChatGPT。
Day11:桌面版ChatGPT推出应用协作功能
跨应用协作能力: 通过快捷键快速调用ChatGPT,与当前使用的应用程序无缝连接。例如,与Warp终端集成,直接生成代码命令;在Notion中,根据文档上下文智能生成内容。
代码与IDE深度集成:全面支持主流开发环境(如Xcode、VS Code、JetBrains、MATLAB等),帮助开发者生成、优化和调试代码,做你的编程助手。
新增高级语音模式:引入语音交互功能,用户可通过语音与ChatGPT协作,处理文档、编辑内容或优化工作流程。
观众评价:开发者的福音,大部分都是和编程应用写作,不过目前能协作的应用相对较少。
Day12:OpenAl推出全新推理模型o3,实力远超o1
推出全新推理模型o3和o3mini,预计明年一月份发布o3mini,o3随后。
在多项基准测试中,o3再次刷新SOTA,就数学、代码、软件工程等领域,完全超越了o1!
同时在ARC-AGI和最难数学测试的EpochAI Frontier Math,取得目前大模型领域最好成绩。
o3-mini 则在保持智能的同时优化了性能和成本,和mini系列一样追求性价比。
同时引入低、中和高推理功能,在编程、数学、博士级科学等基准测试上,不输o1模型。
观众评价:能力超级强大,同时不少人认为o3模型已经达到AGI,但是不少人持反对意见。
OpenAI的年度直播刚刚落下帷幕,推出了一系列新功能,包括我们期待已久的Sora、完整版o1,以及在最后一天压轴出场的o3模型。
但整个的直播热度从一天开始就开始持续走低,甚至快要哑火了,如果不是最后一天放出o3,小编有理由觉得这场马拉松式的直播完全就是没火硬整。
反观有活的是隔壁的Google,在这十二天可正是动作不断,有超快超强的Gemini 2.0 Flash Thinking模型、直接碾压Sora的Veo 2、以及智能体项目Project Astra。
与此同时,今天OpenAI被爆出GPT-5两次训练均以失败告终。
面对快速崛起的Google和在编程领域一直领先ChatGPT的Claude,OpenAI的王者地位似乎岌岌可危。
更有人坦言:全球最大的AI初创公司似乎快要没有护城河了。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
热门跟贴