突破 AI 极限,OpenAI 重磅发布 o3
苹果智能总结新闻出大错
极越公关负责人徐继业被开除
GPT 系列开创人从 OpenAI 离职
与 DeepMind 合作的机器人即将商用
「银狐」木马病毒出现新变种
小红书大量封号,官方回应
SK 海力士获得博通供应内存的大订单
坠崖车主感谢小米 SU7
李想「回归」,理想汽车举行「AI Talk」活动
OpenAI 前首席研究官:面对 AI 浪潮,记得关注 AI 人才的培养
周末也值得一看的新闻 突破 AI 极限,OpenAI 重磅发布 o3
今日凌晨,
此次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。
o3 系列包含两款重磅模型:
OpenAI o3:旗舰版本,具备强大的性能表现
OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比
据官方介绍,o3 在多领域迎来全面提升:
在 SweepBench Verified 基准测试中, o3 达到了约 71.7% 的准确率,直接将 o1 模型甩在身后整整 20% 之多。
编码领域,o1 在编程竞赛平台 Codeforces 上的得分为 1,891。而 o3 在开足马力,延长思考时间的情况下,得分可达 2,727。
在美国数学竞赛 AIME 2024 测试中,o3 以 90.67% 的准确率完全碾压了 o1 的 83.3%。
遇上衡量博士级科学问题解答能力的 GPQA Diamond 测试,o3 取得了 87.7% 的成绩,而 o1 仅为 78%。
OpenAI 还引入了一个全新的数学测试 EpochAI Frontier Math。目前,所有现有模型在该测试上的准确率都不足 2%,而在高算力的长时间测试下,o3 却能取得超过 2,457 的分数。
ARC-AGI 方面,o3 在低算力的配置下得分 75.7 分。当要求 o3 思考更长时间,并且提高算力,o3 在相同的隐藏保留集上得分 87.5%,远超大多数真人。
o1 mini 的延续之作 o3 mini 也一同亮相。保留了 o1 mini 「具有很强的数学和编程能力,而且成本极低」的特征。
据官方介绍,o3 mini 支持低、中、高三种推理时间模式,用户可根据任务复杂度灵活调整模型的思考时间。从首批评估结果来看,在衡量编程能力的 Codeforces Elo 评分中,随着推理时间的增加,其 Elo 分数持续攀升,在中等推理时间下就已超越 o1 mini。
同时,在 AIME 数学基准测试中,其低推理模式就达到了与 o1 mini 相当的性能,中等推理模式更是超越了 o1 mini,且延时更低。
另外,应广大开发者呼声,o3 mini 模型也将全面支持函数调用、结构化输出和开发者指令等 API 功能。
o3 系列目前并不会向普通用户开放,OpenAI 计划先开放外部安全测试申请。现在,o3 mini 和 o3 的申请通道现已开放。o3 mini 预计将于 1 月向所有用户推出,完整版 o3 则将在后续发布。
本次发布会由 Sam Altman、研究高级副总裁 Mark Chen 以及研究科学家 Hongyu Ren(任泓宇)主持。值得注意的是,任泓宇本科毕业于北大,对 o1 有过基础性贡献,也是 GPT-4o 的核心开发者,曾在苹果、微软和英伟达有过丰富的研究实习经历。
苹果智能总结新闻出大错
近日,多家媒体表示,苹果所推出的 Apple Intelligence 频繁出错,甚至以误导用户的方式推送虚假信息。
12 月 19 日,据 BBC 报道,Apple Intelligence 在推送本月初美国联合健康集团(UNH)旗下联合健康保险公司 CEO 布莱恩·汤普森于纽约街头遭枪杀的报道时,将其错误提取总结成「枪手本人对自己开枪」,并最终以「BBC新闻客户端」的形式,向苹果用户进行推送。BBC 表示,Apple Intelligence 在推送错误消息时,会让人以为是 BBC 所推送。
除此之外,11 月 21 日,Apple Intelligence 还试图将纽约时报的三篇文章整合在一起,总结出了「以色列总理内塔尼亚胡被逮捕」的信息,并以「纽约时报客户端」形式推送给用户。而这篇推送其实是根据「国际刑事法院对内塔尼亚胡发出逮捕令」的报道生成,并非内塔尼亚胡已经被逮捕。
据分析,Apple Intelligence 之所以「翻车」,大概与其应用的语言大模型体量有关。其分析模型由苹果自研,其在设备端的本地模型仅有 30 亿数据,如此「小体量」导致处理信息能力自然不足。
极越公关负责人徐继业被开除
据多家媒体报道,今天上午,极越汽车通过邮件发布「员工违纪行为通报」,表示公司依据《员工手册》相关规定,予以徐继业单方解除劳动合同的处理,并通报批评。
网传截图显示,徐继业在朋友圈发文,表示在此邮件出现之前,自己并未接到任何通知,一直联系 HR 负责人和 CEO 夏一平,均处于联系不上状态。
近日,极越汽车的一位离职员工发布了一篇万字长文,直指极越内部管理和 CEO 夏一平的问题。随后徐继业朋友圈回应了此事,并表示「仆从的眼里没有英雄」,认为极越发展至今天,不仅仅是老板的问题,并反问员工是否也有责任,此回应引发大批网友热议。
12 月 20 日午间,徐继业最新朋友圈动态再被曝光,称自己已经「基本搞清楚这是个假诏」,并暗示接下来将有更多内幕信息曝光,称「回头弄点好瓜给大家尝尝」。
GPT 系列开创人从 OpenAI 离职
近日,据 The Information 报道,OpenAI 又一位元老级研究人员 Alec Radford 即将离职,寻求独立研究的机会。
作为 GPT 论文的主要作者,Alec Radford 的贡献包括了 GPT、GPT-2、CLIP 等多个重要研究,论文被引用超过 18 万次,并且参与了 GPT-2、语音模型 Whisper 以及 Dall-E 的开发——称他为 OpenAI 所有重大技术突破的「幕后推手」。
2015 年起,Alec Radford 就投身于研究卷积网络、batch norm 和 GAN 等核心技术的研究。2016 年,他加入 OpenAI,成为早期团队的一员。2017 年,划时代的论文「Attention Is All You Need」发布,改写了计算机领域接下来的走向。
目前,包括 Ilya 在内的其他早期 OpenAI 核心成员如 Mira Murati,Andrej Karpathy,Bob McGrew,John Schulman 等人,都已经悉数离职。
与 DeepMind 合作的机器人即将商用
近日,Google DeepMind 与机器人公司 Apptronik 宣布达成合作,计划共同开发能够在动态环境中运作的 AI 人形机器人。
此次合作双方希望将 Apptronik 的机器人硬件与谷歌 DeepMind 的 AI 大模型相结合,打造可以在复杂环境中工作的 AI 人形机器人。
Apptronik 成立于2016年,源自德克萨斯大学奥斯汀分校的人机中心机器人实验室,目前已开发出 15 种不同型号的机器人,其中包括 NASA 的 Valkyrie 机器人。
此次合作的重点是 Apptronik 最新推出的 Apollo 机器人,身高 1.73 米,重量 73 公斤,专为工业环境设计,能够与人类协作工作。在一段近期的 DeepMind 演示中,Apollo 机器人在 Gemini2.0 的控制下进行操作,展示了其在复杂环境中工作的能力。
同时,谷歌 DeepMind 的机器人团队在机器学习、工程和物理仿真等领域具有丰富的专业知识。团队最近展示了其 AI 模型如何帮助机器人在复杂环境中导航,使用 Gemini1.5Pro 模型时,导航任务的成功率高达 90%。
「银狐」木马病毒出现新变种
近日,国家计算机病毒应急处理中心发布预警,指出针对中国用户的 「银狐」 木马病毒出现新变种,并更新了传播方式。
变种「银狐」病毒通过伪造「财务违规通知」等钓鱼信息,在微信群中传播加密压缩包文件。用户解压后会发现包含 「银狐」 木马的可执行文件,运行后可能导致被远程控制等安全问题。该变种具有针对安全软件的攻击功能,并设置了回联地址和命令控制服务器域名。
国家计算机病毒应急处理中心建议用户不要轻信社交媒体上的官方通知,解压加密包前先进行安全性检测,发现异常情况立即切断网络并备份数据。
11 月,国家计算机病毒应急处理中心和计算机病毒防治技术国家工程实验室发现了一种名为 「银狐」 的最新木马病毒变种,通过虚构财务、税务等主题的钓鱼网页,在微信群中传播病毒下载链接。同时,对于可疑文件,可提交至国家计算机病毒协同分析平台检测。
小红书大量封号,官方回应
近日,有部份网友反馈自己的小红书账号被封禁,同时「小红书封号」相关话题也登上热搜,引发热议。
对于封号一事,小红书官方客服给出回应,称会将情况登记并进行内部反馈,并表示账号处罚情况只和账号违规程度有关。
据悉,近日小红书官方账号「薯管家」曾发布一篇「黑灰产账号治理阶段进展」的公告,公告中提到,11 月 18 日至 12 月 16 日,小红书一共处置账号 1,259,709 个,其中包括了 252 个 10 万粉丝以上和 4,941 个 1 万粉丝以上的账号。并明确指出此类账号定义:黑灰产矩阵账号主要操作方式是前期养号,后期转售账号,「换头」变现。
腾讯与荣耀达成战略合作
近日,腾讯与荣耀正式签署战略合作协议。
据官方介绍,双方将长期合作,充分发挥荣耀在终端、AI 和生态建设上的硬核实力,与腾讯在云计算、内容平台和游戏科技领域的强大资源深度结合,实现优势互补,共同成长。
双方还宣布,携手推出了「荣耀 CoMagic 编码助手」。这一工具基于腾讯云 AI 代码助手的「代码补全」和「智能对话」等关键功能开发而成,可以辅助开发人员编写、调试代码,提高开发效率。目前已经有超过 8000 名荣耀软件工程师使用 AI 辅助编程,将开发过程代码生成比例提升至 30%,代码采纳率提升至 25%。
荣耀还将于 12 月 23 日发布荣耀 Magic7 RSR。新机将首发 2 亿超感光潜望长焦,配备行业领先1G+5P浮动潜望镜组,融合行业首创双电磁对焦马达,据悉,新机长焦将搭载 1/1.4" 大底传感器,光圈大小达 f1.88。
SK 海力士获得博通供应内存的大订单
12 月 20 日,据 TheElec 报道,韩国存储芯片巨头 SK 海力士赢得了一份向博通供应 HBM 芯片的大单,但具体额度未知。
消息人士称,博通计划从 SK 海力士采购存储芯片,并将其应用到一家大型科技公司的 AI 计算芯片上。SK 海力士预计将在明年下半年供应该芯片。
此前 SK 集团会长崔泰源曾透露,英伟达 CEO 黄仁勋请求 SK 海力士提前六个月供应下一代高带宽内存芯片 HBM4。因此由于需要同时向英伟达和博通供应 HBM,SK 海力士将会调整其 DRAM 产能预测。TheElec 预计其产能将增加到 16~17 万片 300mm 晶圆。
SK 海力士在 10 月份的第三季度电话会议上表示,预计 HBM 将在第四季度占其 DRAM 业务营收的 40% 份额。随着 SK 海力士与博通达成协议,预计这一比例将进一步上升。
乐道定下月产 3 万辆,并打算引入英国市场
近日,据 Automotive News Europe 报道,蔚来计划将乐道引入欧洲,并在英国推出旗下 L60。
蔚来产品规划负责人 Eric Yu 表示,乐道品牌首先进入英国市场的原因是英国与欧盟不同,不对中国制造的电动汽车征收进口关税,这对乐道品牌「以性价比为核心」的价格策略至关重要。
同时乐道引入欧洲并没有确切时间点,但 Eric Yu 表示,当乐道月产量达 3 万辆时,蔚来将开始出口乐道 L60,时间预计会在 2025 年 2 月。
据报道,蔚来目前在欧洲的产品线主要定位于高端市场,因此欧盟的进口关税对其盈利影响较小。但预计蔚来会选择在当地生产乐道和萤火虫系列车型,以保持价格竞争力。同时,由于英国尚未建立换电基础设施,L60 初期可能不会提供换电功能。
坠崖车主感谢小米 SU7
近日,来自河南的一家四口驾驶小米 SU7 去巩义市浮戏山景区游玩,下山过程中车辆冲下二三十米高的山崖,经过翻转后被树木挡住,一家人均无生命危险。
随后,坠崖车主在社交平台发文称,「谢谢小米SU7安全,谢谢所有帮助的救援人员。」。车主提到 2024 年 10 月 24 日提车,12 月 11 日发生事故,刚提车一个月遭遇事故,车辆面临报废。车主还表示,车很扎实,安全意识也比较重要,如果要是再订的话,未来可能还会考虑。
近期,小米第二款车 YU7 的无伪装实车遭曝光。实拍图中展示了小米 YU7 正面 45 度、尾部左 45 度以及侧面,此次被拍摄到的实车颜色为官方宣传图中的深蓝色。
小米 YU7 于 12 月 9 日正式公布亮相,为小米旗下第二款车型,该款新车预计于明年 6、7 月正式上市。
机构:预计 2025 年中国新能源汽车将近 1,400 万辆
12 月 20 日,IDC 基于科技产业最新趋势,以及中国汽车市场近年来的发展历程,公布了 2025 年中国汽车市场十大洞察。
报告中指出,随着高压快充技术由 4C 向 4C+ 挺进,以及半固态电池实现装车量产,新能源车的补能短板正逐渐补齐。电池管理技术的发展扩大了电池组设计的自由度,使厂商在解决电池寿命、工况限制等问题时具备更大的创新空间。针对于插混、增程式电动车的电池研发也在各动力电池头部厂商中得到恰当的资源倾斜。IDC 预测,2025 年中国汽车市场新能源车的市场规模将接近 1,400 万辆。
同时,IDC 还提到,插电式混合动力汽车在新能源车中的占比将继续上升,增程式电动汽车也将开拓更加丰富的细分市场。此前,小鹏、智己等品牌纷纷计划在 2025 年推出增程式车型,增程式动力模式将在更加丰富的车身形态与更广泛的价位段占据一席之地。
支付宝推出 AI 创意生成平台
近日,支付宝推出 AI 创意生成平台「蚂上有创意」,将面向商家机构提供 AI 快速生成创意素材、营销广告智能分析等营销服务。
据官方介绍,在 AI 技术的加持下,「蚂上有创意」支持用口语描述就能快速生成海报、Banner、视频等内容,也支持 AI 图片优化、线稿上色、艺术字生成等功能,平台还将提供 AI 创意洞察的智能服务。商家上传营销物料后,支付宝的创意诊断模型便会对物料进行分析评估并给出优化建议,帮助商家提高投放转化率。
据悉,过去一年支付宝将 AI 全面应用于商业开放生态,共接入近 70 个业务场景,累计为生态商家机构生成 8700 万张 AI 素材。此次推出的「蚂上有创意」,则面向所有商家机构及设计师群体开放,聚焦于用 AI 让商业营销更简单。
今年 4 月,支付宝数字推广平台「灯火」宣布推出 AI 广告创意等功能,目前已覆盖数字推广平台「灯火」近 7 成的智能投放场景,相较商家自主上传素材,AI 生成广告的点击转化率提升了 4.74%。
此外,Meta、淘宝、腾讯等互联网大厂也均在开展 AI 广告的布局。今年 10 月,Meta CEO 扎克伯格表示,已有超过 100 万广告使用 AI 生成了超 1500 万条广告。腾讯 CEO 马化腾也曾在年报中表示,广告 AI 模型的改进显著提升了精准投放的效果。
李想「回归」,理想汽车举行「AI Talk」活动
12 月 20 日,理想汽车官方宣布,将于 12 月 25 日至 12 月 27 日,举行「2024 理想 AI Talk」直播,届时理想汽车 CEO 李想将出镜直播。
据官方介绍,这次直播将于每晚 8 点,对话直播 30 分钟,将解答「李想回来了!车企也能做 AI?」、「理想汽车到底谁懂智驾?」、「李想回应为什么买法拉利」等相关话题,同时李想本人也将在此次活动中「回归」。
此前,李想曾被冠以「微博之王」的称号,但自今年 3 月起在微博上一度陷入数月沉寂,其微博最新一条内容为 8 月 14 日发布。
OpenAI 前首席研究官:面对 AI 浪潮,记得关注 AI 人才的培养
近期,OpenAI 前首席研究官 Bob McGrew 与 Unsupervised Learning 频道进行了深度对话,对话提到了「GPT-5 何时到来」、「多模态 AI 如何改变世界」等问题,并且 McGrew 表示,面对 AI 浪潮,要记得关注 AI 人才的培养。
对话中,McGrew 预言,未来几年 AI 领域将迎来巨变。算力竞赛将进一步升温,视频生成模型和机器人技术将迎来爆发式增长,同时多模态 AI 将深刻改变大家的生活。同时他对 GPT-5 进行了一点预测,认为 OpenAI 有望在不大幅增加成本的情况下,持续提升 AI 模型的性能。目前,OpenAI 正专注于「测试时计算」技术,它可以在无需建设新数据中心的情况下实现算力增长。
McGrew 预测了 AI 将在各行业的运用。他认为视频生成模型将在未来两年内彻底改变电影制作方式,以及机器人技术也将在五年后迎来广泛应用。
最后,McGrew 提醒公众应该关注 AI 人才的培养。他认为,数学、编程和写作能力将是未来人才的核心竞争力,相关教育领域的投资也将获得丰厚回报。
REDMI 天玑新机即将推出
12 月 20 日,REDMI 品牌总经理王腾晒出联发科 MTK 送给小米的感谢奖牌。
根据王腾发出的照片所示,奖牌内容为联发科祝贺小米集团在天玑 8000 系上累计出货已经突破 3000 万部,并感谢小米对联发科的大力肯定。
王腾还提到,REDMI 联合联发科定制的天玑新 8 系即将推出,并表示性能更强、能效更好。
此前,联发科宣布新一代天玑芯片将于 12 月 23 日发布,届时将带来天玑 8400 处理器。天玑 8400 将采用台积电 4nm 工艺,8 核 A725 。据悉,REDMI Turbo4 将会首发天玑 8400。
《美队 4》确认引入内地
12 月 20 日,漫威影业宣布新片《美国队长 4》确认引进内地。
《美国队长 4》讲述了世界格局正在改变,曾经的「猎鹰」山姆·威尔逊正式接过美国队长的盾牌,以身入局,勇闯新世界的故事。该片由朱利叶斯·约拿执导,马尔科姆·斯拜尔曼、达兰·穆森、马修·奥尔顿编剧,安东尼·麦凯、哈里森·福特、吉安卡罗·埃斯波西托、丹尼·拉米雷斯、蒂姆·布雷克·尼尔森、丽芙·泰勒等主演的动作科幻电影。
《唐探 1900》定档大年初一
近日,陈思诚宣布电影《唐探 1900》定档 2025 年大年初一(2025 年 1 月 29 日)。
该片是《唐探》系列前传,故事背景设置在 1900 年的旧金山唐人街,围绕一起谋杀案展开。影片由陈思诚携手戴墨共同执导,主演包括刘昊然、王宝强以及张译、黄渤等知名演员。
《唐探》系列前三部电影累计票房高达 87.43 亿元。《唐探 1900》将与《哪吒之魔童闹海》等四部电影共同竞争 2025 年春节档。
✨ 是周末啊! One Fun Thing | 日本麦当劳联名 EVA 打造萌版小手办
近日,日本麦当劳宣布将与《新世纪福音战士》开展联动,推出「麦当劳 EVA 奇迹机器人」套装。
「麦当劳 EVA 奇迹机器人」套装包括零号机、初号机和 2 号机等三个可变形机器人,售价 3900 日元(约合 184 元)。
此次联动活动将持续到 2025 年 1 月 10 日,参与者需在活动期间登录日本麦当劳 APP 参与抽奖,中奖后可在 2025 年 1 月 20 日至 26 日期间前往指定店铺购买。
周末看什么 | 《好东西》
《好东西》是由邵艺辉自编自导,宋佳、钟楚曦、曾慕梅、章宇领衔主演,赵又廷、周野芒特别出演的爱情院线电影。
该片讲述了单亲妈妈王铁梅带小孩王茉莉搬到新家后,结识了邻居小叶,两位性格迥异的女性,一个坚强,一个柔软,一个擅长给人当妈,一个擅长随时撒谎,面对旧创伤和新挑战,她们彼此温暖互相慰藉的故事。
此前,2024 年 5 月,《好东西》入围 2024 微博电影之夜微博网友年度期待影片。《好东西》于 2024 年 11 月 22 日在全国上映。
买书不读指南 | 《双胞胎》
《双胞胎》由日本乐队 Sekai No Owari 钢琴手藤崎彩织所写情感类小说,其内容改编自其亲身经历。
书中讲述了 Sekai No Owari 乐队成员 Saori(藤崎彩织)和主唱深瀬慧的成长经历。只有钢琴作伴的孤独少女夏子,认识了不爱学习的月岛,经历许多陪伴与艰辛后,月岛对夏子说出了「你和我就像双胞胎。」。什么事也不会,只知道弹琴的夏子也渐渐明白了自己想要的是什么,找到了归属。
藤崎彩织为 Sekai No Owari 乐队的钢琴手。自从出道以来,藤崎彩织将敏锐感性发挥到极致的演奏获得了绝对的支持。她的写作活动也引人注目,在杂志《文学界》上连载散文《读书间奏文》。
游戏推荐 | 《星露谷物语》
《星露谷物语》是一个牧场类的RPG游戏。
故事中,玩家所扮演的角色继承了爷爷在星露谷的农场,但是手头上只有最基础的农具和少许的金钱,玩家需要靠此开始新的故事生活。
《星露谷物语》的游戏内容简单容易上手,既可以发展各种职业探索,也可以选择在湖边钓鱼度日。复古的像素画风以及温性的颜色搭配,在冬日里玩也能得到治愈。游戏还支持多人链接,无论身处何地,都能与好友一同在星露谷小镇获得快乐。
《星露谷物语》目前已上线 PC、PlayStation、Xbox、Switch、iOS 以及 Android 等各大平台。
Tomorrow's Product Award 明日产品榜单评委阵容公布
,我们邀请了 19 位评委,参与此次的明日产品榜单评选。
Tomorrow’s Product Award 是由数字潮牌爱范儿面向趋势消费者打造的年度榜单,旨在发掘过去一年最具标杆意义的「明日产品」。
榜单以「创新、改变、普惠」为核心评选标准,由爱范儿团队联合全球意见领袖,在消费电子、智能出行和人工智能三大前沿领域进行提名并评选,致敬推动行业进步与时代变革的杰出之作。
近期,爱范儿将联合陪审团对所有入围产品进行评选,于 2024 年 12 月下旬揭晓完整榜单,敬请关注。
好产品就是一颗糖
我们携手 @制糖工厂,特别推出好产品交流群,汇聚一群热爱科技和新奇好物的朋友!
如果你对 Mac mini 相关或其他新科技产品感兴趣,拥有独到见解,并热衷探索更多产品的使用可能性,那就长按下方图片,加入我们的大家庭吧!在这里,结识志趣相投的小伙伴,一起畅聊科技,解锁未来的无限可能!
热门跟贴