打开网易新闻 查看精彩图片

12 月 13 日,OpenAI CEO Sam Altman 宣布,GPT-5.2 在上线首日,该模型 API 调用量突破万亿,增长迅速。

12月13日消息,宇树科技宣布了一项重磅功能——首发人形机器人 App Store 。这个应用商店内包含用户广场、动作库等内容,用户可以在其中自行下载各项动作和预设,一键 get 复杂操作。

大模型

1)OpenAI 奥特曼:GPT-5.2 API 上线首日调用量破万亿

日前,OpenAI 正式发布了其最新模型 GPT-5.2 系列,并且该模型诞生在公司进入「红色警戒(code red)」状态下,以应对 Google 前不久发布的 Gemini3。

12 月 13 日,OpenAI CEO Sam Altman 宣布,GPT-5.2 在上线首日,该模型 API 调用量突破万亿,增长迅速。

AI应用

1)Google 翻译推出新 AI「同声传译」功能

近期,Google Translate 文本翻译正式宣布,其将结合 Gemini 强大的翻译能力,推出一项耳机实时语音翻译的测试版功能。

该功能因集成在Google 翻译 App 中,因此能够实现适配多款耳机。用户只需要佩戴上耳机,并打开 App 的实时翻译,即可获得单向的「同声传译」(翻译讲话者的语言至耳机中)。

2)豆包手机助手辟谣“侵犯用户隐私”

针对近期网友关于豆包手机助手,能够通过特殊权限,获取银行安全键盘等受保护内容,相关的质疑。

豆包团队在官方公众号,发布了详细的技术说明进行辟谣。此前有观点称,豆包手机应用能利用系统底层权限,绕过上层API 直接从 GPU 缓冲区获取图像数据。对此,豆包方面明确表示,这是对技术实现的错误解读,强调豆包手机助手采用的是系统原生截屏接口。

豆包手机助手严格遵循应用的Secure 标记,从技术底层上无法截取银行 APP 等,声明受保护的界面内容。关于引发争议的 READ_FRAME_BUFFER 权限用途,说明中进行了具体拆解。

该权限是为了获取运行在“虚拟屏空间”中的三方应用截图,以供云端大模型进行视觉理解与推理,但该过程仍然无法读取被设置为 Secure 的内容。豆包进一步披露了其基于视觉的 AI 操作原理,即用户指令 -> 截屏上云 -> 模型推理 -> 手机执行的循环,每步操作间隔约为 3 秒钟。

官方解释称,由于图像分析所需的大模型参数量巨大,受限于当前芯片性能,必须上传云端处理,这也是目前国内多家手机厂商AI 助手的通用实现方法。豆包承诺,上传的截屏仅用于即时推理,任务完成后不会在云端存储。

3)宇树首发人形机器人「App Store」

12月13日消息,宇树科技宣布了一项重磅功能——首发人形机器人 App Store 。这个应用商店内包含用户广场、动作库等内容,用户可以在其中自行下载各项动作和预设,一键 get 复杂操作。

比如目前公测已经首发了搞笑动作、扭扭舞、李小龙三大预设。未来随着官方的开发,以及其他开发者、用户的分享,将会建立一个庞大的数据库,普通用户可以体验到的内容也能越来越丰富。

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。