硅基日报：GPT-5.2 API 上线首日调用量破万亿；宇树首发人形机器人「App Store」

硅基观察Pro

2025-12-15 19:48 ·北京 ·优质互联网领域创作者

12 月 13 日，OpenAI CEO Sam Altman 宣布，GPT-5.2 在上线首日，该模型 API 调用量突破万亿，增长迅速。

12月13日消息，宇树科技宣布了一项重磅功能——首发人形机器人 App Store 。这个应用商店内包含用户广场、动作库等内容，用户可以在其中自行下载各项动作和预设，一键 get 复杂操作。

大模型

1）OpenAI 奥特曼：GPT-5.2 API 上线首日调用量破万亿

日前，OpenAI 正式发布了其最新模型 GPT-5.2 系列，并且该模型诞生在公司进入「红色警戒（code red）」状态下，以应对 Google 前不久发布的 Gemini3。

12 月 13 日，OpenAI CEO Sam Altman 宣布，GPT-5.2 在上线首日，该模型 API 调用量突破万亿，增长迅速。

AI应用

1）Google 翻译推出新 AI「同声传译」功能

近期，Google Translate 文本翻译正式宣布，其将结合 Gemini 强大的翻译能力，推出一项耳机实时语音翻译的测试版功能。

该功能因集成在Google 翻译 App 中，因此能够实现适配多款耳机。用户只需要佩戴上耳机，并打开 App 的实时翻译，即可获得单向的「同声传译」（翻译讲话者的语言至耳机中）。

2）豆包手机助手辟谣“侵犯用户隐私”

针对近期网友关于豆包手机助手，能够通过特殊权限，获取银行安全键盘等受保护内容，相关的质疑。

豆包团队在官方公众号，发布了详细的技术说明进行辟谣。此前有观点称，豆包手机应用能利用系统底层权限，绕过上层API 直接从 GPU 缓冲区获取图像数据。对此，豆包方面明确表示，这是对技术实现的错误解读，强调豆包手机助手采用的是系统原生截屏接口。

豆包手机助手严格遵循应用的Secure 标记，从技术底层上无法截取银行 APP 等，声明受保护的界面内容。关于引发争议的 READ_FRAME_BUFFER 权限用途，说明中进行了具体拆解。

该权限是为了获取运行在“虚拟屏空间”中的三方应用截图，以供云端大模型进行视觉理解与推理，但该过程仍然无法读取被设置为 Secure 的内容。豆包进一步披露了其基于视觉的 AI 操作原理，即用户指令 -> 截屏上云 -> 模型推理 -> 手机执行的循环，每步操作间隔约为 3 秒钟。

官方解释称，由于图像分析所需的大模型参数量巨大，受限于当前芯片性能，必须上传云端处理，这也是目前国内多家手机厂商AI 助手的通用实现方法。豆包承诺，上传的截屏仅用于即时推理，任务完成后不会在云端存储。

3）宇树首发人形机器人「App Store」

12月13日消息，宇树科技宣布了一项重磅功能——首发人形机器人 App Store 。这个应用商店内包含用户广场、动作库等内容，用户可以在其中自行下载各项动作和预设，一键 get 复杂操作。

比如目前公测已经首发了搞笑动作、扭扭舞、李小龙三大预设。未来随着官方的开发，以及其他开发者、用户的分享，将会建立一个庞大的数据库，普通用户可以体验到的内容也能越来越丰富。

PS：如果你对AI大模型领域有独特的看法，欢迎扫码加入我们的大模型交流群。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴