币界网消息,OpenAI开源了realtime-voice-component,这是一套React组件库,允许开发者将语音操控能力嵌入Web应用。用户通过麦克风说话,模型利用预定义工具直接调用应用功能,而非生成文本回复。该库基于OpenAI realtime API,搭配gpt-realtime-1.5使用,采用Apache-2.0许可。开发者用definevoicetool()注册应用动作为语音工具,createvoicecontrolcontroller()管理会话和连接,voicecontrolwidget提供启动按钮,ghostcursoroverlay显示AI操作位置,给用户视觉确认。该库定位为参考实现和教学用途,未发布到npm,readme标注「不是生产级UI框架的承诺」。
OpenAI推出语音控件,让用户轻松用声音操控App
热门跟贴