前文:
文中我提到:“Qwen3.5-Omni有原生联网搜索支持与工具调用能力,加上输出音频的音色支持,完全可以复刻出一个大模型加持的智能音箱了(Qwen 3.5-Omni 有实时版本,也支持联网搜索)”
确实是可行的,我用实时版API结合本地跑的语音唤醒模型做了一个可以把蓝牙音箱变智能的Demo,部署在我24小时开机的Mac mini上,外接麦克风做语音输入,小千小千唤醒它就可以直接提问,涉及互联网信息它会实时搜索后再回答!
我的视频号大家顺手关注➕一下bei
可优化的地方还有很多,目前不确定是否网络问题,延迟有点高。话说,这个模型可以开个10B以下的开源版本就彻底完美了,直接全部本地跑,没有调Api的网络延迟。
Vibe coding 的代码,只能说能跑,再优化一下开源出来。
热门跟贴