IT之家 3 月 9 日消息,今日,MiniMax 宣布将 MiniMax Speech 语音模型和 Music 音乐模型的开放平台接口进行了深度封装,并正式上架到了 OpenClaw 生态中。

IT之家从官方介绍获悉,通过在 Clawhub 中学习新 Skill,你的小龙虾不仅可以在飞书、企业微信、钉钉等 IM 中拥有定制音色、语音回复消息,还能够创作完整歌曲、不同风格的纯音乐、以及人声哼唱的 demo,变成一个既会说话又会唱歌的全能 AI 搭子。

打开网易新闻 查看精彩图片

MiniMax 将文字转语音、音色设计等强大功能集合在了 Voice Maker 技能中。小龙虾通过学习并成功验证 MiniMax API Key 后,即可解锁“语言大师”身份。

它不仅内置了 40+ 种语言和近百种预置音色,还支持自动切分脚本,轻松搞定多重语音、多情感的段落配音。与此同时,团队将音色设计(Voice Design)功能也集成到了 Skill 中。用户可以直接用自然语言描述心中想要的音色,实现对音色多维度的精准创造。

打开网易新闻 查看精彩图片

此外,在学习了 Music Maker 技能并验证 API Key 后,小龙虾就拥有了音乐创作能力。无论是一首长达 5 分钟的完整流行音乐、一段用来放松的纯音乐,还是随口的一段哼唱旋律,它都能轻松拿捏。

如果用户对歌曲有分段落、更加精细化的创作需求,该团队另在 Clawhub 也上传 「Music Expert」Skill ,可以对结构化标签进行自动添加,并自动给出不同乐曲段落的方案。

除了在 OpenClaw 让你的小龙虾学习这两个 Skill 外,也可以在 MaxClaw 中直接体验,或者在已配对的 IM 软件(飞书、企业微信、钉钉等)中发送 Skill 和指令。

初次使用,下载对应 Skill 的 zip 文件,在 MaxClaw 对话框中上传,通过自然语言沟通,提供 API Key 即可在 MaxClaw 中加载对应能力。通过指令技巧和参数配置,你的小龙虾也可以绕过传统的文件形式,直接在飞书中以音频消息的形式向你发送内容。