今日,MiniMax宣布将MiniMaxSpeech语音模型和Music音乐模型的开放平台接口进行深度封装,并正式上架至OpenClaw生态中。这一举措使得小龙虾(AI助手)能够在飞书、企业微信、钉钉等IM平台中实现定制音色、语音回复消息,同时具备创作完整歌曲、不同风格的纯音乐以及人声哼唱的demo的能力。
MiniMax将文字转语音、音色设计等功能集成在VoiceMaker技能中,内置40+种语言和近百种预置音色,并支持自动切分脚本,实现多重语音、多情感的段落配音。用户还可以通过自然语言描述心中想要的音色,实现对音色多维度的精准创造。此外,MusicMaker技能赋予了小龙虾音乐创作能力,无论是流行音乐、纯音乐还是哼唱旋律,都能轻松创作。对于有更精细化创作需求的用户,团队还提供了MusicExpert技能,可以在Clawhub中自动添加结构化标签,并提供不同乐曲段落的方案。
用户可以在OpenClaw中让小龙虾学习这两个Skill,或在MaxClaw中直接体验,也可以在已配对的IM软件中发送Skill和指令。初次使用时,用户需下载对应Skill的zip文件,在MaxClaw对话框中上传,并通过自然语言沟通提供APIKey以加载对应能力。通过指令技巧和参数配置,小龙虾可以直接在飞书中以音频消息的形式发送内容。

