ElevenLabs推出音乐生成模型Eleven Music

专门开发各种AI音频产品的ElevenLabs在本周二（8/5）发布了Eleven Music，这是个文本转音乐模型，能够生成任何风格的录音室等级音乐，同时提供免费与付费版本，后者可应用于商业上。

Eleven Music是在2022年由Mati Staniszewski与Piotr Dąbkowski在纽约共同创立，其中，Staniszewski曾是Palantir部署策略师，Dąbkowski则曾为Google的机器学习工程师，他们两个都是波兰人，创业灵感来自于波兰电影的配音质感低落，因而想打造音质更自然流畅的语音AI系统。所开发的平台已支持文本转语音、声音克隆、文本生成声音及自动配音等。最近一次的融资是今年1月底完成的1.8亿美元的C轮融资，完成后的估值为33亿美元。

Eleven Music能够呈现用户所描述的各种音乐流派、风格或结构；也能选择人声或乐器；目前支持英文、西班牙文、德文及日文等；也允许用户在生成之后编辑部分或整首音乐的声音与歌词。

在该实验所展示的例子中，在下了“梦幻、迷幻、缓慢独立摇滚、有空间感的人声、复古键盘乐器、朗朗上口的副歌、怀旧及国歌”等提示之后，Eleven Music就能生成足以公开发布的音乐。它所生成的音乐长度介于10秒至5分钟之间，采用MP3格式，采样率为音乐CD等级的44.1kHz，比特率则落在128至192kbps之间。

ElevenLabs表示，Eleven Music是与唱片公司、出版社及艺术家合作构建的，几乎可用于所有商业用途，从电视、电影、电视、播客到社交媒体视频等，或是从广告到游戏。

Eleven Music所提供的订阅方案从免费到每月1,320美元不等，其中，免费版不可商用，每月5美元的Starter方案只支持社交媒体及广告等商业用途，更广泛的商业用途则必须订阅每月11美元、Creator方案以上的版本。

此外，不管是免费版或是付费版都必须遵守Eleven Music的服务条款，明文规定用户不得利用它来创建商业音乐库；也不能应用在武器、禁药、成人娱乐、宗教及政府宣传上；也不得在输入提示中使用任何艺人的名字、任何歌曲名称、任何专辑名称或任何音乐出版商的名字。

华尔街日报（WSJ）引用Futurum Group首席执行官Daniel Newman的看法指出，过去许多广告配乐或版权音乐都需经过昂贵且复杂的授权程序，AI的出现让它们能以远低于传统成本的费用取得，对资源有限的公司格外有利。