专门开发各种AI音频产品的ElevenLabs在本周二(8/5)发布了Eleven Music,这是个文本转音乐模型,能够生成任何风格的录音室等级音乐,同时提供免费与付费版本,后者可应用于商业上。
Eleven Music是在2022年由Mati Staniszewski与Piotr Dąbkowski在纽约共同创立,其中,Staniszewski曾是Palantir部署策略师,Dąbkowski则曾为Google的机器学习工程师,他们两个都是波兰人,创业灵感来自于波兰电影的配音质感低落,因而想打造音质更自然流畅的语音AI系统。所开发的平台已支持文本转语音、声音克隆、文本生成声音及自动配音等。最近一次的融资是今年1月底完成的1.8亿美元的C轮融资,完成后的估值为33亿美元。
Eleven Music能够呈现用户所描述的各种音乐流派、风格或结构;也能选择人声或乐器;目前支持英文、西班牙文、德文及日文等;也允许用户在生成之后编辑部分或整首音乐的声音与歌词。
在该实验所展示的例子中,在下了“梦幻、迷幻、缓慢独立摇滚、有空间感的人声、复古键盘乐器、朗朗上口的副歌、怀旧及国歌”等提示之后,Eleven Music就能生成足以公开发布的音乐。它所生成的音乐长度介于10秒至5分钟之间,采用MP3格式,采样率为音乐CD等级的44.1kHz,比特率则落在128至192kbps之间。
ElevenLabs表示,Eleven Music是与唱片公司、出版社及艺术家合作构建的,几乎可用于所有商业用途,从电视、电影、电视、播客到社交媒体视频等,或是从广告到游戏。
Eleven Music所提供的订阅方案从免费到每月1,320美元不等,其中,免费版不可商用,每月5美元的Starter方案只支持社交媒体及广告等商业用途,更广泛的商业用途则必须订阅每月11美元、Creator方案以上的版本。
此外,不管是免费版或是付费版都必须遵守Eleven Music的服务条款,明文规定用户不得利用它来创建商业音乐库;也不能应用在武器、禁药、成人娱乐、宗教及政府宣传上;也不得在输入提示中使用任何艺人的名字、任何歌曲名称、任何专辑名称或任何音乐出版商的名字。
华尔街日报(WSJ)引用Futurum Group首席执行官Daniel Newman的看法指出,过去许多广告配乐或版权音乐都需经过昂贵且复杂的授权程序,AI的出现让它们能以远低于传统成本的费用取得,对资源有限的公司格外有利。