稳定的音频产生高保真的AI生成的音乐

AI产品新闻1年前 (2023)发布 yundic
274 0 0

稳定AI宣布发布其AI音频生成器,并声称它提供一流的性能。

在过去的几个月里,我们已经看到了一些性能各异的AI音频生成器,但稳定音频似乎提高了标准。

使用稳定音频,您可以输入文本提示符,它将根据提示符生成音乐或音频。我们已经从谷歌的MusicLM和Meta的AudioCraft产品中看到了这种功能。

MusicLM仍然只在Google的Test Kitchen中可用,并以24 kHz的频率生成音乐。Meta的AudioCraft真的令人印象深刻,但它只产生32 kHz的音乐。

稳定音频是第一个部署的文本到音频生成器,它以44.1 kHz的频率输出音频,这是“CD音质”音乐的采样率。

Stable Audio的另一个令人印象深刻的特点是它产生的曲目长度。大多数人工智能音频生成器产生的音乐片段很快重复或迷失方向。稳定的音频产生更微妙的音乐约90秒,而不失去连贯性。

您可以在这里查看生成的音频的一些示例。

下面是一个我能够使用该工具生成的轨道的示例,提示如下:

“后摇滚,吉他,鼓包,低音,弦乐,尤感,向上提升,情绪化,流动,原始,史诗,感伤,125 BPM”

听起来不错。

该模型依赖于Stability的潜在扩散技术,该技术用于其其他生成AI产品。它在推理过程中使用了一些聪明的编解码器,它说允许使用Nvidia A100 GPU在1秒内生成95秒的44.1 kHz音乐。

培训和版权问题

稳定AI与Harmonai合作制作了稳定音频,Harmonai是一个专注于创建开源生成性音频模型的深度学习研究实验室。稳定性AI的音频团队在HarmonAI训练的早期舞蹈扩散模型的基础上创建了一个新模型。

用于训练Stable Audio的数据集来自AudioSparx,该数据集提供了大约80万首独立音乐艺术家的歌曲。

艺术家可以选择将他们的作品排除在数据集之外,据报道,大约有10%的人这样做。

选择将其作品包含在数据集中的艺术家将分享稳定AI和AudioSparx已经达成的利润分享安排。

数据集中没有任何大牌艺人,但Stable Audio不会阻止您在提示符中添加艺人或乐队名称。

虽然AudioSparx库不包含AC/DC等乐队的作品,但它确实包含了大量被描述为AC/DC风格的音乐。

你仍然不能对你用人工智能工具生成的音乐授予版权。使用条款规定,您“有责任确保所有使用稳定音频制作的内容的合法性”。

条款进一步声明“您声明并保证您拥有这些提示的所有必要权利、所有权和利益,包括但不限于其中包含的所有必要的版权和公开权。

所以也许不要在提示中添加“Metallica”。这些家伙做的音乐很棒,但他们也喜欢一个好的版权诉讼。

Stable Audio的价格是多少?

您可以免费试用Stable Audio,但每月只能生成20首不可商业化的曲目,每首曲目的长度不得超过20秒。他们的服务器目前绝对瘫痪,所以需要一段时间来生成一个轨道。

专业订阅将运行您每月11.99美元,使您可以生成500个可商业化的轨道,最长为90秒,每个月。

未使用的生成学分不会滚动到下一个月,所以使用它或丢失它。

如果您的应用、网站或软件拥有超过10万用户,您需要联系Stability以获取其企业计划的定价。

​​表示,它将很快开放一种音乐生成模型,并基于不同的数据进行培训。

凭借其稳定音频产品,Stability AI终于找到了一种为投资者赚钱的方法。

© 版权声明

相关文章

暂无评论

暂无评论...