Meta发布其文本到音频生成器AudioCraft

AI产品新闻9个月前发布 yundic
468 0 0

Meta本周发布了名为AudioCraft的文本到音频生成人工智能,其输出样本令人印象深刻。

生成人工智能领域在文本、图像和语音生成方面都有了指数级的发展,但在人工智能音频生成领域我们还没有太多的消息。 音频工艺是首批可供适当试用的文本到音频转换工具之一。

今年早些时候,谷歌让我们看到了它的MusicLM文本到音乐生成器,但我们已经8个月了,你仍然只能尝试它,如果你被他们的AI测试厨房接受。

AudioCraft预训练模型可以在GitHub上下载,Meta希望他们的开源策略能够推动采用和测试,以改进模型。

AudioCraft由Meta的MusicGen、AudioGen和Encodec模型组成。

MusicGen模型是在Meta专门授权和拥有的音乐上训练的,并从文本提示符输出音乐。Meta博客上的例子使用了以下提示:”流行舞曲曲目,旋律朗朗上口,节奏欢快,适合海滩”

音乐输出听起来很好,与提示符非常匹配。样本可能是樱桃挑选的,但它仍然令人印象深刻。你可以听 更多样品.

© 版权声明

相关文章

暂无评论

暂无评论...