Meta本周发布了名为AudioCraft的文本到音频生成人工智能,其输出样本令人印象深刻。
生成人工智能领域在文本、图像和语音生成方面都有了指数级的发展,但在人工智能音频生成领域我们还没有太多的消息。 音频工艺是首批可供适当试用的文本到音频转换工具之一。
今年早些时候,谷歌让我们看到了它的MusicLM文本到音乐生成器,但我们已经8个月了,你仍然只能尝试它,如果你被他们的AI测试厨房接受。
AudioCraft预训练模型可以在GitHub上下载,Meta希望他们的开源策略能够推动采用和测试,以改进模型。
AudioCraft由Meta的MusicGen、AudioGen和Encodec模型组成。
MusicGen模型是在Meta专门授权和拥有的音乐上训练的,并从文本提示符输出音乐。Meta博客上的例子使用了以下提示:”流行舞曲曲目,旋律朗朗上口,节奏欢快,适合海滩”
音乐输出听起来很好,与提示符非常匹配。样本可能是樱桃挑选的,但它仍然令人印象深刻。你可以听 更多样品.
今天,我们将分享有关AudioCraft的详细信息。AudioCraft是一系列具有生成性的人工智能模型,可以让您轻松地从文本生成高质量的音频和音乐。https://t.co/04XAq4rlap
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...