本地音乐生成:ComfyUI 和 ACE-Step-1.5 模型

如今,您不必依赖云服务来创建内容:您可以完全在自己的硬件上生成高质量的音乐。在这篇文章中,我将描述如何使用 ComfyUI 在计算机上本地运行现代 ACE-Step-1.5 模型。

ComfyUI 采用基于节点的架构。这使您能够:
– 完全控制音频生成的每个阶段。
– 轻松共享现成的“工作流程”。

ACE-Step-1.5 是一种高级音乐生成模型,需要大量计算资源。其硬件要求比许多简单的合成器要高:
显卡 (GPU): Nvidia RTX,具有 8 GB VRAM 或更高(建议 12 GB+),可实现舒适的高品质工作。
随机存取存储器 (RAM): 至少 16 GB(最好 32 GB 及以上)。
处理器(CPU):现代多核处理器,对 AVX/CUDA 计算有良好的支持。
磁盘空间: 模型和组件大约需要 20–50 GB。

运行 ACE-Step-1.5 最简单的方法是使用现成的音频生成模板。只需在工作流程窗口中搜索音乐文本到音频并安装即可。

在“提示输入”节点中编写描述流派和情绪的提示(例如,“带有重低音的令人振奋的合成波曲目”)。指定所需的持续时间并按运行
第一代可能需要一些时间,因为模型将被加载到显卡内存中并处理复杂的声学模式。

https://github.com/comfyanonymous/ComfyUI
https://www.youtube.com/watch?v=UAlLD5fS7-c