本地音乐生成：ComfyUI 和 ACE-Step-1.5 模型

如今，您不必依赖云服务来创建内容：您可以完全在自己的硬件上生成高质量的音乐。在这篇文章中，我将描述如何使用 ComfyUI 在计算机上本地运行现代 ACE-Step-1.5 模型。

ComfyUI 采用基于节点的架构。这使您能够：
– 完全控制音频生成的每个阶段。
– 轻松共享现成的“工作流程”。

ACE-Step-1.5 是一种高级音乐生成模型，需要大量计算资源。其硬件要求比许多简单的合成器要高：
– 显卡 (GPU)： Nvidia RTX，具有 8 GB VRAM 或更高（建议 12 GB+），可实现舒适的高品质工作。
– 随机存取存储器 (RAM)： 至少 16 GB（最好 32 GB 及以上）。
– 处理器（CPU）：现代多核处理器，对 AVX/CUDA 计算有良好的支持。
– 磁盘空间： 模型和组件大约需要 20–50 GB。

运行 ACE-Step-1.5 最简单的方法是使用现成的音频生成模板。只需在工作流程窗口中搜索音乐文本到音频并安装即可。

在“提示输入”节点中编写描述流派和情绪的提示（例如，“带有重低音的令人振奋的合成波曲目”）。指定所需的持续时间并按运行。
第一代可能需要一些时间，因为模型将被加载到显卡内存中并处理复杂的声学模式。

https://github.com/comfyanonymous/ComfyUI
https://www.youtube.com/watch?v=UAlLD5fS7-c

Published by demensdeum