Lokale Musikgenerierung: ComfyUI und ACE-Step-1.5-Modell

Heutzutage ist man für die Erstellung von Inhalten nicht mehr auf Cloud-Dienste angewiesen: Sie können hochwertige Musik vollständig auf Ihrer eigenen Hardware generieren. In diesem Beitrag beschreibe ich, wie Sie das moderne ACE-Step-1.5-Modell mithilfe von ComfyUI lokal auf Ihrem Computer ausführen.

ComfyUI verwendet eine knotenbasierte Architektur. Dies ermöglicht Ihnen:
– Volle Kontrolle über jede Phase der Audioerzeugung.
– Teilen Sie ganz einfach vorgefertigte „Workflows“.

ACE-Step-1.5 ist ein fortschrittliches Modell zur Musikgenerierung, das erhebliche Rechenressourcen erfordert. Die Hardwareanforderungen sind höher als bei vielen einfachen Synthesizern:
Grafikkarte (GPU): Nvidia RTX mit 8 GB VRAM oder höher (12 GB+ empfohlen) für komfortables Arbeiten in hoher Qualität.
Arbeitsspeicher (RAM): mindestens 16 GB (vorzugsweise 32 GB und mehr).
Prozessor (CPU): Moderner Multi-Core-Prozessor mit guter Unterstützung für AVX/CUDA-Computing.
Speicherplatz: Ungefähr 20–50 GB für Modelle und Komponenten.

Der einfachste Weg, ACE-Step-1.5 auszuführen, besteht darin, eine vorgefertigte Vorlage zur Audiogenerierung zu verwenden. Suchen Sie einfach im Workflow-Fenster nach „Musiktext zu Audio“ und installieren Sie es.

Schreiben Sie im Knoten „Eingabeaufforderung“ eine Eingabeaufforderung, die das Genre und die Stimmung beschreibt (z. B. „aufmunternder Synthwave-Track mit starkem Bass“). Geben Sie die gewünschte Dauer an und drücken Sie RUN.
Die erste Generation kann einige Zeit in Anspruch nehmen, da die Modelle in den Speicher der Grafikkarte geladen werden und komplexe akustische Muster verarbeiten.

https://github.com/comfyanonymous/ComfyUI
https://www.youtube.com/watch?v=UAlLD5fS7-c