以前は、ニューラル ネットワークを使用してビデオを作成することは、Runway や Luma などのクラウド サービスの特権でした。現在、最新の Nvidia グラフィック カードをお持ちであれば、コンピューター上で高品質のビデオを直接生成できます。この記事では、ComfyUI と効果的なLTX-2.3 モデルを使用してローカル ビデオ生成を設定する方法を説明します。

ビデオ生成用のツール
仕事のためには次のものが必要です。
– ComfyUI: ノードベースのアーキテクチャを備えた強力なインターフェイスで、生成プロセスを柔軟にカスタマイズできます。
– LTX-2.3: Lightricks の最新モデル。比較的適度なビデオ メモリ要件でスムーズで詳細なビデオを作成するために最適化されています。
ハードウェア要件
ビデオの生成は、画像を操作するよりもはるかにリソースを大量に消費するプロセスです。
– ビデオ カード (GPU): 768×512 の解像度には、8 GB VRAM を搭載した Nvidia RTX が最低限必要です。快適な操作とより高い解像度を実現するには、16 ~ 24 GB の VRAM を搭載することが非常に望ましいです。
– ランダム アクセス メモリ (RAM): 最低 32 GB。ビデオ モデルと VAE は、ダウンロード時に多くのスペースを消費します。
– ディスク容量: モデル自体と関連コンポーネント用に約 500 GB。
セットアップと起動
ComfyUI で LTX-2.3 を起動するプロセスは次のとおりです。
1. ComfyUI を更新します: このモデルは比較的新しいため、最新バージョンのインターフェースがインストールされていることを確認してください。
2. ワークフローのインストール: 最も簡単な方法は、LTX ビデオ用の既製の JSON テンプレートを見つけることです。このモデルでは、ビデオ潜在スペースを処理するには特定のノードが必要です。
3. プロンプトとパラメータ: シーンの説明を英語で入力します。 LTX-2.3 は動きをよく理解していることに注意してください (例: 「カメラが周回する」、「速い動き」)。
LTX-2.3 を選ぶ理由
LTX-2.3 は、独自のクラウド サービスと同等の結果を提供しながら、ローカルで実行できるという点で注目に値します。これにより、次のことが得られます。
– 完全なプライバシー: プロンプトや生成されたビデオが他の人のサーバーに送信されることはありません。
– コントロール: 試行ごとに料金を支払うことなく、フレーム レート (FPS)、解像度、プロンプトの強度を試すことができます。
ローカル ビデオ生成は現在も開発が活発に行われており、LTX-2.3 は「ホーム ハリウッド」の世界への素晴らしい入り口となります。
リンク
https://github.com/comfyanonymous/ComfyUI
https://huggingface.co/Lightricks/LTX-Video