【ComfyUI】Wan 2.2 FMLF徹底解説！始点・中間・終点を指定して思い通りのAI動画を作る方法

Wan 2.2 FMLF ノードで
動画生成を完全制御

「最初・中間・最後」の3点を指定するだけで、AI動画の構図崩れや顔の破綻を劇的に改善。ComfyUIの最新ワークフローを解説します🚀

解説を読む ▼

🎥 今回の参考動画はこちら ▼

Table of Contents

1. Wan 2.2 FMLFとは？ - 動画生成の制御革命

AIアーキテクトのOKIHIROです。今回は、AI動画生成における「制御の難しさ」を一気に解決する、画期的なComfyUIカスタムノードをご紹介します🚀

その名も「Wan 2.2 FMLF」です。

従来の動画生成（Image to Video）では、1枚の開始画像から予測して動画を作っていましたが、途中で顔が変わったり、意図しない動きをすることが多々ありました。

しかし、このFMLF (First, Middle, Last Frame) 手法では、以下の3点を指定できます。

First Frame: 開始時の画像
Middle Frame: 動画の中間地点の画像
Last Frame: 終了時の画像

AIはこの3つの点をつなぐように動画を生成するため、顔の一貫性が保たれやすく、例えば「横顔から正面へ向く」といった複雑なカメラワークも、キーフレームアニメーションのように正確に指示できるのです💡

2. 必要な準備（カスタムノード・モデル）

それでは環境を構築していきましょう。今回は新しいモデルを大量にダウンロードする必要はなく、既存のWan環境があれば導入はスムーズです。

カスタムノードのインストール

ComfyUI Managerを開き、以下の手順でインストールしてください。

「Custom Nodes Manager」をクリック。
検索バーに FMLF と入力。
ComfyUI-Wan2.2FMLF (Author: wallen) を探してインストールし、ComfyUIを再起動します。

モデルの準備

動画では、GGUF版のWan 2.2モデルを使用しています。以下のファイルをHugging Face等から入手し、ComfyUI/models/unet (または diffusion_models) フォルダに配置してください。

wan2.2_high_noise_v1.0_Q4_K_M.gguf (高ノイズ除去用)
wan2.2_low_noise_v1.0_Q4_K_M.gguf (低ノイズ除去用)

また、基本的なVAE、Clip Vision、T5エンコーダーも必要です。これらは標準的なWan 2.1用の構成と同様のものを使用します。

3. ComfyUIワークフロー徹底解説

ここからが本番です。FMLFノードを使ったワークフローの構築方法を見ていきましょう⚙️

① 画像のロード (First, Middle, Last)

まず、Load Image ノードを3つ用意します。これが動画の設計図になります。

上段: 開始フレーム（例: 正面の顔）
中段: 中間フレーム（例: 少し横を向いた顔）
下段: 終了フレーム（例: 真横の顔）

これらの画像は、同じ人物や背景で統一感を持たせておくことが重要です。同じシード値で生成した別アングルの画像を使うのがベストプラクティスです✅

② モデルのロードと接続

今回のワークフローの特徴は、High NoiseモデルとLow Noiseモデルを使い分けている点です。

UNET Loader (GGUF) を2つ用意し、それぞれロードします。そして、Wan FMLF 関連のモデルローダーノードに接続していきます。ここで、FP8版を使いたい場合は、ノードの接続を切り替えるだけで対応可能です。

③ Wan FMLF ノードの設定

ここが心臓部です。インストールした Wan FMLF Middle Last Frame ノードを配置します。

このノードには、以下の入力を接続します。

start_image: ①で用意した開始画像
middle_image: ①で用意した中間画像
end_image: ①で用意した終了画像
model: ②でロードしたモデルパイプライン

④ プロンプトによる補強

画像だけでなく、テキストプロンプトでも動きを補強します。動画の例では以下のようなプロンプトが使用されています。

best quality, dynamic motion, camera pushes past women's face while still focused on her face

「画像で動きの始点と終点を決め、プロンプトでその間の動きの質（ダイナミックさ等）を指定する」というイメージで組み合わせるとうまくいきます💡

4. 重要パラメータ調整のコツ

生成結果を微調整するための重要なパラメータを紹介します。

Middle Frame Ratio (中間フレームの比率)

Wan FMLF ノード内にある設定値です。

0.5 (デフォルト): 動画のちょうど真ん中に「中間画像」が来ます。
数値を下げる: 中間画像が動画の前半に来ます（前半の動きが速くなる）。
数値を上げる: 中間画像が動画の後半に来ます（後半の動きが速くなる）。

動きの緩急をつけたい場合に調整してください。

Advanced: 4フレーム以上の制御

さらに高度な制御を行いたい場合、GitHubのリポジトリには「4フレーム版」や「ロングビデオ拡張版」のワークフロー例も同梱されています。

Managerで「Install Missing Custom Nodes」を行い、赤いノードが出ないように環境を整えれば、さらに長いシーケンスの制御も可能になります。

5. まとめ

本記事のゴールは、Wan 2.2 FMLFを使って、制御可能な高品質AI動画を生成することでした。

重要なポイントは以下の3つです。

FMLFノードを使えば、始点・中間・終点を指定して動きを固定できる。
Wan 2.2 (GGUF) のHigh/Lowモデルを組み合わせることで効率的に生成可能。
中間フレームの比率を調整することで、演出意図に合わせたタイミング制御ができる。

これまでは「AI任せ」だった動画生成の動きが、このツールによって「演出可能」な領域に踏み込みました。ぜひ、あなたのクリエイティブな映像制作に取り入れてみてくださいね🚀

【免責事項】本記事は、AI技術を用いて作成された部分を含みます。公開時点の情報に基づいていますが、AIの仕様変更やサービスの更新により、内容が現状と異なる場合があります。最新の情報は公式サイト等でご確認ください。