【FLUXモデル徹底比較】Stable Diffusion Forge on Colabで14種の描写力をXYZ Plot検証！

2025年4月9日

Table of Contents

Stable Diffusion Forge on Colab：最新FLUXモデル徹底比較！ XYZ Plotで見る描写力の違い

本日、Google Colab環境で最新の画像生成モデル「FLUX」系の様々な checkpoints を Stable Diffusion Forge を使って比較検証しました。

今回はXYZ Plot機能を活用し、同一プロンプトで各モデルがどのような画像を生成するのか、その描写力やスタイルの違いを探ってみました。この記事では、その興味深い結果を皆さんと共有したいと思います！

検証環境と方法

プラットフォーム：Google Colab
UI：Stable Diffusion Forge
モデル：今回比較した各種FLUX系モデル（詳細は後述）
手法：XYZ Plot機能を使用し、「Checkpoint Name」を変数として設定。同一プロンプト・パラメータで各モデルの出力を比較。

比較結果：プロンプトテーマとモデル毎の傾向

提供いただいた比較画像（各行が同一プロンプトでの生成結果）を元に、いくつかのテーマで見ていきましょう。（使用したモデルの詳細は記事末尾のリストをご参照ください）

1. テーマ：「幻想的な空と蝶々」

Stable Diffusion FLUXモデル5種の比較(1)：「幻想的な空と蝶々」をテーマにした画像生成結果を横に並べたXYZ Plot画像。

蝶が舞う青空と白い雲背景に、花飾りをつけたピンク髪の女性が優しい表情で横顔を見せる。 — fluxBlockwise_blockwiseBaseDevUNET.safetensors

満月と蝶が舞う幻想的な夜空背景に、黒髪ロングの美しい女性が華やかな衣装と髪飾りで横顔を見せる。 — fluxBlockwise_blockwiseBaseDevUNET.safetensors

使用プロンプト：Close-up profile shot of a cute Chinese idol girl gazing upwards, a cascade of light pink and blue hair flowing behind her, shimmering with light dust. She wears a colorful, ethereal fantasy gown. Countless tiny, glowing butterflies made of light flutter around her. Background is a dreamy sky filled with pastel clouds and multiple moons. The text "UNLOCK UNLIMITED AI VISUALS" is rendered diagonally from bottom left to top right, enormous, sharp, in a delicate, serif font glowing with a soft, warm light, appearing majestic and clear. High quality, ultra-detailed, 8K UHD, photorealistic.
観察：
- 全体的に幻想的で美しい空と、髪の毛や衣装の流れるような表現が試みられています。
- realismOrientalFlux や XeCosplayFlux は、比較的リアル寄りの人物描写を目指しているように見えますが、プロンプトの「アイドル風」な要素と相まって独特の雰囲気になっています。
- mecha_v10 や oligarchy_v10 は、よりイラスト調、あるいはゲームアートのようなスタイルが感じられます。
- どのモデルもプロンプトで指定された巨大なテキスト UNLOCK UNLIMITED AI VISUALS を、指定通りのフォントや配置で正確に再現するには苦労しており、形状や場所が不安定です。これは現在の画像生成AI全般の課題でもあります。

2. テーマ：「輝く粒子とアイドル」

Stable Diffusion FLUXモデル6種の比較(2)：「輝く粒子とアイドル」をテーマにした画像生成結果を横に並べたXYZ Plot画像。

カラフルな光の粒子とネオン背景に、カジュアルな服装の女性が明るく微笑む。「UNLOCK UNLIMITED AI VISUALS」の文字。 — cgConceptStyle_fp8V10.safetensors

惑星や星、ネオンが輝くポップな宇宙空間背景に、ピンク髪のアニメ風キャラクターが笑顔を見せる。「UNLOCK UNLIMITED AI VISUALS」の文字。 — cgConceptStyle_fp8V10.safetensors

使用プロンプト：Medium shot of a cheerful Chinese idol girl looking at the camera, surrounded by floating, sparkling light orbs. Her hair is a playful combination of light green and pink ponytails, radiating a soft glow. She wears a brightly colored, layered fantasy outfit resembling magical girl attire. Background is a vibrant, abstract swirl of pastel colors and light streaks, suggesting a magical transformation. The text "UNLOCK UNLIMITED AI VISUALS" arches across the bottom, massive, sharp, in a bold, friendly sans-serif font with a rainbow gradient fill and a subtle drop shadow, extremely clear and inviting. High quality, ultra-detailed, 8K UHD, photorealistic.
観察：
- 背景の抽象的な光の渦や、人物を取り巻くキラキラした粒子の表現が特徴的です。
- PotpourriConceptStyle、 FLUXLightNGRealityRealistic、 journeyReplica_Flux など、モデルによって人物の顔立ちや画風（アニメ寄り、リアル寄り）が大きく異なります。
- fluxAlFuisonNF4F や XeCosplayFlux_02 は、比較的シャープでコントラストが高めの描写傾向が見られます。
- ここでもテキスト UNLOCK UNLIMITED AI VISUALS の再現はモデルごとに異なり、プロンプト通りの配置（下部アーチ状）やフォント、効果の完全な再現は難しいようです。

3. テーマ：「笑顔のクローズアップと光」

Stable Diffusion FLUXモデル4種の比較(3)：「笑顔のクローズアップと光」をテーマにした画像生成結果を横に並べたXYZ Plot画像。

虹色の放射状光線を背景に、ピンクと緑のウェーブヘアの女性が華やかな衣装で微笑む。 — artsyDream_v6FP8.safetensors

暖かい光とボケ背景に、ピンクの花飾りをつけた緑がかった髪の女の子が優しい笑顔を見せる。 — artsyDream_v6FP8.safetensors

使用プロンプト：Extreme close-up on the smiling face of a very cute Chinese idol girl, direct eye contact, framed by flowing light pink and light green hair that glitters with tiny light particles. She wears a colorful, fantasy-inspired collar accessory glowing faintly. Background is a vibrant, abstract nebula of swirling light blue and pink cosmic dust. High quality, ultra-detailed, 8K UHD, photorealistic.
観察：
- 顔のクローズアップに焦点を当てたプロンプトです。髪の色（ピンクと緑）や表情（笑顔）、背景の星雲のような雰囲気は比較的どのモデルでも反映されています。
- artsyDream_v6FP8 は彩度が高く、非常に明るいイラスト調の仕上がりです。
- flux1CompactCLIPAnd_Flux1DevFp16、 flux_dev は、ほぼ同じような、ややリアル寄りで柔らかな描写をしています（ベースが同じか近いモデルかもしれません）。
- majicflus_v10 は、他のモデルとは異なる独特の顔立ちと雰囲気を持っており、やや落ち着いた色調です。

4. テーマ：「宮殿の中庭にて」

Stable Diffusion FLUXモデル4種の比較(5)：「宮殿の中庭にて」をテーマにした画像生成結果を横に並べたXYZ Plot画像。

夕暮れの中国宮殿風の中庭で、ピンク髪の女性がファンタジー衣装で手のひらに光を集める。「AI POWERED COURSE CREATION?」の文字。 — artsyDream_v6FP8.safetensors

夕暮れの中国宮殿風の中庭で、ピンク髪の女性がファンタジー衣装で手のひらに光を集める。 — artsyDream_v6FP8.safetensors

使用プロンプト：Waist-up shot of an adorable Chinese idol girl, direct camera gaze, her long hair a flowing mix of light pink, blue, and green strands, twinkling with magical light particles. Her costume is a vibrant fusion of traditional Chinese elements and fantasy armor, colorful and intricate, with parts glowing softly. She holds her hands out, palms up, as if presenting something invisible, with light energy swirling around them. Background is a majestic fantasy palace courtyard bathed in golden hour light. The text "AI POWERED COURSE CREATION" is emblazoned diagonally across the image, colossal in size, sharp as a tack, using a calligraphic brush font style but rendered with sharp digital precision, filled with a flowing, iridescent light effect. High quality, ultra-detailed, 8K UHD, photorealistic.
観察：
- 背景の「宮殿の中庭」や「ゴールデンアワーの光」といった要素は、各モデルで雰囲気良く再現されています。
- 衣装の「伝統的要素とファンタジーアーマーの融合」という複雑な指示は、モデルによって解釈が分かれています。
- artsyDream_v6FP8 はファンタジー要素が強く、光の表現が特徴的です。
- flux1CompactCLIPAnd_Flux1DevFp16、 flux_dev は、ここでも似た描写で、比較的現実に近い衣装や背景を描いています。
- majicflus_v10 は、独自の解釈でオリエンタルな雰囲気とファンタジー感を両立させようとしています。指定されたテキスト AI POWERED COURSE CREATION の正確な再現は難しく、意図しない文字や記号のようなものが生成されることがあります。

5. テーマ：「幻想図書館とデジタルペン」

Stable Diffusion FLUXモデル4種の比較(4)：「幻想図書館とデジタルペン」をテーマにした画像生成結果を横に並べたXYZ Plot画像。

図書館で未来的な衣装のピンクと水色ツインテール女性が羽ペンを構える。「AI-POWERED COURSE CREATION」のネオン文字。 — artsyDream_v6FP8.safetensors

浮遊する本がある図書館でピンクと水色髪のアニメ風キャラクターが光るペンを持つ。ファンタジー調。 — artsyDream_v6FP8.safetensors

使用プロンプト：Extreme close-up shot of an incredibly cute Chinese idol girl with vibrant light pink and light blue hair styled in twin tails adorned with glowing flower petals, looking directly at the camera with big sparkling eyes. She wears a futuristic yet fantasy-inspired colorful outfit blending silk and iridescent circuits. She holds a softly glowing digital quill pen. Background is a fantastical library with floating books radiating faint light particles. The text "AI POWERED COURSE CREATION" is rendered in an utterly massive, razor-sharp, 3D futuristic script font filled with swirling rainbow energy patterns, spanning nearly the entire width of the frame, positioned horizontally across the middle, casting intense, flickering multicolored light onto her features without any blur or loss of definition. High quality, ultra-detailed, 8K UHD, photorealistic.
観察：
- 「ツインテール」「ピンクと青の髪」「図書館」「浮遊する本」「デジタルペン」といった要素は、多くのモデルで確認できます。
- artsyDream_v6FP8 は、彩度が高く、目の大きいデフォルメされたキャラクターを描写しています。
- flux1CompactCLIPAnd_Flux1DevFp16、 flux_dev は、ここでも非常に似た結果を出力しており、やや幼い印象のキャラクターを描いています。光の表現が美しいです。
- majicflus_v10 は、他のモデルより少し大人びた雰囲気で、落ち着いた色合いの写実的なスタイルです。
- テキスト AI POWERED COURSE CREATION は、どのモデルもプロンプト通りの巨大でシャープな3Dフォントとしては再現できていませんが、文字のようなものを中央付近に配置しようとはしています。

全体的な考察

モデルの多様性：FLUX系のモデルと一口に言っても、Checkpointによって得意な画風（リアル系、イラスト系、アニメ系など）や描写の細かさ、色使いが大きく異なることが分かりました。
プロンプト解釈：同じプロンプトでも、モデルによって重要視する要素や解釈の仕方が変わるため、出力結果にバリエーションが生まれます。特に複雑な衣装や背景の指示は、モデルの個性が表れやすい部分です。
テキスト生成の課題：プロンプトで指定した特定のフォント、サイズ、効果、配置を持つテキストを正確に画像内にレンダリングするのは、現状の主要な画像生成モデルにとっては依然として難しい課題のようです。テキスト要素を重視する場合は、画像生成後に別途編集するなどの工夫が必要かもしれません。
ForgeとXYZ Plotの有用性：Stable Diffusion ForgeのXYZ Plot機能は、このように複数のモデルやパラメータを効率的に比較検討するのに非常に強力なツールです。