Stable Diffusion Forge on Colab:最新FLUXモデル徹底比較! XYZ Plotで見る描写力の違い
本日、Google Colab
環境で最新の画像生成モデル「FLUX
」系の様々な checkpoints
を Stable Diffusion Forge
を使って比較検証しました。
今回はXYZ Plot
機能を活用し、同一プロンプトで各モデルがどのような画像を生成するのか、その描写力やスタイルの違いを探ってみました。この記事では、その興味深い結果を皆さんと共有したいと思います!
検証環境と方法
- プラットフォーム:
Google Colab
- UI:
Stable Diffusion Forge
- モデル:今回比較した各種
FLUX
系モデル(詳細は後述) - 手法:
XYZ Plot
機能を使用し、「Checkpoint Name
」を変数として設定。同一プロンプト・パラメータで各モデルの出力を比較。
比較結果:プロンプトテーマとモデル毎の傾向
提供いただいた比較画像(各行が同一プロンプトでの生成結果)を元に、いくつかのテーマで見ていきましょう。(使用したモデルの詳細は記事末尾のリストをご参照ください)
1. テーマ:「幻想的な空と蝶々」






- 使用プロンプト:
Close-up profile shot of a cute Chinese idol girl gazing upwards, a cascade of light pink and blue hair flowing behind her, shimmering with light dust. She wears a colorful, ethereal fantasy gown. Countless tiny, glowing butterflies made of light flutter around her. Background is a dreamy sky filled with pastel clouds and multiple moons. The text "UNLOCK UNLIMITED AI VISUALS" is rendered diagonally from bottom left to top right, enormous, sharp, in a delicate, serif font glowing with a soft, warm light, appearing majestic and clear. High quality, ultra-detailed, 8K UHD, photorealistic.
- 観察:
- 全体的に幻想的で美しい空と、髪の毛や衣装の流れるような表現が試みられています。
realismOrientalFlux
やXeCosplayFlux
は、比較的リアル寄りの人物描写を目指しているように見えますが、プロンプトの「アイドル風」な要素と相まって独特の雰囲気になっています。mecha_v10
やoligarchy_v10
は、よりイラスト調、あるいはゲームアートのようなスタイルが感じられます。- どのモデルもプロンプトで指定された巨大なテキスト
UNLOCK UNLIMITED AI VISUALS
を、指定通りのフォントや配置で正確に再現するには苦労しており、形状や場所が不安定です。これは現在の画像生成AI全般の課題でもあります。
2. テーマ:「輝く粒子とアイドル」







- 使用プロンプト:
Medium shot of a cheerful Chinese idol girl looking at the camera, surrounded by floating, sparkling light orbs. Her hair is a playful combination of light green and pink ponytails, radiating a soft glow. She wears a brightly colored, layered fantasy outfit resembling magical girl attire. Background is a vibrant, abstract swirl of pastel colors and light streaks, suggesting a magical transformation. The text "UNLOCK UNLIMITED AI VISUALS" arches across the bottom, massive, sharp, in a bold, friendly sans-serif font with a rainbow gradient fill and a subtle drop shadow, extremely clear and inviting. High quality, ultra-detailed, 8K UHD, photorealistic.
- 観察:
- 背景の抽象的な光の渦や、人物を取り巻くキラキラした粒子の表現が特徴的です。
PotpourriConceptStyle
、FLUXLightNGRealityRealistic
、journeyReplica_Flux
など、モデルによって人物の顔立ちや画風(アニメ寄り、リアル寄り)が大きく異なります。fluxAlFuisonNF4F
やXeCosplayFlux_02
は、比較的シャープでコントラストが高めの描写傾向が見られます。- ここでもテキスト
UNLOCK UNLIMITED AI VISUALS
の再現はモデルごとに異なり、プロンプト通りの配置(下部アーチ状)やフォント、効果の完全な再現は難しいようです。
3. テーマ:「笑顔のクローズアップと光」





- 使用プロンプト:
Extreme close-up on the smiling face of a very cute Chinese idol girl, direct eye contact, framed by flowing light pink and light green hair that glitters with tiny light particles. She wears a colorful, fantasy-inspired collar accessory glowing faintly. Background is a vibrant, abstract nebula of swirling light blue and pink cosmic dust. High quality, ultra-detailed, 8K UHD, photorealistic.
- 観察:
- 顔のクローズアップに焦点を当てたプロンプトです。髪の色(ピンクと緑)や表情(笑顔)、背景の星雲のような雰囲気は比較的どのモデルでも反映されています。
artsyDream_v6FP8
は彩度が高く、非常に明るいイラスト調の仕上がりです。flux1CompactCLIPAnd_Flux1DevFp16
、flux_dev
は、ほぼ同じような、ややリアル寄りで柔らかな描写をしています(ベースが同じか近いモデルかもしれません)。majicflus_v10
は、他のモデルとは異なる独特の顔立ちと雰囲気を持っており、やや落ち着いた色調です。
4. テーマ:「宮殿の中庭にて」





- 使用プロンプト:
Waist-up shot of an adorable Chinese idol girl, direct camera gaze, her long hair a flowing mix of light pink, blue, and green strands, twinkling with magical light particles. Her costume is a vibrant fusion of traditional Chinese elements and fantasy armor, colorful and intricate, with parts glowing softly. She holds her hands out, palms up, as if presenting something invisible, with light energy swirling around them. Background is a majestic fantasy palace courtyard bathed in golden hour light. The text "AI POWERED COURSE CREATION" is emblazoned diagonally across the image, colossal in size, sharp as a tack, using a calligraphic brush font style but rendered with sharp digital precision, filled with a flowing, iridescent light effect. High quality, ultra-detailed, 8K UHD, photorealistic.
- 観察:
- 背景の「宮殿の中庭」や「ゴールデンアワーの光」といった要素は、各モデルで雰囲気良く再現されています。
- 衣装の「伝統的要素とファンタジーアーマーの融合」という複雑な指示は、モデルによって解釈が分かれています。
artsyDream_v6FP8
はファンタジー要素が強く、光の表現が特徴的です。flux1CompactCLIPAnd_Flux1DevFp16
、flux_dev
は、ここでも似た描写で、比較的現実に近い衣装や背景を描いています。majicflus_v10
は、独自の解釈でオリエンタルな雰囲気とファンタジー感を両立させようとしています。指定されたテキストAI POWERED COURSE CREATION
の正確な再現は難しく、意図しない文字や記号のようなものが生成されることがあります。
5. テーマ:「幻想図書館とデジタルペン」





- 使用プロンプト:
Extreme close-up shot of an incredibly cute Chinese idol girl with vibrant light pink and light blue hair styled in twin tails adorned with glowing flower petals, looking directly at the camera with big sparkling eyes. She wears a futuristic yet fantasy-inspired colorful outfit blending silk and iridescent circuits. She holds a softly glowing digital quill pen. Background is a fantastical library with floating books radiating faint light particles. The text "AI POWERED COURSE CREATION" is rendered in an utterly massive, razor-sharp, 3D futuristic script font filled with swirling rainbow energy patterns, spanning nearly the entire width of the frame, positioned horizontally across the middle, casting intense, flickering multicolored light onto her features without any blur or loss of definition. High quality, ultra-detailed, 8K UHD, photorealistic.
- 観察:
- 「ツインテール」「ピンクと青の髪」「図書館」「浮遊する本」「デジタルペン」といった要素は、多くのモデルで確認できます。
artsyDream_v6FP8
は、彩度が高く、目の大きいデフォルメされたキャラクターを描写しています。flux1CompactCLIPAnd_Flux1DevFp16
、flux_dev
は、ここでも非常に似た結果を出力しており、やや幼い印象のキャラクターを描いています。光の表現が美しいです。majicflus_v10
は、他のモデルより少し大人びた雰囲気で、落ち着いた色合いの写実的なスタイルです。- テキスト
AI POWERED COURSE CREATION
は、どのモデルもプロンプト通りの巨大でシャープな3Dフォントとしては再現できていませんが、文字のようなものを中央付近に配置しようとはしています。
全体的な考察
- モデルの多様性:
FLUX
系のモデルと一口に言っても、Checkpoint
によって得意な画風(リアル系、イラスト系、アニメ系など)や描写の細かさ、色使いが大きく異なることが分かりました。 - プロンプト解釈:同じプロンプトでも、モデルによって重要視する要素や解釈の仕方が変わるため、出力結果にバリエーションが生まれます。特に複雑な衣装や背景の指示は、モデルの個性が表れやすい部分です。
- テキスト生成の課題:プロンプトで指定した特定のフォント、サイズ、効果、配置を持つテキストを正確に画像内にレンダリングするのは、現状の主要な画像生成モデルにとっては依然として難しい課題のようです。テキスト要素を重視する場合は、画像生成後に別途編集するなどの工夫が必要かもしれません。
- ForgeとXYZ Plotの有用性:
Stable Diffusion Forge
のXYZ Plot
機能は、このように複数のモデルやパラメータを効率的に比較検討するのに非常に強力なツールです。
まとめ
今回のFLUX
モデル比較実験では、各モデルの持つ個性とポテンシャルを垣間見ることができました。特定のスタイルを狙う場合や、思いがけない表現を求めたい場合に、モデルを切り替えて試してみる価値は十分にありそうです。
Stable Diffusion Forge
と新しいFLUX
モデルの組み合わせは、画像生成の可能性をさらに広げてくれることでしょう。皆さんもぜひ、お気に入りのモデルを見つけて、様々なプロンプトで試してみてはいかがでしょうか?
今回比較した主なモデル
※以下は今回使用したモデルの一部です。
- fluxBlockwise_blockwiseBaseDevUNET.safetensors:
https://civitai.com/models/990110/flux-blockwise?modelVersionId=1109253 - mecha_v10.safetensors:
https://civitai.com/models/1362142/mecha?modelVersionId=1538842 - oligarchy_v10.safetensors:
https://civitai.com/models/1162839/oligarchy?modelVersionId=1308053 - realismOrientalFlux_v10.safetensors:
https://civitai.com/models/1311193/realism-oriental-or-flux-or-lucifer?modelVersionId=1479808 - xeCosplayFlux_02.safetensors:
https://civitai.com/models/744800/xe-cosplay-flux?modelVersionId=924058 - cgConceptStyle_fp8V10.safetensors:
https://civitai.com/models/850570/cg-concept-style?modelVersionId=1013269 - fluxArtFusionNF4Fp8Fp16_v10Fp16.safetensors:
https://civitai.com/models/1021677/flux-art-fusion-nf4-or-fp8-fp16-or-clip-and-vae-included?modelVersionId=1274689 - FLUXLightOfRealityRealistic_v10.safetensors:
https://civitai.com/models/794036/fluxlight-of-reality-realistic-reflections?modelVersionId=887878 - midjourneyReplica_flux1Dev.safetensors:
https://civitai.com/models/885098/midjourney-replica-flux?modelVersionId=990775 - realisticDeepdream_fluxDCLIPVAEBaked.safetensors:
https://civitai.com/models/809336/realistic-deepdream-flux?modelVersionId=905053 - artsyDream_v6FP8.safetensors:
https://civitai.com/models/870948/artsy-dream?modelVersionId=1213097 - flux1CompactCLIPAnd_Flux1DevFp16.safetensors:
https://civitai.com/models/637170/flux1-compact-or-clip-and-vae-included?modelVersionId=713385 - flux_dev.safetensors:
https://civitai.com/models/618692/flux?modelVersionId=691639 - majicflus_v10.safetensors:
https://civitai.com/models/1110156/majicflus?modelVersionId=1247362
ご留意事項
- 生成結果は、使用する
seed
値、sampler
、step
数などの他のパラメータによっても変動します。
この記事が、FLUX
モデルやStable Diffusion Forge
に興味を持つ方々の参考になれば幸いです。