概要
この手法は、Stable Diffusionで高品質な画像を効率的に生成するためのものです。Hires.fixを使用せず、段階的に解像度を上げていくことで、時間とリソースを節約しつつ、最適なプロンプトを見つけ出し、最終的に高品質な画像を得ることを目指します。
手順
ステップ1:低解像度での初期生成
まず、低い解像度(例:360x640 または 640x360)で画像を生成します。これにより、以下のメリットが得られます。
- 生成時間の短縮: プロンプトの試行錯誤を高速化。
- VRAM使用量の削減: 低スペックGPUでも動作可能。
- 大まかな構図の確認: 全体的なバランスを把握。
この段階では、詳細な描写よりも、構図、色合い、主要な要素の配置など、画像全体の基本的な構成要素に焦点を当ててプロンプトを調整します。
ステップ2:中解像度での詳細化
低解像度で満足のいく結果が得られたら、解像度を2倍にします(例:720x1280 または 1280x720)。
- プロンプトの微調整: より詳細な描写のためのプロンプト調整。
この段階では、低解像度で確認した基本的な構成要素を維持しつつ、より細部の描写や質感の表現に焦点を当ててプロンプトを調整します。
ステップ3:最終アップスケーリング(Extrasタブ)
中解像度(720x1280 または 1280x720)で十分に満足のいく画像が得られたら、Stable Diffusion Web UIの「Extras」タブを使用して、1.5倍にアップスケールします(1080x1920 または 1920x1080)。
- Extrasタブの利用: 「Extras」タブで適切なUpscalerを選択。
- 最終的な品質調整: 必要に応じて、生成された画像のノイズ除去やシャープネス調整などを行います。
Upscaler 一覧(Extrasタブ)
Stable Diffusion Web UIの「Extras」タブには、様々なUpscalerが用意されています。以下に代表的なものを紹介します。
- Lanczos: 伝統的な画像補間アルゴリズムの一つ。高速ですが、シャープネス不足や細部がぼやける可能性あり。
- Nearest: 最も単純な補間アルゴリズム。高速ですが、ジャギーが発生しやすく、滑らかさに欠けます。
- 4x-AnimeSharp: アニメ調画像に特化。シャープな線と鮮明な色合いを維持。
- 4x-UltraSharp: 実写系、アニメ系のどちらにも対応できる汎用性の高いUpscaler。生成画像の特徴を維持しつつ、シャープでクリアな高解像度画像を生成できます。
- R-ESRGAN 4x+: 実写系の画像に適したUpscalerです。汎用性が高く、自然な仕上がりが期待できます。
- R-ESRGAN 4x+ Anime6B: アニメ調の画像に適したUpscalerです。細部のシャープさを保ちつつ、滑らかな仕上がりが期待できます。
- ScuNET GAN: GANベース。細部を復元しリアルな画像を生成可能だが、処理時間が長い可能性あり。
- ScuNET PSNR: ScuNET GANのバリエーション。ノイズが少なくクリーンな画像を生成可能だが、処理時間が長い可能性あり。
- SwinIR 4x: 比較的処理時間が長くなる傾向がありますが、細部まで精細で、ノイズが少なく、アーティファクトが少ない高品質な画像を生成する能力があります。よりシャープな結果を求める場合や、画像の細部を重視する場合に適しています。
Upscalerの使い分け
一般的に、実写系とアニメ系では適切なUpscalerが異なると言われています。生成したい画像のスタイルに合わせて、適切なUpscalerを選択しましょう。
補足
- Upscalerの特性は、モデルやバージョンによって異なる場合があります。
利点
- 効率的なプロンプト探索: 低解像度での高速な試行錯誤により、時間を節約。
- リソースの節約: 低スペックGPUでも高解像度画像の生成が可能。
- 段階的な品質向上: 各ステップで品質を確認しながら、最終的な高解像度画像へ。
- Hires.fix不要: Hires.fixを使わないため、よりシンプルな手順。
注意点
- Upscalerの選択: 画風や目的に合わせて適切なUpscalerを選択することが重要です。
- 過度なアップスケーリング: あまりに大きな倍率でのアップスケーリングは、画質の劣化を招く可能性があります(今回は1.5倍なので、比較的安全)。
まとめ
この段階的解像度アップスケーリング法(Hires.fixなし)は、Stable Diffusionを用いた画像生成において、効率性、リソース節約、そして最終的な品質のバランスを取るための効果的なアプローチです。特に、Hires.fixを使わずにシンプルな手順で高画質な画像を生成したい場合に適しています。