Stable Diffusion Web UIでの画像生成について説明する記事のイメージ画像。花柄の服を着た3人の女性の画像と「6. 画像生成」というテキスト。Stable Diffusion, 画像生成, プロンプト, LoRA

6. 画像生成


OKIHIRO
OKIHIRO

ここからは、実際に画像を生成していきます。


おすすめのプロンプト・設定

おすすめの、ベースとなるプロンプトは以下の通りです。

ポジティブ プロンプト

(masterpiece, best quality:1.4), 8k, highres, shiny skin, lips, super detailed skin, detailed beautiful face and eyes, bloom, spotlight, professional lighting,

ネガティブ プロンプト

(worst quality, low quality:2.0), easynegative, negative_hand-neg, bad_prompt_version2-neg, badhandv4, bad-hands-5, text,
BREAK ng_deepnegative_v1_75t

Generation設定

おすすめの設定は以下の通りです。モデルやLoRA、被写体との距離等によって各種変更します。

モデル好みのもの
VAEvae-ft-mse-840000-ema-pruned.safetensors
Clip skip1 or 2
Sampling methodDPM++ 2M Karras
DDIM
Sampling steps30
Hires. fixON
Upscaler4x-UltraSharp
Hires steps15
Denoising strength0.2 ~ 0.4
Upscale by2 or 2.5
Width432 or 768
Height768 or 432
CFG Scale5 ~ 7
ADetailerON
ADetailer modelface_yolov8n.pt

画像生成 実践①

まずは以下の設定で、何枚か画像を生成してみてください。

ポジティブ プロンプト(全身)

(masterpiece, best quality:1.4), 8k, highres, shiny skin, lips, super detailed skin, detailed beautiful face and eyes, bloom, spotlight, professional lighting,
BREAK full body, sneakers, standing, outdoors

ポジティブ プロンプト(上半身)

(masterpiece, best quality:1.4), 8k, highres, shiny skin, lips, super detailed skin, detailed beautiful face and eyes, bloom, spotlight, professional lighting,
BREAK upper body, standing, outdoors

ネガティブ プロンプト(共通)

(worst quality, low quality:2.0), easynegative, negative_hand-neg, bad_prompt_version2-neg, badhandv4, bad-hands-5, text,
BREAK ng_deepnegative_v1_75t

Generation設定

モデルmajicMix realistic_v7
VAEvae-ft-mse-840000-ema-pruned.safetensors
Clip skip2
Sampling methodDDIM
Sampling steps30
Hires. fixON
Upscaler4x-UltraSharp
Hires steps15
Denoising strength0.4
Upscale by2 or 2.5
Width432
Height768
CFG Scale7
ADetailerON
ADetailer modelface_yolov8n.pt

生成の手順

設定ができたら「Generate」をクリック。

プレビュー画面に進行状況が表示されます。青いバーの「ETA」とは、おおよその残り時間のことです。

以下のような、女性の上半身の画像が生成されました。フォルダアイコンをクリックすると、画像が生成された場所のフォルダが開きます。

生成がうまくいった設定は、その都度「Config Presets」に保存しておきましょう。


呪文(プロンプト)をマスターしよう

ここからは、理想の画像を生成するための、呪文(プロンプト)について理解を深めていきます。

トークンについて

Stable Diffusionには、「トークン」という要素があります。「1個の英単語=1トークン」としてカウントされ、区切りに使う「,(カンマ)」も1トークンとしてカウントされます。

トークンは75個を1つのグループとし、基本的に1個目のトークンが最も効きが強く、75個目のトークンが最も効きが弱くなります。76個目からは次のグループに移行し、75個目のトークンよりも、76個目のトークンの方が効きが強くなります。

※後方でも効きの良いプロンプトもあるので、一概には言えません。

プロンプトの要点

  • 基本的に前方の方が効きが強い
  • 前方のプロンプトは後方に影響する
  • 距離が近いプロンプトは影響を受けやすい

例えば「blue hair, red shirt」というプロンプトを並べて入力すると、「青い髪, 青いシャツ」のような、前方の色が後方に移った画像が生成されてしまうことがあります。これを色移りといいます。

色移りを防ぐ方法

  • 違う色のプロンプトを並べない
  • 同じ色は近くにまとめる
  • 間に他のプロンプトを挟む
    →「blue hair, 1girl, smile, red shirt」
  • 複数のカンマを挟む
    →「blue hair,,,,,red shirt」

色移りの他にも、近くにあるプロンプト同士が影響することはよくあります。常に意識しておきましょう。

プロンプトの強調

効きの悪いプロンプトがある場合、いくつかの強調方法で対策ができます。

  • プロンプトを前方に移動する
  • 括弧で強調する
  • BREAK構文を使う

プロンプトを前方に移動する

プロンプトは基本的に、前にある方が効きが強くなります。グループ内の後方にある場合、前方に移動させましょう。先頭に配置すると一番効きが強くなります。

括弧で強調する

図のように括弧でプロンプトを囲うことで、そのプロンプトの効きを強くすることができます。また、逆に効きを弱くすることも可能です。

プロンプトを選択した状態で、「CTRL + 上下キー」により強弱を調整できます。

  • 「CTRL + ↑」効きを強くする
  • 「CTRL + ↓」効きを弱くする

BREAK構文を使う

BREAK構文を使うと、グループの途中で強制的に次のグループへ移行してくれます。例えばトークンが34の地点でBREAKを入れた場合、35~75までが自動的に意味のない文字列で埋まり、BREAKの次が76から始まります。

図のように、グループを分ける際は、改行して次の行にBREAKを入れると見やすくなります。

BREAKを入れるメリット

BREAKでグループを分けることにより、見やすくなり、後からの修正がしやすくなります。グループ同士は影響を受けにくいため、近くのプロンプトの色移り等を防止できます。また、BREAKの次のプロンプトは効きが強いため、強弱の調整にも使えます。


画像生成 実践②

プロンプトについて理解が深まったところで、次は以下の設定で画像を生成してみましょう。

ポジティブ プロンプト

(masterpiece, best quality:1.4), 8k, highres, shiny skin, lips, super detailed skin, detailed beautiful face and eyes, bloom, spotlight, professional lighting,
BREAK 1girl, 8 heads tall, japanese, cinematic angle, angelic smile, slender, medium breasts, short hair, pink hair, @人_髪:前髪@,
BREAK white shirt, full body, arms behind back, standing, outdoors, denim skirt

ポジティブプロンプトのポイント

BREAKでグループを分け、「white shirt」と「denim skirt」の距離を取ることで、色移りを防止しました。表情など人に関するプロンプトは「Easy Prompt Selector」を使用しています。

ネガティブ プロンプト

(worst quality, low quality:2.0), easynegative, negative_hand-neg, bad_prompt_version2-neg, badhandv4, bad-hands-5, text,
BREAK ng_deepnegative_v1_75t

Generation設定

モデルmajicMix realistic_v7
VAEvae-ft-mse-840000-ema-pruned.safetensors
Clip skip2
Sampling methodDDIM
Sampling steps30
Hires. fixON
Upscaler4x-UltraSharp
Hires steps15
Denoising strength0.4
Upscale by2.5
Width432
Height768
CFG Scale7
ADetailerON
ADetailer modelface_yolov8n.pt

上記の設定で、以下のような画像が生成されました。

ピンクヘアーを指定しましたが、うまく反映されていません。「pink hair」を強調して再度生成します。

ポジティブ プロンプト 訂正

(masterpiece, best quality:1.4), 8k, highres, shiny skin, lips, super detailed skin, detailed beautiful face and eyes, bloom, spotlight, professional lighting,
BREAK 1girl, 8 heads tall, japanese, cinematic angle, angelic smile, slender, medium breasts, short hair, (pink hair:1.2), @人_髪:前髪@,
BREAK white shirt, full body, arms behind back, standing, outdoors, denim skirt

同じ構図で髪色だけを変えたい場合は、「Seed」を固定します。

ピンクヘアーの出力に成功しました。

ポイント

今回は、BREAKでグループ分けをして、全てのプロンプトが効きやすいように調整しました。それでも効かない部分を、最終調整として括弧で強調しています。最初から括弧で強調するよりも、効かない部分を後から強調する方がおすすめです。

今回は「pink hair」を括弧で強調しましたが、プロンプトを前方に持ってくるなどの対策もあります。


LoRAを使いこなそう

「LoRA(ローラ)」は、顔や服装・ポーズなどの限定的な部分に対し、追加で調整ができるモデルです。

ダウンロード方法

Civitaiでは、たくさんのLoRAが配布されています。

Civitaiトップページより「Models」タブに移動すると、たくさんのモデルが表示されます。

「Filters」から、LoRAを指定して検索します。

好きなLoRAを選択、右のダウンロードボタンからダウンロードします。

ダウンロードボタンの下にある、おすすめの設定やトリガーワードは、どこかに控えておくことをおすすめします。

情報の管理

LoRAを使う際に、毎回Civitaiを開いて設定の確認をするのは手間です。無料で使えるGoogleの「スプレッドシート」を活用しましょう。

モデル名・タイプ・トリガーワード・ベースモデル・おすすめ設定・ライセンスなどについてスプレッドシートに記録しておくと、Civitaiを開かなくても設定を確認することができます。

以下のテンプレートをコピーしてお使いください。

ファイル名について

LoRAのファイル名を変更しても大丈夫?

はい、ファイル名を変更しても使えます。

管理をしやすくするために、分かりやすい名前に変更するのがおすすめです。ただ、一部トリガーワードが変更になる場合がありますので、ご注意ください。

使用方法

「stable-diffusion-webui」⇒「models」⇒「Lora」にダウンロードしたファイルを設置します。

Stable Diffusion Web UIを開き、「Civitai Helper」のタブに移動、「Scan」をクリック。

Loraタブで「Refresh」をクリックすると、一覧がサムネイル表示になりました。

サムネイルをクリックすると、プロンプト欄に「LoRAを有効化させるプロンプト」が入力されます。

Civitaiに記載のあったトリガーワードの中で、必要なものを追加で入力します。

以上が、LoRAを反映させる一連の流れです。

うまく反映させるコツ

LoRAに関しても、BREAKや括弧での強調が有効です。うまく反映されない時は、BREAKの次に有効化のプロンプトを置いたり、トリガーワードを括弧で強調します。

モデルとの相性もありますので、強調しても反映されない場合があります。

LoRAの影響が強すぎて、著しく画風が変わってしまう場合は、逆に効きを弱くします。

左から強さ「1 → 0.8 → 0.6 → 0.4」。「1」では強すぎますが、「0.8」なら使えそうです。

理想の強さを見つけたら、そちらもスプレッドシートに記録しておきましょう。


ワイルドカード応用編


ControlNetの活用


販売する画像サイズ

販売用の画像サイズについては、以下の通りです。アップスケールを通して、「2160 × 3840」または「3840 × 2160」の「4K画質」の画像を作成します。

元のサイズHires. fix 2倍Extras 2.5倍
432 × 768864 × 15362160 × 3840
768 × 4321536 × 8643840 × 2160
元のサイズHires. fix 2.5倍Extras 2倍
432 × 7681080 × 19202160 × 3840
768 × 4321920 × 10803840 × 2160

「Extras」でのアップスケールに関しては、画像編集を終えた後に行いますので、次の章で詳しく解説します。


まとめ

ここまできたら、もうすでにあなたは「Stable Diffusion」中級者レベルです。あとは今までの前提知識をもとに、売れる画像を生成・販売していくのみです。

次の項目では、画像の品質をあげる「画像編集」についてお伝えします。


次へ進む

講座メニュー

広告