講座ホーム / 4. 画像を動かす!Grok Imagineのプロンプト調整術

🎬 4. 画像を動かす!Grok Imagineのプロンプト調整術

画像が無事に完成したら、次はそれを滑らかに動かします。AI動画特有の「暴走」を防ぎ、意図した通りの動きを作るテクニックを学びましょう。

① Grok Imagineの「5要素構文」

AI動画生成を成功させるには、単に「動かせ」と指示するのではなく、専用の構文を使う必要があります。AIへの指示書は以下の5つの要素で構成します。

  1. 被写体:誰が、何が(例:ショートカットの女性が)
  2. 行動:何をしているか(例:エナジードリンクを飲む)
  3. カメラワーク:視点の動き(例:顔への緩やかなズームイン)
  4. 照明:光の当たり方(例:下からの不穏な照明)
  5. ムード:全体の雰囲気(例:緊迫感、サイバーパンク)

② 失敗例とその原因分析

❌ 重大なエラーを引き起こす「詰め込みすぎ」

「手に持っていたドリンクを口元に運び、一気に飲み始めると、喉からインナーグローが発光し、痛みに耐えながら不穏な空気が漂う...」

[原因分析]
初心者が最も陥りやすい罠です。短時間の動画の中に情報を詰め込みすぎると、AIが処理しきれず混乱します。
結果として、手が急に別人の手に変わったり、飲んでいないのに光ったり、キャラクターの骨格が変形したりと映像が破綻し、生成の無駄打ち(ガチャ)が増加します。

③ 解決策:「1カット=1アクション」の徹底

✅ シンプルイズベスト

「エナジードリンクを一気に飲み始める。顔へのズームイン。」

AI動画生成では極端なまでに指示を単純化することが正解です。「5要素もあるのに矛盾していないか?」と思うかもしれませんが、カメラや照明、ムードはただの「環境・視点設定」なのでAIを混乱させません。対して、キャラクターの「動作(行動)」はAIにとって計算負荷が非常に高いため、1つの動画(約5〜6秒)につき「1アクションだけ」に絞るのが、破綻させないための絶対ルールです。

前の画像生成の段階で「体が発光している状態」を描き込んでおけば、Grok Imagineは「飲む動作」と「光の演出」を自動でうまく繋ぎ合わせます。シンプルな指示ほど、AIは元画像の特徴(顔や服装)を維持したまま的確な計算を行うことができます。

NEXT STEP

5. 視線を引き付ける編集・音声・エフェクト術

次へ進む →