【AI実写風動画】ストーリーテラー工房 制作ワークフロー(Google AI Studio版)

このページでは、「Co-Creator's Forge」の「ストーリーテラー工房」と「Google AI Studio」を連携させ、アニメキャラクターが実在するかのような高品質なショート動画を制作するための、最新・公式ワークフローを解説します。


Step 1: 企画とプロンプト生成(Co-Creator's Forge)

1-1. 企画の決定

  1. _run_gui.bat を実行し、「ストーリーテラー工房」タブを開きます。
  2. 動画のテーマ目標の総再生時間制作スタイルナレーションスタイルを選択します。

1-2. 制作アセットの生成と修正

  1. 1. 制作指示書(台本)を生成」ボタンを押します。
    output/realworld_storyteller/内にプロジェクトフォルダが生成され、企画書(spec_sheet.txt)や、ひらがな台本(narration_script_hiragana.txt)などが出力されます。
  2. 【手動修正】生成された spec_sheet.txt を開き、台本やナレーションの内容を確認します。必要であれば、このテキストファイルを直接編集して内容を修正・確定してください。
  3. 内容が確定したら、「2. 画像プロンプト一式を生成」ボタンを押します。
    → 修正済みの指示書に基づき、静止画を制作するための詳細な指示書(image_prompts.txt)が生成されます。

Step 2: 企画共有と音声準備

2-1. 企画共有(チーム作業)

  1. 確定した spec_sheet.txt 内の「企画概要」セクションをコピーします。
  2. Chatworkのグループチャットを開き、自分自身のタスクとして、コピーした企画概要を登録します。これにより、制作の進捗管理が容易になります。

2-2. ナレーション音声の準備(Google AI Studio)

  1. Google AI Studio の音声生成ページを開き、モデルを「Gemini 2.5 Pro Preview TTS」に設定します。
  2. プロジェクトフォルダ内にある narration_script_hiragana.txt を開きます。(注意:Step 1-2で台本を手動修正した場合、このひらがな台本の内容は古くなっています。再度ひらがな化するか、漢字台本を元に音声生成してください)
  3. ファイルの内容を全てコピーし、AI Studioの「Text」欄に一旦すべて貼り付けます。
  4. 貼り付けたテキストの1行目(漢字かな交じりのスタイル指示)だけを切り取り、上の「Style instructions」欄に貼り付けます。
  5. spec_sheet.txt 記載の推奨音声モデルを参考に「Voice」を選択し、「Run」で音声を生成します。
  6. 生成した音声をPCにダウンロード後、narration.wav として最新のプロジェクトフォルダ内に配置してください。

Step 3: 映像素材の準備(Google AI Studio 等)

3-1. 基準となる静止画の生成

  1. Google AI Studio のチャットページを開き、モデルを「Nano Banana (gemini-2.5-flash-image-preview)」に設定します。
  2. image_prompts.txt を開き、生成したいカットのセクションを探します。
  3. 記載されている「参照画像ガイド」を参考に参照画像を探し、AI Studioに添付します。【重要】生成したい構図と参照画像の構図は必ず一致させてください。
  4. 同じセクションにある、使いたい構図のプロンプト(推奨はBust-up Shot)をコピーして貼り付け、Temperature: 0.3, Aspect ratio: 9:16 に設定して画像を生成します。
  5. 完成したら画像をPCにダウンロードし、input/storyteller_images/フォルダに、対応するカット番号(例: 1.png)で保存します。

3-2. AI動画クリップの生成(オプション)

静止画の代わりに、より高品質なAI動画クリップを使用することも可能です。

  1. CapCut、KlingVeoなどの動画生成AIにアクセスします。
  2. 生成した「基準静止画」をアップロードします。
  3. 【重要】プロンプトによる動きの指定は、AIモデルの特性やバージョンに大きく左右されます。 以下の方法を試し、そのカットに最もふさわしい、自然な動きのクリップを生成してください。

    方法A(プロンプトなし): プロンプトを空欄のまま「Image to Video」を実行する。AIが自動で生成する自然な微動(瞬き、呼吸など)が効果的な場合があります。

    方法B(短い動きの指示): spec_sheet.txtの「行動の詳細」を参考に、「A gentle breeze blows through her hair.」や「The camera slowly zooms in on his face.」のような、非常に短く具体的な動きの指示のみを追加する。過剰な指示は不自然な結果を招くことがあります。

Step 4: 字幕の生成とタイミング調整

  1. ツールに戻り、「3. 音声から字幕を自動生成」ボタンを押します。
    → プロジェクトフォルダ内に、字幕ファイル(final_adjusted.srt)とデザイン案(subtitle_designs.json)が生成されます。
  2. 【最重要】生成された final_adjusted.srt をDaVinci Resolveなどの動画編集ソフトで開き、音声波形を見ながら字幕の表示タイミングを完璧に調整し、上書き保存します。(書き出し形式は「字幕ファイル(フォーマットなし)」を推奨)

Step 5: 最終編集

  1. ツールに戻り、「4B. 字幕クリップ(分割版)を生成」ボタンを押します。
    → プロジェクトフォルダ内に subtitle_clips フォルダが作成され、カットごとに分割された「音声付き字幕動画」(01_cut.mov, 02_cut.mov...)が生成されます。
  2. CapCutやDaVinci Resolveなどの動画編集ソフトを起動し、以下の素材をすべて読み込みます。
    subtitle_clips フォルダ内の全てのMOVファイル
    ・ご自身で用意したAI動画クリップや静止画素材
    ・お好みのBGM
  3. タイムラインの上位トラックに、01_cut.mov, 02_cut.mov... を順番に並べます。
  4. タイムラインの下位トラックに、各カットの長さに合わせて映像素材(AI動画や静止画)を配置します。
  5. (オプション)配置した静止画に、編集ソフトの機能(CapCutのテンプレート、キーフレーム等)を使ってアニメーションを適用します。
  6. BGMや効果音を追加し、全体のバランスを調整して動画を完成させてください。

お疲れ様でした!