【AI実写風動画】ストーリーテラー工房 制作ワークフロー(Google AI Studio版)
このページでは、「Co-Creator's Forge」の「ストーリーテラー工房」と「Google AI Studio」を連携させ、アニメキャラクターが実在するかのような高品質なショート動画を制作するための、最新・公式ワークフローを解説します。
Step 1: 企画とプロンプト生成(Co-Creator's Forge)
1-1. 企画の決定
_run_gui.batを実行し、「ストーリーテラー工房」タブを開きます。- 動画のテーマ、目標の総再生時間、制作スタイル、ナレーションスタイルを選択します。
1-2. 制作アセットの生成と修正
- 「1. 制作指示書(台本)を生成」ボタンを押します。
→output/realworld_storyteller/内にプロジェクトフォルダが生成され、企画書(spec_sheet.txt)や、ひらがな台本(narration_script_hiragana.txt)などが出力されます。 - 【手動修正】生成された
spec_sheet.txtを開き、台本やナレーションの内容を確認します。必要であれば、このテキストファイルを直接編集して内容を修正・確定してください。 - 内容が確定したら、「2. 画像プロンプト一式を生成」ボタンを押します。
→ 修正済みの指示書に基づき、静止画を制作するための詳細な指示書(image_prompts.txt)が生成されます。
Step 2: 企画共有と音声準備
2-1. 企画共有(チーム作業)
- 確定した
spec_sheet.txt内の「企画概要」セクションをコピーします。 - Chatworkのグループチャットを開き、自分自身のタスクとして、コピーした企画概要を登録します。これにより、制作の進捗管理が容易になります。
2-2. ナレーション音声の準備(Google AI Studio)
- Google AI Studio の音声生成ページを開き、モデルを「Gemini 2.5 Pro Preview TTS」に設定します。
- プロジェクトフォルダ内にある
narration_script_hiragana.txtを開きます。(注意:Step 1-2で台本を手動修正した場合、このひらがな台本の内容は古くなっています。再度ひらがな化するか、漢字台本を元に音声生成してください) - ファイルの内容を全てコピーし、AI Studioの「Text」欄に一旦すべて貼り付けます。
- 貼り付けたテキストの1行目(漢字かな交じりのスタイル指示)だけを切り取り、上の「Style instructions」欄に貼り付けます。
spec_sheet.txt記載の推奨音声モデルを参考に「Voice」を選択し、「Run」で音声を生成します。- 生成した音声をPCにダウンロード後、
narration.wavとして最新のプロジェクトフォルダ内に配置してください。
Step 3: 映像素材の準備(Google AI Studio 等)
3-1. 基準となる静止画の生成
- Google AI Studio のチャットページを開き、モデルを「Nano Banana (gemini-2.5-flash-image-preview)」に設定します。
image_prompts.txtを開き、生成したいカットのセクションを探します。- 記載されている「参照画像ガイド」を参考に参照画像を探し、AI Studioに添付します。【重要】生成したい構図と参照画像の構図は必ず一致させてください。
- 同じセクションにある、使いたい構図のプロンプト(推奨はBust-up Shot)をコピーして貼り付け、Temperature: 0.3, Aspect ratio: 9:16 に設定して画像を生成します。
- 完成したら画像をPCにダウンロードし、
input/storyteller_images/フォルダに、対応するカット番号(例:1.png)で保存します。
3-2. AI動画クリップの生成(オプション)
静止画の代わりに、より高品質なAI動画クリップを使用することも可能です。
- CapCut、Kling、Veoなどの動画生成AIにアクセスします。
- 生成した「基準静止画」をアップロードします。
- 【重要】プロンプトによる動きの指定は、AIモデルの特性やバージョンに大きく左右されます。 以下の方法を試し、そのカットに最もふさわしい、自然な動きのクリップを生成してください。
・方法A(プロンプトなし): プロンプトを空欄のまま「Image to Video」を実行する。AIが自動で生成する自然な微動(瞬き、呼吸など)が効果的な場合があります。
・方法B(短い動きの指示):spec_sheet.txtの「行動の詳細」を参考に、「A gentle breeze blows through her hair.」や「The camera slowly zooms in on his face.」のような、非常に短く具体的な動きの指示のみを追加する。過剰な指示は不自然な結果を招くことがあります。
Step 4: 字幕の生成とタイミング調整
- ツールに戻り、「3. 音声から字幕を自動生成」ボタンを押します。
→ プロジェクトフォルダ内に、字幕ファイル(final_adjusted.srt)とデザイン案(subtitle_designs.json)が生成されます。 - 【最重要】生成された
final_adjusted.srtをDaVinci Resolveなどの動画編集ソフトで開き、音声波形を見ながら字幕の表示タイミングを完璧に調整し、上書き保存します。(書き出し形式は「字幕ファイル(フォーマットなし)」を推奨)
Step 5: 最終編集
- ツールに戻り、「4B. 字幕クリップ(分割版)を生成」ボタンを押します。
→ プロジェクトフォルダ内にsubtitle_clipsフォルダが作成され、カットごとに分割された「音声付き字幕動画」(01_cut.mov,02_cut.mov...)が生成されます。 - CapCutやDaVinci Resolveなどの動画編集ソフトを起動し、以下の素材をすべて読み込みます。
・subtitle_clipsフォルダ内の全てのMOVファイル
・ご自身で用意したAI動画クリップや静止画素材
・お好みのBGM - タイムラインの上位トラックに、
01_cut.mov,02_cut.mov... を順番に並べます。 - タイムラインの下位トラックに、各カットの長さに合わせて映像素材(AI動画や静止画)を配置します。
- (オプション)配置した静止画に、編集ソフトの機能(CapCutのテンプレート、キーフレーム等)を使ってアニメーションを適用します。
- BGMや効果音を追加し、全体のバランスを調整して動画を完成させてください。
お疲れ様でした!