音声と編集の統合
台本テキストからAIナレーション音声を生成し、映像素材と合わせてFilmoraで1本の動画に仕上げる。Vrewに頼らない新しい制作フローの確立。
台本→ナレーション音声→映像+音声+テロップの合成→書き出しまでを完走し、YouTube公開可能な動画を1本完成させる。所要時間の目安: 90〜120分
進め方
ワークフローをドロップしてモード3を選ぶ
Quest 1と同じファイル(wrestling_video_workflow.md)をAntigravityにドロップし、モード選択で「3」(音声を作る)を選ぶ。台本テキストは自動検出される。
APIの無料枠で使える高品質な音声合成。最初はこちらを使う。日本語に対応しており、複数の声質から選択可能。
より細かい音声制御が可能。無料枠あり(月間一定文字数まで)。Google Cloudの設定が必要なため、慣れてから切り替える。
ワークフロー実行時にAIが「どの音声エンジンを使いますか?」と聞いてくる。最初は「Gemini TTS」と答えればOK。後から「Google Cloud TTS」に切り替えることもできる。
音声を確認・調整する
生成された音声ファイルを再生して確認する。問題があればAIに「もう少しゆっくり」「声を変えて」などと伝えるだけで再生成される。
Filmoraで映像・音声・テロップを合成する
Filmoraを開いて以下の順番で素材を配置する。
本講座ではFilmoraの操作ガイドは提供していません。基本操作に不安がある場合はFilmora公式チュートリアルを参照してください。編集の細かいテクニックよりも、「素材を並べて書き出す」こと自体が重要です。
完成動画を共有する
完成した動画をOKIHIROに共有してください。MP4ファイルまたはYouTubeの限定公開URLでOK。フィードバック後、Quest 4(量産体制構築)に進みます。