AIによる動画要約
この要約は、AIを使用してYouTube動画の字幕から自動生成されました。動画の内容を理解する一助となれば幸いです。
この動画では、Suno AIを使った楽曲生成から、AI歌姫イラストや歌詞に合わせた画像プロンプトを設計できる自作ツール「SUNO歌詞・AI歌姫イラスト・歌詞画像プロンプト設計ビューワー」の機能と、それを用いた動画制作フローについて解説しています。
なお、この要約文は「YouTube動画字幕からの要約生成指示書セット」を使用して作成しました。
ツールの概要と主な機能
この動画で紹介されているのは、「SUNO歌詞・AI歌姫イラスト・歌詞画像プロンプト設計ビューワー」という自作ツールです。このツールは、AIを活用した楽曲やミュージックビデオ制作を効率化することを目的として開発されました。主な機能として、以下の4つのタブが紹介されています。
- Suno AI歌詞コンセプト提案・楽曲指示書作成:楽曲生成AI「Suno AI」で狙った歌詞を生成するためのプロンプト作成を支援します。
- SRT歌詞修正指示書作成:動画編集ソフトで生成したSRT形式の歌詞テロップの表記揺れなどを修正するための指示書を作成します。
- AI歌姫イラスト指示書作成:AI画像生成で利用する、歌姫風イラストのプロンプトを生成します。
- 歌詞行ごとの画像指示書作成:歌詞の各行に対応した画像を生成するためのプロンプトをまとめて作成します。
また、このビューワーは別売り予定の「ローカルツールセット」と連携することで、さらに高度な動画制作が可能になることも示唆されています。
補足情報
- Suno AI:テキストプロンプトからオリジナルの楽曲や歌声を生成できるAIサービスです。
- SRTファイル:SubRip Textの略で、字幕情報を格納する標準的なファイル形式の一つです。タイムスタンプとテキストで構成されます。
Suno AIによる歌詞生成と楽曲制作フロー
ツールを使った歌詞と楽曲の制作プロセスが、具体的な例(鬼滅の刃の竈門炭治郎の歌)を交えて解説されています。
- 歌詞コンセプト提案:
- 「コンセプト提案指示書作成フォーム」に大まかなテーマ(例:竈門炭治郎の歌)とソース情報(例:キャラクターの背景情報)を入力します。
- 生成された指示書をGoogle AI StudioなどのLLMに投入し、楽曲のテーマ、ジャンル、雰囲気、歌詞に入れたい要素、ボーカルイメージといった詳細なコンセプトを生成させます。
- 歌詞・楽曲生成:
- ビューワーの「楽曲指示書作成フォーム」の指示書をコピーします。
- この指示書を再度LLMに投入することで、Suno AIのカスタムモードで実際に歌唱させるためのひらがな歌詞と、動画のテロップ修正等で使用する漢字仮名交じりの歌詞、さらには楽曲スタイルや曲名案まで自動生成されます。
- Suno AIでの楽曲生成:
- 生成されたひらがな歌詞、楽曲スタイル、曲名をSuno AIのカスタムモードに入力し、楽曲を生成します。
- 動画内では、約20秒という高速で2パターンの楽曲が生成され、そのクオリティについても言及されています。
CapCutを使った歌詞テロップの作成と修正
Suno AIで生成した楽曲を動画化する際の、歌詞テロップ作成と修正の手順がCapCutを例に説明されています。
- 楽曲のダウンロードと読み込み:Suno AIで作成した楽曲をWAV形式でダウンロードし、CapCutのタイムラインに読み込みます。
- 自動歌詞キャプション生成:CapCutの「自動歌詞」機能で、楽曲から歌詞キャプション(SRT形式)を生成します。しかし、この段階では表記の誤りや不自然な区切りが多く見られます。
- SRT歌詞修正:
- CapCutから書き出したSRTファイルの内容を、ビューワーの「SRT歌詞修正 指示書作成フォーム」に貼り付けます。
- 生成した漢字仮名交じり歌詞も入力します。
- コピーした修正用指示書(プロンプト)をGoogle AI Studioに投入し、表記が修正されたSRTファイルの内容を生成させます。
- 修正済みSRTの適用と調整:修正されたSRTファイルの内容を元のSRTファイルに上書き保存し、CapCutで読み込み直します。これにより表記は綺麗になりますが、最終的なタイミング調整は手動で行う必要があります。
補足情報
- CapCut:多機能な動画編集アプリで、PC版とスマートフォン版があります。AIを活用した機能も豊富です。
AIによるイラスト・画像生成プロンプトの作成
動画のビジュアル要素となるAIイラストや画像を生成するためのプロンプト作成機能も紹介されています。
- AI歌姫イラスト指示書作成:
- 動画のメインビジュアルとなるAI歌姫のイラスト(立ち絵など)を生成するためのプロンプトを作成します。
- テーマ、人物像、服装、髪型、背景、画風などを細かく設定でき、複数のプロンプトを一括生成できます。
- 歌詞行ごとの画像プロンプト作成:
- ローカルツールセットを使い、CapCutでタイミング調整したSRTファイルから、歌詞の各行を連番付きテキストリストに変換します。
- このリストとテーマ(例:竈門炭治郎の力強い雰囲気、アニメ調)、LoRA情報などをビューワーに入力することで、歌詞の各行に対応した画像生成プロンプトをStable Diffusionなどの画像生成AIで利用できる形式で一括作成します。
補足情報
- Stable Diffusion:テキストから画像を生成できるオープンソースのAIモデルです。LoRA(Low-Rank Adaptation)という技術で特定の画風やキャラクターを学習させ、再現性を高めることができます。
- Pony Diffusion:アニメ風のイラスト生成に特化したStable Diffusionベースのモデルの一つです。
ローカルツールセット連携と高度な動画表現(リップシンク)
別売り予定のローカルツールセットと連携することで、より高度で効率的な動画制作が可能になる点が強調されています。
- SRT字幕の連番テキスト化:歌詞行ごとの画像プロンプト作成の前処理として使用します。
- 画像から個別クリップ動画を作成:指定したフォルダ内の連番画像とSRTファイルのタイムスタンプを基に、歌詞のタイミングに合わせて画像が切り替わるスライドショー動画クリップを自動生成します。これにより、手作業でのタイミング合わせの手間を大幅に削減できます。
- 音声をSRT区間ごとに分割:SRTファイルの各字幕区間に合わせて、元の音声ファイルを自動で分割・保存します。これは、AIリップシンクツールで処理する際に、長い音声を一度に扱えない場合の対策として非常に有効です。
動画の最後には、分割した音声とAI歌姫イラストを使い、CapCut経由で利用できるDreaminaというAIツールの「マスターモード」で高精度なリップシンク動画を生成するデモンストレーションが行われました。これにより、キャラクターが自然に歌っているかのような表現が可能になります。
補足情報
- Dreamina:Dreaminaは、高品質なリップシンク動画の生成をはじめとする、先進的なAI動画編集機能を提供するツールの一つで、CapCutのAI機能の一部としても提供されています。
まとめ:AIツール連携で高品質な音楽動画を効率的に制作
この動画では、自作の「SUNO歌詞・AI歌姫イラスト・歌詞画像プロンプト設計ビューワー」とローカルツールセット、そしてSuno AI、Google AI Studio、CapCut、Stable Diffusion、Dreaminaといった複数のAIツールやソフトウェアを連携させることで、歌詞生成から楽曲制作、動画編集、AIイラスト・画像生成、リップシンクに至るまで、オリジナルの音楽動画を効率的に、かつ高品質に制作する具体的なワークフローが詳細に解説されました。
紹介されたビューワーは、特にプロンプトエンジニアリングが重要となるAIツールの活用を支援し、作業の自動化と効率化に大きく貢献する可能性を秘めています。