NotebookLM動画制作
ナレーション音声とSRT字幕の準備(共通フロー)


このページでは、どちらの動画制作パターンを選択するにしても、最初に行うことになる「ナレーション音声」と「SRT字幕ファイル」の準備フローをステップバイステップで解説します。ここをしっかり押さえることで、後の動画制作が格段にスムーズになります!

NotebookLMの強力なAI機能と、いくつかの便利なツールを連携させて、高品質な動画素材の土台を作り上げていきましょう。


ステップ1:ソース準備とNotebookLMへの入力

まず、動画の元となる情報を準備します。NotebookLMは様々な形式の情報を「ソース」として読み込み、それを理解して動画制作の土台となるアイデアやナレーションの元を提供してくれます。

NotebookLMでサポートされている主なソース形式と入力方法:

  • ファイルアップロード:
    • PDF(.pdf):論文、レポート、電子書籍など。
    • テキストファイル(.txt):プレーンなテキスト原稿、メモなど。
    • Markdown(.md):構造化されたテキスト文書。
    • 音声ファイル(例:.mp3):既存のナレーション音声やインタビュー録音など。
  • Googleドライブ連携:
    • Googleドキュメント:作成済みの原稿や資料。
    • Googleスライド:プレゼンテーション資料。各スライドのノートも読み込み対象になります。
  • リンク入力:
    • ウェブサイトURL:参考記事やブログ記事など、公開されているウェブページの内容。
    • YouTube URL:動画のトランスクリプト(字幕情報)を読み込みます。(YouTube動画の内容を元に解説動画を作りたい場合に便利です。)
  • テキスト貼り付け:
    • コピーしたテキスト:他のアプリケーションやウェブページからコピーしたテキストを直接貼り付けてソースにできます。

具体的なソースの例:

  • ご自身で執筆したブログ記事のテキストファイル。
  • 商品紹介のためのプレゼンテーション資料(GoogleスライドまたはPDF)。
  • 解説したいテーマに関する参考ウェブサイトのURL。
  • YouTubeで公開されている興味深い動画のURL(トランスクリプトを利用)。
  • 過去に作成したセミナーの音声録音(.mp3)。

これらの情報をNotebookLMの左側パネルにある「+追加」ボタンから、適切な方法でソースとして追加してください。複数のソースを組み合わせることも可能です。

ソースを追加すると、NotebookLMがその内容を分析し、AIとの対話や「音声概要」機能のベースとして活用できるようになります。


ステップ2:NotebookLM用カスタマイズ指示と読み間違い防止リストの準備(ビューワー活用)

次に、本講座で提供する「NotebookLM連携 AI動画制作 支援ビューワー」を活用し、Google AI Studio(Gemini 2.5 Pro推奨)を使ってNotebookLMの動作を最適化するための具体的なテキストコンテンツ(「カスタマイズ指示」と「読み間違い防止リスト」)を作成します。

  1. 「NotebookLM連携 AI動画制作 支援ビューワー」(パスワード:Maum_Na_0304_Natty)を開き、「NotebookLM音声概要」タブに移動します。
  2. 「カスタマイズ指示」の準備:
    • ビューワーの「NotebookLM音声概要」タブ内にあるフォームに、以下の情報を入力します。
      • テーマ:生成したい音声概要の全体的なテーマや目的(例:「製品Xの概要と利点をまとめる」)。
      • ソース1 タイトルと内容〜ソース10 タイトルと内容:NotebookLMに追加した(または追加する予定の)各ソースのタイトルと、その具体的な内容やキーポイントを入力します。入力するソース情報は、実際にNotebookLMで使用するソースと整合性を取るようにしてください。最大10個のソース情報を入力できます。
    • フォーム入力後、「カスタマイズ生成指示書をコピー」ボタンをクリックします。これにより、入力したテーマとソース情報が反映された指示書(プロンプトテンプレート)がクリップボードにコピーされます。
    • コピーした指示書をGoogle AI Studio(Gemini 2.5 Pro推奨)のチャット入力欄に貼り付けて実行します。
    • Google AI Studioが、NotebookLMの「音声概要をカスタマイズ」欄に設定するための具体的な「カスタマイズ指示」(AIホストの話し方や焦点などを指示する文章)を生成します。これを控えておきます。
  3. 「読み間違い防止リスト」の準備:
    • ビューワーの「NotebookLM音声概要」タブ内にある「読み間違いリスト生成指示書をコピー」ボタンをクリックします。これにより、上記フォームに入力したテーマやソース情報が反映された、読み間違い防止リスト生成用の指示書(プロンプトテンプレート)がクリップボードにコピーされます。
    • コピーした指示書をGoogle AI Studioのチャット入力欄に貼り付けて実行します。
    • Google AI Studioが、NotebookLMのソースとして追加するための具体的な「読み間違い防止リスト」(例:「AI:エーアイ」のような形式のリスト)を生成します。これを控えておきます。(このリストは後のSRT修正時の表記ゆれ対策にも有効なため、作成を推奨します。ただし、必ずしも全ての読み間違いを防げるわけではない点にご注意ください。)
  4. 生成・準備した「読み間違い防止リスト」を、NotebookLMの左側「ソース」パネルから新しいソースとして追加します。同じく準備した「カスタマイズ指示」(AIホストの話し方や焦点などを指示する文章)は、次のステップでNotebookLMの「音声概要をカスタマイズ」欄に設定するために控えておきます。

ステップ3:NotebookLMでのナレーション音声生成とダウンロード

ステップ2で「読み間違い防止リスト」をNotebookLMのソースに追加し、「カスタマイズ指示」を準備したら、いよいよナレーション音声の元となる「音声概要」を生成します。

  1. NotebookLMの右側「Studio」パネル内にある「音声概要」セクションの「詳細な会話」にある「カスタマイズ」ボタンをクリックして設定画面を開きます。
  2. 開いた設定画面(「AIホストが焦点を当てるべきこと」などの入力欄がある画面)に、ステップ2で準備しておいた「カスタマイズ指示」を貼り付けます。
  3. 設定後、「生成」ボタンをクリックします。これにより、あなたが追加した全ソース(読み間違い防止リストを含む)とカスタマイズ指示に基づいて、AIホスト2名が対話形式で内容を解説する音声コンテンツが自動で作成されます。
  4. 生成された「音声概要」は、ナレーション音声ファイル(.wav形式)としてダウンロードできます。このダウンロードした音声ファイルを、ローカルツールのinputフォルダ内にinput_audio.wavというファイル名で保存してください。(ファイル名はご自身で管理しやすいものでも構いませんが、以降のローカルツールのデフォルト設定に合わせておくと便利です。)

このinput_audio.wavファイルが、最終的な動画のメインナレーションの元となります。


ステップ4:プロ級音声に激変!DaVinci Resolve無料版での音声下処理完全ガイド(最新版)

動画編集において、映像と同じくらい、あるいはそれ以上に重要なのが「音声」です。NotebookLMからダウンロードしたナレーション音声を、さらにクリアで聞き取りやすい状態に整えることを強く推奨します。

ここでは、無料でありながらプロフェッショナルな音声編集機能を備えたDaVinci Resolveの「Fairlight」ページを使い、ノイズ除去、音質調整、音量調整を行う基本的な「音声下処理」のワークフローを解説します。本ガイドでは、主要な音質調整エフェクトをオーディオトラック「A1」に適用し、最終段の音量管理として「Bus 1」にリミッターをかける方法を採用します。この方法により、素材固有の調整と全体の音量管理を両立させ、作業効率と品質の向上を目指します。

この工程を経ることで、後のSRT生成の精度向上や、最終的な動画の品質が飛躍的に向上します。

4.1. 準備〜Fairlightページで素材を読み込む

まずはDaVinci Resolveで音声処理を行うための準備をしましょう。

  1. Fairlightページを開く:DaVinci Resolveの画面下部にあるメニューアイコンの中から、「Fairlight」(音符のアイコン)をクリックして、音声編集専用のページに移動します。
  2. 素材をタイムラインに読み込む:
    • PCのファイルエクスプローラー(Finderなど)から、ステップ3で保存したナレーション音声ファイル(例:input_audio.wav)を、直接DaVinci Resolveのオーディオトラック(例:オーディオ 1)上にドラッグ・アンド・ドロップします。
    • 【重要ポイント】タイムライン配置のコツ:音声クリップをタイムラインの一番左端(0秒地点)にぴったり付けて配置すると、エフェクト処理などの影響で冒頭の音声がわずかに欠けてしまうことがあります。これを避けるため、クリップの開始位置をタイムラインの先頭からほんの少しだけ右にずらして配置することをお勧めします。(例:数フレーム分、または0.1秒程度など)

4.2. ミキサーパネルの理解とエフェクト適用先

Fairlightページでの音声処理は、主に「ミキサー」パネルで行います。ミキサーが表示されていない場合は、画面右上の「ミキサー」ボタンで表示してください。

ミキサーには、タイムライン上の各オーディオトラック(例:オーディオ 1オーディオ 2…)に対応するチャンネルストリップと、それらの音声が最終的にミックスされて出力される「バス」のチャンネルストリップ(例:Bus 1)があります。

本ワークフローのポイント:素材固有の音質調整エフェクト(Noise Reduction、De-Esser、Dynamics(Compressor)、EQ)は、ナレーション音声が配置されているオーディオトラック「A1」(またはオーディオ 1など、該当するトラック名)のチャンネルストリップに直接適用します。そして、全体の最終的な音量管理とクリッピング防止のためのリミッターのみを「Bus 1」(メイン出力バス)のチャンネルストリップに適用します。

4.3. オーディオトラック「A1」への推奨エフェクト設定ワークフロー

オーディオトラック「A1」のミキサーチャンネルストリップに対して、以下の順序でエフェクトを設定・調整していきます。Fairlightでは、トラックのミキサーチャンネルストリップにある「処理順」のプルダウンメニューから、内蔵EQ(EQ)、内蔵ダイナミクス(DY)、インサートエフェクト(FX)の処理順を選択できます。ここでは、一般的なセリフ処理に適した処理順と、各エフェクトの推奨設定値を解説します。

  1. 処理順の設定(「A1」トラックにて):「A1」トラックのミキサーにある「処理順」ボタンをクリックし、「FX DY EQ」を選択します。これにより、インサートエフェクト→ダイナミクス→EQの順で処理されます。
  2. インサートエフェクト(FX)の設定(「A1」トラックのFXスロットにて):
    • 以下の順でFXスロットにエフェクトを追加し、設定します。
      1. Noise Reduction(ノイズリダクション):(FXスロットの1番目)
        • モード:自動
        • しきい値:-45.0 dB
        • アタック:10.0 ms
        • 感度:2.50
        • レシオ:0.7
        • スムース時間:オン
        • スムース周波数:1.00
        • 出力ドライ・ウェット:90.0 %
        • 出力レベル:0.0 dB
      2. De-Esser(ディエッサー):(FXスロットの2番目)
        • 周波数:6.50k Hz
        • 適用量:40.0 %
        • 反応時間:中速
  3. ダイナミクス(Compressor)設定(「A1」トラックの内蔵ダイナミクスにて):
    • 「A1」トラックの「ダイナミクス」セクションをダブルクリックしてダイナミクスウィンドウを開きます。
    • ウィンドウ内の「コンプレッサー」セクションのスイッチをオンにします。「エキスパンダー・ゲート」と「リミッター」のスイッチはオフにします。
    • 推奨設定値:
      • しきい値(Threshold):-18.0 dB
      • レシオ(Ratio):3.0:1
      • ニー(Knee):50
      • ミックス(Mix):100 %
      • アタック(Attack):4 ms
      • ホールド(Hold):0.00 ms
      • リリース(Release):80 ms
      • メイクアップ(Makeup Gain):0.0 dB(必要に応じて、圧縮で下がった音量を補うために調整)
  4. EQ(イコライザー)設定(「A1」トラックの内蔵EQにて):
    • 「A1」トラックの「EQ」セクションをダブルクリックしてEQウィンドウを開きます。
    • EQの種類:Fire
    • Band 1(ハイパスフィルター):周波数 100 Hz、スロープ 12 dB・oct
    • Band 2(ピーキング):周波数 119 Hz、L、ゲイン -1.0 dB、Qファクター 2.3
    • Band 3(ピーキング):周波数 240 Hz、ML、ゲイン -1.5 dB、Qファクター 1.1
    • Band 4(ピーキング):周波数 1.2K Hz、MH、ゲイン 0.0 dB、Qファクター 1.1
    • Band 5(ハイシェルフフィルター):周波数 6.0K Hz、H、ゲイン +2.0 dB、Qファクター 5.0
    • Band 6(ローパスフィルター):周波数 18.0K Hz、スロープ 12 dB・oct
  5. エフェクト効果の確認:「A1」トラックのミキサーにある各処理(FXスロット内のエフェクト、ダイナミクス、EQ)のオン・オフスイッチを使って、処理前後の音を注意深く比較し、意図した効果が得られているか、不自然な音になっていないかを確認します。
  6. 音量フェーダーで調整(「A1」トラックにて):ナレーション音声の基本的な音量レベルは、「A1」トラックのフェーダーで調整します。この調整は、Bus 1に送られる前の音量に影響します。

4.4. 「Bus 1」へのリミッター設定

オーディオトラック「A1」での音質調整が完了したら、最終的な音量管理とクリッピング防止のために、「Bus 1」にリミッターを設定します。

  1. 「Bus 1」のミキサーチャンネルストリップのFXスロットに「Limiter」を追加します。
  2. Limiter 推奨設定値:
    • 入力レベル:0.0 dB
    • 入力Softモード:オン
    • 上限(Ceiling・Threshold):-1.0 dBTP
    • リリース(Release):80.00 ms
  3. Bus 1のダイナミクス・EQをオフに設定:Limiterを追加した後、Bus 1のミキサーチャンネルストリップで、内蔵されている「ダイナミクス」および「EQ」セクションのスイッチを「オフ」に設定してください。これにより、A1トラックで行った音質調整が意図せず変更されることを防ぎます。
  4. ラウドネスメーターで確認(目安):画面右上のラウドネスメーター(表示されていなければ画面右上の「メーター」ボタンで表示)で、主要部分を再生し、統合ラウドネス(Integrated)とTrue Peak(TP)の値を確認します。最終的な音量調整は次の「音声書き出し」ステップのノーマライゼーションで行うため、ここではあくまで目安としての確認です。

4.5. 音声書き出し〜高品質WAVファイルを作成

「A1」トラックでの音質調整と「Bus 1」でのリミッター処理が完了したら、次に行うSRTファイル生成(CapCutなど)や最終的な動画編集で使用するための高品質な音声ファイル(.wav形式)を書き出します。その際、音声の末尾に短い無音区間を追加することで、より自然な仕上がりを目指します。

(推奨)ナレーション末尾への無音追加

NotebookLMで生成された音声は末尾が急に終わることがあります。リップシンクの自然な終了や編集時の余韻のため、書き出す前にナレーション音声の末尾に短い無音区間を追加しましょう。

  1. ローカルツールセットのinputフォルダ内にあるsilence.wav(1秒無音ファイル)を、Fairlightタイムライン上の処理済みナレーションクリップ(「A1」トラック上)の末尾にドラッグアンドドロップして連結します。
  2. これで、ナレーション音声の末尾に1秒間の無音区間が追加されました。この連結された音声全体を書き出し対象とします。

音声ファイルの書き出し手順

  1. デリバーページへ移動:画面下部のロケットアイコン(デリバーページ)をクリックします。
  2. 「Audio Only」プリセット選択:画面左上の「レンダー設定」で、「Audio Only」プリセットを選択します。
  3. ファイル名・保存先設定:「ファイル名」をinput_audioとし、「保存先」をローカルツールセット内のinputフォルダに指定します。(これにより、既存のinput_audio.wavに直接上書き保存され、後の設定変更が不要になります。)
  4. ビデオ設定確認:「ビデオ」タブで、「ビデオの書き出し」のチェックがオフになっていることを確認します。
  5. オーディオ設定:「オーディオ」タブで、以下の項目を設定します。
    • フォーマット:Wave
    • コーデック:リニアPCM
    • ビット深度:24(推奨)
    • 出力トラック:Bus 1 (Stereo)(A1トラックの音声がBus 1経由で出力されるため、これで正しいです)
  6. オーディオノーマライゼーション設定(最終音量調整):「オーディオのノーマライズ」のチェックボックスをオンにします。通常は「標準にノーマライズ」を選択し、「標準」プルダウンメニューから配信プラットフォーム(例:YouTube)を選びます。これで適切な音量に調整されます。
  7. レンダーキューに追加し、書き出し実行:設定画面下部にある「レンダーキューに追加」ボタンをクリックします。すると、画面右側の「レンダーキュー」パネルにジョブが追加されます。最後に、その「レンダーキュー」パネル内にある「すべてレンダー」ボタンをクリックして、音声ファイルの書き出しを開始します。
  8. 完了確認:inputフォルダ内のinput_audio.wavが、末尾に無音が付加された新しい音声ファイルに正しく上書きされていることを確認します。これで、次のステップ(CapCutでのSRT生成など)に進む準備が整いました。

4.6. 【超効率化!】プロジェクトの使い回しと音声入れ替えテクニック

一度「A1」トラックと「Bus 1」に最適なエフェクト設定を施したこのDaVinci Resolveプロジェクトは、今後の動画制作で「音声処理テンプレート」として何度も活用できます。毎回ゼロからエフェクトを設定し直す必要はありません。

音声入れ替えの具体的な手順:

  1. この音声処理済みのDaVinci Resolveプロジェクトを別名で保存しておくか、テンプレートとしてコピーしておきます。
  2. 次回、新しいナレーション音声(例:new_audio.wav)を処理する際、このプロジェクトを開きます。
  3. Fairlightページのタイムラインで、新しい音声ファイル(new_audio.wav)を、「A1」トラックの同じ位置(先頭から少しずらした位置)にドラッグ・アンド・ドロップし上書きします。
  4. 新しい音声に合わせて、「A1」トラックの各エフェクトの微調整(特にNoise Reductionの再分析やCompressorのしきい値、EQなど)を行います。Bus 1のリミッターは通常そのままで問題ないことが多いですが、必要に応じて確認します。
  5. 調整後、ステップ4.5の手順で新しい処理済み音声を書き出します。

この方法を使えば、毎回エフェクトをゼロから設定する手間が大幅に削減され、一貫性のある高品質な音声処理を効率的に行うことができます。ぜひマスターしてください!


ステップ5:ナレーション音声からの初期SRTファイル生成(外部ツール)

ステップ4でクリーンアップ・調整したナレーション音声ファイル(例:input_audio.wav)を元に、字幕の元となるSRTファイルを作成します。これには、動画編集ソフトの自動キャプション機能や、専用の文字起こしツールを使用します。

  • CapCutデスクトップ版を使用する場合:
    • CapCutを起動し、新規プロジェクトを作成します。
    • 処理済みのナレーション音声ファイル(例:input_audio.wav)をメディアにインポートし、タイムラインに配置します。
    • 画面左上のメニューから「キャプション」を選択します。
    • 表示されたオプションの中から「自動キャプション」機能を選びます。
    • 「話されている言語」で「日本語」が選択されていることを確認し、「生成」ボタン(Pro版の機能である点に注意)をクリックします。
    • キャプションが生成されたら、画面右上の青い「エクスポート」ボタンをクリックします。
    • 表示された「エクスポート」設定画面では、今回はSRTファイルのみが必要なため、「動画」や「オーディオ」セクションの書き出しはオフにします。その後、「キャプション」セクションのチェックボックスをオンにしてください。
    • 「フォーマット」が「SRT」になっていることを確認します(なっていなければ選択)。「文字のエンコーディング」は通常「Unicode・UTF-8」のままで問題ありません。
    • 必要に応じて「名前」や「次にエクスポート」(保存先フォルダ)を設定し、画面下部の「エクスポート」ボタンをクリックして.srtファイルを書き出します。このファイルを仮にtemp_initial.srtとして保存します。
  • その他のツール(Vrew、Whisperなど)を使用する場合:
    • 各ツールの指示に従い、ナレーション音声ファイルから文字起こしを行い、SRT形式でエクスポートしてください。同様にtemp_initial.srtとして保存します。

ステップ6:SRTファイルのAI修正(ビューワー活用)

ステップ5で生成した初期SRTファイル(temp_initial.srt)は、自動生成の特性上、誤字脱字や不自然な区切りなどが含まれていることが一般的です。これらをGoogle AI Studioと本講座提供の「NotebookLM連携 AI動画制作 支援ビューワー」を使って修正・整備し、より正確で使いやすいSRTファイルにしていきます。

  1. ステップ2で作成した「読み間違い防止リスト」と、ステップ5で作成したtemp_initial.srtファイルの内容を準備します。
  2. 本講座提供の「NotebookLM連携 AI動画制作 支援ビューワー」(パスワード:Maum_Na_0304_Natty)を開き、「SRT修正」タブに移動します。
  3. 「SRT修正・結合指示書」セクションにある「読み間違い防止リストをここに貼り付け」というテキストエリアに、準備した「読み間違い防止リスト」の内容を貼り付けます。
  4. 「SRT修正指示書をコピー」ボタンをクリックして、指示書全体をクリップボードにコピーします。
  5. Google AI Studioを開き、System Instructionsに、コピーした指示書を貼り付けます。
  6. Google AI Studioのチャット入力欄に、temp_initial.srtファイルの内容全体を貼り付けて送信(実行)します。
  7. Google AI Studioが、修正されたSRTファイルの内容を出力します。
  8. 出力された修正済みSRTファイルの内容をコピーし、ローカルツールのinputフォルダ内にinput_subtitles.srtというファイル名で保存します(既存の場合は上書き)。このファイルが、後続の全ツールが参照する「正本」となります。

ステップ7:SRT整形パターンの確認(任意・補助ツール)

AIによって修正されたinput/input_subtitles.srtを、動画編集ソフトで手動調整する前に、ローカルツールを使って機械的に整形したらどうなるか、パターンを確認することができます。このステップは任意であり、あくまで手動調整の参考として利用します。

  1. ローカルツールセットのルートフォルダにある1_SRT一括整形.bat(または.command)をダブルクリックします。
  2. 実行すると、どの処理([1]ギャップ修正、[2]改行調整、[3]句読点除去)を行うか選択する画面が表示されます。
  3. ここでは例として、ギャップ修正と改行調整を試してみます。キーボードで`12`と入力し、Enterキーを押してください。
  4. 処理が完了すると、output/formatted_srt/フォルダ内に、処理後のSRTファイル(ファイル名に`_1-gap-fixed_2-formatted`などが含まれる)が生成されます。このファイルを開き、どのような整形結果になるかを確認し、手動調整の際の参考にしてください。【重要】このツールで出力されたファイルは、後続の自動処理では使用されません。

ステップ8:SRTの手動微調整と最終化

AIと補助ツールによる自動処理を経ても、完璧なSRTファイルにするためには最終的な人間の目による確認と微調整が不可欠です。このステップで、最終的な動画の品質を左右する字幕を完成させます。

  1. お使いの動画編集ソフト(CapCut、DaVinci Resolveなど)を起動します。
  2. ステップ4で処理したナレーション音声ファイル(例:input_audio.wav)と、ステップ6でAI修正後に保存したinput/input_subtitles.srtファイルをタイムラインに読み込みます。
  3. ナレーション音声を再生しながら、字幕の表示タイミングが音声と正確に一致しているか、一文の区切りは自然か、誤字脱字はないかなどを徹底的に確認し、修正します。(ステップ7で生成した整形済みSRTを参考にしても良いでしょう)
  4. 【最重要】手動調整したSRTの保存と反映:全ての調整が完了したら、修正後のSRTデータを動画編集ソフトからエクスポートします。ファイル名は分かりやすい名前(例:manual_adjusted.srt)で構いません。次に、エクスポートした修正済みSRTファイルの内容を全てコピーし、ローカルツールセットの`input`フォルダ内にある`input_subtitles.srt`ファイルを開き、その中身を、先ほどコピーした内容で完全に上書き保存してください。この作業により、あなたの手動調整が後続のツール処理に正しく反映されます。

【重要】このステップで、動画制作のベースとなる「人間が読むための最終調整済みSRT」が完成しました。このinput/input_subtitles.srtが、後続の全ツールの入力元となります。

お疲れ様でした!これで、動画制作の最も重要な土台となる「クリーンなナレーション音声」と「最終調整済みのSRT字幕ファイル」の準備が整いました。次のページでは、これらの素材を使って、いよいよ具体的な動画制作パターンに進んでいきましょう!

次に進む

講座メニュー

広告