AIによる動画要約
この要約は、AIを使用してYouTube動画の字幕から自動生成されました。動画の内容を理解する一助となれば幸いです。
この動画では、GoogleのAIツール「NotebookLM」の基本的な使い方(初級編)について解説しています。
なお、この要約文は「YouTube動画字幕からの要約生成指示書セット」を使用して作成しました。
NotebookLMの概要と基本設定
NotebookLMは、最近日本語に対応し、X(旧Twitter)などで話題になっているGoogleのAIツールです。この動画では、NotebookLMの初級編として、基本的な使い方や話者が使用して覚えたことを解説します。
まず、トップ画面右上の設定ボタンから出力言語
を選択できます。日本語以外にも中国語、英語、タイ語など様々な言語に対応しており、タイ語での出力も試したところ、ある程度の精度が確認できたとのことです。
補足情報
- NotebookLM:Googleが提供するAIを活用したリサーチおよびライティングアシスタントツール。アップロードしたドキュメントに基づいて、要約、質問応答、アイデア生成などを行うことができます。
プロジェクト作成とソースの追加
NotebookLMでは、「新規作成」または既存のプロジェクトを開くことで作業を開始します。新規作成すると、まずソース素材
をアップロードする画面が表示されます。
ソースとしては以下の形式に対応しています:
- PCやスマートフォンからのファイルアップロード
- サポートされているファイル形式: PDF, .txt, Markdown, 音声(例: mp3)
- Google ドキュメント
- Google スライド
- ウェブサイトのリンク(テキストのみインポート)
- YouTubeリンク
- コピーしたテキストの直接貼り付け
一度画面を閉じても、左側の「追加」ボタンからいつでもソースを追加できます。
注意点として、ウェブサイトからはテキストのみがインポートされ、画像は含まれません。また、有料記事やパスワード保護された記事はソースとして利用できません。
AIチャット機能とメモ機能
ソースを追加すると、チャット欄で自動的に簡単な要約
が表示されます。このチャット機能を使って、ソースの内容について質問したり、深掘りしたりすることができます。
チャットの回答は、ソースの内容に基づいて生成されます。内部的にはGoogleのAIモデル「Gemini」(バージョンは不明)が使用されていると考えられます。
チャット画面下部には質問テンプレートも用意されており、これを利用して質問することも可能です。チャットで得られた重要な情報は、「メモに保存」ボタンでメモに追加できます。このメモの内容も、後の音声概要生成などに活用される可能性があります。
補足情報
- Gemini:Googleが開発したマルチモーダルAIモデルファミリー。テキスト、画像、音声、動画など、様々な種類の情報を理解し、生成することができます。
音声概要の生成とカスタマイズ
NotebookLMの大きな特徴の一つが、ソースに基づいて音声概要(オーディオ概要)
を自動生成する機能です。
生成前に「カスタマイズ」オプションを選択すると、500文字以内で特に話してほしい内容や強調したい点を指示できます。話者は、このカスタマイズ指示文を効率的に生成するための自作ツール「NotebookLM連携AI動画制作支援ビューワー」を開発しています。
今回はカスタマイズなしで、「朝早く起きることで得られる3つの良いこと」という一般的なテーマのテキスト(Google AI Studioで作成)をソースとして音声生成を試します。生成にはソース量にもよりますが、5分から10分程度かかる場合があるようです。
補足情報
- Google AI Studio:Googleが提供する、生成AIモデル(Geminiなど)を試したり、プロトタイプを開発したりするためのウェブベースのツール。
生成された音声の確認と課題
生成された音声は、女性と男性の掛け合い形式で、単調にならず飽きさせない工夫がされています。導入部分から引き込まれるような構成になっており、内容もソースに基づいて解説が進められます。
生成された音声の内容が気に入らない場合は、削除して再生成することも可能です。その際は、カスタマイズ機能を使って、より具体的に指示を出すことが推奨されます。
一方で、読み間違いの課題も指摘されています。特にニッチな情報や専門用語などは、正しく読まれない場合があります。話者は、読み間違い防止リストをソースに追加したり、メモに記載したりする対策を試しましたが、現在のところ効果は限定的とのことです。今後の精度向上に期待が寄せられています。
話者としては、自動生成だけでなく、指定したテキストをそのまま読ませる機能があれば、さらに活用の幅が広がると考えています。
マインドマップ機能と共有
NotebookLMには、ソースの内容をマインドマップ形式で視覚的に整理・表示する機能もあります。情報が、階層構造で分かりやすく図式化されます。
作成されたプロジェクトやマインドマップは、「共有」機能を使ってリンクをコピーし、他の人に見せることも可能です。複雑な情報を分かりやすく伝える手段として、ビジネスシーンなどでの活用も期待されます。
ビジネス応用と今後の展望
NotebookLMは、単なる情報整理ツールに留まらず、様々なビジネスシーンでの活用が可能です。
- 会議の音声ファイルをソースにして議事録を要約
- セールスドキュメントの分析・要約
- 商品紹介コンテンツの作成支援
話者は現在、NotebookLMをYouTube動画制作に活用するシステム開発に注力していますが、今後はビジネス向けのシステム開発も検討しているとのことです。
NotebookLMはまだ進化の途上であり、特に多言語対応は大きな強みです。日本語だけでなく、英語、中国語、タイ語など、世界に向けた情報発信が容易になる点は、今後の活用において非常に重要だと述べられています。
YouTube動画制作への応用(話者のワークフロー)
話者は、NotebookLMで生成した音声をYouTube動画に加工するための独自のワークフローを構築しています。
- 音声ダウンロード:NotebookLMから生成された音声をダウンロードします。
- 動画編集ソフトへ読込:
CapCut
などの動画編集ソフトに音声を読み込みます。 - 自動キャプション生成:
CapCut
の機能で音声から自動で文字起こし(キャプション生成)を行います。 - SRTファイル修正:自作の「支援ビューワー」とAIを使い、細切れになった
SRT
(字幕)ファイルを結合・修正します。手作業での修正は時間と手間がかかり、誤字脱字のリスクもあるため、AI活用が推奨されます。翻訳機能も利用可能です。 - 画像生成・配置:AIで動画内容に合った画像を生成し、修正したテロップ情報に基づいて、
Python
スクリプト(自作のバッチファイル)で動画タイムライン上に自動配置します。 - リップシンク動画作成:必要に応じて、立ち絵キャラクターに音声に合わせて口パクさせるリップシンク動画も、自作ビューワーとAI連携で作成可能です。
- 投稿情報生成:最後に、YouTubeへの投稿に必要なタイトル、説明文、タグなどもAIで生成します。
補足情報
- CapCut:スマートフォンおよびPC向けの無料動画編集アプリケーション。豊富な機能と使いやすさで人気があります。
- Python:汎用のプログラミング言語。データ分析、ウェブ開発、自動化など幅広い分野で利用されています。
- SRT (SubRip Text):字幕ファイル形式の一つ。テキストとタイムコードで構成されます。
話者の提供サービス紹介
話者は「OKIHIRO AI クリエイティブ」というスクールサイトを運営しており、以下のようなサービスを提供しています。
- プロンプト(指示書)販売:AI美女ツイート生成、YouTube SEO対策、特定の動画スタイル(妖怪変身、キメラ融合)作成用などのプロンプト集を、使いやすいビューワー形式で提供。
- Google Colabノートブック販売:エラーなく安定して動作するよう整備された、動画生成、
LoRA
作成、Stable Diffusion
起動、リップシンク用のGoogle Colab
ノートブック。 - 各種AI関連講座:AI変身動画講座、動画編集爆速化講座など。
まとめ:NotebookLMの可能性と活用
NotebookLMは、情報整理、AIとの対話による深掘り、音声コンテンツ生成、マインドマップ作成など、多彩な機能を備えた非常に面白いAIツールです。特に、ソースに基づいて男女の掛け合い形式で解説音声を生成する機能はユニークで、コンテンツ作成の新たな可能性を感じさせます。
現状では読み間違いなどの課題もありますが、Googleによる今後の精度向上が期待されます。多言語対応という強みを活かせば、グローバルな情報発信も可能です。
話者は、NotebookLMをYouTube動画制作に応用するシステムを開発するなど、積極的に活用を進めており、ビジネスシーンでの応用にも大きな可能性を感じています。情報収集、学習、コンテンツ作成、業務効率化など、様々な目的で活用できる将来性のあるツールと言えるでしょう。