AIによる動画要約
この要約は、AIを使用してYouTube動画の字幕から自動生成されました。動画の内容を理解する一助となれば幸いです。
この動画では、AIを活用してYouTube動画のSRT字幕ファイルを自動調整する方法について解説しています。
なお、この要約文は「YouTube動画字幕からの要約生成指示書セット」を使用して作成しました。
字幕生成とSRTファイルの課題
動画編集ソフト CapCut (Pro版) を使用して動画から字幕を自動生成する方法が紹介されています。Premiere Proなど他のソフトでもSRT形式の字幕ファイルが作成できれば同様の手法が可能です。
しかし、自動生成された字幕には、歯抜け(無音部分の空白)、誤字脱字、不自然な区切り(短すぎる表示時間、文の途中で改行されるなど)といった課題が多く見られます。これらの課題は、視聴者にとって読みにくさの原因となります。
SRTファイルは、連番、タイムコード(表示開始時間 --> 表示終了時間)、字幕テキストで構成されるシンプルなテキストファイルであり、メモ帳などで開いて手動編集も可能ですが、今回はAIによる字幕自動調整を目指します。
Google AI Studioと指示書を用いたSRT修正
字幕の自動調整には Google AI Studio と専用の指示書(System instructions用)を使用します。
手順は以下の通りです:
- 指示書の準備:SRTファイル修正用の指示文をコピーします。
- System instructionsへの設定:コピーした指示文をGoogle AI Studioの System instructions に貼り付けます。ここには、AIに期待する出力形式や挙動を定義します。
- 参考情報の追加:指示文の下に、動画の内容に関連する参考記事(例:動画で紹介している Gemini 2.5 Pro の公式情報や自身で作成した要約記事など)を貼り付けます。これにより、AIが動画の文脈を理解し、より正確な誤字脱字修正や専門用語の統一を行いやすくなります。
- SRTファイルの入力:修正したいSRTファイルの内容全体をコピーし、Google AI Studioの入力欄に貼り付けます。
- モデルと設定:モデルとして高性能な Gemini 2.5 Pro を選択し、Temperature(創造性の度合い)は指示に忠実に従わせるため 0 に設定します。
補足情報
- Google AI Studio:Googleが提供する、ブラウザベースの生成AIモデル(Geminiなど)を試用・開発するためのプラットフォームです。プロトタイピングやAPIキー取得に利用できます。
- Gemini 2.5 Pro:Googleが開発した最新の高性能AIモデル(動画公開時点)。特に長いコンテキスト(文脈)の処理能力が向上しており、動画では最大64,000トークン(約10万文字)の出力が可能になった点が強調されています。
- System instructions:Google AI Studioにおいて、AIモデルに対して常に適用させたい指示や背景情報を設定する機能です。チャットの各ターンで指示を繰り返す必要がなくなります。
Gemini 2.5 Proの実行と特徴
設定後、実行すると Gemini 2.5 Pro はまず「Thinking」プロセスに入り、入力されたSRTと参考情報を分析します。この過程で、誤字脱字の修正候補や、不自然に区切られた字幕の結合候補などを検討している様子が表示されます(Flash Thinking と呼ばれる手法に類似)。
Gemini 2.5 Pro は長いSRTファイル(動画の例では約23,000文字)も一括で処理できる能力を持ちますが、トークン制限やその他の要因で処理が途中で停止する場合もあります。その場合は、SRTファイルを半分に分割するなどして再度実行する必要があります。
修正結果の確認とさらなる調整
AIによる修正後、出力されたSRTファイルの内容を確認します。文章が自然な箇所で区切られ、句読点も適切に使用されているかなどをチェックします。
さらに精度を高めるため、別の指示書(誤字チェック用)を使用して、表記揺れやさらなる誤字脱字がないかを確認します。
- 修正後のSRTをコピーし、誤字チェック用指示書の指定箇所に貼り付けます。
- 指示書全体をコピーし、Google AI Studioの入力欄に貼り付けて実行します。
- AIが修正候補を表形式で提示します。
ただし、AIの提案が常に正しいとは限りません(例:日付の間違いなど)。文末表現の統一や口語表現の修正など、どこまで反映させるかは任意です。
特に重要なのは表記揺れ(例:「返信」と「変身」)や固有名詞(例:「YouTube」と「youtube」、「Grounding with Google Search」のカタカナ表記)のチェックです。最終的には人間の目での確認が不可欠です。
補足情報
- Grounding with Google Search:Google AI Studioの機能の一つ。AIモデルが回答を生成する際に、Google検索の情報を参照して、より正確で信頼性の高い情報に基づいた回答を行うようにする仕組みです。
修正済みSRTの保存と読み込み
AIによる修正とチェックが完了したSRTテキストを、新しいメモ帳ファイルに貼り付けます。
保存する際は、ファイルの種類を「すべてのファイル」に変更し、ファイル名に .srt という拡張子を付けて保存します(例: 修正済み.srt)。
改行コードの不統一はエラーの原因となる可能性があるため、空行の有無などは統一することが推奨されます。
保存したSRTファイルを CapCut などの動画編集ソフトにインポートします。CapCutの場合は、元の字幕トラックを削除した後、新しいSRTファイルをインポートし、タイムラインに追加します。
映像トラックを非表示にするなどして、音声と修正後の字幕のタイミングが合っているかを確認します。AIによる結合処理で稀にタイムコードがずれる可能性もありますが、多くの場合、高い精度で調整されています。
タイムコードの穴埋め調整
字幕間の無音部分(歯抜け)をなくし、常に字幕が表示されている状態にしたい場合は、さらにタイムコード調整用の指示書を使用します。
- 修正済みSRTの内容をコピーし、タイムコード調整用指示書の指定箇所に貼り付けます。
- 指示書全体をコピーし、新しいチャット(Create prompt)の入力欄に貼り付けます。
- モデルは Gemini 2.0 Flash (2.5 Proよりシンプルなモデル)を使用し、Temperatureを 0 に設定して実行します。
- AIが、前の字幕の終了タイムコードと次の字幕の開始タイムコードを一致させるように調整したSRTを出力します。
この調整済みSRTを再度保存し(例: 穴埋め済み.srt)、動画編集ソフトに読み込むことで、字幕間のギャップが完全に埋まります。
AI活用のメリットと関連情報
一連のAI活用により、SRTファイルの誤字脱字修正、区切り調整、タイムコード調整といった作業を大幅に効率化できます。手作業での修正に比べて時間を大幅に短縮でき、ヒューマンエラーも削減できます。
動画編集者にとって、字幕制作の品質向上と作業効率化は重要な課題であり、AIツールの活用は今後さらに主流になると考えられます。
動画投稿者は、今回紹介したSRT調整指示書を含む様々なAI活用指示書や、AIに関する情報を提供するチャットマガジン(無料)などのサービスも展開しています。
まとめ:AIによるSRT字幕調整のポイント
この動画では、Google AI Studio と Gemini 2.5 Pro を中心としたAIツール、そして専用の指示書を活用することで、CapCutなどで生成されたSRT字幕ファイルの品質を自動で向上させる具体的な手順が解説されました。
主なポイントは以下の通りです:
- 課題の認識:自動生成字幕には誤字脱字、不自然な区切り、タイムコードのギャップなどの課題がある。
- AIによる修正:Google AI StudioのSystem instructionsと参考記事を活用し、Gemini 2.5 ProでSRTの文章内容(誤字脱字、区切り)を修正する。
- 精度向上:誤字チェック用の指示書で表記揺れなどをさらに確認し、必要に応じて手動修正を加える。
- タイムコード調整:別の指示書とGemini 2.0 Flashを使い、字幕間のギャップ(穴)を埋める。
- 効率化と品質向上:一連のAI活用により、動画編集における字幕制作の効率化と品質向上が期待できる。
最終的なチェックは必要ですが、AIを導入することで、従来の手作業に比べて大幅な時間短縮と精度向上が可能になります。
今回使用した指示書はこちら👇
SRT字幕ファイル修正
指示書セット

AIを活用してSRT字幕ファイルの修正作業を効率化!テキスト修正、不自然な箇所の結合、校正、タイムコードギャップ修正、多言語翻訳まで、一連の作業をサポートする指示書セットです。動画編集者や翻訳者の作業負担を軽減し、字幕の品質を向上させます。
✅指示書リスト
- SRT修正・結合指示書:テキスト修正(誤字脱字、表記ゆれ)、不自然な字幕の結合、タイムコード調整(結合時)、SRTフォーマット整形を行います。
- SRTテキスト校正チェック指示書:SRTのテキスト部分をチェックし、誤字、脱字、不自然な表記、表記ゆれを修正案と共にリストアップします。
- SRTギャップ修正指示書:字幕間の不要な時間的ギャップを埋めるため、各字幕の終了時刻を次の字幕の開始時刻に自動調整します(開始時刻は変更しません)。
- SRTファイル翻訳指示書:日本語SRTファイルを指定言語へ翻訳します。Google検索を活用し、タイムコードを厳守した自然な翻訳を実現します。
これらの指示書を使えば、面倒なSRTファイルの編集作業をAIに任せ、より正確で自然な字幕を効率的に作成できます。特に、タイムコードの厳密な管理や、表記ゆれの修正、不自然な分割の結合など、手作業では時間のかかる処理を自動化できます。
動画編集の効率化、多言語対応、字幕品質の向上に貢献します。
価格:3,980円