レッスン01:ツールの導入と初期設定
Thumb-AI-Studioの世界へようこそ!このレッスンでは、ツールをあなたのPCで動かすための全ての準備を整えます。ツールのダウンロードから、実行環境の構築、そしてAIを動かすためのAPIキー設定とライセンス認証まで、順番に完了させていきましょう。
1. Git/GitHubによるツールの導入
本講座では、プロの開発現場で標準的に使われているバージョン管理システム「Git」と、そのプラットフォームである「GitHub」を利用してツールを導入します。これにより、今後のアップデートがコマンド一つで安全かつ簡単に行えるようになります。
Step 1: GitHubチームへの参加
まず、あなたのGitHubアカウントを開発チームに招待します。以下の手順で進めてください。
- まだお持ちでない場合は、GitHub公式サイトからアカウントを作成してください。
- OKIHIROのプライベートチャットにて、あなたのGitHubアカウント名を講師までご連絡ください。開発チームへの招待をお送りします。
- GitHubから届く招待メールを開き、「View invitation」ボタンをクリックして招待を承認してください。これでリポジトリへのアクセスが可能になります。
Step 2: アクセス認証の準備 (初回のみ)
プライベートリポジトリの操作には認証が必要です。今後のパスワード入力を不要にするため、PCとGitHubアカウントを安全に連携させる「SSHキー」の設定を行います。
- キーを生成する: PCのターミナル(WindowsならGit BashやPowerShell)で以下のコマンドを実行します。メールアドレスはご自身のGitHub登録メールアドレスに置き換えてください。「Enter a file...」「Enter passphrase...」「Enter same passphrase again...」と3回聞かれますが、すべて何も入力せずEnterキーを押してください。
ssh-keygen -t ed25519 -C "your_email@example.com" - 公開キーをコピーする: 生成された公開キー(通常は
~/.ssh/id_ed25519.pub)の中身を全てコピーします。 - GitHubに登録する: GitHubのSSHキー設定ページを開き、「New SSH key」ボタンからコピーしたキーを貼り付けて保存します。
より詳しい手順はGitHub公式ドキュメントをご確認ください。
Step 3: ツールのダウンロード (Clone)
コマンドプロンプト(またはターミナル)でツールを保存したい場所に移動し、以下のコマンドを実行してツール一式をPCにダウンロードします。
git clone git@github.com:your-github-org/Thumb-AI-Studio.git
2. 実行環境のインストール
次に、ツールを動かすために必要な基本的なソフトウェアをPCにインストールします。
2-1. FFmpegのインストール(最重要)
【必須作業】
このツールは、動画から音声を抽出するために「FFmpeg」というソフトウェアを必要とします。PCにインストールされていない場合は、以下の手順で必ずインストールし、「PATHを通す」設定を行ってください。この設定が完了しないと、ツールは動作しません。
▼ Windows ユーザーの方
1. こちらのサイト(gyan.dev)から、最新リリースの「ffmpeg-git-essentials.7z」をダウンロードします。
2. ダウンロードしたファイルを解凍し、中のフォルダを分かりやすい場所(例: Cドライブ直下)に移動させます。
3. 以下の詳細手順に従って、環境変数PATHの設定を行ってください。
▼ FFmpegの環境変数PATH設定方法(Windows)
- ダウンロードした
ffmpeg-git-essentials.7zを解凍します。(7-Zipなどの解凍ソフトが必要です) - 解凍して出てきたフォルダ(例:
ffmpeg-7.0-essentials_build)を、PCのCドライブ直下など、分かりやすい場所に移動させます。 - 移動したフォルダの中にある
binフォルダを開き、エクスプローラーのアドレスバーをクリックして、パス(例:C:\ffmpeg-7.0-essentials_build\bin)をコピーします。 - Windowsの検索バーで「環境変数」と検索し、「システム環境変数の編集」を開きます。
- 「環境変数」ボタンをクリックし、「システム環境変数」の欄にある
Pathを選択して「編集」をクリックします。 - 「新規」ボタンを押し、先ほどコピーした
binフォルダのパスを貼り付けて「OK」を押して、全てのウィンドウを閉じます。
これで設定は完了です。コマンドプロンプトを開き ffmpeg -version と入力して、バージョン情報が表示されれば成功です。
▼ macOS ユーザーの方
ターミナルを開き、Homebrewを使ってインストールするのが最も簡単です。以下のコマンドを実行してください。brew install ffmpeg
2-2. Pythonのインストール
本ツールはPythonで動作します。互換性を確保するため、Python 3.11 のインストールを推奨します。お使いのPCにPythonがインストールされていない、またはバージョンが異なる場合は、Python 3.11.9 公式サイトからインストーラーをダウンロードしてインストールしてください。(Windowsでのインストール時、「Add python.exe to PATH」に必ずチェックを入れてください)
2-3. Visual Studio Code (VSC) のインストール(推奨)
プロンプトファイルなどを快適に編集するために、高機能なテキストエディタの導入を推奨します。公式サイトからご自身のPCに合ったインストーラーをダウンロードして、インストールしてください。
3. ツールのセットアップとライセンス認証
3-1. 基本セットアップ
ツール本体に必要なライブラリ(部品)をインストールします。この作業は初回と、ツールをアップデートした後に必要です。
▼ Windows ユーザーの方
ダウンロードしたツールフォルダ内にある「_setup.bat」をダブルクリックして実行します。黒い画面が表示され、ハードウェアの選択(CPU/GPU)を求められた後、インストールが開始されます。完了するまで数分お待ちください。
▼ macOS ユーザーの方
ターミナルを開き、cdコマンドでツールフォルダに移動した後、以下のコマンドを順番に実行します。chmod +x _setup.sh (初回のみ)./_setup.sh
3-2. APIキーの設定
本ツールはGoogleの生成AI(Gemini)を利用して動作します。以下の2種類のAPIキーを取得し、ツールに設定してください。
- Gemini APIキー(テキスト生成用): Google AI StudioでAPIキーを作成し、コピーします。ツールフォルダ内の
system/api_keys_gemini.txtを開き、コピーしたキーを貼り付けて保存します。このファイルにはキーを複数行にわたって登録でき、ツールが自動でキーを切り替えながら安定して動作します。 - Gemini APIキー(画像生成用): サムネイルの背景をAIに自動生成させる機能です。この機能を利用するには、Google Cloud Platform (GCP) でお支払い情報(課金)を有効にしたプロジェクトで発行したAPIキーが必要です。Google AI Studioの無料枠で発行したキーでは画像生成は実行できませんのでご注意ください。準備したAPIキーを、ツールフォルダ内の
system/api_keys_image_gen.txtに貼り付けて保存します。
3-3. ライセンス認証
最後に、ツールを使用するためのライセンス認証を行います。
- ツールフォルダ内の「
_run_gui.bat」(macOSの場合は「_run_gui.sh」)を実行して、ツールを起動します。 - 初回起動時に「ライセンス認証」ウィンドウが表示されます。ウィンドウ内に表示されている「マシンID」の文字列をコピーしてください。
- コピーしたマシンIDを、OKIHIROのプライベートチャットで講師までご連絡ください。あなた専用の「アクティベーションキー」を発行してお送りします。
- 受け取ったアクティベーションキーを「アクティベーションキー」入力欄に貼り付け、「認証」ボタンをクリックします。
- 「認証成功」のメッセージが表示されたら、一度ツールを閉じ、再度起動してください。これで全ての機能が利用可能になります。
4. 主要フォルダの役割
ツールを操作する上で、主に以下の3つのフォルダを使用します。
input/video/
分析したい動画ファイル(.mp4など)を1つだけ置く場所です。input/background_image/
サムネイルの背景として使用したい画像を置く場所です(任意)。空の場合はAIが背景を自動生成します。output/
AIが生成した全ての成果物(SEO情報、サムネイル画像など)が、動画名のフォルダ内に保存されます。
お疲れ様でした!以上で全ての準備が完了です。次のレッスンでは、いよいよ実際にツールを動かして、最初のサムネイルを生成していきます。