手描きスケッチがAIによって3Dパースに変換される過程を示すイメージ画像。

AI開発・活用事例

【Python】建築スケッチを3Dパースに!Nano Banana Pro (Gemini 3) 自動生成ワークフロー

広告

Gemini 3 Pro Image Preview
手描きスケッチが3秒でパースに変わる未来。Nano Banana Proの実力をPythonで引き出す

建築家やデザイナーの皆さん、レンダリング待ちの時間にサヨナラを告げましょう。Googleの最新画像生成モデル「Nano Banana Pro」を使えば、ラフなスケッチからフォトリアルな完成予想図まで、コード数行で自動生成可能です。今回はその具体的な実装ワークフローを、実際のランドスケープデザインの事例と共に解説します。

Python 3.10+google-genai SDKGemini 3 Pro

🎥 今回の参考動画はこちら



1. Nano Banana Pro (Gemini 3) とは? - 建築デザインにおける革命

今回は、Googleの最新鋭モデルファミリーの中でも特に画像生成・編集能力に特化したNano Banana Pro(別名: Gemini 3 Pro Image Preview)に焦点を当てます。動画では、手描きのラフなランドスケープスケッチが、段階を経て洗練された3Dパースやプレゼンテーションボードへと進化していく様子が紹介されていました。

Nano Banana Proの最大の特徴は、単に画像を生成するだけでなく、「思考プロセス」を持って複雑な指示を理解し、最大14枚もの参照画像を考慮して高解像度(4K対応)のビジュアルを出力できる点にあります。これにより、建築パース作成において以下のような革新的なワークフローが可能になります。

  • スケッチの清書: 汚れた手描き線をクリーンな図面に変換。
  • スタイル変換: 平面図をアイソメトリック(俯瞰)図やフォトリアルなパースに変換。
  • 詳細制御: 具体的な樹木や建材の写真を「参照画像」として渡し、正確に反映させる。

本記事では、このプロセスをPythonコードで再現し、あなたのデザイン業務にAIオートメーションを導入する方法を解説します。

2. 必要な準備(環境構築)

まず、Googleの最新の生成AI SDKである google-genai ライブラリをインストールします。以前のライブラリとは異なるため注意してください。

以下のコマンドを実行します。

pip install google-genai pillow

次に、Google AI StudioでAPIキーを取得し、環境変数またはコード内で設定してください。Nano Banana Proを利用するには、モデル名として gemini-3-pro-image-preview を指定します。

3. 実装・使い方の解説

ここからは、動画のワークフローになぞらえて、Pythonでの実装コードを見ていきましょう。

STEP 1: 手描きスケッチをクリーンな平面図にする

動画の冒頭で行われていた、不明瞭なスケッチをAIに清書させるプロセスです。ここでは、Gemini 3 Pro Image Preview の画像編集機能を使用します。

from google import genai
from google.genai import types
from PIL import Image
import io

# クライアントの初期化
client = genai.Client(api_key="YOUR_API_KEY")

# 手描きスケッチ画像の読み込み
sketch_image = Image.open("hand_sketch.jpg")

# プロンプトの定義
prompt = "Turn this hand-drawn landscape plan into a clean, refined landscape architecture master plan. Use professional architectural line weights, clear geometry, and removing noise."

# 生成リクエスト
response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[prompt, sketch_image],
    config=types.GenerateContentConfig(
        image_config=types.ImageConfig(
            aspect_ratio="4:3",
            image_size="2K"  # 高解像度指定
        )
    )
)

# 画像の保存処理
for part in response.parts:
    if part.inline_data:
        img = part.as_image()
        img.save("refined_plan.png")
        print("生成完了: refined_plan.png")

このコードのポイントは、contents リストにプロンプト文字列と画像オブジェクトの両方を渡している点です。これにより、AIは入力画像をベースに、指示通りのスタイルへ変換(Image-to-Image)を行います。

STEP 2: 平面図から3Dアイソメトリック図への変換

次に、2Dの平面図を立体的なアイソメトリック図に変換します。Nano Banana Proは空間認識能力が高いため、平面情報から高さを推論して立体化することが得意です。

plan_image = Image.open("refined_plan.png")

iso_prompt = "Convert this landscape plan into a 3D isometric architectural model view. Show a 2-story house with a pool deck. Style: Clean architectural rendering, soft sunlight, pastel tones."

response_iso = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[iso_prompt, plan_image],
    config=types.GenerateContentConfig(
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
            image_size="2K"
        )
    )
)

動画では、ここで「バルコニーを削除して」といった追加指示を出していました。Gemini SDKではチャットセッション(client.chats.create)を利用することで、生成された画像に対して対話的に修正を加えることも可能です。

STEP 3: 具体的な素材(参照画像)の反映

ここがNano Banana Proの真骨頂です。動画では、具体的な樹木の画像をアップロードしてパースに反映させていました。このモデルは最大14枚の参照画像を受け取れます。

例えば、クライアント指定の「特定の植栽」や「外壁材」をパースに使いたい場合、以下のように実装します。

# 参照画像(素材や植栽)の読み込み
tree_ref = Image.open("specific_tree.png")
shrub_ref = Image.open("specific_shrub.png")

render_prompt = "Render a perspective view of the garden from the back door. Use the specific tree and shrub provided in the reference images for the planting. Photorealistic style."

# 複数の画像をcontentsリストに含める
response_render = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[
        render_prompt,
        plan_image,  # ベースとなる平面図
        tree_ref,    # 参照画像1
        shrub_ref    # 参照画像2
    ],
    config=types.GenerateContentConfig(
        image_config=types.ImageConfig(image_size="4K") # プレゼン用に4K指定
    )
)

このように、テキストだけでなく視覚的なリファレンスを渡すことで、AI特有の「ハルシネーション(勝手な創作)」を抑え、設計意図に沿ったパースを作成できます。

4. 応用・注意点

思考プロセス (Thinking Process) について:
Nano Banana Pro (Gemini 3 Pro Image) は、複雑な生成を行う際に内部で「思考」を行います。APIレスポンスには、最終画像だけでなく、中間の思考過程が含まれる場合があります。これらは自動的に処理されますが、生成に数秒〜数十秒の時間がかかる点を考慮して、タイムアウト設定などは長めにとっておくと良いでしょう。

コスト管理:
高解像度(2K/4K)の生成や、思考モデルの使用は、通常のモデル(Gemini 2.5 Flash等)に比べてトークン消費やコストが高くなる可能性があります。ラフな確認には gemini-2.5-flash-image (Nano Banana) を使い、ここぞというプレゼン用パースで gemini-3-pro-image-preview (Nano Banana Pro) を使うといった使い分けが、プロの現場では推奨されます。

5. まとめ

動画で紹介されていた魔法のようなワークフローは、PythonとGemini APIを使えば、あなたの手元で再現可能です。Nano Banana Proは、単なるお絵描きツールではなく、建築家やデザイナーの「意図」を汲み取る強力なパートナーと言えます。

ぜひこのコードをベースに、自分だけの「自動デザインアシスタント」を構築してみてください。未来の設計プロセスは、ここから始まります。


【免責事項】本記事は、AI技術を用いて作成された部分を含みます。公開時点の情報に基づいていますが、AIの仕様変更やサービスの更新により、内容が現状と異なる場合があります。最新の情報は公式サイト等でご確認ください。
  • この記事を書いた人
  • 最新記事

運営者:OKIHIRO

Gemini API × Python のスペシャリスト。 AI技術でWeb制作とブログ運営を完全自動化するエンジニア。 理論だけでなく、実際に動くコードとシステム設計で、クリエイターの時間を「単純作業」から解放する。 最先端AIの実装ノウハウを、どこよりも分かりやすく発信中。

-AI開発・活用事例
-, , , ,