2025年8月、InstagramとXに突然「3Dフィギュア」写真が溢れ出した。普通の自撮り写真が精巧なフィギュアに変わり、多くの人はどのAIが使われているのか知らなかった。それがNano Bananaのデビューだった。Googleが🍌の絵文字でGemini Flash Imageをほのめかし、コミュニティがそのまま名前にしてしまった。

Nano Bananaとは

Nano BananaはGoogle DeepMindが開発したAI画像生成モデルで、Geminiエコシステムの一部です。正式名称はGemini Flash Image。Googleが正式発表前に🍌の絵文字でヒントを出したため、このニックネームが定着しました。

バージョンの変遷:

  • Nano Banana(Gemini 2.5 Flash Image、2025年8月):初代。3Dフィギュアブームを起こし、Geminiアプリに数千万人の新規ユーザーと2億回以上の画像編集実績をもたらした
  • Nano Banana Pro(Gemini 3 Pro Image、2025年11月):フラグシップ版。品質が高く、利用枠は少なめ
  • Nano Banana 2(Gemini 3.1 Flash Image、2026年2月):現行バージョン。現在はすべてのGeminiサブスクリプションのデフォルト画像モデル

従来のテキスト生成AIと違い、Nano Bananaは最初から「会話の中で画像を生成する」ことを前提に設計されています。独立した画像生成ツールではなく、チャットの延長線上にある。この設計がMidjourneyより直感的な使い勝手をもたらしている一方で、細かいピクセル単位の制御はプロ向けツールに及ばない面もあります。

使い始める(無料)

最速ルート:gemini.google.com

  1. gemini.google.comを開く
  2. Googleアカウントでログイン(なければ5分以内で作成できる)
  3. 新しい会話を開始し、画像生成モードになっていることを確認(インターフェースによっては手動で画像モデルに切り替える必要あり)
  4. 「絵を描いて…」と入力して生成スタート

スマホの場合はGeminiアプリをダウンロードしても同じ体験ができます。

GeminiのWebインターフェース — Googleアカウントでログイン後、プロンプトを入力するだけで画像を生成できる

開発者ルート:Google AI Studio

開発者の方や、より高い無料枠とAPIアクセスが必要な場合はGoogle AI Studioへ。無料配分が多く、APIキーを取得して自分のアプリに組み込むこともできます。

Google AI Studioの開発者インターフェース — モデルを選択してパラメータを調整し、APIキーを生成できる

できること

テキストから画像生成

テキストで説明するだけでNano Bananaが画像を生成します。複数のアスペクト比(正方形・横長・縦長)に対応。Nano Banana 2は最大4K出力が可能(無料版は1K上限、4KはAI Proプランが必要)。

プロンプトの基本構造:主体 + スタイル + 場面 + 雰囲気。例:

「カフェの窓際に座るオレンジ色の猫、水彩イラスト風、午後の斜め光、暖かい色調。」

「猫を描いて」だけよりも、最初の出力から求めているものに近い結果が得られます。

会話形式の画像編集

Nano BananaとMidjourneyで最も差が出るのがここです。自分の写真をアップロードして、変えたいことを普通の言葉で伝えると直接編集されます。

操作方法:チャット欄左側のアップロードアイコンをクリック → 写真を送信 → 「背景を雨の降る街に変えて、人物はそのままで」と伝える。

具体的な指示が安定した結果をもたらします。「背景を少し変えて」という曖昧な指示では結果がブレますが、「白い背景を日本の畳の和室に変えて、人物のシルエットと光の方向は維持して」は安定して機能します。

対応している編集:オブジェクトの削除、背景の変更、光の方向の変更、スタイル変換(写真をイラスト風に)、色調調整。Photoshopのような細かいマスクやピクセル単位の操作には対応していません。ここを理解しておかないと期待外れになります。

キャラクターの一貫性

Nano Banana 2の大きなアップグレード:同一の会話内で最大5キャラクター・14オブジェクトの外見一貫性を維持できます。絵コンテ、ステッカーシリーズ、IPキャラクターデザインなどに有用で、異なるシーンでも同じキャラクターの外見がブレません。

コツは同じ会話スレッドで生成し続けること。最初の画像でキャラクターの外見を確定させたら、同じスレッドで「彼女が〇〇に現れるシーンを描いて」と続けると、モデルが前の外見を覚えています。

画像内のテキスト

Nano Bananaは画像内での英語テキストのレンダリングが他の多くのAI画像モデルより優れており、精度は約87〜96%。画像内にスローガンやキャッチコピーを入れたい場合、英語のほうが安定しています。

日本語テキストの扱い方

プロンプトは日本語で書いても問題ありません。モデルは理解できます。ただし、生成画像の「中に」日本語テキストを表示させる場合は注意が必要です。

画像内日本語の現状

コミュニティのテスト(非公式データ):Nano Bananaが生成する画像内の日本語テキスト精度は70%程度で、払い・はね・点の欠落、文字の順序ミス、字形の乱れなどがよく見られます。

Nano Bananaが生成した画像内の文字では、払いや点の欠落、字の並び順の乱れが頻繁に起きる

Nano Banana 2でこの問題は改善されましたが、完全には解決されていません。

精度を高めるコツ

1. 画像内に入れたい文字を「」で囲んで明示する

「ポスターをデザインして。中央に「認真玩 AI」の文字を大きく表示。繁体字中国語(台湾)。フォントはシャープでクリアに。」

2. 4K出力を指定する

解像度が高いほど細い線が潰れにくくなります:「4K解像度で出力して、テキストをクリアに保って」(AI Proプランが必要)

3. 構図は英語、テキスト部分だけ日本語で書く

場面・スタイル・光の条件を英語で描写し(訓練データ密度が高く安定する)、テキストとして表示したい部分だけ日本語で記載する。

4. どうしても安定しない場合はCanvaでテキストレイヤーを追加する

回り道ですが実用的な方法:AIが構図とスタイルを担当し、文字はCanvaで後から重ねる。品質が安定します。

無料版 vs 有料プラン

無料Google AI Pro(約US$19.99/月)
1日の生成枚数約20枚(ピーク時は減少)約100枚
最大解像度1K4K
キャラクター一貫性ありあり
会話形式の編集ありあり
APIアクセス別途従量課金無料枠あり

他にもAI Plus(US$7.99/月)とAI Ultra(US$249.99/月)があり、それぞれ枠と機能の組み合わせが異なります。Googleはこの数字を頻繁に更新するため、公式発表を最新情報として参照してください。

APIでは、Nano Banana 2は1枚あたり約US$0.039〜0.07。大量生成する開発者はこれでコスト計算できます。

すべてのNano Banana出力画像にはGoogleの不可視のSynthID透かしとC2PA来歴メタデータが埋め込まれており、AI生成コンテンツであることを示しています。見た目ではわかりませんが、技術的には記録されています。

他のツールとの比較

vs Midjourney:Midjourneyはアーティスティックなスタイル制御と品質の天井という点でNano Bananaを上回り、「美的クオリティ」では依然として高い評価を受けています。ただし無料プランはなく(要サブスクリプション)、画像内テキストは弱点で、会話形式の編集もありません。アーティスティックな深みとスタイルのこだわりが優先なら、Midjourneyはサブスクに値する。写真編集とワークフロー統合が目的なら、Nano Bananaのほうが直感的に使えます。

vs GPT Image(ChatGPT):GPT Imageは写実的な人物生成に優れており、2026年4月のGPT Image 2公開後はImage Arenaランキングでトップに立ちました。どちらも会話形式の編集に対応しており、能力は近い水準。主な違いはエコシステム:Nano BananaはGeminiアプリに統合されリアルタイムウェブ検索と連携できる、GPT ImageはChatGPT環境にある。もともとChatGPTを使っているなら乗り換えコストは低い。Geminiをメインにしているなら、Nano Bananaが自然な選択です。

vs Stable Diffusion:Stable Diffusionの強みはローカル実行、セットアップ後は本当の意味で無料、ControlNetによる精緻な構図コントロール。その代わり、環境構築・モデル調整・LoRA選定が必要で技術的ハードルが明確に高い。Nano Bananaはすぐ使える。この二つは対象ユーザーが違うので、どちらが優れているという話ではありません。

学生の方はGemini学生プランの対象かどうか確認してみてください。有料条件がより有利になる可能性があります。

まとめ

Nano Bananaのポジションは明確です:AI画像編集への一番ハードルが低い入り口。無料、インストール不要、Googleアカウントで開始できる。AIで画像生成を試してみたい人にとって、この3点は大きな後押しになります。

選び方の目安:会話形式の写真編集(写真をアップロードして言葉で変更)がしたい → まずNano Bananaの無料版。日常の大半のニーズに対応できます。シリーズキャラクターや絵コンテを作りたい → 同じくNano Banana 2、キャラクター一貫性は十分です。最高品質のアーティスティックスタイルと細部コントロールが欲しい → Midjourneyの地位はまだ揺るいでいない。画像の中に日本語テキストを入れたい → まずNano Bananaで試して、安定しないならCanvaで後からテキストを重ねるのが現実的。モデルとの格闘に時間をかけすぎないこと。

画像内テキストの問題はNano Banana 2でも残っており、改善スピードは今後の公式発表次第です。

関連記事


— Penchan