2025 年 8 月,IG 和 X 上突然爆發一波「3D 公仔」照——真人自拍秒變精緻手辦,很多人不知道背後是哪套 AI。那就是 Nano Banana 的首亮相,Google 給 Gemini Flash Image 用 🍌 teaser 暗示、社群就這樣叫開了。

Nano Banana 是什麼

Nano Banana 是 Google DeepMind 出品的 AI 圖片生成模型,屬於 Gemini 生態系。官方名稱叫 Gemini Flash Image,社群稱呼 Nano Banana 是因為 Google 在正式發布前用 🍌 emoji 暗示,這個暱稱就這樣留下來了。

版本演進:

  • Nano Banana(Gemini 2.5 Flash Image,2025 年 8 月):原版,引爆 3D 公仔風潮,Gemini app 因此新增了千萬級新使用者和超過 2 億次修圖紀錄
  • Nano Banana Pro(Gemini 3 Pro Image,2025 年 11 月):旗艦版,品質更高、額度較少
  • Nano Banana 2(Gemini 3.1 Flash Image,2026 年 2 月):現行版本,現在是 Gemini 所有訂閱層級的預設圖片模型

跟早一批的文字生成 AI 不同,Nano Banana 從一開始就設計成「在對話裡生圖」,而不是另開一個獨立的繪圖工具。這個設計讓它的使用方式比 Midjourney 直覺很多,代價是對畫素的精細控制不如專業工具。

怎麼開始用(免費)

最快的路:gemini.google.com

  1. 打開 gemini.google.com
  2. 用 Google 帳號登入(沒有的話五分鐘內可以申請)
  3. 開新對話,確認頁面上顯示的是圖片生成模式(有些介面需要手動切換到影像模型)
  4. 輸入「畫一張…」開始生圖

台灣可以直接用。手機的話也可以下載 Gemini app,體驗跟網頁版差不多。

Gemini 網頁版介面,登入 Google 帳號後可直接輸入指令生成圖片

開發者路:Google AI Studio

如果你是開發者,或者需要更高的免費額度和 API 存取,走 Google AI Studio。這個入口的免費配額更高,可以直接拿 API key 串接自己的應用。

Google AI Studio 開發者介面,可挑選模型、調整參數並產生 API key

能做什麼

文字生圖片

輸入文字描述,Nano Banana 生出圖片。支援多種長寬比(方形、橫幅、直幅),Nano Banana 2 最高輸出到 4K(免費版上限 1K 解析度,付費版才開 4K)。

Prompt 的基本結構:主體 + 風格 + 場景 + 氛圍。舉例:

「畫一隻坐在咖啡廳窗邊的橘貓,水彩插畫風格,午後日光斜射,溫暖色調。」

比起只說「畫一隻貓」,這樣的描述方式第一次出來的結果就接近想要的東西。

對話式修圖

這是 Nano Banana 跟 Midjourney 差異最大的地方。上傳你自己的照片,用口語說想改什麼,它就直接改。

操作方式:點對話框左側的上傳圖示 → 傳照片 → 說「把背景換成下雨的街道,保留人物」。

修圖指令越具體越好——說清楚要保留什麼、要改什麼、光線從哪裡來。「改一下背景」這種模糊指令出來的結果不穩,「把白色背景換成日式榻榻米室內空間,保留人物輪廓和光影方向」就穩很多。

支援的修圖動作包括:去除物件、換背景、改光線方向、改風格(把照片改成插畫)、色調調整。不支援像 Photoshop 的精細遮罩或畫素級操作——這個定位要搞清楚,否則會對它失望。

角色一致性

Nano Banana 2 的一大升級:支援在同一個對話裡維持最多 5 個角色、14 個物件的外觀一致性。這對做分鏡、系列貼圖、IP 角色設計很有用——同一個角色在不同場景裡不會長相飄移。

在同一個對話裡持續生圖是關鍵,不要每張圖都開新對話。第一張確定角色外觀後,後續每張在同一串繼續說「讓她出現在…」,模型會記住前面的外觀。

圖內文字

Nano Banana 在圖片內渲染英文文字的能力比大多數 AI 圖片模型好,準確率大約 87–96%。想在圖片裡加 slogan 或標語,英文比繁中穩。

繁體中文怎麼用

Prompt 本身用繁體中文下沒問題,模型能讀懂。但圖片「裡面」要出現繁中字就要特別處理。

繁中圖內文字的現況

社群實測(非官方數據):Nano Banana 生成圖片內的繁中文字準確率只有七成多,常見問題是缺筆畫、字序錯、字形模糊。簡體中文支援略好於繁中,但一樣不穩。

Nano Banana 生成圖片內的繁體中文常出現缺筆畫、字序錯亂

這個問題在 Nano Banana 2 有改善,但沒有完全解決。

提高繁中準確率的技巧

1. 把要放進圖裡的字用「」包起來,明確標示

「設計一張海報,畫面中央有「認真玩 AI」四個大字,繁體中文(台灣),字體清晰銳利。」

2. 指定 4K 輸出

解析度越高,細筆畫越不容易模糊:「請輸出 4K 解析度,確保文字清晰。」(需要付費方案才能真的出 4K)

3. 構圖用英文、文字欄位用繁中

把圖片的場景、風格、光線用英文描述(英文訓練資料密度高,這部分生得比較穩),只在「要顯示的文字」那個欄位放繁中字。

4. 實在不穩的字,先讓 AI 用簡體排好版面位置,再拿去 Canva 疊繁中文字層

這個方案繞路但實際:AI 管構圖和風格,文字用現有排版工具處理,品質穩得多。

免費版 vs 付費方案

免費版Google AI Pro(約 US$19.99/月)
每日產圖量約 20 張(尖峰縮水)約 100 張
最高解析度1K4K
角色一致性
對話式修圖
API 存取需另計費有免費額度

另外還有 AI Plus(US$7.99/月)和 AI Ultra(US$249.99/月),各有不同額度和功能組合,以官方最新公告為準——這個數字 Google 調整頻率高。

API 的話,Nano Banana 2 每張圖約 US$0.039–0.07,大量出圖的開發者可以這樣算成本。

所有 Nano Banana 輸出的圖片都帶有 Google 的 SynthID 隱形浮水印和 C2PA 來源標記,標示這是 AI 生成的內容。顯示上看不出來,但技術層面是有記錄的。

跟其他工具比

vs Midjourney:Midjourney 的藝術風格控制和畫質上限比 Nano Banana 強,在「美感」上仍是公認的高水準。但 Midjourney 沒有免費版(需要訂閱),圖內文字是它的弱點,也沒有對話式修圖。如果要的是藝術感和風格細膩度,Midjourney 值得訂;如果要的是修圖和整合進工作流,Nano Banana 直覺很多。

vs GPT Image(ChatGPT):GPT Image 的寫實人物生成能力強,2026 年 4 月 GPT Image 2 上線後一度在 Image Arena 排行榜拿榜首。兩者都支援對話式修圖,能力接近。主要差異在生態:Nano Banana 整合在 Gemini app、可以搭配即時網路搜尋一起用;GPT Image 在 ChatGPT 環境。如果你本來就用 ChatGPT,GPT Image 切換成本低;如果用 Gemini,Nano Banana 就是最自然的選擇。

vs Stable Diffusion:Stable Diffusion 的優勢是本地跑、真正免費(跑起來之後)、加 ControlNet 可以精細控制構圖。代價是需要自己架環境、調模型、選 LoRA,技術門檻明顯較高。Nano Banana 是開箱即用,沒有這些學習成本。兩個定位不同,不是誰比較好的問題。

學生的話可以先看看有沒有資格用 Gemini 學生方案,付費條件可能更優惠。

小企鵝的看法

Nano Banana 這個東西,我覺得定位很清楚:進場門檻最低的 AI 修圖入口。免費、免安裝,Google 帳號就能開,這三點對想試試 AI 生圖的人是很大的加速器。

我會這樣選:想做 對話式修圖(上傳照片口語改)→ 先試 Nano Banana 免費版,絕大多數日常需求夠用。想做系列角色或分鏡→ 同樣推 Nano Banana 2,角色一致性的功夫做得不錯。想要頂級藝術風格和細節控制→ Midjourney 的位置沒被取代。想在圖片裡放繁中文字→ 先跑 Nano Banana 試試,結果不穩的話 Canva 補一層文字是實際的解決方式,不要花太多時間跟 AI 的繁中渲染拔河。

繁中圖內文字這個坑目前在 Nano Banana 2 仍然存在,以官方公告為主,改善的速度我持觀望態度。

延伸閱讀

常見問題

Q: Nano Banana 是什麼?

Nano Banana 是 Google DeepMind 推出的 AI 圖片生成模型,屬於 Gemini 生態系。官方名稱是 Gemini Flash Image,社群叫它 Nano Banana 是因為 Google 在發布前用 🍌 emoji 作為神秘暗示。現在最新版是 Nano Banana 2(Gemini 3.1 Flash Image),是 Gemini 各訂閱層級的預設圖片模型。

Q: Nano Banana 免費嗎?

有免費額度。在 gemini.google.com 登入 Google 帳號就能用,免費版每日約 20 張(尖峰時段可能縮水)。付費方案可以提高到約每日 100 張,並支援更高解析度。具體額度以官方公告為準。

Q: Nano Banana 台灣可以用嗎?

可以,台灣直接用。到 gemini.google.com 或下載 Gemini app,用 Google 帳號登入就能開始。

Q: Nano Banana 支援繁體中文嗎?

對話可以用繁體中文,模型看得懂。但圖片「裡面」的繁中文字渲染只有七成多的準確率,常見缺筆畫或字序混亂。有技巧可以改善:在 prompt 裡明確指定「繁體中文(台灣)」、把要呈現的文字放「」內、要求 4K 輸出。

Q: Nano Banana 跟 Nano Banana 2 差在哪?

Nano Banana(Gemini 2.5 Flash Image,2025 年 8 月)是第一代,掀起 3D 公仔風潮。Nano Banana 2(Gemini 3.1 Flash Image,2026 年 2 月)是現行版本,角色一致性更強(最多 5 角色 14 物件),圖內文字準確率更高,現在是 Gemini 預設的圖片模型。

Q: Nano Banana 怎麼修改已有的照片?

在 Gemini 對話框點上傳圖示,把照片傳上去,然後用口語說你想改什麼就好。記得說清楚要保留什麼、要改什麼,指令越具體效果越穩。例如:「保留人物,把背景換成夜晚的東京街頭,光源從左側打來。」


整理:Penna|小企鵝 Penchan