AI 生圖工具很多,但 Midjourney 的名字在創作社群裡的出現頻率一直不低。原因很直接:它的畫質和藝術感在同類工具裡公認頂尖,尤其是需要一張「看起來像有人認真畫過」的圖的時候,差距很明顯。

缺點也同樣明顯:沒有免費試用,最低 $10/月才能開始,介面是英文,而且圖內放中文字會很痛。適不適合你,取決於最在乎的是什麼。

認識 Midjourney

Midjourney 是 Midjourney Inc.(創辦人 David Holz)開發的文字生圖片 AI,2022 年 7 月公測,從一開始就以藝術感強著稱。它正在跨足影片生成,但核心仍是把文字 prompt 轉成靜態圖片。

跟 DALL-E 或 Stable Diffusion 的設計哲學不同,Midjourney 選的是「你輸入 prompt,它生出一張看起來像藝術品的圖」。這個選擇讓它在風格美感上有優勢,代價是 prompt 遵從度有時比較鬆,它傾向生出「好看的東西」,不一定是你說的「那個東西」。

2026 年的預設版本是 V8.1,上線日期是 2026 年 6 月 10 日。原生 2K 解析度、速度比前一代快 3–5 倍、成本降了約 25%、人體解剖結構也有明顯改善。動漫風格有專門的 Niji V7 模型可以切換。

怎麼開始用

主介面:web app

2026 年不需要靠 Discord 了,直接在瀏覽器開 midjourney.com 就好。

步驟:

  1. midjourney.com,點右上角的「Sign In」
  2. 用 Google 帳號或 Discord 帳號登入(沒有 email-only 的選項)
  3. 選一個方案訂閱,必須先訂閱才能生圖,沒有免費試用
  4. 登入後進 Create 分頁
  5. 在下方輸入欄打入 prompt,按 Enter
  6. 等 Midjourney 生出 4 張預覽圖
  7. 點 U1–U4 放大(Upscale)或 V1–V4 做變化(Vary),滿意就下載

整個流程在瀏覽器裡完成,不需要安裝任何東西。台灣可以直接連線,付款用國際信用卡。

Midjourney 官網 midjourney.com:可用 Google 或 Discord 帳號登入

Discord 也還能用

如果你習慣 Discord,或是想瀏覽社群生成的圖,Discord 依然有效。加入 Midjourney 的 Discord server 之後,在頻道裡輸入 /imagine 指令加上 prompt 就能生圖。Web app 和 Discord 用的是同一個帳號和額度,兩邊切換不會有問題。

價格方案

重要前提:Midjourney 賣的是 GPU 時數(Fast hours),不是張數。 每張圖消耗的時數依解析度、參數而不同。未使用的 Fast hours 不會滾存到下個月。

方案月付年付(省 20%)Fast hours/月Relax 無限慢速Stealth 隱私並發數
BasicUS$10US$83.3h3
StandardUS$30US$2415h3
ProUS$60US$4830h12
MegaUS$120US$9660h12

幾個選擇關鍵:

Relax 模式(Standard 起才有):Relax 是無限慢速生成,不扣 Fast hours,適合不趕時間但量大的場景。Standard 主要的吸引力就在這個。

Stealth 模式(Pro 起才有):預設狀態下,你在 Midjourney 生的圖可以被其他人在 Explore 頁面看到。Stealth 讓生圖結果只有你自己看得到,商業創作或不想公開的內容才需要這個。

商用授權:所有付費方案都含商用授權。如果你的公司年營收超過 US$100 萬,授權條款要求用 Pro 或 Mega。

著作權注意事項:付費含商用授權,但純 AI 生成圖在美國法律下多半無法取得著作權保護,也就是說別人也可能使用你生成的圖。這個問題跨 AI 生圖工具都存在,不是 Midjourney 獨有的。

主要功能與參數

模型切換

--v 參數切版本,用 --niji 切動漫模型。不加的話預設是 V8.1。

a serene lake in autumn, photorealistic --v 8.1
anime style character portrait --niji 7

Niji V7 是動漫特化版,人物、場景的動漫風格比 V8.1 更準確,喜歡日系插畫風格的話選這個。

常用參數

參數功能範例
--ar比例(寬:高)--ar 16:9--ar 4:5(IG 直式)
--v指定版本--v 8.1
--niji動漫模型版本--niji 7
--sref風格參考圖 URL--sref https://...
角色參考維持角色一致性(V7 為 --oref Omni Reference,版本不同參數不同)以官方文件為準
--raw減少 Midjourney 的「美化」傾向適合追求寫實風格時
--hd高解析度(2K)輸出各方案皆可用
--chaos四張圖差異程度(0-100)--chaos 50(較多變化)
--stylize藝術化程度(0-1000)預設 100;越高越「藝術」

風格一致性:—sref 和角色參考

這兩類參考是做系列創作時非常實用的工具。

--sref(Style Reference):貼上參考圖的 URL,Midjourney 會學這張圖的風格、色調、氛圍,套用到新 prompt 上。做品牌系列圖時先確定一張「基準圖」,之後每張都加 --sref 能維持視覺一致性。

角色參考:讓角色在不同場景裡保持一致外觀,做漫畫分格或系列故事圖時很有用。要注意的是這個功能的參數依 Midjourney 版本不同(V7 是 --oref Omni Reference),用之前先查 docs.midjourney.com 對應你目前的模型版本。

其他工具

生出 4 張後,還有幾個後處理選項:

  • Vary:在原圖基礎上做細微或較大的變化
  • Zoom Out / Pan:把畫面往外延伸,補充原圖看不到的部分
  • Inpainting:局部重繪,只改你圈選的區域
  • 影片:把靜態圖轉成短動畫,SD 或 HD 輸出(HD 需 Standard 以上)

個人化功能(Personal Style)可以記住你的偏好風格;Moodboards 讓你收藏參考圖、建立系列。

中文怎麼用

Prompt 用中文可以,但英文更準

Midjourney 能接受中文 prompt,也能大致理解意思。但有幾個實際的差距:

概念映射不完整:中文 prompt 對應的英文概念有時候 Midjourney 抓得不準,尤其是有文化背景的詞彙(「水墨」「仙境」「懸崖上的城鎮」這類),英文描述反而更精準。

技術參數:所有參數(--ar--v--sref 等)都用英文,不管 prompt 用什麼語言都一樣。

實際上最常見的做法是:用中文或中英混合描述主題和氛圍,參數全用英文。

寧靜的秋日湖面,有霧,早晨的光線 --ar 16:9 --raw

這樣寫通常沒問題。如果結果不符合預期,把主要描述翻成英文通常能改善。

圖內中文字:Midjourney 的弱點

這是最值得提前知道的坑。

AI 生圖工具在「圖內放文字」這件事普遍都弱,Midjourney 也不例外。英文字在近幾個版本已經有改善,能生出大致可讀的英文字;但 CJK 文字(中文、日文、韓文)更弱,生出來通常是看起來像漢字但實際上不對的形狀。

解決方案:別靠 Midjourney 處理圖內中文字。先生出不含文字的圖,之後用 Canva 或 Photoshop 把中文字疊上去。這個工作流反而更可控:字型、大小、排版都能精確設定,不需要賭 Midjourney 生對的機率。

跟其他工具比

MidjourneyNano BananaDALL-E / GPT ImageStable Diffusion
畫質藝術感頂尖良好良好依模型,參差
免費試用有免費額度完全免費(本地)
中文圖內文字較好較好依模型
Prompt 遵從度偏鬆中等較嚴格依設定
風格一致性(系列圖)--sref / 角色參考 很好用中等中等需要額外工具
技術門檻較高(本地架設)
介面語言英文中文友善中文友善英文(多)

幾個場景的選擇建議:

要藝術感最強的圖:Midjourney,特別是系列插畫、有氛圍感的場景、品牌視覺。--sref 做風格一致的系列圖非常強。

要圖裡有中文字:生圖用任何工具,文字用 Canva 疊。不要用 Midjourney 直接生含中文字的圖。

預算考量,或需要免費試用先試水溫:DALL-E(ChatGPT Plus 含額度)或 Nano Banana 都有免費選項,Midjourney 沒有。

想完全自己掌控、不介意技術門檻:Stable Diffusion 本地跑,免費且高度可控,但需要時間學習。

對話式修圖(邊聊邊改):Nano Banana 的對話式介面在這個場景更直覺。Midjourney 修改主要靠參數和 Vary,不是對話式的。

結論

Midjourney 的定位很清楚:你知道自己要什麼風格、願意花時間調參數、需要藝術感強的輸出,它是目前最強的選項。這個評價在 V8.1 之後更穩了。

比較值得說的是「為什麼不一定選它」。

沒有免費試用是門檻,你沒辦法先試再決定,直接就要 $10。如果你不確定自己能不能用好 prompt、或者只是偶爾需要生幾張圖,這筆錢花起來會很猶豫。同樣 $10,ChatGPT Plus($20/月含 DALL-E 額度)的 prompt 遵從度更好、圖內英文文字也更可靠。

Midjourney 的 prompt 遵從度「鬆」這件事在實際使用時不時會出現:你想要「一隻橘貓坐在書桌上」,它給你「一隻橘貓在充滿書桌氛圍的空間裡,也許是坐也許是走」。結果還是很漂亮,但不一定是你要的那個構圖。用 --raw 可以稍微改善,但不是根治。

如果預算沒問題、對藝術風格有要求、需要系列圖的一致性,Midjourney 值得訂 Standard($30/月,含 Relax 無限慢速)長期用。如果是偶爾生圖、主要在乎 prompt 有多少照做,其他選項可能更划算。

版本更新快(以 docs.midjourney.com 為準),V9 的訊息已經在社群流傳,影片功能也持續在擴張。功能本身不會讓你的判斷過時,但具體規格細節記得查官方。

延伸閱讀


整理:Penna|小企鵝 Penchan