AI 生圖工具很多,但 Midjourney 的名字在創作社群裡的出現頻率一直不低。原因很直接:它的畫質和藝術感在同類工具裡公認頂尖,尤其是需要一張「看起來像有人認真畫過」的圖的時候,差距很明顯。
缺點也同樣明顯:沒有免費試用,最低 $10/月才能開始,介面是英文,而且圖內放中文字會很痛。適不適合你,取決於最在乎的是什麼。
認識 Midjourney
Midjourney 是 Midjourney Inc.(創辦人 David Holz)開發的文字生圖片 AI,2022 年 7 月公測,從一開始就以藝術感強著稱。它正在跨足影片生成,但核心仍是把文字 prompt 轉成靜態圖片。
跟 DALL-E 或 Stable Diffusion 的設計哲學不同,Midjourney 選的是「你輸入 prompt,它生出一張看起來像藝術品的圖」。這個選擇讓它在風格美感上有優勢,代價是 prompt 遵從度有時比較鬆,它傾向生出「好看的東西」,不一定是你說的「那個東西」。
2026 年的預設版本是 V8.1,上線日期是 2026 年 6 月 10 日。原生 2K 解析度、速度比前一代快 3–5 倍、成本降了約 25%、人體解剖結構也有明顯改善。動漫風格有專門的 Niji V7 模型可以切換。
怎麼開始用
主介面:web app
2026 年不需要靠 Discord 了,直接在瀏覽器開 midjourney.com 就好。
步驟:
- 到 midjourney.com,點右上角的「Sign In」
- 用 Google 帳號或 Discord 帳號登入(沒有 email-only 的選項)
- 選一個方案訂閱,必須先訂閱才能生圖,沒有免費試用
- 登入後進 Create 分頁
- 在下方輸入欄打入 prompt,按 Enter
- 等 Midjourney 生出 4 張預覽圖
- 點 U1–U4 放大(Upscale)或 V1–V4 做變化(Vary),滿意就下載
整個流程在瀏覽器裡完成,不需要安裝任何東西。台灣可以直接連線,付款用國際信用卡。

Discord 也還能用
如果你習慣 Discord,或是想瀏覽社群生成的圖,Discord 依然有效。加入 Midjourney 的 Discord server 之後,在頻道裡輸入 /imagine 指令加上 prompt 就能生圖。Web app 和 Discord 用的是同一個帳號和額度,兩邊切換不會有問題。
價格方案
重要前提:Midjourney 賣的是 GPU 時數(Fast hours),不是張數。 每張圖消耗的時數依解析度、參數而不同。未使用的 Fast hours 不會滾存到下個月。
| 方案 | 月付 | 年付(省 20%) | Fast hours/月 | Relax 無限慢速 | Stealth 隱私 | 並發數 |
|---|---|---|---|---|---|---|
| Basic | US$10 | US$8 | 3.3h | 無 | 無 | 3 |
| Standard | US$30 | US$24 | 15h | 有 | 無 | 3 |
| Pro | US$60 | US$48 | 30h | 有 | 有 | 12 |
| Mega | US$120 | US$96 | 60h | 有 | 有 | 12 |
幾個選擇關鍵:
Relax 模式(Standard 起才有):Relax 是無限慢速生成,不扣 Fast hours,適合不趕時間但量大的場景。Standard 主要的吸引力就在這個。
Stealth 模式(Pro 起才有):預設狀態下,你在 Midjourney 生的圖可以被其他人在 Explore 頁面看到。Stealth 讓生圖結果只有你自己看得到,商業創作或不想公開的內容才需要這個。
商用授權:所有付費方案都含商用授權。如果你的公司年營收超過 US$100 萬,授權條款要求用 Pro 或 Mega。
著作權注意事項:付費含商用授權,但純 AI 生成圖在美國法律下多半無法取得著作權保護,也就是說別人也可能使用你生成的圖。這個問題跨 AI 生圖工具都存在,不是 Midjourney 獨有的。
主要功能與參數
模型切換
用 --v 參數切版本,用 --niji 切動漫模型。不加的話預設是 V8.1。
a serene lake in autumn, photorealistic --v 8.1
anime style character portrait --niji 7
Niji V7 是動漫特化版,人物、場景的動漫風格比 V8.1 更準確,喜歡日系插畫風格的話選這個。
常用參數
| 參數 | 功能 | 範例 |
|---|---|---|
--ar | 比例(寬:高) | --ar 16:9、--ar 4:5(IG 直式) |
--v | 指定版本 | --v 8.1 |
--niji | 動漫模型版本 | --niji 7 |
--sref | 風格參考圖 URL | --sref https://... |
| 角色參考 | 維持角色一致性(V7 為 --oref Omni Reference,版本不同參數不同) | 以官方文件為準 |
--raw | 減少 Midjourney 的「美化」傾向 | 適合追求寫實風格時 |
--hd | 高解析度(2K)輸出 | 各方案皆可用 |
--chaos | 四張圖差異程度(0-100) | --chaos 50(較多變化) |
--stylize | 藝術化程度(0-1000) | 預設 100;越高越「藝術」 |
風格一致性:—sref 和角色參考
這兩類參考是做系列創作時非常實用的工具。
--sref(Style Reference):貼上參考圖的 URL,Midjourney 會學這張圖的風格、色調、氛圍,套用到新 prompt 上。做品牌系列圖時先確定一張「基準圖」,之後每張都加 --sref 能維持視覺一致性。
角色參考:讓角色在不同場景裡保持一致外觀,做漫畫分格或系列故事圖時很有用。要注意的是這個功能的參數依 Midjourney 版本不同(V7 是 --oref Omni Reference),用之前先查 docs.midjourney.com 對應你目前的模型版本。
其他工具
生出 4 張後,還有幾個後處理選項:
- Vary:在原圖基礎上做細微或較大的變化
- Zoom Out / Pan:把畫面往外延伸,補充原圖看不到的部分
- Inpainting:局部重繪,只改你圈選的區域
- 影片:把靜態圖轉成短動畫,SD 或 HD 輸出(HD 需 Standard 以上)
個人化功能(Personal Style)可以記住你的偏好風格;Moodboards 讓你收藏參考圖、建立系列。
中文怎麼用
Prompt 用中文可以,但英文更準
Midjourney 能接受中文 prompt,也能大致理解意思。但有幾個實際的差距:
概念映射不完整:中文 prompt 對應的英文概念有時候 Midjourney 抓得不準,尤其是有文化背景的詞彙(「水墨」「仙境」「懸崖上的城鎮」這類),英文描述反而更精準。
技術參數:所有參數(--ar、--v、--sref 等)都用英文,不管 prompt 用什麼語言都一樣。
實際上最常見的做法是:用中文或中英混合描述主題和氛圍,參數全用英文。
寧靜的秋日湖面,有霧,早晨的光線 --ar 16:9 --raw
這樣寫通常沒問題。如果結果不符合預期,把主要描述翻成英文通常能改善。
圖內中文字:Midjourney 的弱點
這是最值得提前知道的坑。
AI 生圖工具在「圖內放文字」這件事普遍都弱,Midjourney 也不例外。英文字在近幾個版本已經有改善,能生出大致可讀的英文字;但 CJK 文字(中文、日文、韓文)更弱,生出來通常是看起來像漢字但實際上不對的形狀。
解決方案:別靠 Midjourney 處理圖內中文字。先生出不含文字的圖,之後用 Canva 或 Photoshop 把中文字疊上去。這個工作流反而更可控:字型、大小、排版都能精確設定,不需要賭 Midjourney 生對的機率。
跟其他工具比
| Midjourney | Nano Banana | DALL-E / GPT Image | Stable Diffusion | |
|---|---|---|---|---|
| 畫質藝術感 | 頂尖 | 良好 | 良好 | 依模型,參差 |
| 免費試用 | 無 | 有 | 有免費額度 | 完全免費(本地) |
| 中文圖內文字 | 弱 | 較好 | 較好 | 依模型 |
| Prompt 遵從度 | 偏鬆 | 中等 | 較嚴格 | 依設定 |
| 風格一致性(系列圖) | --sref / 角色參考 很好用 | 中等 | 中等 | 需要額外工具 |
| 技術門檻 | 低 | 低 | 低 | 較高(本地架設) |
| 介面語言 | 英文 | 中文友善 | 中文友善 | 英文(多) |
幾個場景的選擇建議:
要藝術感最強的圖:Midjourney,特別是系列插畫、有氛圍感的場景、品牌視覺。--sref 做風格一致的系列圖非常強。
要圖裡有中文字:生圖用任何工具,文字用 Canva 疊。不要用 Midjourney 直接生含中文字的圖。
預算考量,或需要免費試用先試水溫:DALL-E(ChatGPT Plus 含額度)或 Nano Banana 都有免費選項,Midjourney 沒有。
想完全自己掌控、不介意技術門檻:Stable Diffusion 本地跑,免費且高度可控,但需要時間學習。
對話式修圖(邊聊邊改):Nano Banana 的對話式介面在這個場景更直覺。Midjourney 修改主要靠參數和 Vary,不是對話式的。
結論
Midjourney 的定位很清楚:你知道自己要什麼風格、願意花時間調參數、需要藝術感強的輸出,它是目前最強的選項。這個評價在 V8.1 之後更穩了。
比較值得說的是「為什麼不一定選它」。
沒有免費試用是門檻,你沒辦法先試再決定,直接就要 $10。如果你不確定自己能不能用好 prompt、或者只是偶爾需要生幾張圖,這筆錢花起來會很猶豫。同樣 $10,ChatGPT Plus($20/月含 DALL-E 額度)的 prompt 遵從度更好、圖內英文文字也更可靠。
Midjourney 的 prompt 遵從度「鬆」這件事在實際使用時不時會出現:你想要「一隻橘貓坐在書桌上」,它給你「一隻橘貓在充滿書桌氛圍的空間裡,也許是坐也許是走」。結果還是很漂亮,但不一定是你要的那個構圖。用 --raw 可以稍微改善,但不是根治。
如果預算沒問題、對藝術風格有要求、需要系列圖的一致性,Midjourney 值得訂 Standard($30/月,含 Relax 無限慢速)長期用。如果是偶爾生圖、主要在乎 prompt 有多少照做,其他選項可能更划算。
版本更新快(以 docs.midjourney.com 為準),V9 的訊息已經在社群流傳,影片功能也持續在擴張。功能本身不會讓你的判斷過時,但具體規格細節記得查官方。
延伸閱讀
整理:Penna|小企鵝 Penchan