AI 生图工具很多,但 Midjourney 的名字在创作社区里的出现频率一直不低。原因很直接:它的画质和艺术感在同类工具里公认顶尖,尤其是需要一张「看起来像有人认真画过」的图的时候,差距很明显。
缺点也同样明显:没有免费试用,最低 $10/月才能开始,界面是英文,而且图内放中文字会很痛。适不适合你,取决于最在乎的是什么。
认识 Midjourney
Midjourney 是 Midjourney Inc.(创始人 David Holz)开发的文字生图片 AI,2022 年 7 月公测,从一开始就以艺术感强著称。它正在拓展视频生成,但核心仍是把文字 prompt 转成静态图片。
跟 DALL-E 或 Stable Diffusion 的设计理念不同,Midjourney 选的是「你输入 prompt,它生出一张看起来像艺术品的图」。这个选择让它在风格美感上有优势,代价是 prompt 遵从度有时比较松,它倾向生出「好看的东西」,不一定是你说的「那个东西」。
2026 年的默认版本是 V8.1,上线日期是 2026 年 6 月 10 日。原生 2K 分辨率、速度比前一代快 3–5 倍、成本降了约 25%、人体解剖结构也有明显改善。动漫风格有专门的 Niji V7 模型可以切换。
怎么开始用
主界面:web app
2026 年不需要靠 Discord 了,直接在浏览器开 midjourney.com 就好。
步骤:
- 到 midjourney.com,点右上角的「Sign In」
- 用 Google 账号或 Discord 账号登录(没有纯 email 的选项)
- 选一个套餐订阅,必须先订阅才能生图,没有免费试用
- 登录后进 Create 分页
- 在下方输入栏打入 prompt,按 Enter
- 等 Midjourney 生出 4 张预览图
- 点 U1–U4 放大(Upscale)或 V1–V4 做变化(Vary),满意就下载
整个流程在浏览器里完成,不需要安装任何东西。付款用国际信用卡。

Discord 也还能用
如果你习惯 Discord,或是想浏览社区生成的图,Discord 依然有效。加入 Midjourney 的 Discord server 之后,在频道里输入 /imagine 指令加上 prompt 就能生图。Web app 和 Discord 用的是同一个账号和额度,两边切换不会有问题。
价格套餐
重要前提:Midjourney 卖的是 GPU 时长(Fast hours),不是张数。 每张图消耗的时长依分辨率、参数而不同。未使用的 Fast hours 不会滚存到下个月。
| 套餐 | 月付 | 年付(省 20%) | Fast hours/月 | Relax 无限慢速 | Stealth 隐私 | 并发数 |
|---|---|---|---|---|---|---|
| Basic | US$10 | US$8 | 3.3h | 无 | 无 | 3 |
| Standard | US$30 | US$24 | 15h | 有 | 无 | 3 |
| Pro | US$60 | US$48 | 30h | 有 | 有 | 12 |
| Mega | US$120 | US$96 | 60h | 有 | 有 | 12 |
几个选择关键:
Relax 模式(Standard 起才有):Relax 是无限慢速生成,不扣 Fast hours,适合不赶时间但量大的场景。Standard 主要的吸引力就在这个。
Stealth 模式(Pro 起才有):默认状态下,你在 Midjourney 生的图可以被其他人在 Explore 页面看到。Stealth 让生图结果只有你自己看得到,商业创作或不想公开的内容才需要这个。
商用授权:所有付费套餐都含商用授权。如果你的公司年营收超过 US$100 万,授权条款要求用 Pro 或 Mega。
版权注意事项:付费含商用授权,但纯 AI 生成图在美国法律下多半无法取得版权保护,也就是说别人也可能使用你生成的图。这个问题跨 AI 生图工具都存在,不是 Midjourney 独有的。
主要功能与参数
模型切换
用 --v 参数切版本,用 --niji 切动漫模型。不加的话默认是 V8.1。
a serene lake in autumn, photorealistic --v 8.1
anime style character portrait --niji 7
Niji V7 是动漫特化版,人物、场景的动漫风格比 V8.1 更准确,喜欢日系插画风格的话选这个。
常用参数
| 参数 | 功能 | 示例 |
|---|---|---|
--ar | 比例(宽:高) | --ar 16:9、--ar 4:5(IG 竖版) |
--v | 指定版本 | --v 8.1 |
--niji | 动漫模型版本 | --niji 7 |
--sref | 风格参考图 URL | --sref https://... |
| 角色参考 | 维持角色一致性(V7 为 --oref Omni Reference,版本不同参数不同) | 以官方文档为准 |
--raw | 减少 Midjourney 的「美化」倾向 | 适合追求写实风格时 |
--hd | 高分辨率(2K)输出 | 各套餐皆可用 |
--chaos | 四张图差异程度(0-100) | --chaos 50(较多变化) |
--stylize | 艺术化程度(0-1000) | 默认 100;越高越「艺术」 |
风格一致性:—sref 和角色参考
这两类参考是做系列创作时非常实用的工具。
--sref(Style Reference):贴上参考图的 URL,Midjourney 会学这张图的风格、色调、氛围,套用到新 prompt 上。做品牌系列图时先确定一张「基准图」,之后每张都加 --sref 能维持视觉一致性。
角色参考:让角色在不同场景里保持一致外观,做漫画分格或系列故事图时很有用。要注意的是这个功能的参数依 Midjourney 版本不同(V7 是 --oref Omni Reference),用之前先查 docs.midjourney.com 对应你目前的模型版本。
其他工具
生出 4 张后,还有几个后处理选项:
- Vary:在原图基础上做细微或较大的变化
- Zoom Out / Pan:把画面往外延伸,补充原图看不到的部分
- Inpainting:局部重绘,只改你圈选的区域
- 视频:把静态图转成短动画,SD 或 HD 输出(HD 需 Standard 以上)
个人化功能(Personal Style)可以记住你的偏好风格;Moodboards 让你收藏参考图、建立系列。
中文怎么用
Prompt 用中文可以,但英文更准
Midjourney 能接受中文 prompt,也能大致理解意思。但有几个实际的差距:
概念映射不完整:中文 prompt 对应的英文概念有时候 Midjourney 抓得不准,尤其是有文化背景的词汇(「水墨」「仙境」「悬崖上的城镇」这类),英文描述反而更精准。
技术参数:所有参数(--ar、--v、--sref 等)都用英文,不管 prompt 用什么语言都一样。
实际上最常见的做法是:用中文或中英混合描述主题和氛围,参数全用英文。
宁静的秋日湖面,有雾,早晨的光线 --ar 16:9 --raw
这样写通常没问题。如果结果不符合预期,把主要描述翻成英文通常能改善。
图内中文字:Midjourney 的弱点
这是最值得提前知道的坑。
AI 生图工具在「图内放文字」这件事普遍都弱,Midjourney 也不例外。英文字在近几个版本已经有改善,能生出大致可读的英文字;但 CJK 文字(中文、日文、韩文)更弱,生出来通常是看起来像汉字但实际上不对的形状。
解决方案:别靠 Midjourney 处理图内中文字。先生出不含文字的图,之后用 Canva 或 Photoshop 把中文字叠上去。这个工作流反而更可控:字体、大小、排版都能精确设定,不需要赌 Midjourney 生对的概率。
跟其他工具比
| Midjourney | Nano Banana | DALL-E / GPT Image | Stable Diffusion | |
|---|---|---|---|---|
| 画质艺术感 | 顶尖 | 良好 | 良好 | 依模型,参差 |
| 免费试用 | 无 | 有 | 有免费额度 | 完全免费(本地) |
| 中文图内文字 | 弱 | 较好 | 较好 | 依模型 |
| Prompt 遵从度 | 偏松 | 中等 | 较严格 | 依设定 |
| 风格一致性(系列图) | --sref / 角色参考 很好用 | 中等 | 中等 | 需要额外工具 |
| 技术门槛 | 低 | 低 | 低 | 较高(本地部署) |
| 界面语言 | 英文 | 中文友好 | 中文友好 | 英文(多) |
几个场景的选择建议:
要艺术感最强的图:Midjourney,特别是系列插画、有氛围感的场景、品牌视觉。--sref 做风格一致的系列图非常强。
要图里有中文字:生图用任何工具,文字用 Canva 叠加。不要用 Midjourney 直接生含中文字的图。
预算有限,或需要免费试用先试试水:DALL-E(ChatGPT Plus 含额度)或 Nano Banana 都有免费选项,Midjourney 没有。
想完全自己掌控、不介意技术门槛:Stable Diffusion 本地跑,免费且高度可控,但需要时间学习。
对话式修图(边聊边改):Nano Banana 的对话式界面在这个场景更直观。Midjourney 修改主要靠参数和 Vary,不是对话式的。
结论
Midjourney 的定位很清楚:你知道自己要什么风格、愿意花时间调参数、需要艺术感强的输出,它是目前最强的选项。这个评价在 V8.1 之后更稳了。
比较值得说的是「为什么不一定选它」。
没有免费试用是门槛,你没办法先试再决定,直接就要 $10。如果你不确定自己能不能用好 prompt、或者只是偶尔需要生几张图,这笔钱花起来会很犹豫。同样 $10,ChatGPT Plus($20/月含 DALL-E 额度)的 prompt 遵从度更好、图内英文文字也更可靠。
Midjourney 的 prompt 遵从度「松」这件事在实际使用时不时会出现:你想要「一只橘猫坐在书桌上」,它给你「一只橘猫在充满书桌氛围的空间里,也许是坐也许是走」。结果还是很漂亮,但不一定是你要的那个构图。用 --raw 可以稍微改善,但不是根治。
如果预算没问题、对艺术风格有要求、需要系列图的一致性,Midjourney 值得订 Standard($30/月,含 Relax 无限慢速)长期用。如果是偶尔生图、主要在乎 prompt 有多少照做,其他选项可能更划算。
版本更新快(以 docs.midjourney.com 为准),V9 的消息已经在社区流传,视频功能也持续在扩张。功能本身不会让你的判断过时,但具体规格细节记得查官方。
延伸阅读
整理:Penna|小企鹅 Penchan