AI 生图工具很多,但 Midjourney 的名字在创作社区里的出现频率一直不低。原因很直接:它的画质和艺术感在同类工具里公认顶尖,尤其是需要一张「看起来像有人认真画过」的图的时候,差距很明显。

缺点也同样明显:没有免费试用,最低 $10/月才能开始,界面是英文,而且图内放中文字会很痛。适不适合你,取决于最在乎的是什么。

认识 Midjourney

Midjourney 是 Midjourney Inc.(创始人 David Holz)开发的文字生图片 AI,2022 年 7 月公测,从一开始就以艺术感强著称。它正在拓展视频生成,但核心仍是把文字 prompt 转成静态图片。

跟 DALL-E 或 Stable Diffusion 的设计理念不同,Midjourney 选的是「你输入 prompt,它生出一张看起来像艺术品的图」。这个选择让它在风格美感上有优势,代价是 prompt 遵从度有时比较松,它倾向生出「好看的东西」,不一定是你说的「那个东西」。

2026 年的默认版本是 V8.1,上线日期是 2026 年 6 月 10 日。原生 2K 分辨率、速度比前一代快 3–5 倍、成本降了约 25%、人体解剖结构也有明显改善。动漫风格有专门的 Niji V7 模型可以切换。

怎么开始用

主界面:web app

2026 年不需要靠 Discord 了,直接在浏览器开 midjourney.com 就好。

步骤:

  1. midjourney.com,点右上角的「Sign In」
  2. 用 Google 账号或 Discord 账号登录(没有纯 email 的选项)
  3. 选一个套餐订阅,必须先订阅才能生图,没有免费试用
  4. 登录后进 Create 分页
  5. 在下方输入栏打入 prompt,按 Enter
  6. 等 Midjourney 生出 4 张预览图
  7. 点 U1–U4 放大(Upscale)或 V1–V4 做变化(Vary),满意就下载

整个流程在浏览器里完成,不需要安装任何东西。付款用国际信用卡。

Midjourney 官网 midjourney.com:可用 Google 或 Discord 账号登录

Discord 也还能用

如果你习惯 Discord,或是想浏览社区生成的图,Discord 依然有效。加入 Midjourney 的 Discord server 之后,在频道里输入 /imagine 指令加上 prompt 就能生图。Web app 和 Discord 用的是同一个账号和额度,两边切换不会有问题。

价格套餐

重要前提:Midjourney 卖的是 GPU 时长(Fast hours),不是张数。 每张图消耗的时长依分辨率、参数而不同。未使用的 Fast hours 不会滚存到下个月。

套餐月付年付(省 20%)Fast hours/月Relax 无限慢速Stealth 隐私并发数
BasicUS$10US$83.3h3
StandardUS$30US$2415h3
ProUS$60US$4830h12
MegaUS$120US$9660h12

几个选择关键:

Relax 模式(Standard 起才有):Relax 是无限慢速生成,不扣 Fast hours,适合不赶时间但量大的场景。Standard 主要的吸引力就在这个。

Stealth 模式(Pro 起才有):默认状态下,你在 Midjourney 生的图可以被其他人在 Explore 页面看到。Stealth 让生图结果只有你自己看得到,商业创作或不想公开的内容才需要这个。

商用授权:所有付费套餐都含商用授权。如果你的公司年营收超过 US$100 万,授权条款要求用 Pro 或 Mega。

版权注意事项:付费含商用授权,但纯 AI 生成图在美国法律下多半无法取得版权保护,也就是说别人也可能使用你生成的图。这个问题跨 AI 生图工具都存在,不是 Midjourney 独有的。

主要功能与参数

模型切换

--v 参数切版本,用 --niji 切动漫模型。不加的话默认是 V8.1。

a serene lake in autumn, photorealistic --v 8.1
anime style character portrait --niji 7

Niji V7 是动漫特化版,人物、场景的动漫风格比 V8.1 更准确,喜欢日系插画风格的话选这个。

常用参数

参数功能示例
--ar比例(宽:高)--ar 16:9--ar 4:5(IG 竖版)
--v指定版本--v 8.1
--niji动漫模型版本--niji 7
--sref风格参考图 URL--sref https://...
角色参考维持角色一致性(V7 为 --oref Omni Reference,版本不同参数不同)以官方文档为准
--raw减少 Midjourney 的「美化」倾向适合追求写实风格时
--hd高分辨率(2K)输出各套餐皆可用
--chaos四张图差异程度(0-100)--chaos 50(较多变化)
--stylize艺术化程度(0-1000)默认 100;越高越「艺术」

风格一致性:—sref 和角色参考

这两类参考是做系列创作时非常实用的工具。

--sref(Style Reference):贴上参考图的 URL,Midjourney 会学这张图的风格、色调、氛围,套用到新 prompt 上。做品牌系列图时先确定一张「基准图」,之后每张都加 --sref 能维持视觉一致性。

角色参考:让角色在不同场景里保持一致外观,做漫画分格或系列故事图时很有用。要注意的是这个功能的参数依 Midjourney 版本不同(V7 是 --oref Omni Reference),用之前先查 docs.midjourney.com 对应你目前的模型版本。

其他工具

生出 4 张后,还有几个后处理选项:

  • Vary:在原图基础上做细微或较大的变化
  • Zoom Out / Pan:把画面往外延伸,补充原图看不到的部分
  • Inpainting:局部重绘,只改你圈选的区域
  • 视频:把静态图转成短动画,SD 或 HD 输出(HD 需 Standard 以上)

个人化功能(Personal Style)可以记住你的偏好风格;Moodboards 让你收藏参考图、建立系列。

中文怎么用

Prompt 用中文可以,但英文更准

Midjourney 能接受中文 prompt,也能大致理解意思。但有几个实际的差距:

概念映射不完整:中文 prompt 对应的英文概念有时候 Midjourney 抓得不准,尤其是有文化背景的词汇(「水墨」「仙境」「悬崖上的城镇」这类),英文描述反而更精准。

技术参数:所有参数(--ar--v--sref 等)都用英文,不管 prompt 用什么语言都一样。

实际上最常见的做法是:用中文或中英混合描述主题和氛围,参数全用英文。

宁静的秋日湖面,有雾,早晨的光线 --ar 16:9 --raw

这样写通常没问题。如果结果不符合预期,把主要描述翻成英文通常能改善。

图内中文字:Midjourney 的弱点

这是最值得提前知道的坑。

AI 生图工具在「图内放文字」这件事普遍都弱,Midjourney 也不例外。英文字在近几个版本已经有改善,能生出大致可读的英文字;但 CJK 文字(中文、日文、韩文)更弱,生出来通常是看起来像汉字但实际上不对的形状。

解决方案:别靠 Midjourney 处理图内中文字。先生出不含文字的图,之后用 Canva 或 Photoshop 把中文字叠上去。这个工作流反而更可控:字体、大小、排版都能精确设定,不需要赌 Midjourney 生对的概率。

跟其他工具比

MidjourneyNano BananaDALL-E / GPT ImageStable Diffusion
画质艺术感顶尖良好良好依模型,参差
免费试用有免费额度完全免费(本地)
中文图内文字较好较好依模型
Prompt 遵从度偏松中等较严格依设定
风格一致性(系列图)--sref / 角色参考 很好用中等中等需要额外工具
技术门槛较高(本地部署)
界面语言英文中文友好中文友好英文(多)

几个场景的选择建议:

要艺术感最强的图:Midjourney,特别是系列插画、有氛围感的场景、品牌视觉。--sref 做风格一致的系列图非常强。

要图里有中文字:生图用任何工具,文字用 Canva 叠加。不要用 Midjourney 直接生含中文字的图。

预算有限,或需要免费试用先试试水:DALL-E(ChatGPT Plus 含额度)或 Nano Banana 都有免费选项,Midjourney 没有。

想完全自己掌控、不介意技术门槛:Stable Diffusion 本地跑,免费且高度可控,但需要时间学习。

对话式修图(边聊边改):Nano Banana 的对话式界面在这个场景更直观。Midjourney 修改主要靠参数和 Vary,不是对话式的。

结论

Midjourney 的定位很清楚:你知道自己要什么风格、愿意花时间调参数、需要艺术感强的输出,它是目前最强的选项。这个评价在 V8.1 之后更稳了。

比较值得说的是「为什么不一定选它」。

没有免费试用是门槛,你没办法先试再决定,直接就要 $10。如果你不确定自己能不能用好 prompt、或者只是偶尔需要生几张图,这笔钱花起来会很犹豫。同样 $10,ChatGPT Plus($20/月含 DALL-E 额度)的 prompt 遵从度更好、图内英文文字也更可靠。

Midjourney 的 prompt 遵从度「松」这件事在实际使用时不时会出现:你想要「一只橘猫坐在书桌上」,它给你「一只橘猫在充满书桌氛围的空间里,也许是坐也许是走」。结果还是很漂亮,但不一定是你要的那个构图。用 --raw 可以稍微改善,但不是根治。

如果预算没问题、对艺术风格有要求、需要系列图的一致性,Midjourney 值得订 Standard($30/月,含 Relax 无限慢速)长期用。如果是偶尔生图、主要在乎 prompt 有多少照做,其他选项可能更划算。

版本更新快(以 docs.midjourney.com 为准),V9 的消息已经在社区流传,视频功能也持续在扩张。功能本身不会让你的判断过时,但具体规格细节记得查官方。

延伸阅读


整理:Penna|小企鹅 Penchan