Midjourney 到底是个什么东西
把它想成一个住在网上的定制画师。你不用会握笔,只要用文字跟他说清楚:“我要一只穿宇航服的柴犬,站在月球上,写实照片风格。”他听完,几十秒就给你画几个版本挑。你说“第二张不错,放大”,或者“都不太对,重画一版”,他就接着干。
你写的那段文字,就叫提示词(英文 Prompt);它一次给你的那几张图,就是初始图,你从里面挑一张来放大或微调。
说回正经的:Midjourney 是一个文字生成图片的 AI 工具。你给文字,它给图。背后用的是“扩散模型”——简单说,它从一团随机噪点出发,照着你的描述一步步“擦”出一张清晰的图。原理你完全不用懂,只要记住一句话:你说得越具体,它画得越接近你脑子里那张图。
它不“画”实物照片,也不去网上搜现成图拼给你,而是每次现生成一张全新的图。所以同一句提示词,今天和明天出来的可能不一样,这是它的特性,不是出故障。
它和别的生图工具,一句话的区别
市面上能用文字出图的工具不止 Midjourney 一个,新手常被名字绕晕。这里只给你一句话的印象,够你起步:
- Midjourney:出图“好看”是它的强项,默认就带一股精致的艺术感,新手随便写都不太丑——代价是要付费、对画面的精确控制偏弱。
- DALL·E(在 ChatGPT 里就能用):胜在顺手,边聊边改,理解大白话描述好;出图的“高级感”平均不如 Midjourney。
- Stable Diffusion:能装在自己电脑上、免费、可深度调,但上手门槛高,是给愿意折腾的人准备的。
一句话收尾:想省事又要好看,先用 Midjourney;想免费或想精确控制,再考虑另两个。三个怎么挑,这篇生图工具对比讲得更细。
从打开到出第一张图,照着点
这是最该一步不落照着做的部分。现在新手走网页版最省事,整个流程是这样:
- 打开官网:浏览器里输入 midjourney.com。别在搜索引擎里点来路不明的“免费 Midjourney”,认准这个官方域名。
- 注册 / 登录:用 Google 账号或 Discord 账号登录都行,跟着提示走完一遍即可。第一次会让你确认服务条款。
- 进入出图界面:登录后找到那个顶部或中间的输入框(通常写着 “Imagine…” 或“描述你想要的图”)。这一步很多人卡住,是因为界面会先停在画廊/探索页——别在那看别人的图,找到能打字的输入框才是你出图的地方。
- 输入提示词出图:在输入框里粘一句描述,按回车。网页版直接打字就行;如果你走的是 Discord,则要在频道里打
/imagine再跟上提示词。两条路殊途同归,新手走网页版即可。 - 挑图、放大、重出:它会给你几张图。喜欢哪张就放大(Upscale,常标 U1–U4)得到高清版;想要“这张的感觉但再变一变”就出变体(Variation,常标 V1–V4);几张都不行就整组重出(🔄 / Re-roll),或回去改提示词再来。
A cozy coffee shop interior, morning sunlight through large windows, warm tones, watercolor style
(一间温馨的咖啡馆内景,晨光透过大窗,暖色调,水彩风格。)出来不满意很正常,往下看怎么改。
提示词怎么写才不空泛
新手第一张图大多让人失望,几乎都栽在同一件事上:提示词太空。你写“一只猫”,它当然只能给你一只随机的猫。好提示词不在长,在有结构。记这个顺口的公式就够起步:
下面这张对照,左边是新手常写的,右边是补全四要素后的,差别一眼能看出来:
| ❌ 空泛的写法 | ✅ 具体的写法 | 差在哪 |
|---|---|---|
cat |
a fluffy orange cat on a windowsill, golden hour light, soft bokeh, photorealistic, --ar 3:2 |
补了主体细节、光线、风格、画幅,结果可控 |
a city at night |
a rain-soaked cyberpunk street at night, glowing neon signs, reflections on wet ground, cinematic wide shot, --ar 16:9 |
有了氛围、光线和构图,画面有“电影感” |
a girl, beautiful |
portrait of a young woman, soft window light, calm expression, film photography style, muted tones, --ar 4:5 |
“beautiful”这种空词没用,具体的光线和风格才有用 |
几条好用的小习惯:
- 用画面词,别用评价词。“好看”“高级”这类对它没用;换成
soft lighting(柔光)、warm tones(暖色调)、detailed texture(细腻质感)这种能落到画面上的词。 - 风格直接点名。
watercolor(水彩)、oil painting(油画)、photorealistic(写实照片)、anime(动漫)、3D render(三维渲染)、pixel art(像素风)。 - 构图也能说。
close-up(特写)、wide shot(广角)、bird's eye view(俯视)、portrait(竖构图人像)。 - 一次只突出一个主题。一句话里塞十个元素,它会顾此失彼,谁都画不好。
几个常用参数,记这几个就够
参数就是加在提示词末尾、以 -- 开头的小开关,用来调画面比例、版本这些。新手不用全记,下面这几个最常用:
| 参数 | 管什么 | 怎么用 |
|---|---|---|
--ar | 画幅(图片比例) | --ar 16:9 横屏、--ar 9:16 竖屏(手机壁纸)、--ar 1:1 正方形 |
--v | 模型版本 | --v 6 一类,指定用哪一代模型;不写就用当前默认版本 |
--style | 风格倾向 | 切换不同的风格预设(具体可选值以官方为准),让出图更偏某种调子 |
--s | 风格化强度 | --s 250 更浓的 MJ 艺术味、--s 0 更忠于你的字面描述 |
--no | 排除元素 | --no text, watermark 表示不要文字和水印 |
--ar(定横竖)。其余的等你出图顺手了再慢慢碰。参数的可用版本号和取值随官方更新会变,以官方文档当时显示为准。
新手最容易卡的四个地方
把第一次最常见的“卡壳”单独拎出来讲,因为这几道坎挡住的人,比“画得不够好”多得多。
卡在进不去 / 注册不顺
常见情况:搜“Midjourney”点进了山寨站,或者纠结要不要先装 Discord。对策:只认 midjourney.com 这个官方域名,网页版用 Google 或 Discord 账号一键登录即可,新手完全不需要先去玩 Discord。登录后第一步会让你确认条款,照常点过即可。
卡在“出图的界面在哪”
登录后界面常常先停在画廊/探索页,满屏都是别人的作品,你会一时找不到自己从哪开始。对策:别在画廊里逛,找到那个能打字的输入框(多半在顶部,提示文字类似 “What will you imagine?”),在那里粘提示词、回车,才是你自己出图的地方。
卡在“提示词全是英文,我不会写”
它能看懂中文,但英文精度更高。对策:用中文把画面描述清楚,丢给 ChatGPT,让它“翻译成一句结构清楚的 Midjourney 英文提示词”,再粘过来。等于让一个 AI 给另一个 AI 当翻译,省事又准。想系统学怎么把话说清楚,可看这篇讲提示词怎么写。
卡在“图出来了,但不是我要的”
这一步最劝退,但其实最好解决。对策:别整句推倒重写,一次只改一处——颜色不对就只动颜色词,构图不对就加一个构图词,然后重出对比。改一点、出一版、再改一点,这才是出图的正常节奏。下一节给你一个完整例子。
一个真实例子:从一句话改到能用
光说没感觉,看一次真实的迭代。目标:给一篇咖啡店推文配一张封面图。
- 第 1 版(太空):
coffee shop—— 出来一张平平无奇、像随手拍的店面,没氛围。 - 第 2 版(补主体+风格+光线):
cozy coffee shop interior, morning light, warm tones, watercolor style—— 立刻有内味了,暖、温馨,但有点窄,配不上横版封面。 - 第 3 版(补画幅):在上面那句后面加
--ar 16:9—— 变成横版,刚好做封面背景。 - 第 4 版(只微调一处):觉得太满,加
--no people(不要人),让画面更干净。出图后挑一张顺眼的点 Upscale 放大,得到高清图,收工。
注意整个过程:每一步只动一件事,所以每次都知道是哪句话起了作用。这比你写一长串、出来不对又不知道删哪句,效率高太多。
这些坑,第一次几乎人人踩
🚫 新手最常翻车的几件事
- 提示词太短。“画个人”只会得到一个随机的人。至少补上场景、风格、光线。
- 一句话塞太多。二十个元素挤一句,它谁都画不好。一次一个重点。
- 指望它写对文字。AI 生图在画面里写精确文字(招牌、标题)很容易出乱码,需要文字就出图后自己加。
- 非要画好“手”和复杂人群。手指数量、密集人脸是公认的难点,硬刚很费劲,换角度、拉远或裁掉更省事。
- 忘了定画幅。默认是正方形,做手机壁纸要
--ar 9:16、做横版封面要--ar 16:9,别等出完才发现比例不对。 - 额度用着用着没了还不知道。付费档的“快速出图”额度是有限的,用完出图会变慢或受限,留意官方界面里的用量提示。
版权和商用,先把边界搞清楚
⚠️ 用它出的图之前,记住三条
- 使用权以官方条款为准。一般付费订阅用户对自己生成的图有较宽的使用权,但能不能商用、有没有附加条件,一切以 Midjourney 官方当时的服务条款为准,别只信任何二手说法(包括本文)。
- 有使用权≠可以随便用。就算你对生成图有权使用,也不能拿它去仿冒他人商标、明星肖像、受版权保护的卡通/游戏角色——那侵的是别人的权,跟 Midjourney 给不给你使用权是两码事。
- 别直接拿去侵权。提示词里写“某在世艺术家的风格”、或刻意复刻某个知名 IP,都可能踩线。要商用、要对外发布,先确认画面里没有别人的受保护元素。
什么时候该换个工具
会用一个工具,也包括知道什么时候它不再是最优解。出现下面这些“停止信号”,说明你该看看别的:
- 你要对画面精确控制——同一个角色多张图保持一致、精确摆放某个物体的位置。Midjourney 偏“给你惊喜”,这类活它不擅长,Stable Diffusion 一类可调的更合适。
- 你就是不想花钱——Midjourney 基本要订阅。预算为零,先用 ChatGPT 里的生图,或本地的免费方案。
- 你要在自己电脑上离线跑——出于隐私或大批量需求想本地化,那 Midjourney 这种云端服务不适合,Stable Diffusion 能装本地。
三类工具到底怎么取舍,生图工具对比这篇把场景对着工具列清楚了,撞到上面信号就去那篇对号入座。
这工具适合谁、不适合谁
| 如果你是… | 建议 |
|---|---|
| 想快速出“好看”的配图、海报、封面的人 | 很合适,Midjourney 默认审美高,省心 |
| 做自媒体 / 小店 / 做 PPT,需要大量不重样素材的人 | 合适,当“素材发生器”用回报高 |
| 想随便玩玩、找点灵感的人 | 合适,但记得它要订阅,按月算账 |
| 需要同一角色多图一致、精确控制构图的人 | 别只靠它,看可调的工具(如 Stable Diffusion) |
| 预算为零、或必须本地离线运行的人 | 先看免费 / 本地方案,Midjourney 不对路 |
常见问题
Midjourney 现在还要用 Discord 吗?
新手不用了。直接进网页版 midjourney.com,登录后在网页里打字出图就行,不必再进 Discord、学斜杠命令。Discord 那套老用户还在用,你可以跳过。入口以官方页面为准。
Midjourney 免费吗?
通常要付费订阅,没有稳定免费额度。最低档约每月 10 美元,能生成一定数量的图,够试一个月。是否有限时免费、各档价格和额度随时会变,以官方定价页面为准。
不会英文能用吗?
能。可以直接写中文,它看得懂;但英文精度更高,重要的图建议用英文。最省事是先让 ChatGPT 把你的中文描述翻成一句结构清楚的英文提示词,再贴进去。
出的图能商用吗?
一般付费用户对自己生成的图有较宽使用权,但能不能商用、有何条件,以 Midjourney 官方当时的服务条款为准。另外即便有使用权,也不能拿去仿冒商标、肖像或受版权保护的角色。
为什么我的图总是不对?
多半是提示词太空泛,或一句话塞太多。先把主体、风格、光线、画幅说清楚,一次突出一个主题;不对就改一处再重出,别整句重来。手、文字、密集人群这类本就难,换角度或裁掉更省事。
别只信我,去官方页面核对
本文讲的是怎么上手和怎么判断;具体的功能、价格、使用条款随时会变,请以官方为准,别只信任何二手说法(包括本文):
- Midjourney 官方网站(midjourney.com) —— 注册登录、查最新出图界面、各档套餐价格与额度。
- 登录后在官网内的定价 / 订阅页,能看到当前各计划的价格和功能差异。
- 关于商用和使用权,以官网公布的服务条款(Terms of Service)为准。功能价格以官方页面为准,本文不保证与最新政策完全一致。
