全文约3500字,阅读时间约10分钟
本期测试:Midjourney V7 | 测试时间:2026年5月
一、写在前面:为什么是“一只穿西服的猫”?
上一期我们聊了ChatGPT写文案,这次轮到AI绘画的扛把子——Midjourney V7。
选择“一只穿西服的猫”作为测试用例,是因为它完美踩中了AI绘画的三个核心难点:
| 难点 | 为什么难 |
|---|---|
| 动物拟人化 | 猫的脸部结构要保留,又要穿衣服、摆姿势 |
| 材质一致性 | 西装的布料质感、猫毛的纹理要共存且不违和 |
| 商业可用性 | 不是“随便玩玩”,要能放进海报里用 |
本文完整记录我从注册到输出商业级海报的全流程。实测告诉你:Midjourney V7到底有多强?有哪些坑?从一张草稿到最终成品,到底需要多少步?
测试环境:
| 项目 | 信息 |
|---|---|
| 测试时间 | 2026年5月 |
| 使用模型 | Midjourney V7(2025年6月成为默认模型) |
| 使用界面 | Web版(midjourney.com/imagine) |
| 订阅计划 | Standard Plan($30/月,15h fast GPU + 无限relax) |
二、关于Midjourney V7:你需要知道的三件事
在开始实战之前,有必要快速了解V7的核心变化。如果你已经从V6升级,可以直接跳到第三节。
2.1 V7 vs V6:不是“更好看”那么简单
很多评测说V7“图更好看了”——这没错,但错过了重点。V7真正的升级是工作流层面的:
| 维度 | V6 | V7 |
|---|---|---|
| Prompt处理 | 强,但依赖堆参数 | 精度更高,更自然的语言即可 |
| 探索成本 | 每次生成都贵 | Draft Mode:10倍速度,1/2成本 |
| 风格复用 | 靠运气和seed | --sref + Moodboard 可复用品牌体系 |
| 跨场景一致性 | 难 | Omni Reference(--oref)原生支持 |
2.2 Draft Mode:这次测试的“省钱利器”
如果你只想记住V7的一个功能,记这个:Draft Mode。
官方数据:草稿模式速度约快10倍,GPU成本约为标准生成的一半。什么意思?你可以放肆地试方向、试构图、试风格,成本几乎可以忽略不计。选中最满意的方向后,再“升级”到全质量输出。
💡 本次测试中,我用Draft Mode生成了约60张探索图,总成本不到标准模式10张的费用。
2.3 中文提示词:V7的重大进步
Midjourney V7内置了多语言语义对齐模块,中文直出的质量大幅提升-2。官方数据显示,中文prompt的CLIP-Score较V6提升62%。但注意一个坑:不要中英文混用。比如“赛博朋克 cyberpunk”会触发双路径解析冲突,建议统一用“cyberpunk”或“赛博朋克风格”。
三、第一轮探索:Draft Mode狂野试错
3.1 第一次尝试:最简单的Prompt(翻车现场)
我的第一个Prompt(中文):
“一只穿西服的猫,正面照,商业摄影风格”
输出结果: 生成了4张图,没有一张能用的。有的猫脸完全变形,有的西装和猫毛糊在一起,有的姿势诡异得像猫在受刑。
问题诊断:
-
❌ 太笼统,V7不知道你要什么“风格”
-
❌ 没有指定画幅比例
-
❌ 没有材质描述
-
❌ 缺少负面提示词
⚠️ 教训: V7虽然prompt精度提升了,但“会说人话”不等于“不写细节”。你仍然需要告诉AI:什么材质、什么光线、什么构图。
3.2 第二次尝试:补充细节(明显进步)
优化后的Prompt:
“一只橘色虎斑猫穿着炭灰色羊毛西装,白色衬衫配深蓝色领带,坐在皮质扶手椅上,严肃表情,专业摄影,工作室柔光,50mm镜头,f/2.8,超细节,4K”
这次的结果: 猫像猫了,西装像西装了,但还是有两个大问题:
-
一致性崩塌:同一个prompt跑两次,得到完全不同的猫(脸不同、毛色不同)
-
材质混淆:西装有时和猫毛融为一体,看起来像猫“长”了一件西装
3.3 引入Style Reference:锁定风格
这是V7的核心武器——--sref(Style Reference)。它的作用是:从参考图中提取色调、光影、纹理和美学方向,然后套用到你的新图上。
我的操作步骤:
-
在网上找了一张满意的“商业宠物摄影”参考图(光影和色调)
-
上传到Midjourney,复制图片URL
-
在prompt末尾加上
--sref [URL] --sw 200
--sw是Style Weight,范围0-1000,默认100。值越高,风格越“用力”,代价是主体准确度可能下降-6。我用200作为平衡点。
对比结果:
| 维度 | 无--sref | 有--sref --sw 200 |
|---|---|---|
| 色调一致性 | 每张不同 | 统一暖调 |
| 光影质感 | 随机 | 参考图风格 |
| 毛发纹理 | 模糊 | 清晰 |
四、技术深潜:V7的参数炼金术
经过大约40张Draft Mode的探索,我总结出一套稳定输出“西服猫”的参数组合。这是本篇文章最干的部分。
4.1 最终稳定的Prompt结构
V7的最佳实践是:短、高信号的短语,而非长段落-3。我采用的prompt结构如下:
[主体] in [场景],[光线],[氛围] --sref [风格URL] --sw [200-300] --ar [画幅比例] --v 7
我的完整prompt示例:
“orange tabby cat wearing a tailored charcoal wool suit, white shirt with navy tie, sitting in leather armchair, serious executive expression, studio soft lighting, 50mm portrait lens, professional corporate photography
--sref [参考图URL] --sw 250
--ar 3:4
--v 7”
4.2 参数详解:每个参数的作用
| 参数 | 作用 | 我的设置 | 说明 |
|---|---|---|---|
--sref [URL] |
风格参考 | 1张商业摄影图 | 锁定色调和光影 |
--sw |
风格权重 | 250 | 比默认100更“用力”,保持风格统一 |
--ar |
画幅比例 | 3:4 | 适合竖版海报,兼顾社交媒体 |
--v 7 |
模型版本 | 7 | 确保使用V7引擎 |
--stylize 或 --s |
艺术发挥程度 | 默认(未设置) | V7中调节模型创意自由度 |
4.3 Omni Reference:解决“同一只猫”的问题
如果你想让同一只猫出现在不同场景中(比如做系列海报),V7的Omni Reference(--oref)是必需品。
操作流程:
-
从之前满意的生成中,选择一张“标准脸”的猫图
-
上传作为Omni Reference
-
在新prompt中加上
--oref [URL] --ow 300
--ow是Omni Weight,范围0-1000。值越高,角色一致性越强。商业项目建议从200-300开始调。
效果对比: 用了--oref之后,同一只猫可以出现在办公室、会议室、图书馆等不同场景,而脸部和毛发特征保持一致。这是做系列海报的基础。
五、从AI生成到商业海报:我的全流程
一张AI生成的图,距离“可用的商业海报”还有多远?挺远的。 以下是我完成一张海报的完整步骤。
5.1 流程图
阶段1: 方向探索 (Draft Mode,约30分钟) ↓ 生成50-80张草稿,筛选3-5个方向 阶段2: 精修定稿 (Standard Mode,约45分钟) ↓ 对选定方向生成10-15张高质量版本 阶段3: 后期处理 (Photoshop/Lightroom,约1小时) ↓ 去瑕疵、加文字、调色 阶段4: 版式设计 (约30分钟) ↓ 输出最终海报 |
5.2 各阶段详解
阶段1:方向探索(Draft Mode)
-
目标:找到“西服猫”的视觉方向
-
操作:用不同的prompt变体跑Draft Mode,每次4张
-
数量:约60张草稿
-
耗时:约30分钟(大部分是筛选时间)
-
成本:Draft Mode成本低,可以大胆试
筛选标准:
-
✅ 猫脸结构正常(非异形)
-
✅ 西装质感可识别
-
✅ 光影有层次
-
❌ 肢体畸形 → 直接淘汰
阶段2:精修定稿(Standard Mode)
选定2个最满意的方向,切到Standard Mode出高质量版本。
-
操作:用确定的prompt + --sref,跑10-15张
-
技巧:对某一张接近完美的图,使用 Vary (Subtle) 生成微调版本
-
最终:选出1张“冠军图”
阶段3:后期处理(Photoshop)
AI出的图很少能直接商用,必须有后期环节。
我的PS处理清单:
-
修复爪子细节(AI常把猫爪画得奇怪)
-
统一西装褶皱逻辑
-
调整眼神光(让猫“有灵魂”)
-
去除背景杂物
-
锐化毛发纹理
-
整体调色(对齐品牌色)
阶段4:版式设计
加上文案、Logo、背景元素,形成最终海报。
最终输出规格:
-
尺寸:1080×1440 px(适配小红书/Instagram)
-
格式:PNG + 可编辑PSD
-
用途:社交媒体海报 + 印刷预留
六、Midjourney V7能力边界:它能做什么,不能做什么
基于这次测试,我对V7的定位有了清晰的认识。
✅ V7擅长的事
| 场景 | 表现 | 说明 |
|---|---|---|
| 创意概念探索 | ⭐⭐⭐⭐⭐ | Draft Mode让试错成本极低 |
| 风格化品牌视觉 | ⭐⭐⭐⭐⭐ | --sref + Moodboard体系成熟 |
| 系列化内容生产 | ⭐⭐⭐⭐ | Omni Reference锁角色一致性 |
| 中文prompt理解 | ⭐⭐⭐⭐ | v6基础上提升62% |
⚠️ V7不擅长的事
| 场景 | 问题 | 建议 |
|---|---|---|
| 精确文字排版 | 海报上的文字经常乱码、错位 | 文字部分在PS里加,别让AI直接出 |
| 像素级编辑 | “只改这只爪子的角度,其他不动” → 做不到 | 用PS局部修,或在Midjourney里用Vary (Region)尝试 |
| 严格设计系统 | 无法保证每次生成都符合品牌VI的精确规范 | 把AI输出当作“素材”,设计师做最后的规范和把控 |
七、成本与时间统计
7.1 时间投入
| 阶段 | 耗时 |
|---|---|
| 方向探索(Draft) | 30分钟 |
| 精修出图(Standard) | 45分钟 |
| 后期处理 | 60分钟 |
| 版式设计 | 30分钟 |
| 总计 | 约2小时45分钟 |
7.2 成本核算(Standard Plan,$30/月)
-
Draft Mode:约60张,消耗约0.5小时fast GPU
-
Standard Mode:约15张,消耗约0.75小时fast GPU
-
总计消耗:约1.25小时/月额度(15小时/月,绰绰有余)
如果用量大,Pro Plan($60/月,30小时fast GPU)更划算-1。
八、给新手的“避坑清单”
| # | 坑 | 解法 |
|---|---|---|
| 1 | 不知道从哪开始 | 先跑Draft Mode,低成本试方向,别上来就Standard |
| 2 | 每次生成的猫都不一样 | 用 --sref 锁定风格,用 --oref 锁定角色 |
| 3 | 中英文混写 | 统一用一种语言,避免双路径解析冲突 |
| 4 | 期望一次出完美图 | 迭代思维:Draft探索 → 筛选 → Standard精修 → PS后期 |
| 5 | 不会调权重参数 | 新手先试:--sw 200, --ow 300,再根据效果微调 |
| 6 | 海报上的字没法看 | 不要在AI里加文字,在PS/Canva里后加 |
九、总结:我会继续用吗?
总体评分:⭐⭐⭐⭐½ (4.5/5)
| 维度 | 评分 | 说明 |
|---|---|---|
| 易用性 | ⭐⭐⭐⭐ | Web界面友好,但参数学习有门槛 |
| 图片质量 | ⭐⭐⭐⭐⭐ | V7的质感和细节是同级别顶尖 |
| 可控性 | ⭐⭐⭐⭐ | --sref/--oref让一致性大幅提升 |
| 中文支持 | ⭐⭐⭐⭐ | v6基础上提升明显 |
| 性价比 | ⭐⭐⭐⭐ | Draft Mode改变了成本结构 |
回答开头的问题:从“一只穿西服的猫”到商业海报,需要多少步?
答案:4个阶段,约2小时45分钟,中间经历了约75次生成。
📌 本文核心知识点速查
| 你想做的事 | 用什么 |
|---|---|
| 快速试方向 | Draft Mode-5 |
| 锁定视觉风格 | --sref [URL] --sw 200-300 |
| 同一角色跨场景 | --oref [URL] --ow 300 |
| 中文出图 | 中英文不混用,直接用中文 |
| 后期处理 | Photoshop必要,不要期望AI一步到位 |
下一篇预告
下一期“AI实战笔记”,我将测试AI视频生成工具:从文字描述到15秒短视频,哪个工具最靠谱?敬请期待。