Midjourney V7实战笔记：从“一只穿西服的猫”到商业海报，我经历了什么？

上一期我们聊了ChatGPT写文案，这次轮到AI绘画的扛把子——Midjourney V7。选择“一只穿西服的猫”作为测试用例，是因为它完美踩中了AI绘画的三个核心难点。

原创

全文约3500字，阅读时间约10分钟

本期测试：Midjourney V7 | 测试时间：2026年5月

一、写在前面：为什么是“一只穿西服的猫”？

上一期我们聊了ChatGPT写文案，这次轮到AI绘画的扛把子——Midjourney V7。

选择“一只穿西服的猫”作为测试用例，是因为它完美踩中了AI绘画的三个核心难点：

难点	为什么难
动物拟人化	猫的脸部结构要保留，又要穿衣服、摆姿势
材质一致性	西装的布料质感、猫毛的纹理要共存且不违和
商业可用性	不是“随便玩玩”，要能放进海报里用

本文完整记录我从注册到输出商业级海报的全流程。实测告诉你：Midjourney V7到底有多强？有哪些坑？从一张草稿到最终成品，到底需要多少步？

测试环境：

项目	信息
测试时间	2026年5月
使用模型	Midjourney V7（2025年6月成为默认模型）
使用界面	Web版（midjourney.com/imagine）
订阅计划	Standard Plan（$30/月，15h fast GPU + 无限relax）

二、关于Midjourney V7：你需要知道的三件事

在开始实战之前，有必要快速了解V7的核心变化。如果你已经从V6升级，可以直接跳到第三节。

2.1 V7 vs V6：不是“更好看”那么简单

很多评测说V7“图更好看了”——这没错，但错过了重点。V7真正的升级是工作流层面的：

维度	V6	V7
Prompt处理	强，但依赖堆参数	精度更高，更自然的语言即可
探索成本	每次生成都贵	Draft Mode：10倍速度，1/2成本
风格复用	靠运气和seed	--sref + Moodboard 可复用品牌体系
跨场景一致性	难	Omni Reference（--oref）原生支持

2.2 Draft Mode：这次测试的“省钱利器”

如果你只想记住V7的一个功能，记这个：Draft Mode。

官方数据：草稿模式速度约快10倍，GPU成本约为标准生成的一半。什么意思？你可以放肆地试方向、试构图、试风格，成本几乎可以忽略不计。选中最满意的方向后，再“升级”到全质量输出。

💡 本次测试中，我用Draft Mode生成了约60张探索图，总成本不到标准模式10张的费用。

2.3 中文提示词：V7的重大进步

Midjourney V7内置了多语言语义对齐模块，中文直出的质量大幅提升-2。官方数据显示，中文prompt的CLIP-Score较V6提升62%。但注意一个坑：不要中英文混用。比如“赛博朋克 cyberpunk”会触发双路径解析冲突，建议统一用“cyberpunk”或“赛博朋克风格”。

三、第一轮探索：Draft Mode狂野试错

3.1 第一次尝试：最简单的Prompt（翻车现场）

我的第一个Prompt（中文）：
“一只穿西服的猫，正面照，商业摄影风格”

输出结果： 生成了4张图，没有一张能用的。有的猫脸完全变形，有的西装和猫毛糊在一起，有的姿势诡异得像猫在受刑。

问题诊断：

❌ 太笼统，V7不知道你要什么“风格”
❌ 没有指定画幅比例
❌ 没有材质描述
❌ 缺少负面提示词

⚠️ 教训： V7虽然prompt精度提升了，但“会说人话”不等于“不写细节”。你仍然需要告诉AI：什么材质、什么光线、什么构图。

3.2 第二次尝试：补充细节（明显进步）

优化后的Prompt：
“一只橘色虎斑猫穿着炭灰色羊毛西装，白色衬衫配深蓝色领带，坐在皮质扶手椅上，严肃表情，专业摄影，工作室柔光，50mm镜头，f/2.8，超细节，4K”

这次的结果： 猫像猫了，西装像西装了，但还是有两个大问题：

一致性崩塌：同一个prompt跑两次，得到完全不同的猫（脸不同、毛色不同）
材质混淆：西装有时和猫毛融为一体，看起来像猫“长”了一件西装

3.3 引入Style Reference：锁定风格

这是V7的核心武器——--sref（Style Reference）。它的作用是：从参考图中提取色调、光影、纹理和美学方向，然后套用到你的新图上。

我的操作步骤：

在网上找了一张满意的“商业宠物摄影”参考图（光影和色调）
上传到Midjourney，复制图片URL
在prompt末尾加上 --sref [URL] --sw 200

--sw 是Style Weight，范围0-1000，默认100。值越高，风格越“用力”，代价是主体准确度可能下降-6。我用200作为平衡点。

对比结果：

维度	无--sref	有--sref --sw 200
色调一致性	每张不同	统一暖调
光影质感	随机	参考图风格
毛发纹理	模糊	清晰

四、技术深潜：V7的参数炼金术

经过大约40张Draft Mode的探索，我总结出一套稳定输出“西服猫”的参数组合。这是本篇文章最干的部分。

4.1 最终稳定的Prompt结构

V7的最佳实践是：短、高信号的短语，而非长段落-3。我采用的prompt结构如下：

[主体] in [场景]，[光线]，[氛围]
--sref [风格URL] --sw [200-300]
--ar [画幅比例]
--v 7

我的完整prompt示例：

“orange tabby cat wearing a tailored charcoal wool suit, white shirt with navy tie, sitting in leather armchair, serious executive expression, studio soft lighting, 50mm portrait lens, professional corporate photography
--sref [参考图URL] --sw 250
--ar 3:4
--v 7”

4.2 参数详解：每个参数的作用

参数	作用	我的设置	说明
`--sref [URL]`	风格参考	1张商业摄影图	锁定色调和光影
`--sw`	风格权重	250	比默认100更“用力”，保持风格统一
`--ar`	画幅比例	3:4	适合竖版海报，兼顾社交媒体
`--v 7`	模型版本	7	确保使用V7引擎
`--stylize` 或 `--s`	艺术发挥程度	默认（未设置）	V7中调节模型创意自由度

4.3 Omni Reference：解决“同一只猫”的问题

如果你想让同一只猫出现在不同场景中（比如做系列海报），V7的Omni Reference（--oref）是必需品。

操作流程：

从之前满意的生成中，选择一张“标准脸”的猫图
上传作为Omni Reference
在新prompt中加上 --oref [URL] --ow 300

--ow 是Omni Weight，范围0-1000。值越高，角色一致性越强。商业项目建议从200-300开始调。

效果对比： 用了--oref之后，同一只猫可以出现在办公室、会议室、图书馆等不同场景，而脸部和毛发特征保持一致。这是做系列海报的基础。

五、从AI生成到商业海报：我的全流程

一张AI生成的图，距离“可用的商业海报”还有多远？挺远的。 以下是我完成一张海报的完整步骤。

5.1 流程图

阶段1: 方向探索 (Draft Mode，约30分钟)
↓ 生成50-80张草稿，筛选3-5个方向
阶段2: 精修定稿 (Standard Mode，约45分钟)
↓ 对选定方向生成10-15张高质量版本
阶段3: 后期处理 (Photoshop/Lightroom，约1小时)
↓ 去瑕疵、加文字、调色
阶段4: 版式设计 (约30分钟)
↓ 输出最终海报

5.2 各阶段详解

阶段1：方向探索（Draft Mode）

目标：找到“西服猫”的视觉方向
操作：用不同的prompt变体跑Draft Mode，每次4张
数量：约60张草稿
耗时：约30分钟（大部分是筛选时间）
成本：Draft Mode成本低，可以大胆试

筛选标准：

✅ 猫脸结构正常（非异形）
✅ 西装质感可识别
✅ 光影有层次
❌ 肢体畸形 → 直接淘汰

阶段2：精修定稿（Standard Mode）

选定2个最满意的方向，切到Standard Mode出高质量版本。

操作：用确定的prompt + --sref，跑10-15张
技巧：对某一张接近完美的图，使用 Vary (Subtle) 生成微调版本
最终：选出1张“冠军图”

阶段3：后期处理（Photoshop）

AI出的图很少能直接商用，必须有后期环节。

我的PS处理清单：

修复爪子细节（AI常把猫爪画得奇怪）
统一西装褶皱逻辑
调整眼神光（让猫“有灵魂”）
去除背景杂物
锐化毛发纹理
整体调色（对齐品牌色）

阶段4：版式设计

加上文案、Logo、背景元素，形成最终海报。

最终输出规格：

尺寸：1080×1440 px（适配小红书/Instagram）
格式：PNG + 可编辑PSD
用途：社交媒体海报 + 印刷预留

六、Midjourney V7能力边界：它能做什么，不能做什么

基于这次测试，我对V7的定位有了清晰的认识。

✅ V7擅长的事

场景	表现	说明
创意概念探索	⭐⭐⭐⭐⭐	Draft Mode让试错成本极低
风格化品牌视觉	⭐⭐⭐⭐⭐	--sref + Moodboard体系成熟
系列化内容生产	⭐⭐⭐⭐	Omni Reference锁角色一致性
中文prompt理解	⭐⭐⭐⭐	v6基础上提升62%

⚠️ V7不擅长的事

场景	问题	建议
精确文字排版	海报上的文字经常乱码、错位	文字部分在PS里加，别让AI直接出
像素级编辑	“只改这只爪子的角度，其他不动” → 做不到	用PS局部修，或在Midjourney里用Vary (Region)尝试
严格设计系统	无法保证每次生成都符合品牌VI的精确规范	把AI输出当作“素材”，设计师做最后的规范和把控

七、成本与时间统计

7.1 时间投入

阶段	耗时
方向探索（Draft）	30分钟
精修出图（Standard）	45分钟
后期处理	60分钟
版式设计	30分钟
总计	约2小时45分钟

7.2 成本核算（Standard Plan，$30/月）

Draft Mode：约60张，消耗约0.5小时fast GPU
Standard Mode：约15张，消耗约0.75小时fast GPU
总计消耗：约1.25小时/月额度（15小时/月，绰绰有余）

如果用量大，Pro Plan（$60/月，30小时fast GPU）更划算-1。

八、给新手的“避坑清单”

#	坑	解法
1	不知道从哪开始	先跑Draft Mode，低成本试方向，别上来就Standard
2	每次生成的猫都不一样	用 --sref 锁定风格，用 --oref 锁定角色
3	中英文混写	统一用一种语言，避免双路径解析冲突
4	期望一次出完美图	迭代思维：Draft探索 → 筛选 → Standard精修 → PS后期
5	不会调权重参数	新手先试：--sw 200, --ow 300，再根据效果微调
6	海报上的字没法看	不要在AI里加文字，在PS/Canva里后加

九、总结：我会继续用吗？

总体评分：⭐⭐⭐⭐½ (4.5/5)

维度	评分	说明
易用性	⭐⭐⭐⭐	Web界面友好，但参数学习有门槛
图片质量	⭐⭐⭐⭐⭐	V7的质感和细节是同级别顶尖
可控性	⭐⭐⭐⭐	--sref/--oref让一致性大幅提升
中文支持	⭐⭐⭐⭐	v6基础上提升明显
性价比	⭐⭐⭐⭐	Draft Mode改变了成本结构

回答开头的问题：从“一只穿西服的猫”到商业海报，需要多少步？

答案：4个阶段，约2小时45分钟，中间经历了约75次生成。

📌 本文核心知识点速查

你想做的事	用什么
快速试方向	Draft Mode-5
锁定视觉风格	`--sref [URL] --sw 200-300`
同一角色跨场景	`--oref [URL] --ow 300`
中文出图	中英文不混用，直接用中文
后期处理	Photoshop必要，不要期望AI一步到位

下一篇预告

下一期“AI实战笔记”，我将测试AI视频生成工具：从文字描述到15秒短视频，哪个工具最靠谱？敬请期待。

Midjourney V7AI绘画体验-sref风格参考Draft Mode Omni ReferenceAI实战笔记