1. 认识 Midjourney

Midjourney 是一款由位于旧金山的独立研究实验室 Midjourney, Inc. 开发的生成式人工智能程序与服务,它根据自然语言描述(即"提示词" prompts)来生成图像,与 OpenAI 的 DALL-E、Stability AI 的 Stable Diffusion 属于同类产品。它于 2022 年 7 月开启公开测试,如今已发展成一套涵盖图像、视频乃至 3D 内容生成的完整创作生态。
最初 Midjourney 主要通过 Discord 服务器使用,用户输入指令即可生成图像;现在则已拥有功能完善的网页端界面,支持对构图、角色一致性等进行更精细的控制。
核心优势
Midjourney 在技术上最大的特点是它在训练时异常侧重于审美质量。模型吸收了大量的美术作品、摄影、概念设计与平面设计内容,因此即使面对简单的提示词,其输出也往往倾向于视觉上精致、构图扎实的结果。
不过这种审美偏向既是 Midjourney 最大的强项,也是它的主要局限:它擅长营造美感,但有时会抗拒严格的照片级写实。
具体优势可以概括为以下几点:
-
出图美感强、起点高。 对于氛围、光影、构图要求较高的场景——例如电影感人像、奇幻场景、产品概念图、时尚视觉等——通常无需反复重试即可得到精致成片。
-
角色与风格一致性工具完善。 通过角色参考(–cref)可以锁定面部特征与服饰,让同一角色在不同风格和场景中保持一致;用户还能构建持久化的"风格代码"(Style Codes),相当于个性化的微调检查点。
-
专门的动漫/插画分支 Niji。 Niji 系列是 Midjourney 与 Spellbrush 合作开发的专门面向东方与动漫审美的模型分支,拥有独立的网站和 Discord 服务器。最新的 Niji 7 于 2026 年 1 月 9 日推出,在连贯性上有大幅提升,眼睛、反光、背景细节等都更加清晰,并且更贴合提示词。
-
已扩展到视频与 3D。 平台现已支持文生视频和图生视频,视频生成起步为 5 秒,最长可扩展到 21 秒。
需要说明的一个短板是:Midjourney 至今仍缺乏 API 接口,对需要程序化调用的开发者和团队不够友好;此外其视频功能虽已上线,但成本较高,许多创作者在视频方面仍会选择 Kling、Veo 等专用工具。
最新模型
目前 Midjourney 处于 V7 与 V8 系列并行的过渡阶段:
-
V8 系列(最新,仍处于 Alpha 测试)。 V8 最早于 2026 年 3 月 17 日通过 alpha 版网站作为 alpha 测试推出。官方称 V8 系列能更好地遵循详细指令、生成更连贯的图像、在用引号标注文字时改善文本渲染,且标准任务速度比早期版本快约 4 到 5 倍。随后在 2026 年 4 月 14 日,Midjourney 在 V8.0 测试一个月后发布了 V8.1 Alpha。V8.1 于 2026 年 4 月 30 日在 midjourney.com 上线,是目前最快的模型。V8.1 带来了更接近 V7 风格的熟悉审美、更稳定的情绪板与风格参考、更快更省的 HD 模式、图像提示、图像权重、提示词精简器,以及更新后的 Describe 功能。它还支持 HD 2K 高分辨率图像输出。
-
V7(当前默认版本)。 值得注意的是,尽管 V8 系列更新,但官方版本文档中的默认 Midjourney 模型仍为 V7,V8 的各项功能在社区测试期间仍可能调整。换句话说,V8/V8.1 是"最新但仍在测试",而 V7 才是面向大多数用户的稳定默认选项。

评论
0 条