Midjourney V7之后,AI画图的战场已经换了规则

AI PM 编辑部 · 2025年04月08日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

Midjourney V7发布后,并没有像以往那样引发一致欢呼。在ChatGPT ImageGen掀起范式变化的背景下,这次更新更像一次价值观与路线之争:是继续追求“好看又好玩”,还是全面拥抱可控、可对话、可编辑的生成体验?

Midjourney V7之后,AI画图的战场已经换了规则

Midjourney V7发布后,并没有像以往那样引发一致欢呼。在ChatGPT ImageGen掀起范式变化的背景下,这次更新更像一次价值观与路线之争:是继续追求“好看又好玩”,还是全面拥抱可控、可对话、可编辑的生成体验?

一次“本该轰动”的发布,为何反应平平?

这为什么重要?因为Midjourney几乎定义了过去两年AI绘画的审美上限,而V7是它近一年来的首次大版本更新。视频一开始就点明背景:Midjourney V7本身“极其漂亮”,无论是照片级真实感还是强风格化图像都依然顶级,同时加入了语音提示、基于个人偏好的图像个性化,以及多档生成速度设置。

但问题在于——它并没有引入真正“新的范式”。正如主持人总结的那样,V7更像是“一个更好的Midjourney”,而不是一个不同的Midjourney。这在OpenAI刚刚用ChatGPT ImageGen掀起病毒式传播后,显得格外微妙。后者采用了不同于传统扩散模型的路径,直接在多模态聊天中完成生成与修改,让很多人开始怀疑:Midjourney所代表的那一整套工作流,会不会被原生多模态彻底取代?

当有人在X上直接@Midjourney创始人David Holtz,问“在Gemini 40和ChatGPT ImageGen之后,Midjourney会不会就此终结”时,他只回了一个词:“Nah。”而在V7发布说明中,Holtz也强调:这是一个“全新的模型,有独特优势,也可能有弱点”,并提醒用户需要“尝试不同的提示风格”。这句话本身,就已经暗示了这次更新的定位——延续,而非革命。

社区分裂:V7是6.2,还是质变?

为什么要看这些反应?因为Midjourney真正的护城河,从来不是技术论文,而是那群愿意每天生成、讨论、付费的核心用户。V7发布后,社区反馈罕见地呈现出明显分裂。

资深用户Freebitar直言“有点失望”,认为OpenAI已经把标准抬得太高,“你可以像跟兄弟聊天一样和ImageGen对话”,而V7“更真实,但我们真的需要吗?”甚至表示可能会暂停订阅。Magnific创始人Yavi Lopez的评价更克制但同样尖锐:Midjourney依然有“超酷的艺术美感和风格丰富度”,但这些在6.1时代就已经存在,“V7不像V7,更像6.2”。

也有人给出更阴谋论式的解读。Jimmy Ortega认为,Midjourney原本知道V7还没准备好,但在“40 Image Gen”爆火后被迫提前发布,“只是一次防守性的反击”。相对温和的声音来自宾大教授Ethan Mollick,他说自己“很喜欢”这次更新,只是问题在于——“V6已经非常好了”。

当然,也不乏完全相反的体验。Perplexity的创意大使Tatiana直接表示:“探索Midjourney V7让我大脑爆炸,是一次巨大的质量跃迁。”这种两极分化本身,恰恰说明Midjourney正在触碰它用户群体的边界。

当“听话”成为核心能力,Midjourney开始显得固执

这可能是整期视频里最重要的洞见。主持人坦言:在任何“深度创意或艺术项目”中,Midjourney依然是他的首选,因为风格和审美“仍然是顶级的”。但在日常高频使用中,他早已几乎全面转向Ideogram。

原因并不复杂:提示遵循度(prompt adherence)。Ideogram能更稳定地生成带准确文字的封面图,而Midjourney常常给人一种“它觉得自己比你更懂什么是酷”的感觉。当你愿意放手让AI自由发挥时,这是一种优势;但当你有明确目标时,它就变成了摩擦。

ChatGPT ImageGen的出现,则把这种差距进一步放大。因为它不只是“更听话”,还支持内联编辑——你可以直接对图像说“把这个改成那样”,模型真的会照做。这种交互方式“极具变革性”,覆盖了大量过去Midjourney并不擅长的使用场景。

结果是:Midjourney的适用范围正在变窄。主持人坦言,自己生成过“成千上万张”Midjourney图片,也不介意同时订阅多个工具,但现在也开始认真思考,“什么时候会暂停Midjourney,因为用得已经不够多了”。

一家“不想征服世界”的公司,能走多远?

Midjourney之所以特殊,还在于它的公司形态。它是少见的、完全自筹资金且高度盈利的生成式AI公司。这意味着,它并不一定需要在每一轮范式变化中拼命追赶。

David Holtz在去年12月的一段长文中,把这种态度说得极其坦率:“按VC的标准,我们要么征服世界,要么死在火里。但这两件事在精神上都不吸引我。”他说自己“从没想要一个公司,只是想要一个家”,而现在他们有“一个庞大而忠诚的付费社区”,有足够的收入做“疯狂的研发”。

他提出的成功标准也很不一样:不是市值,而是“一个资金充足的研发实验室,让酷的人可以自由做想做的事”,“我们能不能做出让婴儿时期的David感到骄傲的东西?”

但视频最后也留下一个悬念:当工具范式、用户预期、竞争对手都在快速变化时,这个“忠诚而稳定的社区”还能保持多久?Midjourney或许不需要赢下整个世界,但它终究需要决定,自己要坚守的,到底是哪一小块世界。

总结

Midjourney V7并不失败,但它清晰地暴露了一条分岔路:一边是极致审美与创作乐趣,另一边是可控、可对话、可持续修改的生产力工具。ChatGPT ImageGen让“听话”和“协作”成为新基准,而Midjourney仍在捍卫“风格”和“感觉”。对用户而言,问题不再是谁更强,而是:你现在更需要哪一种创作体验?


关键词: Midjourney V7, ChatGPT ImageGen, AI绘画, 多模态生成, 提示遵循度

事实核查备注: 关键人物:David Holtz(Midjourney创始人)、Ethan Mollick、Mustafa Suleyman;关键产品:Midjourney V7、ChatGPT ImageGen、Ideogram、Magnific、Perplexity;关键公司:Midjourney、OpenAI、Microsoft、Google;关键概念:prompt adherence(提示遵循度)、内联编辑、多模态图像生成;引用原话均来自视频原文转述。