Midjourney V7之后，AI画图的战场已经换了规则

AI PM 编辑部 · 2025年04月08日 · 4 阅读 · AI/人工智能

Mustafa Suleyman 文本转语音 AI绘画文本生成图像多模态提示工程生成式AI AI应用 AI Agent AI搜索

正在加载视频...

视频章节

Midjourney V7发布后，并没有像以往那样引发一致欢呼。在ChatGPT ImageGen掀起范式变化的背景下，这次更新更像一次价值观与路线之争：是继续追求“好看又好玩”，还是全面拥抱可控、可对话、可编辑的生成体验？

Midjourney V7之后，AI画图的战场已经换了规则

Midjourney V7发布后，并没有像以往那样引发一致欢呼。在ChatGPT ImageGen掀起范式变化的背景下，这次更新更像一次价值观与路线之争：是继续追求“好看又好玩”，还是全面拥抱可控、可对话、可编辑的生成体验？

一次“本该轰动”的发布，为何反应平平？

这为什么重要？因为Midjourney几乎定义了过去两年AI绘画的审美上限，而V7是它近一年来的首次大版本更新。视频一开始就点明背景：Midjourney V7本身“极其漂亮”，无论是照片级真实感还是强风格化图像都依然顶级，同时加入了语音提示、基于个人偏好的图像个性化，以及多档生成速度设置。

但问题在于——它并没有引入真正“新的范式”。正如主持人总结的那样，V7更像是“一个更好的Midjourney”，而不是一个不同的Midjourney。这在OpenAI刚刚用ChatGPT ImageGen掀起病毒式传播后，显得格外微妙。后者采用了不同于传统扩散模型的路径，直接在多模态聊天中完成生成与修改，让很多人开始怀疑：Midjourney所代表的那一整套工作流，会不会被原生多模态彻底取代？

当有人在X上直接@Midjourney创始人David Holtz，问“在Gemini 40和ChatGPT ImageGen之后，Midjourney会不会就此终结”时，他只回了一个词：“Nah。”而在V7发布说明中，Holtz也强调：这是一个“全新的模型，有独特优势，也可能有弱点”，并提醒用户需要“尝试不同的提示风格”。这句话本身，就已经暗示了这次更新的定位——延续，而非革命。

社区分裂：V7是6.2，还是质变？

为什么要看这些反应？因为Midjourney真正的护城河，从来不是技术论文，而是那群愿意每天生成、讨论、付费的核心用户。V7发布后，社区反馈罕见地呈现出明显分裂。

资深用户Freebitar直言“有点失望”，认为OpenAI已经把标准抬得太高，“你可以像跟兄弟聊天一样和ImageGen对话”，而V7“更真实，但我们真的需要吗？”甚至表示可能会暂停订阅。Magnific创始人Yavi Lopez的评价更克制但同样尖锐：Midjourney依然有“超酷的艺术美感和风格丰富度”，但这些在6.1时代就已经存在，“V7不像V7，更像6.2”。

也有人给出更阴谋论式的解读。Jimmy Ortega认为，Midjourney原本知道V7还没准备好，但在“40 Image Gen”爆火后被迫提前发布，“只是一次防守性的反击”。相对温和的声音来自宾大教授Ethan Mollick，他说自己“很喜欢”这次更新，只是问题在于——“V6已经非常好了”。

当然，也不乏完全相反的体验。Perplexity的创意大使Tatiana直接表示：“探索Midjourney V7让我大脑爆炸，是一次巨大的质量跃迁。”这种两极分化本身，恰恰说明Midjourney正在触碰它用户群体的边界。

当“听话”成为核心能力，Midjourney开始显得固执

这可能是整期视频里最重要的洞见。主持人坦言：在任何“深度创意或艺术项目”中，Midjourney依然是他的首选，因为风格和审美“仍然是顶级的”。但在日常高频使用中，他早已几乎全面转向Ideogram。

原因并不复杂：提示遵循度（prompt adherence）。Ideogram能更稳定地生成带准确文字的封面图，而Midjourney常常给人一种“它觉得自己比你更懂什么是酷”的感觉。当你愿意放手让AI自由发挥时，这是一种优势；但当你有明确目标时，它就变成了摩擦。

ChatGPT ImageGen的出现，则把这种差距进一步放大。因为它不只是“更听话”，还支持内联编辑——你可以直接对图像说“把这个改成那样”，模型真的会照做。这种交互方式“极具变革性”，覆盖了大量过去Midjourney并不擅长的使用场景。

结果是：Midjourney的适用范围正在变窄。主持人坦言，自己生成过“成千上万张”Midjourney图片，也不介意同时订阅多个工具，但现在也开始认真思考，“什么时候会暂停Midjourney，因为用得已经不够多了”。

一家“不想征服世界”的公司，能走多远？

Midjourney之所以特殊，还在于它的公司形态。它是少见的、完全自筹资金且高度盈利的生成式AI公司。这意味着，它并不一定需要在每一轮范式变化中拼命追赶。

David Holtz在去年12月的一段长文中，把这种态度说得极其坦率：“按VC的标准，我们要么征服世界，要么死在火里。但这两件事在精神上都不吸引我。”他说自己“从没想要一个公司，只是想要一个家”，而现在他们有“一个庞大而忠诚的付费社区”，有足够的收入做“疯狂的研发”。

他提出的成功标准也很不一样：不是市值，而是“一个资金充足的研发实验室，让酷的人可以自由做想做的事”，“我们能不能做出让婴儿时期的David感到骄傲的东西？”

但视频最后也留下一个悬念：当工具范式、用户预期、竞争对手都在快速变化时，这个“忠诚而稳定的社区”还能保持多久？Midjourney或许不需要赢下整个世界，但它终究需要决定，自己要坚守的，到底是哪一小块世界。

总结

Midjourney V7并不失败，但它清晰地暴露了一条分岔路：一边是极致审美与创作乐趣，另一边是可控、可对话、可持续修改的生产力工具。ChatGPT ImageGen让“听话”和“协作”成为新基准，而Midjourney仍在捍卫“风格”和“感觉”。对用户而言，问题不再是谁更强，而是：你现在更需要哪一种创作体验？

关键词： Midjourney V7， ChatGPT ImageGen， AI绘画，多模态生成，提示遵循度

事实核查备注：关键人物：David Holtz（Midjourney创始人）、Ethan Mollick、Mustafa Suleyman；关键产品：Midjourney V7、ChatGPT ImageGen、Ideogram、Magnific、Perplexity；关键公司：Midjourney、OpenAI、Microsoft、Google；关键概念：prompt adherence（提示遵循度）、内联编辑、多模态图像生成；引用原话均来自视频原文转述。

返回文章列表