OpenAI 正面硬刚纽约时报：一场版权官司，真正审的是整个大模型时代

AI PM 编辑部 · 2024年01月10日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

纽约时报起诉 OpenAI，本以为是一次传统媒体维权，却被 OpenAI 反手指控“诱导模型复读”。这不是一场普通的版权纠纷，而是一次可能决定大模型训练合法性的世纪对决。

纽约时报起诉 OpenAI，本以为是一次传统媒体维权，却被 OpenAI 反手指控“诱导模型复读”。这不是一场普通的版权纠纷，而是一次可能决定大模型训练合法性的世纪对决。

很多人第一反应是：纽约时报在告 OpenAI“拿内容训练模型”。但如果只看到这一层，就低估了这场官司的杀伤力。

在起诉书里，纽约时报反复强调的不是“你训练了我”，而是另一句话——ChatGPT 和 Bing Chat 正在“替代”纽约时报，抢走订阅用户。这一点非常关键。

这意味着，纽约时报试图绕开“训练是否属于合理使用”这个灰色地带，而是直接指控：模型在输出层面，已经构成了对原作品的市场替代。如果法院认可这一点，那不只是 OpenAI，几乎所有面向用户的生成式 AI 产品都会被重新定义为“潜在侵权机器”。

换句话说，这不是一次关于过去的官司，而是一场关于“你还能不能继续做产品”的诉讼。

OpenAI 的回应分成四层，但真正的“硬菜”只有两点。

第一，训练本身是合理使用。OpenAI 的态度非常明确：用公开互联网内容训练大模型，是创新的必要前提，也是长期司法先例支持的做法。更耐人寻味的是那句表态——“法律权利不如做个好公民重要”，于是他们提供了 opt-out。

这句话听起来很谦逊，但潜台词其实很强硬：我不是因为你有法律权利才让你退出，而是我愿意。

第二，关于最致命的“逐字复现”指控，OpenAI 直接把球踢了回去。他们称这是一种极罕见的失败模式，而且往往发生在内容被大量重复收录的情况下，更重要的是——这些案例很可能是被“刻意诱导”出来的。

他们甚至暗示，纽约时报可能通过反复尝试、拼接长段原文提示，才得到那些截图级证据。这一说法的目的只有一个：否定“ChatGPT 是纽约时报替代品”这个核心前提。

从法律评论界的反应就能看出分裂有多严重。

支持 OpenAI 的人认为：大模型的“变换性”极强，学习的是统计规律而非文本本身，本质上和人类阅读、总结没有区别。如果训练不算合理使用，那整个 AI 产业都会被锁死。

而批评者则指出，OpenAI 的博客更像一篇公关声明，而不是严谨的法律论证：几乎没有引用关键的合理使用判例，反而引用了 Adobe、IBM、Grammarly 这些“利益相关方”的背书。

但不管你站哪一边，有一件事几乎是共识：这场官司不可能在一审、二审结束。它触及的是一个此前从未被正面裁决的问题——大模型训练，到底是不是一种全新的、需要单独定义的行为。

正如视频里那句判断：2024 年只是序章，真正的裁决，几乎注定要在最高法院完成。

很多讨论停留在“OpenAI 会不会赔钱”，但这反而是最不重要的部分。

真正值得每个 AI 从业者警惕的是：一旦法院认定“训练 + 可复现输出 = 侵权”，那未来的大模型开发将被迫进入高度许可化时代。数据获取成本飙升，小团队和开源模型首当其冲。

相反，如果 OpenAI 赢了，训练合理使用的边界会被极大拓宽，但模型在输出层面的安全、去记忆化、抗诱导能力，将成为新的合规底线。

换句话说，这不是“媒体 vs 科技公司”，而是“模型应该为记住多少负责”的制度性裁决。

这场 OpenAI 与纽约时报的对决，表面上是版权之争，实质上是在为整个大模型时代定规则。作为从业者，你不需要站队，但必须看懂信号：训练合法性、输出可控性、以及产品是否构成替代，将成为未来 AI 合规的三条红线。

一个值得思考的问题是：如果你现在做的产品，被要求证明“它不会替代原内容”，你能拿出什么证据？答案，很可能决定你还能不能继续做下去。

关键词： OpenAI，纽约时报，大模型训练，合理使用， ChatGPT

事实核查备注：需核查：纽约时报起诉时间（2023年12月）；OpenAI 博客发布时间；是否明确指控“诱导提示”；Wirecutter 示例是否来自多年旧文；Opt-out 机制上线时间（2023年）；法律评论人 Cecilia Zeni 的原始评论表述