AI训练算不算侵权？一场判决撬动整个大模型行业

AI PM 编辑部 · 2025年07月01日 · 8 阅读 · AI/人工智能

Sam Altman 预训练模型训练对话AI 语音AI 生成式AI AI应用 AI Agent ChatGPT ElevenLabs

正在加载视频...

视频章节

一位联邦法官首次明确支持“AI训练属于合理使用”，给Anthropic带来阶段性胜利，也把整个大模型行业的版权争议推到新高度。本文梳理这起判决的关键细节、未解决的风险，以及它为何可能改变AI公司、创作者和法律之间的博弈方式。

AI训练算不算侵权？一场判决撬动整个大模型行业

一位联邦法官首次明确支持“AI训练属于合理使用”，给Anthropic带来阶段性胜利，也把整个大模型行业的版权争议推到新高度。本文梳理这起判决的关键细节、未解决的风险，以及它为何可能改变AI公司、创作者和法律之间的博弈方式。

为什么这次判决如此关键：AI训练第一次被当成“阅读”

这期《The AI Daily Brief》一开场，就抛出了一个足以影响整个行业的消息：Anthropic在版权诉讼中取得了一次“相当大的胜利”。一名联邦法官裁定，用受版权保护的作品进行AI训练，属于合理使用（fair use）。这不是技术细节之争，而是大模型能否继续存在的法律地基。

Anthropic和其他AI实验室一直坚持一个核心类比：模型训练就像人类阅读。人类可以通过阅读书籍、文章来学习写作风格和知识，而不构成侵权；模型训练也是如此。法官接受了这一逻辑。迈阿密大学法学院法律写作教授Christina Frohawk解释说，法院“将AI的学习方式视作人类从受版权材料中学习”。

更有分量的一句话来自法官本人。他指出，版权法的目的，是“促进原创作品的产生，而不是保护作者免受竞争”。这句话几乎点破了整个争议的价值取向：如果AI被视为新型创作工具，而不是简单的复制机器，那么训练本身就不必然违法。对所有依赖大规模预训练的模型公司来说，这都是一次重要的风向转变。

胜利并不完整：700万本盗版书仍是悬在头上的剑

但节目很快泼了一盆冷水。这次裁决，只是Anthropic的“部分胜利”。法院只就“训练是否构成合理使用”这一狭窄法律问题表态，真正危险的战场还在后面。

争议的核心是Anthropic所谓的“central library”——一个用于构建训练数据集的书籍语料库。原告指控Anthropic从盗版网站下载了多达700万本电子书。对此，法官的态度明显更为严厉。他直言，对“从盗版网站下载内容”是否能被认定为合理使用，持高度怀疑态度。

更严重的是，如果被认定为故意侵权（willful infringement），单本作品的法定赔偿最高可达15万美元。节目中直言，这种量级的风险“可能直接让一家初创公司破产”。法官还特别强调一个细节：事后再去购买正版书籍，并不能洗白之前的盗用行为，最多只能在赔偿金额上产生影响。

这个故事的反转在于：Anthropic一边赢得了行业层面的原则性认可，一边却可能在具体操作层面付出极其昂贵的代价。这也给所有AI公司敲响警钟——法律认可“学习”，并不等于纵容“偷书”。

“高度变革性”：AI输出为何成为判决的关键支点

节目中特别指出，法官支持合理使用的一个重要前提，是Anthropic模型的输出具有“变革性”（transformative）。这是美国版权法中一个非常关键的概念，指使用作品并不是为了复制或替代原作，而是创造出全新的东西。

法官在判决中形容Claude的输出“exceedingly transformative（高度变革性）”。换句话说，模型无法直接复现书籍内容，而是基于学习到的模式生成新的文本。这一点，成为Anthropic的重要护城河。

这也解释了为什么这项裁决的影响力如此微妙。一方面，它是“里程碑式的裁决”；另一方面，它既不具备全国范围的约束力，也极有可能被上诉。节目明确提醒，这个判决“在联邦法院之外并不具有约束力”，但它会被其他法官引用、讨论，逐渐塑造司法共识。

主持人给出的判断是：如此根本性的冲突，最终可能需要美国最高法院来定夺。在那之前，行业将处在一种“有方向，但没终局”的法律灰色地带。

法律之外的暗线：OpenAI的多线作战与平台化野心

在版权话题之外，节目快速切换到另一场法律争议。Sam Altman正在X上公开回应一桩名为“IO”的诉讼，涉及Johnny Ive的AI硬件初创公司与一家同名的Google系公司。Altman的说法是，对方曾寻求投资或收购，在OpenAI拒绝后转而提起诉讼。

OpenAI的法律文件补充了更多细节：公司内部对演示“并不 impressed”，于是选择自己做了别的东西。原告则坚持认为，这场纠纷的本质在于名称侵权。社区观点分裂，而节目给出的现实判断是：OpenAI“可能干脆改个名字了事”。

更耐人寻味的是，节目提到OpenAI还在悄然设计一套面向ChatGPT的生产力套件，功能可能包括文档协作和沟通工具，直接对标Microsoft和Google Workspace。这被视为Canvas功能的自然延伸，也可能对OpenAI与Microsoft的关系构成潜在张力。

把这些线索放在一起看，可以感受到一个更大的背景：当AI公司从模型提供者走向平台型产品，法律、命名、生态关系都会同时变得更加复杂。

从Anthropic到Airtable：AI“代理化”正在成为新默认

节目最后用两个产品更新，勾勒出行业的另一条主线：agentic（代理化）应用的崛起。Airtable宣布“重建”为AI原生应用，CEO Howie Liu将其称为一次“refounding moment”。这不再只是无代码数据库，而是一个可以用自然语言创建应用、运行AI查询、生成完整工作流的“vibe coding”平台。

紧接着，ElevenLabs发布了语音AI助手11 AI，具备完整的MCP集成，可连接Slack、Gmail和Google Calendar，并提供移动端应用。主持人坦言，他对通用型消费者助手“仍然有些怀疑”，但也承认，这一发布再次证明了各大AI平台正在向“相似的一组能力”快速收敛。

把这一趋势与前面的版权判决放在一起看，会发现一个隐含逻辑：只有当法律允许模型自由学习，应用层的代理化、平台化才有可能真正爆发。否则，一切都会被卡在数据来源这一最底层的问题上。

总结

这期节目最有价值的地方，不在于简单宣布“Anthropic赢了”，而在于展示了AI行业正在形成的新平衡：训练被视为学习，但获取数据的方式仍然可能致命。对创业者来说，这是关于合规边界的警示；对创作者来说，这是关于“竞争”而非“复制”的现实提醒；对普通用户而言，它解释了为什么AI能力会继续快速进化，却始终伴随着法律不确定性。未来几年，AI真正的战场，可能既不在模型参数，也不在产品体验，而在法庭之上。

关键词：合理使用， AI训练， Anthropic，版权法， AI Agent

事实核查备注：联邦法官裁定AI训练属于合理使用；Anthropic涉及的central library被指下载约700万本电子书；故意侵权的法定赔偿上限为每件作品15万美元；法官评价Claude输出为“exceedingly transformative”；节目来源为The AI Daily Brief，发布时间2025-07-01。

返回文章列表