当中国公司领跑开源AI，美国该如何应对？

AI PM 编辑部 · 2025年02月17日 · 8 阅读 · AI/人工智能

Sam Altman Dario Amodei Elon Musk Ilya Sutskever 蒸馏微调闭源模型 AI安全文本生成图像模型训练

正在加载视频...

视频章节

DeepSeek的突然崛起，不只是一次模型性能的意外突破，更重塑了全球AI关于“开源 vs 闭源”的核心叙事。本篇文章从技术细节、产业博弈和政策走向三个层面，梳理这场冲击为何被称为AI领域的“黑天鹅事件”，以及它可能如何改变美国AI的长期竞争策略。

当中国公司领跑开源AI，美国该如何应对？

DeepSeek的突然崛起，不只是一次模型性能的意外突破，更重塑了全球AI关于“开源 vs 闭源”的核心叙事。本篇文章从技术细节、产业博弈和政策走向三个层面，梳理这场冲击为何被称为AI领域的“黑天鹅事件”，以及它可能如何改变美国AI的长期竞争策略。

一只“黑天鹅”：DeepSeek如何改变讨论起点

为什么DeepSeek重要？因为它不是简单做出一个“更便宜的模型”，而是用一连串出人意料的选择，击中了美国AI产业最敏感的神经。

视频一开始，主持人就将DeepSeek的发布称为“Black Swan event”。这家公司出身并不传统——它是一家从对冲基金中孵化出来的中国AI公司，却在短时间内推出了R1推理模型，性能被认为可以对标OpenAI的o1，在数学、逻辑和代码任务上显著优于免费版ChatGPT。更让人震惊的是成本：运行成本据称只有OpenAI同类模型的约2%。

具体故事在于产品层面。DeepSeek没有像OpenAI那样，把最强能力锁在付费墙后，而是直接在免费应用中提供“推理模型”，并通过UI把模型的中间思考过程显性化。这种设计让用户第一次直观感受到“模型在思考”，极大提升了使用黏性。

主持人强调，围绕DeepSeek的争论很多：蒸馏是否真实有效？成本数据是否被低估？但他认为，最重要、也最被低估的影响是——DeepSeek把行业焦点重新拉回到一个老问题：美国是否应该继续坚持以闭源为主的AI路线？

从OpenAI到DeepSeek：开源理想为何被重新审视

这一切之所以刺眼，是因为历史的反讽感太强。OpenAI最初就叫“OpenAI”，却在多年里逐步停止公开研究细节和模型权重，并以“AI安全”为主要理由。

视频中回顾了这场长期争论的双方立场。支持闭源的一方认为，公开模型权重会让“坏人”更容易滥用技术；反对者则质疑，安全只是表面理由，真正的动机是竞争优势。讨论因此一直僵持。

DeepSeek的出现打破了平衡。正如前Google CEO埃里克·施密特在文章中那句被反复引用的话：“这是一个奇怪的时刻——一家中国公司，成了事实上的开源AI领导者，而大多数美国公司却把方法论紧紧藏起来。”

这种反转本身就极具戏剧性。过去的共识是：最先进的闭源模型在美国，开源和中国模型至少落后数月。但R1和随后发布、可在笔记本运行的Janus Pro（图像生成模型）证明，这种时间差可能瞬间消失。甚至资本市场也迅速给出反馈——美国科技股在相关消息后出现明显下挫。

真正的技术冲击：绕过“常识”的训练方法

如果只是“更便宜的复制品”，DeepSeek不会引发如此大的震荡。真正危险的地方在于，它挑战了一系列被视为常识的AI训练假设。

首先是效率。美国的出口管制原本意在限制中国获取高端GPU，拖慢其模型训练速度。但视频指出，一个可能的反效果是：算力稀缺反而迫使中国团队寻找更高效的方法。DeepSeek展示了一条不同路径——通过绕过传统的监督微调（Supervised Fine-Tuning）阶段，直接用强化学习训练推理能力。他们甚至发布了一个完全省略该步骤的实验模型R10，公开挑战“微调不可或缺”的行业信条。

其次是“推理训练”的去神秘化。OpenAI在o1模型中首次引入基于自我反思的推理机制，但训练方法一直高度保密。DeepSeek直接发表论文，详细说明如何用强化学习，让一个公开的基础模型（如Meta的Llama 3）学会多步推理、回溯错误路径，并探索新解法。

主持人点出关键影响：这意味着研究者不必再从零预训练一个庞大的基础模型，也能获得强推理能力。这会显著降低门槛，让大学实验室和中小团队重新进入前沿AI研究。

安全之争与立场松动：谁在害怕开源？

当然，反对声音同样激烈。Anthropic CEO Dario Amodei在采访中称，他们的安全评估显示，DeepSeek在生成潜在危险信息方面“是他们测试过最差的模型之一”，几乎没有任何防护。

但这一说法立刻引发反弹。Marc Andreessen将其斥为“为监管护城河制造恐慌”，并直言：“开源AI的所谓生存威胁，其实是大AI卡特尔。”他随后补充道，Transformer、RLHF和推理训练的方法早已不是秘密，“已经没有把它再塞回盒子里的可能”。

更耐人寻味的是立场变化。主持人提到，Sam Altman在一次Reddit AMA中罕见承认，OpenAI“可能站在了历史的错误一边”，需要重新思考开源策略。几乎同时，有消息称百度计划开源其未来的文心一言模型——而它此前一直是最坚定的闭源支持者之一。

这些信号叠加在一起，让人感觉“沙子正在移动”，行业共识正在松动。

美国的下一步：不只是模型，而是制度选择

视频的结尾并没有给出简单答案，而是把问题抛向政策层面。

主持人认为，美国的前沿模型公司短期内不太可能彻底改变商业模式，开源与闭源更可能形成某种均衡。但DeepSeek标志着一个转折点：美国的竞争优势，不能只依赖最强的闭源模型，还需要一个繁荣的开源生态，以及更开放的训练方法共享。

这一思路与白宫宣布的“Stargate项目”形成呼应——未来四年投入5000亿美元建设AI基础设施。技术投资之外，更深层的问题是：美国是否愿意重新拥抱曾经带来长期优势的“开放科学”传统。

正如视频中暗含的判断：如果效率和方法论正在取代规模成为关键变量，那么封闭，可能反而是最大的风险。

总结

DeepSeek带来的冲击，并不只是“中国模型追上来了”，而是它用开源、低成本和方法论透明，撬动了整个AI产业的底层逻辑。对美国而言，真正的挑战不在于要不要“打败”DeepSeek，而在于是否敢于重新相信开放协作本身就是竞争力的一部分。这场关于开源与闭源的争论，正在从技术选择，升级为一场制度与价值观的选择。

关键词： DeepSeek，开源AI，闭源模型， AI推理，中美科技竞争

事实核查备注：关键事实包括：DeepSeek R1对标OpenAI o1；运行成本约为OpenAI的2%；Janus Pro可在笔记本运行并生成图像；DeepSeek公开推理训练论文；使用Llama 3进行强化学习推理；相关人物观点来自Sam Altman、Dario Amodei、Eric Schmidt、Marc Andreessen；白宫Stargate项目投资规模为5000亿美元。

返回文章列表