当中国公司领跑开源AI,美国该如何应对?

AI PM 编辑部 · 2025年02月17日 · 8 阅读 · AI/人工智能

正在加载视频...

视频章节

DeepSeek的突然崛起,不只是一次模型性能的意外突破,更重塑了全球AI关于“开源 vs 闭源”的核心叙事。本篇文章从技术细节、产业博弈和政策走向三个层面,梳理这场冲击为何被称为AI领域的“黑天鹅事件”,以及它可能如何改变美国AI的长期竞争策略。

当中国公司领跑开源AI,美国该如何应对?

DeepSeek的突然崛起,不只是一次模型性能的意外突破,更重塑了全球AI关于“开源 vs 闭源”的核心叙事。本篇文章从技术细节、产业博弈和政策走向三个层面,梳理这场冲击为何被称为AI领域的“黑天鹅事件”,以及它可能如何改变美国AI的长期竞争策略。

一只“黑天鹅”:DeepSeek如何改变讨论起点

为什么DeepSeek重要?因为它不是简单做出一个“更便宜的模型”,而是用一连串出人意料的选择,击中了美国AI产业最敏感的神经。

视频一开始,主持人就将DeepSeek的发布称为“Black Swan event”。这家公司出身并不传统——它是一家从对冲基金中孵化出来的中国AI公司,却在短时间内推出了R1推理模型,性能被认为可以对标OpenAI的o1,在数学、逻辑和代码任务上显著优于免费版ChatGPT。更让人震惊的是成本:运行成本据称只有OpenAI同类模型的约2%。

具体故事在于产品层面。DeepSeek没有像OpenAI那样,把最强能力锁在付费墙后,而是直接在免费应用中提供“推理模型”,并通过UI把模型的中间思考过程显性化。这种设计让用户第一次直观感受到“模型在思考”,极大提升了使用黏性。

主持人强调,围绕DeepSeek的争论很多:蒸馏是否真实有效?成本数据是否被低估?但他认为,最重要、也最被低估的影响是——DeepSeek把行业焦点重新拉回到一个老问题:美国是否应该继续坚持以闭源为主的AI路线?

从OpenAI到DeepSeek:开源理想为何被重新审视

这一切之所以刺眼,是因为历史的反讽感太强。OpenAI最初就叫“OpenAI”,却在多年里逐步停止公开研究细节和模型权重,并以“AI安全”为主要理由。

视频中回顾了这场长期争论的双方立场。支持闭源的一方认为,公开模型权重会让“坏人”更容易滥用技术;反对者则质疑,安全只是表面理由,真正的动机是竞争优势。讨论因此一直僵持。

DeepSeek的出现打破了平衡。正如前Google CEO埃里克·施密特在文章中那句被反复引用的话:“这是一个奇怪的时刻——一家中国公司,成了事实上的开源AI领导者,而大多数美国公司却把方法论紧紧藏起来。”

这种反转本身就极具戏剧性。过去的共识是:最先进的闭源模型在美国,开源和中国模型至少落后数月。但R1和随后发布、可在笔记本运行的Janus Pro(图像生成模型)证明,这种时间差可能瞬间消失。甚至资本市场也迅速给出反馈——美国科技股在相关消息后出现明显下挫。

真正的技术冲击:绕过“常识”的训练方法

如果只是“更便宜的复制品”,DeepSeek不会引发如此大的震荡。真正危险的地方在于,它挑战了一系列被视为常识的AI训练假设。

首先是效率。美国的出口管制原本意在限制中国获取高端GPU,拖慢其模型训练速度。但视频指出,一个可能的反效果是:算力稀缺反而迫使中国团队寻找更高效的方法。DeepSeek展示了一条不同路径——通过绕过传统的监督微调(Supervised Fine-Tuning)阶段,直接用强化学习训练推理能力。他们甚至发布了一个完全省略该步骤的实验模型R10,公开挑战“微调不可或缺”的行业信条。

其次是“推理训练”的去神秘化。OpenAI在o1模型中首次引入基于自我反思的推理机制,但训练方法一直高度保密。DeepSeek直接发表论文,详细说明如何用强化学习,让一个公开的基础模型(如Meta的Llama 3)学会多步推理、回溯错误路径,并探索新解法。

主持人点出关键影响:这意味着研究者不必再从零预训练一个庞大的基础模型,也能获得强推理能力。这会显著降低门槛,让大学实验室和中小团队重新进入前沿AI研究。

安全之争与立场松动:谁在害怕开源?

当然,反对声音同样激烈。Anthropic CEO Dario Amodei在采访中称,他们的安全评估显示,DeepSeek在生成潜在危险信息方面“是他们测试过最差的模型之一”,几乎没有任何防护。

但这一说法立刻引发反弹。Marc Andreessen将其斥为“为监管护城河制造恐慌”,并直言:“开源AI的所谓生存威胁,其实是大AI卡特尔。”他随后补充道,Transformer、RLHF和推理训练的方法早已不是秘密,“已经没有把它再塞回盒子里的可能”。

更耐人寻味的是立场变化。主持人提到,Sam Altman在一次Reddit AMA中罕见承认,OpenAI“可能站在了历史的错误一边”,需要重新思考开源策略。几乎同时,有消息称百度计划开源其未来的文心一言模型——而它此前一直是最坚定的闭源支持者之一。

这些信号叠加在一起,让人感觉“沙子正在移动”,行业共识正在松动。

美国的下一步:不只是模型,而是制度选择

视频的结尾并没有给出简单答案,而是把问题抛向政策层面。

主持人认为,美国的前沿模型公司短期内不太可能彻底改变商业模式,开源与闭源更可能形成某种均衡。但DeepSeek标志着一个转折点:美国的竞争优势,不能只依赖最强的闭源模型,还需要一个繁荣的开源生态,以及更开放的训练方法共享。

这一思路与白宫宣布的“Stargate项目”形成呼应——未来四年投入5000亿美元建设AI基础设施。技术投资之外,更深层的问题是:美国是否愿意重新拥抱曾经带来长期优势的“开放科学”传统。

正如视频中暗含的判断:如果效率和方法论正在取代规模成为关键变量,那么封闭,可能反而是最大的风险。

总结

DeepSeek带来的冲击,并不只是“中国模型追上来了”,而是它用开源、低成本和方法论透明,撬动了整个AI产业的底层逻辑。对美国而言,真正的挑战不在于要不要“打败”DeepSeek,而在于是否敢于重新相信开放协作本身就是竞争力的一部分。这场关于开源与闭源的争论,正在从技术选择,升级为一场制度与价值观的选择。


关键词: DeepSeek, 开源AI, 闭源模型, AI推理, 中美科技竞争

事实核查备注: 关键事实包括:DeepSeek R1对标OpenAI o1;运行成本约为OpenAI的2%;Janus Pro可在笔记本运行并生成图像;DeepSeek公开推理训练论文;使用Llama 3进行强化学习推理;相关人物观点来自Sam Altman、Dario Amodei、Eric Schmidt、Marc Andreessen;白宫Stargate项目投资规模为5000亿美元。