DeepSeek风暴：中国正用“开源+低成本”改写AI竞赛规则？

AI PM 编辑部 · 2025年03月26日 · 8 阅读 · AI/人工智能

黄仁勋李开复强化学习闭源模型计算机视觉文本生成图像模型训练模型部署 GPU 开源模型

正在加载视频...

视频章节

这期《AI Daily Brief》并没有简单回答“中国是否已经在AI上超过美国”，而是揭示了一个更重要的变化：AI竞赛的规则正在被中国重新定义。通过DeepSeek的开源模型、国产芯片替代路径以及人才回流，中国正在用更快的节奏、更低的成本，逼迫美国AI产业正视一个全新的竞争范式。

DeepSeek风暴：中国正用“开源+低成本”改写AI竞赛规则？

这期《AI Daily Brief》并没有简单回答“中国是否已经在AI上超过美国”，而是揭示了一个更重要的变化：AI竞赛的规则正在被中国重新定义。通过DeepSeek的开源模型、国产芯片替代路径以及人才回流，中国正在用更快的节奏、更低的成本，逼迫美国AI产业正视一个全新的竞争范式。

从“AI斯普特尼克时刻”说起：DeepSeek为何刺痛了华盛顿

这一切讨论的起点，来自DeepSeek R1的发布。主持人回顾道，这个模型的出现，迫使华盛顿第一次“认真地”面对中国正在追赶AI前沿的现实，甚至被Marc Andreessen称为“AI Sputnik Moment”。重要的不只是技术指标，而是节奏：几乎没有预热、没有发布会，模型就直接上线。

这种反差在中美之间尤为刺眼。一边是美国AI政策仍停留在“别让中国赢”的模糊目标上，另一边则是中国国内出现了某种近乎全民式的DeepSeek整合浪潮。演讲者形容，如果说DeepSeek在西方是一次警钟，那么在中国，它已经成了一种“现象级事件”，被迅速嵌入各类产品和流程中。

这里的转折在于：讨论的焦点不再只是“谁的模型更强”，而是“谁的系统推进速度更快”。正如视频中反复强调的，2025年的核心主题，已经从单点技术突破，转向国家级AI动员能力的较量。

V3模型的“静默发布”：开源正在变成一种武器

让这场讨论再度升温的，是DeepSeek V3基础模型的发布方式。它被悄无声息地扔到了Hugging Face上，甚至连README都是空的——只有模型权重和商业使用许可。主持人特别指出，这种“毫无仪式感”的发布，本身就是一个信号。

基准测试显示，V3在推理和代码能力上都有显著提升。Zappon测试后直言：“它在所有测试指标上都有巨大飞跃，现在是最强的非推理模型，超越了Claude 3.5 Sonnet。”这还不是大家真正等待的推理模型R2，但已经足够引发震动。

更具象的故事来自部署端。苹果机器学习研究员Anil Hannan在一台512GB内存的M3 Ultra Mac Studio上，以4-bit模式跑起了这个6850亿参数模型，速度达到20 tokens/s。正如VentureBeat总结的那样，这意味着“最先进的大模型，正在能跑在一台价格低于一辆二手车的机器上”。这种效率突破，直接改变了AI部署的经济学。

开源对闭源：中国式AI加速器正在显形

VentureBeat点出了中美AI战略的根本分歧：美国的OpenAI和Anthropic选择将模型牢牢放在付费墙后，而中国公司则尽可能开源。报道直言，这种策略正在产生“乘数效应”，让创业者和研究者无需巨额资本就能使用前沿模型。

他们给出了一个关键判断：几个月前，主流观点还认为中国落后美国1到2年；而现在，这个差距可能已经缩小到3到6个月，在某些领域甚至接近平手或反超。围绕DeepSeek R2的传闻——比如“在RCGI基准上拿到90%”——虽然被多次强调缺乏来源，但其广泛传播本身，就说明了心态的变化。

主持人点破了一个耐人寻味的事实：即便这些传闻并不属实，它们依然能影响市场情绪和开发者选择。这种“预期层面的竞争”，正在成为AI竞赛中一个不可忽视的变量。

芯片与算力：在出口管制下的中国式绕行

模型之外，芯片进展同样关键。Bloomberg报道称，蚂蚁集团通过混合专家（MoE）架构，在使用华为AI芯片的情况下，将训练成本降低了20%。更重要的是，这一方法在NVIDIA H800（为合规而降级的芯片）上也同样奏效。

蚂蚁在论文中披露，训练一个万亿token规模的大模型，成本约为88万美元，未来希望在低规格硬件上降至70万美元。这直接回应了一个核心问题：出口管制是否真的能卡住中国的前沿模型训练？

连NVIDIA CEO黄仁勋都在近期承认：“华为是中国最强大的科技公司……我们不能假设他们不会成为AI领域的重要因素。”正如前对冲基金量化投资人Jeffrey Emanuel调侃的那样，“这也太快了”。芯片替代路径，正在从假设走向现实。

人才回流与终局判断：领先不止一种方式

竞争的最后一条战线是人才。视频讲述了一个具体故事：43岁的前微软研究员顾某（Chi）在美国工作十年后，回到杭州西湖大学。她曾获微软、IBM Fellowship，并在ACM多媒体会议拿下最佳论文。她说，自己被“更自由的学术氛围”吸引。

主持人并不回避争议：这是否是政治动作、是否被用作宣传？但即便如此，趋势依然存在。数据显示，2022年中国培养了全球47%的顶尖AI本科生，美国约为18%。正如评论者所言，“只要中国人数是美国的四倍，就很难在任何关键技术上不形成规模优势。”

视频最后给出了一个冷静却不安的结论：也许中国尚未全面领先，但“趋势线在那”。而且，谁规定AI竞赛的胜负，只取决于最强模型？当‘好到足够用’的模型成本骤降，真正被改写的，可能是整个AI产业的商业逻辑。

总结

这期节目最有价值的地方，不在于给出一个简单的“中美谁赢了”的答案，而在于揭示规则正在变化。开源、低成本、快速部署，正在成为中国AI推进的核心武器。即便美国仍掌握最强模型，中国也可能通过改变成本曲线和应用扩散速度，重塑AI的全球格局。对从业者而言，真正需要关注的不是榜单，而是趋势。

关键词： DeepSeek，开源模型， AI芯片，中美AI竞争，大语言模型

事实核查备注： DeepSeek V3为开源基础模型；Claude 3.5 Sonnet被提及为对比对象；V3在M3 Ultra上约20 tokens/s（4-bit）；模型参数约6850亿；蚂蚁集团称万亿token训练成本约88万美元；中国培养全球47%顶尖AI本科生（2022）；黄仁勋评价华为为中国最强科技公司之一。

返回文章列表