DeepSeek风暴:中国正用“开源+低成本”改写AI竞赛规则?
正在加载视频...
视频章节
这期《AI Daily Brief》并没有简单回答“中国是否已经在AI上超过美国”,而是揭示了一个更重要的变化:AI竞赛的规则正在被中国重新定义。通过DeepSeek的开源模型、国产芯片替代路径以及人才回流,中国正在用更快的节奏、更低的成本,逼迫美国AI产业正视一个全新的竞争范式。
DeepSeek风暴:中国正用“开源+低成本”改写AI竞赛规则?
这期《AI Daily Brief》并没有简单回答“中国是否已经在AI上超过美国”,而是揭示了一个更重要的变化:AI竞赛的规则正在被中国重新定义。通过DeepSeek的开源模型、国产芯片替代路径以及人才回流,中国正在用更快的节奏、更低的成本,逼迫美国AI产业正视一个全新的竞争范式。
从“AI斯普特尼克时刻”说起:DeepSeek为何刺痛了华盛顿
这一切讨论的起点,来自DeepSeek R1的发布。主持人回顾道,这个模型的出现,迫使华盛顿第一次“认真地”面对中国正在追赶AI前沿的现实,甚至被Marc Andreessen称为“AI Sputnik Moment”。重要的不只是技术指标,而是节奏:几乎没有预热、没有发布会,模型就直接上线。
这种反差在中美之间尤为刺眼。一边是美国AI政策仍停留在“别让中国赢”的模糊目标上,另一边则是中国国内出现了某种近乎全民式的DeepSeek整合浪潮。演讲者形容,如果说DeepSeek在西方是一次警钟,那么在中国,它已经成了一种“现象级事件”,被迅速嵌入各类产品和流程中。
这里的转折在于:讨论的焦点不再只是“谁的模型更强”,而是“谁的系统推进速度更快”。正如视频中反复强调的,2025年的核心主题,已经从单点技术突破,转向国家级AI动员能力的较量。
V3模型的“静默发布”:开源正在变成一种武器
让这场讨论再度升温的,是DeepSeek V3基础模型的发布方式。它被悄无声息地扔到了Hugging Face上,甚至连README都是空的——只有模型权重和商业使用许可。主持人特别指出,这种“毫无仪式感”的发布,本身就是一个信号。
基准测试显示,V3在推理和代码能力上都有显著提升。Zappon测试后直言:“它在所有测试指标上都有巨大飞跃,现在是最强的非推理模型,超越了Claude 3.5 Sonnet。”这还不是大家真正等待的推理模型R2,但已经足够引发震动。
更具象的故事来自部署端。苹果机器学习研究员Anil Hannan在一台512GB内存的M3 Ultra Mac Studio上,以4-bit模式跑起了这个6850亿参数模型,速度达到20 tokens/s。正如VentureBeat总结的那样,这意味着“最先进的大模型,正在能跑在一台价格低于一辆二手车的机器上”。这种效率突破,直接改变了AI部署的经济学。
开源对闭源:中国式AI加速器正在显形
VentureBeat点出了中美AI战略的根本分歧:美国的OpenAI和Anthropic选择将模型牢牢放在付费墙后,而中国公司则尽可能开源。报道直言,这种策略正在产生“乘数效应”,让创业者和研究者无需巨额资本就能使用前沿模型。
他们给出了一个关键判断:几个月前,主流观点还认为中国落后美国1到2年;而现在,这个差距可能已经缩小到3到6个月,在某些领域甚至接近平手或反超。围绕DeepSeek R2的传闻——比如“在RCGI基准上拿到90%”——虽然被多次强调缺乏来源,但其广泛传播本身,就说明了心态的变化。
主持人点破了一个耐人寻味的事实:即便这些传闻并不属实,它们依然能影响市场情绪和开发者选择。这种“预期层面的竞争”,正在成为AI竞赛中一个不可忽视的变量。
芯片与算力:在出口管制下的中国式绕行
模型之外,芯片进展同样关键。Bloomberg报道称,蚂蚁集团通过混合专家(MoE)架构,在使用华为AI芯片的情况下,将训练成本降低了20%。更重要的是,这一方法在NVIDIA H800(为合规而降级的芯片)上也同样奏效。
蚂蚁在论文中披露,训练一个万亿token规模的大模型,成本约为88万美元,未来希望在低规格硬件上降至70万美元。这直接回应了一个核心问题:出口管制是否真的能卡住中国的前沿模型训练?
连NVIDIA CEO黄仁勋都在近期承认:“华为是中国最强大的科技公司……我们不能假设他们不会成为AI领域的重要因素。”正如前对冲基金量化投资人Jeffrey Emanuel调侃的那样,“这也太快了”。芯片替代路径,正在从假设走向现实。
人才回流与终局判断:领先不止一种方式
竞争的最后一条战线是人才。视频讲述了一个具体故事:43岁的前微软研究员顾某(Chi)在美国工作十年后,回到杭州西湖大学。她曾获微软、IBM Fellowship,并在ACM多媒体会议拿下最佳论文。她说,自己被“更自由的学术氛围”吸引。
主持人并不回避争议:这是否是政治动作、是否被用作宣传?但即便如此,趋势依然存在。数据显示,2022年中国培养了全球47%的顶尖AI本科生,美国约为18%。正如评论者所言,“只要中国人数是美国的四倍,就很难在任何关键技术上不形成规模优势。”
视频最后给出了一个冷静却不安的结论:也许中国尚未全面领先,但“趋势线在那”。而且,谁规定AI竞赛的胜负,只取决于最强模型?当‘好到足够用’的模型成本骤降,真正被改写的,可能是整个AI产业的商业逻辑。
总结
这期节目最有价值的地方,不在于给出一个简单的“中美谁赢了”的答案,而在于揭示规则正在变化。开源、低成本、快速部署,正在成为中国AI推进的核心武器。即便美国仍掌握最强模型,中国也可能通过改变成本曲线和应用扩散速度,重塑AI的全球格局。对从业者而言,真正需要关注的不是榜单,而是趋势。
关键词: DeepSeek, 开源模型, AI芯片, 中美AI竞争, 大语言模型
事实核查备注: DeepSeek V3为开源基础模型;Claude 3.5 Sonnet被提及为对比对象;V3在M3 Ultra上约20 tokens/s(4-bit);模型参数约6850亿;蚂蚁集团称万亿token训练成本约88万美元;中国培养全球47%顶尖AI本科生(2022);黄仁勋评价华为为中国最强科技公司之一。