开源模型会反超吗?一场关于DeepSeek与Llama的现实讨论

AI PM 编辑部 · 2025年05月12日 · 9 阅读 · AI/人工智能

正在加载视频...

视频章节

这场来自 Sequoia AI Ascent 的圆桌讨论,没有给出简单的“开源或闭源谁会赢”的答案,而是通过 DeepSeek 的意外走红、Llama 4 的评估争议,以及对模型格局的定量判断,勾勒出未来 AI 生态更真实的走向。

开源模型会反超吗?一场关于DeepSeek与Llama的现实讨论

这场来自 Sequoia AI Ascent 的圆桌讨论,没有给出简单的“开源或闭源谁会赢”的答案,而是通过 DeepSeek 的意外走红、Llama 4 的评估争议,以及对模型格局的定量判断,勾勒出未来 AI 生态更真实的走向。

从黄仁勋的问题开始:为什么“开源是否能追上闭源”如此关键

这一场讨论的起点,并不是某个具体模型,而是“Jensen framed for us this morning”的那个问题。主持人直接引用了黄仁勋在当天早些时候抛出的核心命题:在算力、资金和人才高度集中的背景下,开源模型是否还有机会在前沿能力上追赶甚至超越闭源模型。之所以重要,是因为这个问题决定了未来创新是集中在少数巨头,还是分散在更广泛的开发者社区中。现场举手的人数“a good amount of the crowd”本身就说明,这并不是一个小众担忧,而是整个 AI 行业正在共同面对的不确定性。讨论者并没有急着给出立场,而是把这个问题当成理解后续所有案例的背景框架:如果答案是否定的,那开源的意义更多在基础设施;如果答案是肯定的,那产业权力结构将被重写。

DeepSeek 时刻:一次连从业者都低估的转折

当话题转向“the deepseek moment”时,现场的语气明显发生了变化。提问者坦言,这件事“most people in the AI space still aren't aware of”,本身就构成了一个信号:DeepSeek 的出现并非源自铺天盖地的营销,而更像一次悄然发生的突破。讨论并没有渲染具体性能数字,而是反复追问“how did this happen?”——为什么一个开源相关的产品,能在不被广泛看好的情况下,引发如此多的关注。这背后的故事价值在于,它提醒从业者不要只盯着排行榜或头部公司。DeepSeek 成为一个案例,说明在合适的工程取舍、社区参与和分发路径下,开源模型依然可能制造出让行业重新校准认知的时刻。

Llama 4 与评估困境:当“奖励黑客”成为真实风险

讨论进入技术层面时,Dimma 被问及对 Llama 4 的看法,话题自然落在“evaluating models to avoid reward hacking”上。这里的关键不在于 Llama 4 本身,而在于评估方法。奖励黑客(reward hacking)指的是模型学会在评测体系中“取巧”,表面得分很高,却未必真正对齐人类目标。这一段之所以重要,是因为它揭示了一个常被忽略的事实:模型能力的竞争,已经从参数规模和数据量,转移到评估与对齐机制上。开源模型尤其依赖公开评测,一旦评测被‘玩坏’,整个社区都会被误导。这也是为什么 AI 对齐与 AI 安全不再只是伦理话题,而是直接影响技术路线选择的工程问题。

不会有“统治一切的模型”:关于未来格局的定量判断

在最后的定量问题中,有嘉宾明确提出一个判断:未来不太可能出现“necessarily a single model which like will dominate everything more than 50%”。这句话的分量在于,它否定了一个很多投资叙事里默认存在的假设——即终局一定是‘一家通吃’。相反,讨论更倾向于认为,不同场景、不同约束条件下,会共存多种模型形态:有的偏向闭源极致性能,有的依托开源生态快速迭代。这个判断为前面的 DeepSeek 与 Llama 讨论提供了一个统一解释:它们的价值,不在于是否击败某个闭源巨头,而在于共同塑造一个多中心、长期演化的模型生态。

总结

这场圆桌最有价值的地方,并不在于预测了谁输谁赢,而在于校正了讨论方式:从“开源能不能打败闭源”,转向“不同模式如何在真实约束下共存”。DeepSeek 的意外走红、Llama 4 的评估挑战,以及对模型集中度的冷静判断,都指向同一个结论——未来 AI 的竞争,不只是技术指标之争,更是生态、评估与分发路径的长期博弈。对读者而言,这意味着在判断趋势时,值得多关注那些尚未被大声讨论、却正在改变结构的细节。


关键词: 开源模型, DeepSeek, Llama, AI对齐, AI安全

事实核查备注: 视频标题:Will Open Source AI Overtake Closed Models?;频道:Sequoia AI Ascent;人物提及:黄仁勋(Jensen);产品:DeepSeek、Llama;关键原话片段:"the deepseek moment"、"evaluating models to avoid reward hacking"、"necessarily a single model which like will dominate everything more than 50%"