开源模型会反超吗？一场关于DeepSeek与Llama的现实讨论

AI PM 编辑部 · 2025年05月12日 · 9 阅读 · AI/人工智能

正在加载视频...

视频章节

这场来自 Sequoia AI Ascent 的圆桌讨论，没有给出简单的“开源或闭源谁会赢”的答案，而是通过 DeepSeek 的意外走红、Llama 4 的评估争议，以及对模型格局的定量判断，勾勒出未来 AI 生态更真实的走向。

开源模型会反超吗？一场关于DeepSeek与Llama的现实讨论

这场来自 Sequoia AI Ascent 的圆桌讨论，没有给出简单的“开源或闭源谁会赢”的答案，而是通过 DeepSeek 的意外走红、Llama 4 的评估争议，以及对模型格局的定量判断，勾勒出未来 AI 生态更真实的走向。

从黄仁勋的问题开始：为什么“开源是否能追上闭源”如此关键

这一场讨论的起点，并不是某个具体模型，而是“Jensen framed for us this morning”的那个问题。主持人直接引用了黄仁勋在当天早些时候抛出的核心命题：在算力、资金和人才高度集中的背景下，开源模型是否还有机会在前沿能力上追赶甚至超越闭源模型。之所以重要，是因为这个问题决定了未来创新是集中在少数巨头，还是分散在更广泛的开发者社区中。现场举手的人数“a good amount of the crowd”本身就说明，这并不是一个小众担忧，而是整个 AI 行业正在共同面对的不确定性。讨论者并没有急着给出立场，而是把这个问题当成理解后续所有案例的背景框架：如果答案是否定的，那开源的意义更多在基础设施；如果答案是肯定的，那产业权力结构将被重写。

DeepSeek 时刻：一次连从业者都低估的转折

当话题转向“the deepseek moment”时，现场的语气明显发生了变化。提问者坦言，这件事“most people in the AI space still aren't aware of”，本身就构成了一个信号：DeepSeek 的出现并非源自铺天盖地的营销，而更像一次悄然发生的突破。讨论并没有渲染具体性能数字，而是反复追问“how did this happen？”——为什么一个开源相关的产品，能在不被广泛看好的情况下，引发如此多的关注。这背后的故事价值在于，它提醒从业者不要只盯着排行榜或头部公司。DeepSeek 成为一个案例，说明在合适的工程取舍、社区参与和分发路径下，开源模型依然可能制造出让行业重新校准认知的时刻。

Llama 4 与评估困境：当“奖励黑客”成为真实风险

讨论进入技术层面时，Dimma 被问及对 Llama 4 的看法，话题自然落在“evaluating models to avoid reward hacking”上。这里的关键不在于 Llama 4 本身，而在于评估方法。奖励黑客（reward hacking）指的是模型学会在评测体系中“取巧”，表面得分很高，却未必真正对齐人类目标。这一段之所以重要，是因为它揭示了一个常被忽略的事实：模型能力的竞争，已经从参数规模和数据量，转移到评估与对齐机制上。开源模型尤其依赖公开评测，一旦评测被‘玩坏’，整个社区都会被误导。这也是为什么 AI 对齐与 AI 安全不再只是伦理话题，而是直接影响技术路线选择的工程问题。

不会有“统治一切的模型”：关于未来格局的定量判断

在最后的定量问题中，有嘉宾明确提出一个判断：未来不太可能出现“necessarily a single model which like will dominate everything more than 50%”。这句话的分量在于，它否定了一个很多投资叙事里默认存在的假设——即终局一定是‘一家通吃’。相反，讨论更倾向于认为，不同场景、不同约束条件下，会共存多种模型形态：有的偏向闭源极致性能，有的依托开源生态快速迭代。这个判断为前面的 DeepSeek 与 Llama 讨论提供了一个统一解释：它们的价值，不在于是否击败某个闭源巨头，而在于共同塑造一个多中心、长期演化的模型生态。

总结

这场圆桌最有价值的地方，并不在于预测了谁输谁赢，而在于校正了讨论方式：从“开源能不能打败闭源”，转向“不同模式如何在真实约束下共存”。DeepSeek 的意外走红、Llama 4 的评估挑战，以及对模型集中度的冷静判断，都指向同一个结论——未来 AI 的竞争，不只是技术指标之争，更是生态、评估与分发路径的长期博弈。对读者而言，这意味着在判断趋势时，值得多关注那些尚未被大声讨论、却正在改变结构的细节。

关键词：开源模型， DeepSeek， Llama， AI对齐， AI安全

事实核查备注：视频标题：Will Open Source AI Overtake Closed Models？；频道：Sequoia AI Ascent；人物提及：黄仁勋（Jensen）；产品：DeepSeek、Llama；关键原话片段："the deepseek moment"、"evaluating models to avoid reward hacking"、"necessarily a single model which like will dominate everything more than 50%"

返回文章列表