DeepSeek的AGI野心：从“更便宜的模型”走向真正的技术边界

AI PM 编辑部 · 2025年02月19日 · 10 阅读 · AI/人工智能

蒸馏 TPU AI安全模型训练 GPU 深度学习推理通用人工智能 AI应用 AI搜索

正在加载视频...

视频章节

这期《AI Daily Brief》用几个看似分散的新闻，拼出了一幅清晰的行业图景：DeepSeek正在为AGI正面冲锋，OpenAI一边应对安全与合规争议，一边加速自研芯片，而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

DeepSeek的AGI野心：从“更便宜的模型”走向真正的技术边界

这期《AI Daily Brief》用几个看似分散的新闻，拼出了一幅清晰的行业图景：DeepSeek正在为AGI正面冲锋，OpenAI一边应对安全与合规争议，一边加速自研芯片，而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

为什么DeepSeek的招聘，比一次模型发布更重要

如果你只把DeepSeek理解为“做出更便宜、更快模型的中国公司”，那这次招聘信息值得你重新评估它的定位。视频一开始就点出：DeepSeek“not slowing down at all”，而是明确在为AGI（通用人工智能）做人员布局。

他们一次性放出了多项与AGI直接相关的岗位，包括数据专家、深度学习研究员，以及一个非常不“工程导向”的角色——法律负责人。这个法律岗位的描述尤其耐人寻味：不仅要建立AGI的风险治理框架，还要负责与政府和监管机构沟通。换句话说，DeepSeek已经假设自己将进入一个需要被严肃监管的技术阶段。

主持人给了一个非常关键的判断：到目前为止，DeepSeek的创新主要体现在训练方法和模型蒸馏上，但“they haven't produced anything that pushes beyond leading US models in performance”。这次招聘，像是一种战略宣言——不再满足于“同样效果但更低成本”，而是试图真正在能力上越界。对一家已经尝到规模化成功甜头的实验室来说，这是顺理成章的一步，但也意味着风险、监管和国际关注度都会同步升级。

蒸馏之争：OpenAI为什么这次态度异常强硬

DeepSeek的技术路线，也正是争议的中心。视频中花了相当篇幅讲述OpenAI配合美国政府调查DeepSeek的背景，其中核心问题是：DeepSeek是否未经授权，使用OpenAI模型的输出进行蒸馏训练。

蒸馏（distillation）指的是利用一个强模型的推理或输出结果，来训练另一个模型，从而“转移能力”。OpenAI方面表示，他们“have seen some evidence”，并且微软的安全研究人员发现，有“groups linked to DeepSeek”通过OpenAI API外流了大量数据。

这里最有价值的是OpenAI全球事务负责人给出的比喻。他说，如果你去图书馆读书、学习，这是合理使用；但如果你“take the book， put your name on the book， slap a cover on the book and hand it out as if it's your book”，那就是复制和侵权。主持人强调，OpenAI真正需要证明的，是这些输出是否等价于“整本书被搬走”。

讽刺之处在于，OpenAI自己正深陷多起版权诉讼，因此外界批评其立场虚伪。这种张力让DeepSeek不只是一个技术挑战者，也成了政策和法律层面的“hot ongoing concern”。

从模型到芯片：OpenAI的另一条战线

就在外界聚焦模型和蒸馏争议时，视频抛出了另一个重量级消息：OpenAI正在接近完成自己的AI芯片设计。根据路透社的说法，芯片将在未来几个月内定型，并送往台积电流片，首批测试芯片大约需要6个月。

这意味着，如果一切顺利，OpenAI可能在2026年开始规模化生产自己的芯片。主持人特别指出，这对于“first chip design”来说是异常快速的节奏，而这项计划最早在2024年10月才被媒体披露。

动机其实并不复杂：降低对NVIDIA的依赖。OpenAI正在与博通合作设计芯片，并聘请了前Google TPU工程师Richard Ho，组建约40人的内部团队。虽然“hundreds of millions of dollars”听起来很夸张，但在5000亿美元规模的Stargate基础设施项目面前，这几乎只是零头。

这条新闻的隐含信号是：AI竞争正在系统性升级，从算法、数据，延伸到算力的最底层。

应用层的另一种胜利：Perplexity的超级碗实验

在一片AGI、芯片和监管的宏大叙事中，视频最后用一个轻巧但极具启发性的案例收尾——Perplexity的超级碗营销。

他们没有投放昂贵广告，而是把预算变成一个竞赛：用户在比赛期间下载应用并至少提问5个问题，就有机会赢得100万美元。CEO Aravind Srinivas直接在X上宣布：“there will be no Perplexity Super Bowl ad”。

结果非常具体：根据Appfigures数据，活动带来了50%的日下载量增长，应用商店排名从第257名跃升到第49名。更重要的是，这种方式真正让用户“用起来”，而不是只看一个抽象的AI广告。

主持人评价得很直接：对于那些希望广告能展示AI用例的人来说，Perplexity“actually fulfilled that brief”。在算力和模型之外，如何让用户形成真实使用习惯，可能同样决定一家AI公司的长期价值。

总结

这期节目传递的核心信号很明确：AI竞赛已经进入多维度博弈阶段。DeepSeek试图从“成本创新者”跃迁为AGI挑战者，OpenAI同时在模型、合规和芯片上构筑护城河，而Perplexity则证明应用层依然有聪明的破局方式。对从业者和观察者来说，真正的机会往往藏在这些转折点上——当一家公司开始为监管、硬件和用户行为同时下注时，它已经不再只是做模型了。

关键词： DeepSeek， AGI，模型蒸馏， OpenAI芯片， Perplexity

事实核查备注：视频来源：The AI Daily Brief，2025-02-19；DeepSeek招聘方向：AGI、数据专家、深度学习研究员、法律负责人；OpenAI指控涉及蒸馏、API数据外流；引用人物：OpenAI全球事务负责人；芯片信息：Reuters报道，合作方Broadcom，代工TSMC，前Google TPU工程师Richard Ho；Perplexity活动数据来源：Appfigures，下载量增长50%，排名257升至49。

返回文章列表