DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

AI PM 编辑部 · 2025年02月19日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

这期《AI Daily Brief》用几个看似分散的新闻,拼出了一幅清晰的行业图景:DeepSeek正在为AGI正面冲锋,OpenAI一边应对安全与合规争议,一边加速自研芯片,而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

这期《AI Daily Brief》用几个看似分散的新闻,拼出了一幅清晰的行业图景:DeepSeek正在为AGI正面冲锋,OpenAI一边应对安全与合规争议,一边加速自研芯片,而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

为什么DeepSeek的招聘,比一次模型发布更重要

如果你只把DeepSeek理解为“做出更便宜、更快模型的中国公司”,那这次招聘信息值得你重新评估它的定位。视频一开始就点出:DeepSeek“not slowing down at all”,而是明确在为AGI(通用人工智能)做人员布局。

他们一次性放出了多项与AGI直接相关的岗位,包括数据专家、深度学习研究员,以及一个非常不“工程导向”的角色——法律负责人。这个法律岗位的描述尤其耐人寻味:不仅要建立AGI的风险治理框架,还要负责与政府和监管机构沟通。换句话说,DeepSeek已经假设自己将进入一个需要被严肃监管的技术阶段。

主持人给了一个非常关键的判断:到目前为止,DeepSeek的创新主要体现在训练方法和模型蒸馏上,但“they haven't produced anything that pushes beyond leading US models in performance”。这次招聘,像是一种战略宣言——不再满足于“同样效果但更低成本”,而是试图真正在能力上越界。对一家已经尝到规模化成功甜头的实验室来说,这是顺理成章的一步,但也意味着风险、监管和国际关注度都会同步升级。

蒸馏之争:OpenAI为什么这次态度异常强硬

DeepSeek的技术路线,也正是争议的中心。视频中花了相当篇幅讲述OpenAI配合美国政府调查DeepSeek的背景,其中核心问题是:DeepSeek是否未经授权,使用OpenAI模型的输出进行蒸馏训练。

蒸馏(distillation)指的是利用一个强模型的推理或输出结果,来训练另一个模型,从而“转移能力”。OpenAI方面表示,他们“have seen some evidence”,并且微软的安全研究人员发现,有“groups linked to DeepSeek”通过OpenAI API外流了大量数据。

这里最有价值的是OpenAI全球事务负责人给出的比喻。他说,如果你去图书馆读书、学习,这是合理使用;但如果你“take the book, put your name on the book, slap a cover on the book and hand it out as if it's your book”,那就是复制和侵权。主持人强调,OpenAI真正需要证明的,是这些输出是否等价于“整本书被搬走”。

讽刺之处在于,OpenAI自己正深陷多起版权诉讼,因此外界批评其立场虚伪。这种张力让DeepSeek不只是一个技术挑战者,也成了政策和法律层面的“hot ongoing concern”。

从模型到芯片:OpenAI的另一条战线

就在外界聚焦模型和蒸馏争议时,视频抛出了另一个重量级消息:OpenAI正在接近完成自己的AI芯片设计。根据路透社的说法,芯片将在未来几个月内定型,并送往台积电流片,首批测试芯片大约需要6个月。

这意味着,如果一切顺利,OpenAI可能在2026年开始规模化生产自己的芯片。主持人特别指出,这对于“first chip design”来说是异常快速的节奏,而这项计划最早在2024年10月才被媒体披露。

动机其实并不复杂:降低对NVIDIA的依赖。OpenAI正在与博通合作设计芯片,并聘请了前Google TPU工程师Richard Ho,组建约40人的内部团队。虽然“hundreds of millions of dollars”听起来很夸张,但在5000亿美元规模的Stargate基础设施项目面前,这几乎只是零头。

这条新闻的隐含信号是:AI竞争正在系统性升级,从算法、数据,延伸到算力的最底层。

应用层的另一种胜利:Perplexity的超级碗实验

在一片AGI、芯片和监管的宏大叙事中,视频最后用一个轻巧但极具启发性的案例收尾——Perplexity的超级碗营销。

他们没有投放昂贵广告,而是把预算变成一个竞赛:用户在比赛期间下载应用并至少提问5个问题,就有机会赢得100万美元。CEO Aravind Srinivas直接在X上宣布:“there will be no Perplexity Super Bowl ad”。

结果非常具体:根据Appfigures数据,活动带来了50%的日下载量增长,应用商店排名从第257名跃升到第49名。更重要的是,这种方式真正让用户“用起来”,而不是只看一个抽象的AI广告。

主持人评价得很直接:对于那些希望广告能展示AI用例的人来说,Perplexity“actually fulfilled that brief”。在算力和模型之外,如何让用户形成真实使用习惯,可能同样决定一家AI公司的长期价值。

总结

这期节目传递的核心信号很明确:AI竞赛已经进入多维度博弈阶段。DeepSeek试图从“成本创新者”跃迁为AGI挑战者,OpenAI同时在模型、合规和芯片上构筑护城河,而Perplexity则证明应用层依然有聪明的破局方式。对从业者和观察者来说,真正的机会往往藏在这些转折点上——当一家公司开始为监管、硬件和用户行为同时下注时,它已经不再只是做模型了。


关键词: DeepSeek, AGI, 模型蒸馏, OpenAI芯片, Perplexity

事实核查备注: 视频来源:The AI Daily Brief,2025-02-19;DeepSeek招聘方向:AGI、数据专家、深度学习研究员、法律负责人;OpenAI指控涉及蒸馏、API数据外流;引用人物:OpenAI全球事务负责人;芯片信息:Reuters报道,合作方Broadcom,代工TSMC,前Google TPU工程师Richard Ho;Perplexity活动数据来源:Appfigures,下载量增长50%,排名257升至49。