Karpathy 用1小时拆穿 ChatGPT：它并不“懂”，却比你想象更危险

AI PM 编辑部 · 2025年02月05日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为 ChatGPT 是在“理解”你，那这正是最大误解。Andrej Karpathy 用一场长达一小时的 Deep Dive，把大语言模型从神话拉回工程现实：它只是一个在模仿人类的统计机器，但正是这种“不会思考的系统”，正在重塑整个软件世界。

如果你以为 ChatGPT 是在“理解”你，那这正是最大误解。Andrej Karpathy 用一场长达一小时的 Deep Dive，把大语言模型从神话拉回工程现实：它只是一个在模仿人类的统计机器，但正是这种“不会思考的系统”，正在重塑整个软件世界。

Karpathy 在视频一开始就抛出一个足以让很多 AI 从业者不安的事实：ChatGPT 并不是在理解问题、推理答案，而是在做一件极其单一却被放大到极致的事情——预测下一个 Token。

听起来像是老生常谈，但真正反直觉的地方在于：整个大语言模型的能力上限，几乎都来自这个看似“愚蠢”的目标函数。在预训练阶段，模型面对的是海量互联网文本，它唯一的任务就是：在给定上下文的情况下，猜下一个最可能出现的 Token。

没有事实校验，没有价值判断，更没有“我懂了”。Karpathy 强调，这更像是一种“高维统计模仿”——模型学到的不是世界本身，而是人类在文本中如何谈论世界。也正因为如此，LLM 在语言上表现得异常聪明，却在逻辑、事实一致性上时常翻车。

如果说 ChatGPT 的魔法来自哪里，Karpathy 的答案非常直接：预训练。

在这一阶段，几乎没有“产品思维”，只有工程规模。模型被丢进一个由网页、书籍、代码、对话构成的文本宇宙中，通过神经网络去内化语言的结构、节奏和关联方式。重要的不是单条数据，而是规模本身。

Karpathy 特别点出一个常被忽略的事实：预训练阶段决定了模型的上限，而后续所有精细化调教，只是在这个上限内做修饰。这也是为什么真正有能力训练前沿模型的公司，往往是那些能负担巨型数据中心、电力和算力成本的玩家。

从研究者视角看，训练一个 LLM 更像是在“监控一场缓慢成型的生命体”：loss 曲线是否稳定、梯度是否爆炸、模型是否开始产生连贯文本——这些才是日常，而不是科幻。

在解释 LLM 心理学时，Karpathy 给了一个极其有用的类比：上下文窗口，就是模型的工作记忆。

所有输入文本都会被切分成 Token——这些 Token 是模型世界里的“原子”。模型并不知道“句子”或“段落”，它只看到一长串 Token ID。在给定上下文窗口大小内，模型能利用这些 Token 进行预测；一旦超出窗口，之前的信息就像从大脑中被抹去。

这也解释了很多真实使用中的怪异现象：模型前后自相矛盾、长对话后逐渐偏离主题，并不是“变笨了”，而是工作记忆耗尽了。Karpathy 的隐含提醒是：LLM 的智能不是持续的，而是瞬时的——每一次生成，都是在有限上下文中的一次性计算。

当话题进入 Transformer，Karpathy 的态度反而异常冷静。在他看来，Transformer 架构本身已经被讲过无数次，真正重要的是：它如何在规模化训练中表现。

自注意力机制让模型能在上下文中“看向”任何位置，这使得长距离依赖成为可能。但代价是计算成本随上下文长度快速增长。于是，研究者每天面对的现实问题不是“原理对不对”，而是“今天能不能跑完一轮训练”。

Karpathy 分享的研究者视角非常接地气：大部分时间并不是在发明新算法，而是在调学习率、看训练曲线、排查数值不稳定。这种持续数周甚至数月的训练过程，本质上是一种工程耐力赛。

视频后半段，Karpathy 特意澄清了一个行业内也常被误解的概念：RLHF 不是传统意义上的强化学习。

在这个阶段，模型已经具备流畅生成文本的能力，但输出往往不符合人类期望。于是，人类标注者被引入，对模型回答进行排序和偏好判断。模型并不是学会“什么是对的”，而是学会“什么样的回答更像一个被人类喜欢的助手”。

Karpathy 直言，这一过程的本质是：让模型更像在模仿人类标注者，而不是模仿真实世界。这既解释了 ChatGPT 的礼貌、克制与安全感，也解释了它有时显得过于圆滑、缺乏立场。

Karpathy 这一小时的 Deep Dive，真正的价值不在于教会你 Transformer 或 RLHF 的细节，而是帮你建立一个清醒的心智模型：大语言模型不是会思考的实体，而是被规模、数据和人类偏好塑造出来的统计系统。

对从业者而言，这意味着两件事：第一，不要神化模型，把问题归因到“不够聪明”；第二，真正的竞争力往往不在算法，而在数据、算力和对人类行为的理解。未来的突破，可能不是更大的模型，而是更清楚地知道，我们到底在让模型模仿谁。

关键词：大语言模型， ChatGPT，预训练， Transformer，人类反馈强化学习

事实核查备注：需要核查：视频发布时间（2025-02-05）、作者 Andrej Karpathy、视频标题与链接、RLHF 与传统强化学习的区分表述是否与原视频原话一致