Jeremy Howard谈深度学习入门：别看模型，去训练它

AI PM 编辑部 · 2019年08月28日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

在这段与Lex Fridman的对话中，fast.ai创始人Jeremy Howard给出了与主流路径截然不同的深度学习学习建议：不要停留在看论文或跑推理，而是亲手训练、微调大量模型，并且始终围绕你真正关心的真实问题。

Jeremy Howard谈深度学习入门：别看模型，去训练它

在这段与Lex Fridman的对话中，fast.ai创始人Jeremy Howard给出了与主流路径截然不同的深度学习学习建议：不要停留在看论文或跑推理，而是亲手训练、微调大量模型，并且始终围绕你真正关心的真实问题。

为什么“训练模型”是学习深度学习的唯一路径

对很多初学者来说，深度学习看起来像一门“看懂就会”的学科：理解网络结构、跑一跑现成模型、看看推理结果，似乎就算入门了。但Jeremy Howard从一开始就否定了这种路径。他的建议简单到近乎粗暴：“train lots of models（训练大量模型）——这就是你学习它的方式。”

在他看来，真正的理解不是来自公式或架构图，而是来自反复的实验：打印模型的输入，打印模型的输出，稍微改变输入，再观察输出如何变化。他在fast.ai课程中反复强调这种“手感式学习”，通过大量实验获得对模型行为的直觉认知。他说，这种过程会让人“get hooked（上瘾）”，因为你开始真正看见模型在做什么，而不是抽象地谈论它。

这个观点之所以重要，是因为它直接挑战了学术导向的学习路线。Jeremy并不否认理论的价值，但他认为，如果不通过训练模型建立直觉，理论很容易变成空中楼阁。fast.ai课程本身就是这种理念的体现：它不是从数学推导开始，而是从可运行、可修改、可观察的模型开始。

别只跑推理：为什么“微调你的模型”至关重要

在对话中，Lex Fridman追问了一个初学者常见的误区：如果只是运行已有模型的推理，算不算入门？Jeremy的回答非常明确：“no — you’ve got to fine-tune the models（不行，你必须微调模型）。”

原因很现实：别人的模型不是你的模型。只有当模型在你的数据、你的领域上训练过，它才真正属于你。Jeremy强调，微调并不昂贵，也不复杂——“只需要五分钟”，就可以把一个预训练模型适配到你关心的数据集上。

他用fast.ai课程中的一个经典演示说明这一点：在第二课中，学生会学到如何通过脚本抓取Google图片搜索结果，快速构建自己的数据集。他现场演示了一个区分“teddy bear、grizzly bear 和 brown bear”的计算机视觉模型，数据抓取大约花了四分钟，最终准确率接近100%。课程中还提供了图形化的小组件，用于清洗数据、分析错误样本。

这个案例的价值不在于“熊分类”本身，而在于它向初学者证明了一件事：构建一个可上线的、准确的应用，不需要庞大的团队或长周期研究。关键在于，你是否愿意亲手训练并研究模型的输入和输出。

真实问题的力量：从课堂作业到国家级应用

fast.ai社区中最让Jeremy自豪的，并不是课程本身，而是学生们“分享他们做出来的东西”。他提到，在“Share Your Work”讨论区里，已经有上千条学生回复，展示他们用课程中学到的方法构建的项目。

其中一些成果甚至达到了“state of the art（当前最先进）”水平。有人在第一课之后，就做出了一个比现有学术论文更准确的角色识别模型；也有人做的是更贴近生活的项目，比如一位来自特立尼达和多巴哥的学生，训练了一个可以识别当地蜂鸟种类的模型——那是她国家的象征性鸟类。

这些故事之所以重要，是因为它们揭示了Jeremy对“专家”的重新定义。他直言：“我们不需要更多在所有人都研究的方向上做微小改进的专家。”真正稀缺的，是那些把深度学习应用到具体领域的人——用它诊断疟疾、分析媒体偏见、研究渔业和海洋问题。

在他看来，深度学习是一种通用工具，而真正的壁垒来自领域理解。当你把模型训练能力与你的热情和专业知识结合起来，你几乎必然能比外行做得更好。

研究的终点不是技术本身，而是把问题解决好

在谈到迁移学习、主动学习等前沿研究方向时，Jeremy给出了一个看似朴素、却极具分量的判断：如果你不关心具体问题，你就无法判断自己的研究是否有价值。

他反问道：当结果不好时，你怎么知道是方法的问题、数据的问题，还是问题本身就没定义清楚？如果你不真正理解一个现实问题，就很难判断模型的改进是否“有意义”。因此，他认为“绝大多数真正有趣的研究”，都来自于“尝试把一个真实问题解决得非常好”。

这个观点为很多技术导向的研究者提供了一个反思视角：创新不一定来自更复杂的算法，也可能来自对问题更深的理解。即便你想在迁移学习或其他方法上创新，找到一个你在意的数据集和应用场景，依然是不可替代的起点。

在这段对话的最后，当Lex得知fast.ai所有课程完全免费、没有任何收入来源时，脱口而出一句：“You’re a saint（你是个圣人）。”这句玩笑背后，恰恰体现了Jeremy一以贯之的理念：把工具交到更多真正想解决问题的人手中。

总结

Jeremy Howard给出的路径并不神秘，却极其务实：少一点旁观，多一点亲手训练；少一点抽象讨论，多一点真实问题。无论是入门者还是想成为专家的人，他反复强调的只有一件事——在你关心的领域里，训练、微调并研究大量模型。深度学习不是目的，而是一种放大你专业判断和热情的工具。

关键词：深度学习， fast.ai，模型训练，微调，计算机视觉

事实核查备注：视频来源：Lex Fridman YouTube频道，2019-08-28；演讲者：Jeremy Howard（fast.ai）；关键原话包括“train lots of models”“you’ve got to fine-tune the models”；案例：teddy bear / grizzly bear / brown bear 分类；数据来源示例：Google 图片搜索；课程性质：fast.ai 所有课程免费，无收入来源。

返回文章列表