Jeremy Howard谈深度学习入门:别看模型,去训练它

AI PM 编辑部 · 2019年08月28日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

在这段与Lex Fridman的对话中,fast.ai创始人Jeremy Howard给出了与主流路径截然不同的深度学习学习建议:不要停留在看论文或跑推理,而是亲手训练、微调大量模型,并且始终围绕你真正关心的真实问题。

Jeremy Howard谈深度学习入门:别看模型,去训练它

在这段与Lex Fridman的对话中,fast.ai创始人Jeremy Howard给出了与主流路径截然不同的深度学习学习建议:不要停留在看论文或跑推理,而是亲手训练、微调大量模型,并且始终围绕你真正关心的真实问题。

为什么“训练模型”是学习深度学习的唯一路径

对很多初学者来说,深度学习看起来像一门“看懂就会”的学科:理解网络结构、跑一跑现成模型、看看推理结果,似乎就算入门了。但Jeremy Howard从一开始就否定了这种路径。他的建议简单到近乎粗暴:“train lots of models(训练大量模型)——这就是你学习它的方式。”

在他看来,真正的理解不是来自公式或架构图,而是来自反复的实验:打印模型的输入,打印模型的输出,稍微改变输入,再观察输出如何变化。他在fast.ai课程中反复强调这种“手感式学习”,通过大量实验获得对模型行为的直觉认知。他说,这种过程会让人“get hooked(上瘾)”,因为你开始真正看见模型在做什么,而不是抽象地谈论它。

这个观点之所以重要,是因为它直接挑战了学术导向的学习路线。Jeremy并不否认理论的价值,但他认为,如果不通过训练模型建立直觉,理论很容易变成空中楼阁。fast.ai课程本身就是这种理念的体现:它不是从数学推导开始,而是从可运行、可修改、可观察的模型开始。

别只跑推理:为什么“微调你的模型”至关重要

在对话中,Lex Fridman追问了一个初学者常见的误区:如果只是运行已有模型的推理,算不算入门?Jeremy的回答非常明确:“no — you’ve got to fine-tune the models(不行,你必须微调模型)。”

原因很现实:别人的模型不是你的模型。只有当模型在你的数据、你的领域上训练过,它才真正属于你。Jeremy强调,微调并不昂贵,也不复杂——“只需要五分钟”,就可以把一个预训练模型适配到你关心的数据集上。

他用fast.ai课程中的一个经典演示说明这一点:在第二课中,学生会学到如何通过脚本抓取Google图片搜索结果,快速构建自己的数据集。他现场演示了一个区分“teddy bear、grizzly bear 和 brown bear”的计算机视觉模型,数据抓取大约花了四分钟,最终准确率接近100%。课程中还提供了图形化的小组件,用于清洗数据、分析错误样本。

这个案例的价值不在于“熊分类”本身,而在于它向初学者证明了一件事:构建一个可上线的、准确的应用,不需要庞大的团队或长周期研究。关键在于,你是否愿意亲手训练并研究模型的输入和输出。

真实问题的力量:从课堂作业到国家级应用

fast.ai社区中最让Jeremy自豪的,并不是课程本身,而是学生们“分享他们做出来的东西”。他提到,在“Share Your Work”讨论区里,已经有上千条学生回复,展示他们用课程中学到的方法构建的项目。

其中一些成果甚至达到了“state of the art(当前最先进)”水平。有人在第一课之后,就做出了一个比现有学术论文更准确的角色识别模型;也有人做的是更贴近生活的项目,比如一位来自特立尼达和多巴哥的学生,训练了一个可以识别当地蜂鸟种类的模型——那是她国家的象征性鸟类。

这些故事之所以重要,是因为它们揭示了Jeremy对“专家”的重新定义。他直言:“我们不需要更多在所有人都研究的方向上做微小改进的专家。”真正稀缺的,是那些把深度学习应用到具体领域的人——用它诊断疟疾、分析媒体偏见、研究渔业和海洋问题。

在他看来,深度学习是一种通用工具,而真正的壁垒来自领域理解。当你把模型训练能力与你的热情和专业知识结合起来,你几乎必然能比外行做得更好。

研究的终点不是技术本身,而是把问题解决好

在谈到迁移学习、主动学习等前沿研究方向时,Jeremy给出了一个看似朴素、却极具分量的判断:如果你不关心具体问题,你就无法判断自己的研究是否有价值。

他反问道:当结果不好时,你怎么知道是方法的问题、数据的问题,还是问题本身就没定义清楚?如果你不真正理解一个现实问题,就很难判断模型的改进是否“有意义”。因此,他认为“绝大多数真正有趣的研究”,都来自于“尝试把一个真实问题解决得非常好”。

这个观点为很多技术导向的研究者提供了一个反思视角:创新不一定来自更复杂的算法,也可能来自对问题更深的理解。即便你想在迁移学习或其他方法上创新,找到一个你在意的数据集和应用场景,依然是不可替代的起点。

在这段对话的最后,当Lex得知fast.ai所有课程完全免费、没有任何收入来源时,脱口而出一句:“You’re a saint(你是个圣人)。”这句玩笑背后,恰恰体现了Jeremy一以贯之的理念:把工具交到更多真正想解决问题的人手中。

总结

Jeremy Howard给出的路径并不神秘,却极其务实:少一点旁观,多一点亲手训练;少一点抽象讨论,多一点真实问题。无论是入门者还是想成为专家的人,他反复强调的只有一件事——在你关心的领域里,训练、微调并研究大量模型。深度学习不是目的,而是一种放大你专业判断和热情的工具。


关键词: 深度学习, fast.ai, 模型训练, 微调, 计算机视觉

事实核查备注: 视频来源:Lex Fridman YouTube频道,2019-08-28;演讲者:Jeremy Howard(fast.ai);关键原话包括“train lots of models”“you’ve got to fine-tune the models”;案例:teddy bear / grizzly bear / brown bear 分类;数据来源示例:Google 图片搜索;课程性质:fast.ai 所有课程免费,无收入来源。