从混沌到秩序:Chollet回忆Keras与TensorFlow的诞生

AI PM 编辑部 · 2019年10月08日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

这篇文章梳理了François Chollet在Lex Fridman播客中,对Keras与TensorFlow早期历史的亲述视角。你将看到深度学习框架如何从混乱中生长、个人兴趣如何意外改变行业,以及研究者走向工程化浪潮的关键转折。

从混沌到秩序:Chollet回忆Keras与TensorFlow的诞生

这篇文章梳理了François Chollet在Lex Fridman播客中,对Keras与TensorFlow早期历史的亲述视角。你将看到深度学习框架如何从混乱中生长、个人兴趣如何意外改变行业,以及研究者走向工程化浪潮的关键转折。

为什么早期深度学习需要“新的工具”

理解Keras的诞生,首先要回到2013—2014年前后的深度学习生态。Chollet在对话中提到,当时“caffe was the one library that everyone was using for computer vision”,计算机视觉是最热门的问题领域,而Caffe几乎是事实标准。这一点很重要,因为它解释了一个背景:工具是为特定问题而生的,而不是为“通用研究体验”设计的。

在那个阶段,深度学习框架高度碎片化,每个库都服务于某一类研究者或任务。Chollet形容这是一种从“philosophical to the practical”的过渡——研究理念快速前进,但实际开发体验却跟不上。这种张力,正是后来Keras出现的土壤。

他并没有一开始就试图“改变行业”。相反,Keras最初更像是一个个人项目,用来让自己能更快地实验模型想法。这一点为后文的转折埋下伏笔:很多影响深远的工具,起点并不是宏大的战略,而是对日常痛点的直接回应。

Keras的意外走红:从个人需求到社区共识

Chollet回忆自己在2014年末开始认真使用并打磨Keras时,用了一个很有感染力的词来形容体验:“it's magical”。这里的“魔法感”并不是性能突破,而是一种开发者体验——模型搭建变得直观、可读,甚至令人愉悦。

更有意思的是,Keras并非一开始就计划成为主流框架。他在播客中坦言,这个项目源自“desire to implement our hands”,一种非常个人化、偏研究者的动机。但正是这种专注于“人如何思考模型”的设计哲学,让越来越多研究者产生共鸣。

Lex Fridman在对话中也表现出惊讶,Chollet回应说自己同样没预料到Keras会成长得这么快。“so it grew from there”,从一个小工具,逐渐演变为被大量研究者和工程师采用的接口层。这一过程本身,就是深度学习社区需求变化的缩影。

加入Google:当个人项目遇上工业级框架

真正的转折点出现在Chollet加入Google之后。他提到,在那之后,“eventually you know tensorflow overtook it right”。这里的“it”,指的是此前生态中占主导的一批框架。TensorFlow的出现,标志着深度学习开始全面进入工业化阶段。

这并不是一次突兀的替代,而是一次“natural transition”。随着研究规模、数据规模和工程复杂度的提升,单纯服务研究者的小而美工具,开始需要与更强大的底层系统结合。Keras在这一阶段逐渐成为TensorFlow之上的高层接口,这既保留了“魔法般”的易用性,也顺应了工业需求。

Chollet的叙述中,没有胜负叙事,更多是一种时代变化的记录:当环境变了,工具也必须随之进化。对今天的技术人来说,这是一个关于适应而非固守的现实提醒。

研究者身份的改变,以及未竟的AGI问题

在时间线推进到2016年左右时,Chollet提到自己在“maybe October 2016”之后,已经很少回到过去那种纯粹的研究节奏。“I've never actually gotten back to my old sim doing research”,这句话透露出一种复杂心态。

他开始面对的问题,已经不只是模型本身,而是如何服务“from researchers to data scientists and everything in between”。也就是说,工具的设计对象从少数研究者,扩展到了一个极其多样化的人群。

这种角色变化,也为对话最终回到通用人工智能(AGI)埋下伏笔。Keras和TensorFlow的历史,不只是框架演进史,更是一个研究者在现实约束中不断调整目标的故事:在理想、工程与社区之间寻找平衡。

总结

从Chollet的回忆可以看到,Keras与TensorFlow的成功并非单点突破,而是一连串“顺势而为”的结果:从个人痛点出发,因社区需求放大,最终融入工业体系。对读者的启发在于,真正有生命力的技术,往往诞生于具体问题之中,并在不断妥协与演化中走向成熟。


关键词: Keras, TensorFlow, 深度学习框架, 计算机视觉, 通用人工智能

事实核查备注: 视频来源:Lex Fridman Podcast(2019-10-08);提及人物:François Chollet;技术与框架:Keras、TensorFlow、Caffe;时间节点:2014年末(Keras早期)、2016年10月左右(角色转变);公司:Google;引用原话包括“caffe was the one library that everyone was using for computer vision”“it's magical”“eventually you know tensorflow overtook it right”“I've never actually gotten back to my old sim doing research”。