他把生成模型从“堆积木”,推向了连续时间:一场被低估的效率革命
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
如果你以为生成模型的效率问题只能靠“堆更多层”,那这场 2018 年的 OpenAI 分享会会直接打脸。Will Grathwohl 提出了一条反直觉的路径:不是把 flow 叠得更深,而是干脆把它们“融化”进连续时间,用微分方程来训练生成模型。
这场由CMU教授Ruslan Salakhutdinov主讲的演讲,系统梳理了无监督深度学习的发展脉络。从早期的稀疏编码、自编码器,到生成模型与GAN,他反复追问一个核心问题:在没有标签的情况下,我们是否真的能学到有用的表示?
FAL 的 Gorkem Yurtseven 以亲历者视角回顾了生成式媒体从早期实验到全面爆发的过程,提出“创作的边际成本正在逼近零”的判断,并结合广告、电商与视频等行业,勾勒出生成式媒体即将带来的结构性变化。
Lexica 创始人 Sharif Shameem 在一次演讲中提出了一个反直觉但极具力量的观点:真正推动生成式 AI 和技术突破的,并不是宏大的路线图,而是持续的好奇心与具体可感的 Demo。这篇文章还原他的核心论点、关键案例与方法论,解释为什么“跟着好奇心做 Demo”可能是 2025 年最重要的工程能力。
这是一场由 ComfyUI 原作者 ComfyAnonymous 亲自讲述的完整工作坊。从个人项目的诞生,到被数百万创作者和大厂采用,再到节点式工作流为何能承载生成式 AI 的未来,这场演讲给出了许多只有一线开发者才能说出的真实判断。
这是一次罕见的内部视角分享:Google Photos 工程师 Kelvin Ma 讲述了 Magic Editor 等功能背后的技术演进与真实取舍。从传统计算摄影到生成式 AI,从云端到端侧,这个拥有 15 亿月活用户的产品,如何在“好看、可控、可规模化”之间做选择。
在这场来自 OpenAI 的分享中,Toki Sherbakov 和 Anoop Kotha 用真实演示和架构对比,解释了为什么语音 AI 正站在“可规模化应用”的临界点,并总结了构建高质量语音 Agent 时必须权衡的关键因素。
在生成式AI和提示工程席卷产品开发的当下,John Pham给出了一个反直觉的判断:好设计的原则从未改变。这场演讲通过真实产品案例,拆解了速度、信任、可访问性与愉悦感,展示了如何把用户变成“超级粉丝”。