当机器学习成为画笔:Google Brain如何设计创意工具

AI PM 编辑部 · 2019年09月13日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一场来自 Google Brain 的分享,主题不是更强的模型,而是如何把机器学习变成艺术家和设计师真正愿意用的创意工具。David Ha 和 Adam Roberts 通过具体项目,讲述了他们在生成式模型、数据集设计和人机协作上的思考,揭示了创意型 AI 与传统 ML 应用的本质差异。

当机器学习成为画笔:Google Brain如何设计创意工具

这是一场来自 Google Brain 的分享,主题不是更强的模型,而是如何把机器学习变成艺术家和设计师真正愿意用的创意工具。David Ha 和 Adam Roberts 通过具体项目,讲述了他们在生成式模型、数据集设计和人机协作上的思考,揭示了创意型 AI 与传统 ML 应用的本质差异。

为什么“创意工具”是机器学习里最难的一类应用

演讲一开始,David Ha 就半开玩笑地说自己有点紧张,因为台下“机器学习专家可能比台上还多”。这句话并不是客套,而是点出了这场分享的立场:他们并不是来展示复杂的新算法,而是讨论一件在 ML 社区里反而常被低估的事——如何把机器学习用在创意工具上。

在他们看来,创意工具和传统 ML 产品(比如分类、预测)最大的不同,在于“没有标准答案”。艺术家和设计师并不是要模型给出最优解,而是希望它提供启发、变化和意外。正因如此,评价指标、训练目标乃至交互方式,都不能照搬工业级 ML 的那一套。

David Ha 明确提到,这类工作往往显得“很 trivial”,但真正难的是让模型在不取代人的情况下,成为创作过程中的合作者。这也是 Google Brain 内部,尤其是 Magenta 项目长期关注的方向:机器学习不是自动化创作,而是扩展人的创造力。

从 Google Brain 到 Magenta:研究者为何转向艺术与设计

两位演讲者都来自 Google Brain,这是一个以基础研究著称的团队。但在 Brain 内部,很早就出现了一个看似“离经叛道”的方向:用机器学习研究音乐、绘画和其他创意行为。

他们提到,Magenta 并不是一个独立在外的“艺术实验室”,而是 Brain 内部研究的一部分。这意味着,同样的生成模型、序列建模方法,也被用来探索旋律、节奏和视觉形式。这种背景解释了为什么他们关注的问题,不是模型是否更大,而是模型是否“好用”。

在分享中,他们多次强调,研究的目标不是替代艺术家,而是理解创作过程本身。正如他们所暗示的,如果你把创作看成一个不断试探、修改、再理解的过程,那么机器学习最有价值的角色,恰恰是在这些中间步骤上提供支持。

用生成模型“理解”人类涂鸦:Quick, Draw! 的故事

最具体、也最有代表性的案例,是他们关于向量图像生成模型的工作。这项研究使用的数据集,正是后来广为人知的 Quick, Draw! ——一个由全球用户贡献的涂鸦数据集,每一笔都是向量形式,而不是像素。

David Ha 介绍说,他们尝试构建一个生成模型,让机器不仅能“画出”某个物体,还能学习人类绘画的过程。这意味着模型学习的不是结果,而是从第一笔到最后一笔的顺序。这种思路直接影响了后续的 SketchRNN 等工作。

在演示中,他们展示了模型如何在给定部分草图的情况下,继续补全剩余的线条。有时结果合理,有时却出人意料,而正是这种“不完美”让它具备创意工具的潜质。正如演讲中提到的,这些变化“取决于我们如何解读它”,而不是模型是否犯错。

从研究原型到创意应用:意外才是价值所在

随着论文和原型工具发布,他们观察到一个有趣的现象:很多创意用法,并不是研究者最初设计的。有人用这些模型生成不存在的角色,有人把它当成灵感引擎,而不是绘图工具。

演讲中提到,“because we put this paper out earlier”,社区的反馈反而拓展了研究本身的边界。这种自下而上的演化,正是创意型 ML 项目最有生命力的地方。模型一旦开放,就会被放进完全不同的语境中。

在后半段的讨论里,他们还谈到声音和音乐方向的实验,例如把生成模型用于声音结构的探索,而不是简单生成一段‘好听的音乐’。这些案例再次强调了一个核心观点:创意工具的成功,往往来自使用者的重新诠释,而非研究者的预设目标。

总结

这场分享真正有价值的地方,不在于某个具体模型,而在于一种方法论:当机器学习进入创意领域,研究重点必须从“正确性”转向“可对话性”。David Ha 和 Adam Roberts 用自己的实践说明,最好的创意型 AI 往往不会给你答案,而是制造空间,让人产生新的想法。对今天的开发者和产品设计者来说,这或许是比算法本身更重要的启示。


关键词: 机器学习, 生成式AI, Google Brain, Magenta, Quick Draw

事实核查备注: 视频标题:Building creative tools with ML;演讲者:David Ha、Adam Roberts;机构:Google Brain、Magenta;数据集:Quick, Draw!(向量涂鸦数据集);研究方向:生成模型、创意工具;发布时间:2019-09-13