把图AI变成真金白银：Kumo如何把预测模型“塞进”数据仓库

AI PM 编辑部 · 2025年01月21日 · 5 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 Sequoia AI Ascent 的访谈中，Kumo AI 联合创始人兼工程负责人 Hema Raghavan 讲述了一个核心命题：为什么几乎所有企业天生都拥有“图”，却很少真正从图神经网络中获得 ROI。她分享了 Kumo 的产品哲学——让复杂的图学习对业务透明，同时又为资深数据科学家保留“掀开引擎盖”的自由。

把图AI变成真金白银：Kumo如何把预测模型“塞进”数据仓库

在这期 Sequoia AI Ascent 的访谈中，Kumo AI 联合创始人兼工程负责人 Hema Raghavan 讲述了一个核心命题：为什么几乎所有企业天生都拥有“图”，却很少真正从图神经网络中获得 ROI。她分享了 Kumo 的产品哲学——让复杂的图学习对业务透明，同时又为资深数据科学家保留“掀开引擎盖”的自由。

为什么大多数企业，其实早就活在“图”里

理解 Kumo 的切入点，首先要回答一个看似基础却被长期忽视的问题：什么是图？Hema 在访谈中反复强调，图并不是社交网络的专属。“你不需要是一个社交网络公司，”她说，“几乎我认识的每一家企业，都已经有一张图。”客户、账户、交易、设备、内容、广告位，这些实体之间的关系，本质上天然构成了图结构。

之所以重要，是因为企业里的关键预测问题——欺诈、流失、推荐、风控——几乎都依赖关系，而不是孤立的行。传统机器学习往往把这些关系“压扁”成特征工程，代价是复杂、脆弱、难以维护。Hema 用一个极其直观的方式解释给“5 岁小孩”听：我们不是先人工决定哪些关系重要，而是把所有关系都交给模型，让它自己学会什么重要。

这也是她的核心判断之一：图不是一种特殊数据类型，而是“最通用的数据类型”。正因为企业一直在用关系型表存储数据，才让人误以为自己没有图，而 Kumo 要做的，是把这层结构重新释放出来。

AutoML + 数据仓库：把图神经网络藏在引擎盖下

Kumo 最有意思的地方，不在于它“会做图神经网络”，而在于它刻意让用户不必关心这一点。Hema 描述产品时用了一个反复出现的比喻：“我们会给你一辆自动驾驶的车。”如果你的数据已经以关系型表的形式存在，Kumo 只需要通过连接器读入数据，理解 schema，用户就可以直接开始写预测查询。

在这个过程中，图被完全抽象掉了。对业务团队来说，体验更像是在数据仓库上写 SQL，而不是在调一个研究级别的 GNN 系统。但这并不意味着能力被阉割。Hema 紧接着补了一句：“如果你想看引擎盖下面，或者你想开手动挡，我们也允许。”对那些“喜欢调神经网络参数的数据科学家”，系统依然开放。

这一设计背后的洞见很现实：图学习之所以难以落地，并不是效果不好，而是工程成本和组织成本太高。Kumo 选择把复杂性集中在平台内部，用 AutoML 的方式在数据仓库之上持续学习和更新关系特征，从而把图 AI 变成一项可重复、可规模化的能力。

从 Transformer 到图神经网络：预测式 AI 的另一条路线

在访谈中，Hema 多次把 Kumo 的技术路线与 Transformer 以及大语言模型作比较。她明确提到，Kumo 正在把 Transformer 的思想“带到预测型 AI 问题中”。这里的关键不在生成，而在表示学习：模型不是手工设计特征，而是在图上自动学习节点和关系的表示。

她把图神经网络称为“最通用的神经网络”，原因很直接：现实世界并不是线性序列。“我不认为人类大脑是线性序列连起来的，”她说，而图更接近真实世界中信息的组织方式。正因为如此，图模型天然适合处理跨表、跨实体、跨时间的复杂依赖。

这一点也解释了她对传统特征工程的态度。Kumo 的系统会在训练过程中不断“发现”新特征，而不是一次性固定下来。正如她确认的那样：模型会随着时间学习和优化关系结构本身。这不是一个静态的 pipeline，而是一个持续演化的预测系统。

ROI、可解释性与“少一点幻觉”的现实挑战

当话题转向 ROI 和企业落地时，访谈的重心明显变得务实。Hema 反复提到，企业真正关心的是成本、规模和稳定性。Kumo 强调的是在“我们所做的规模”和“我们所做的成本”下，实现图学习的可行性，这也是图 AI 长期难以商业化的关键瓶颈。

她还主动把话题引向当下热门的大语言模型，并指出一个重要差异：预测型 AI 的输出空间是受约束的，因此天然更容易控制“幻觉”。在讨论可解释性 AI 时，她强调，在高风险领域，这并不是锦上添花，而是进入市场的前提条件。

最后，当被问及长期愿景时，Hema 描绘的是一个平台化的未来：Kumo 成为“分析大脑”，而真正的应用——广告、推荐、风控、内容分发——构建在它之上。这既是技术判断，也是她多年在 AI 系统落地中的经验总结。

总结

这场访谈的价值，不在于介绍了一种新模型，而在于提供了一种落地图 AI 的现实路径：承认企业天然拥有图，接受复杂性不可避免，然后用产品和系统设计把复杂性隔离起来。对读者而言，最大的启发或许是：真正决定 AI ROI 的，从来不只是模型能力，而是它能否被普通团队持续、低成本地使用。

关键词：图神经网络， AutoML，数据仓库，预测型AI， Transformer

事实核查备注： Hema Raghavan：Kumo AI 联合创始人兼工程负责人；Kumo AI：构建在数据仓库之上的预测型 AutoML 与图学习平台；核心技术概念：图神经网络（GNN）、Transformer、AutoML；关键比喻原话："self-driving car"、"explain it to me like I'm 5"、人类大脑不是线性序列；讨论话题包含：ROI、幻觉（hallucination）、可解释性 AI。

返回文章列表