把图AI变成真金白银:Kumo如何把预测模型“塞进”数据仓库
正在加载视频...
视频章节
在这期 Sequoia AI Ascent 的访谈中,Kumo AI 联合创始人兼工程负责人 Hema Raghavan 讲述了一个核心命题:为什么几乎所有企业天生都拥有“图”,却很少真正从图神经网络中获得 ROI。她分享了 Kumo 的产品哲学——让复杂的图学习对业务透明,同时又为资深数据科学家保留“掀开引擎盖”的自由。
把图AI变成真金白银:Kumo如何把预测模型“塞进”数据仓库
在这期 Sequoia AI Ascent 的访谈中,Kumo AI 联合创始人兼工程负责人 Hema Raghavan 讲述了一个核心命题:为什么几乎所有企业天生都拥有“图”,却很少真正从图神经网络中获得 ROI。她分享了 Kumo 的产品哲学——让复杂的图学习对业务透明,同时又为资深数据科学家保留“掀开引擎盖”的自由。
为什么大多数企业,其实早就活在“图”里
理解 Kumo 的切入点,首先要回答一个看似基础却被长期忽视的问题:什么是图?Hema 在访谈中反复强调,图并不是社交网络的专属。“你不需要是一个社交网络公司,”她说,“几乎我认识的每一家企业,都已经有一张图。”客户、账户、交易、设备、内容、广告位,这些实体之间的关系,本质上天然构成了图结构。
之所以重要,是因为企业里的关键预测问题——欺诈、流失、推荐、风控——几乎都依赖关系,而不是孤立的行。传统机器学习往往把这些关系“压扁”成特征工程,代价是复杂、脆弱、难以维护。Hema 用一个极其直观的方式解释给“5 岁小孩”听:我们不是先人工决定哪些关系重要,而是把所有关系都交给模型,让它自己学会什么重要。
这也是她的核心判断之一:图不是一种特殊数据类型,而是“最通用的数据类型”。正因为企业一直在用关系型表存储数据,才让人误以为自己没有图,而 Kumo 要做的,是把这层结构重新释放出来。
AutoML + 数据仓库:把图神经网络藏在引擎盖下
Kumo 最有意思的地方,不在于它“会做图神经网络”,而在于它刻意让用户不必关心这一点。Hema 描述产品时用了一个反复出现的比喻:“我们会给你一辆自动驾驶的车。”如果你的数据已经以关系型表的形式存在,Kumo 只需要通过连接器读入数据,理解 schema,用户就可以直接开始写预测查询。
在这个过程中,图被完全抽象掉了。对业务团队来说,体验更像是在数据仓库上写 SQL,而不是在调一个研究级别的 GNN 系统。但这并不意味着能力被阉割。Hema 紧接着补了一句:“如果你想看引擎盖下面,或者你想开手动挡,我们也允许。”对那些“喜欢调神经网络参数的数据科学家”,系统依然开放。
这一设计背后的洞见很现实:图学习之所以难以落地,并不是效果不好,而是工程成本和组织成本太高。Kumo 选择把复杂性集中在平台内部,用 AutoML 的方式在数据仓库之上持续学习和更新关系特征,从而把图 AI 变成一项可重复、可规模化的能力。
从 Transformer 到图神经网络:预测式 AI 的另一条路线
在访谈中,Hema 多次把 Kumo 的技术路线与 Transformer 以及大语言模型作比较。她明确提到,Kumo 正在把 Transformer 的思想“带到预测型 AI 问题中”。这里的关键不在生成,而在表示学习:模型不是手工设计特征,而是在图上自动学习节点和关系的表示。
她把图神经网络称为“最通用的神经网络”,原因很直接:现实世界并不是线性序列。“我不认为人类大脑是线性序列连起来的,”她说,而图更接近真实世界中信息的组织方式。正因为如此,图模型天然适合处理跨表、跨实体、跨时间的复杂依赖。
这一点也解释了她对传统特征工程的态度。Kumo 的系统会在训练过程中不断“发现”新特征,而不是一次性固定下来。正如她确认的那样:模型会随着时间学习和优化关系结构本身。这不是一个静态的 pipeline,而是一个持续演化的预测系统。
ROI、可解释性与“少一点幻觉”的现实挑战
当话题转向 ROI 和企业落地时,访谈的重心明显变得务实。Hema 反复提到,企业真正关心的是成本、规模和稳定性。Kumo 强调的是在“我们所做的规模”和“我们所做的成本”下,实现图学习的可行性,这也是图 AI 长期难以商业化的关键瓶颈。
她还主动把话题引向当下热门的大语言模型,并指出一个重要差异:预测型 AI 的输出空间是受约束的,因此天然更容易控制“幻觉”。在讨论可解释性 AI 时,她强调,在高风险领域,这并不是锦上添花,而是进入市场的前提条件。
最后,当被问及长期愿景时,Hema 描绘的是一个平台化的未来:Kumo 成为“分析大脑”,而真正的应用——广告、推荐、风控、内容分发——构建在它之上。这既是技术判断,也是她多年在 AI 系统落地中的经验总结。
总结
这场访谈的价值,不在于介绍了一种新模型,而在于提供了一种落地图 AI 的现实路径:承认企业天然拥有图,接受复杂性不可避免,然后用产品和系统设计把复杂性隔离起来。对读者而言,最大的启发或许是:真正决定 AI ROI 的,从来不只是模型能力,而是它能否被普通团队持续、低成本地使用。
关键词: 图神经网络, AutoML, 数据仓库, 预测型AI, Transformer
事实核查备注: Hema Raghavan:Kumo AI 联合创始人兼工程负责人;Kumo AI:构建在数据仓库之上的预测型 AutoML 与图学习平台;核心技术概念:图神经网络(GNN)、Transformer、AutoML;关键比喻原话:"self-driving car"、"explain it to me like I'm 5"、人类大脑不是线性序列;讨论话题包含:ROI、幻觉(hallucination)、可解释性 AI。