Glean CEO解密企业搜索:为什么AI助理的胜负在“看不见的底层”

AI PM 编辑部 · 2024年10月29日 · 14 阅读 · AI/人工智能

正在加载视频...

视频章节

在这场访谈中,Glean 联合创始人兼 CEO Arvind Jain 详细讲述了企业搜索为何是 AI at Work 最难、也最关键的一环,以及他们如何在大模型之前就打好“数据、权限和排序”的地基。这不仅是一个产品故事,更是一套关于企业级 AI 如何真正落地的方法论。

Glean CEO解密企业搜索:为什么AI助理的胜负在“看不见的底层”

在这场访谈中,Glean 联合创始人兼 CEO Arvind Jain 详细讲述了企业搜索为何是 AI at Work 最难、也最关键的一环,以及他们如何在大模型之前就打好“数据、权限和排序”的地基。这不仅是一个产品故事,更是一套关于企业级 AI 如何真正落地的方法论。

为什么“企业搜索”成了 AI at Work 的决胜点

理解 Glean 的价值,首先要理解一个现实:企业里的知识,并不缺,而是“找不到”。Arvind Jain 在访谈一开始就抛出了一个判断:“今天我们做的大多数工作,五年后都不会再由人来完成。”这句话的前提,是每个员工都会拥有一个真正理解公司内部信息的 AI 助理。

这正是 Glean 想解决的问题。Jain 用一个非常直观的类比解释产品定位:“把 Glean 想成是企业内部的 Google,或者 ChatGPT。”区别在于,它不是面向互联网,而是面向公司内部所有分散、异构、权限复杂的知识系统。

他特别提到,‘Google for Work’几乎是每一个 CIO 的“圣杯”——不是再造一个聊天机器人,而是让企业多年沉淀下来的文档、邮件、Wiki、工单和代码真正变得可搜索、可理解、可被 AI 使用。这件事听起来简单,但难度远高于大众对搜索或对话式 AI 的想象。

看不见但最难的部分:在 LLM 之前完成的“苦活累活”

当外界把注意力集中在大语言模型时,Jain 反复强调:真正决定企业 AI 体验好坏的工作,大多发生在 LLM 之前。“我们必须先完成所有这些工作,才能真正开始用大模型做任何事情。”

这些“工作”包括什么?首先是数据连接与规范化——企业内部的信息分布在无数系统中,结构各异、质量不一。其次是权限模型:谁能看到什么,取决于组织结构、项目、时间和合规要求。哪怕回答内容完全正确,只要权限错了,在企业环境中就是致命问题。

更关键的是排序(ranking)。当员工提问时,系统并不是简单返回‘相关文档列表’,而是要判断:对“这个人”“在此刻”“最有价值的知识是什么”。Jain 明确指出,排名系统越好,AI 体验的上限就越高,而这正是通用大模型无法替企业定制完成的部分。

企业搜索与 RAG:不是新概念,而是长期工程

在谈到 RAG(检索增强生成,Retrieval-Augmented Generation)时,Jain 的态度非常务实。他并没有把 RAG 描述成某种突破性“新魔法”,而是把它看作企业搜索长期演进的自然结果。

他的核心观点是:RAG 的效果,直接取决于底层检索系统的质量。如果检索本身不理解上下文、不懂权限、不知道什么更重要,那么再强的生成模型,也只是在“优雅地胡说”。

这也是为什么 Glean 先把大量精力投入到搜索、索引和排序上,再去谈生成式 AI 体验。企业搜索解决的是“找到什么”,RAG 决定的是“怎么说出来”。两者共同作用,才可能带来 Jain 所说的“更好的 AI 体验”,而不是一次性 demo。

从‘能用’到‘离不开’:北极星指标与真实使用

如何判断一个企业级 AI 产品真的成功了?Jain 给出的标准非常简单,也非常苛刻:是不是“全公司的人都在用”。他提到,当 Glean 在客户公司内部运行时,能明显看到员工在日常工作中高频依赖它来获取信息,而不是被强制试用。

但即便如此,他依然保持着极强的克制。谈到北极星指标(North Star Metric)时,Jain 直言不讳地说:“我们可能只走了 2%。”这不是谦虚,而是一种对长期目标的清醒认知——距离真正覆盖大多数知识工作,还有巨大的空间。

这种判断也解释了为什么 Glean 并没有急于把自己包装成‘全能 AI 员工’,而是持续聚焦在一个看似狭窄、但极其坚实的切入口上。

Agentic Reasoning 的前提:别被‘炫技工作流’带偏

在访谈后半段,话题转向当前非常热门的 Agentic Reasoning(智能体推理)和复杂工作流。Jain 的态度依然保持一贯的克制和现实主义。

他的建议是:不要先迷恋 act one 如何接 act two,而是把全部注意力放在业务问题本身。复杂的多步骤 Agent,只有在对知识、上下文和目标理解足够扎实时,才不会变成不稳定的自动化噩梦。

展望五到十年后,Jain 描绘的并不是一个炫技的超级机器人,而是“世界上最成功的 AI 助理”——它深度嵌入工作流,安静、高效、值得信任。这种愿景,本质上仍然建立在企业搜索、理解和排序这些基础能力之上。

总结

这场访谈最有价值的地方,不在于对未来的宏大想象,而在于对现实约束的清醒认知。Arvind Jain 反复强调:企业级 AI 的竞争,不是模型参数之争,而是谁更愿意、也更有能力,把那些枯燥、缓慢、看不见的基础工作做到极致。对创业者和产品人来说,这既是一个警告,也是一个机会——真正的护城河,往往藏在最不性感的地方。


关键词: 企业搜索, Glean, RAG, AI at Work, AI Agent

事实核查备注: Arvind Jain:Glean 联合创始人兼 CEO;Glean 被描述为企业内部的 Google / ChatGPT;“Google for Work”被 CIO 视为圣杯;RAG 指检索增强生成(Retrieval-Augmented Generation);提到北极星指标时使用了“only 2% of the way there”的表述;涉及概念包括大语言模型(LLMs)、Agentic Reasoning、企业级权限与排序系统。