“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面
正在加载视频...
视频章节
上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。
“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面
上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。
所有人都说 RAG 死了,但真相恰恰相反
“RAG is dead.” 这句话你最近一定听过。理由听起来也很合理:模型的上下文窗口已经大到离谱,为什么不把所有数据一股脑塞进去?IBM 的开发者关系工程师 Phil Nash 在开场就给了一个近乎嘲讽的反击——如果你的业务数据不到一百万 token,那也许 RAG 的确没必要;但如果真是这样,可能连你的业务本身都不太成立。
更现实的问题是成本和可持续性。不是每个团队都愿意、也不是每个场景都适合为“每一次提问”支付巨额输入 token 费用。于是,“RAG 已死”的另一层含义浮现出来:不是它没用了,而是大家低估了它的难度,把它误当成一个已经被解决的脚注。
理论上的 RAG 很优雅:切文档、做 embedding、进向量库、Top-K 检索、塞进模型。但 Phil Nash 的态度很明确——这只是幻觉级别的简化。真正的 RAG,远比这套流程图要脏、要难、也要因项目而异。
真正折磨人的,从来不是模型,而是这些细节
如果你真的落地过 RAG 系统,你一定对下面这些痛点会心一笑:PDF 是噩梦,chunk 怎么切永远不对;embedding 模型半年一变,你的旧索引瞬间“过期”;检索效果差一点点,但你又说不清到底差在哪。
而且复杂性是叠加的。为了提升效果,你可能会加:chunk 摘要、chunk 扩展、交叉编码器重排、查询重写……每一个技巧单独看都合理,但组合起来就是一个难以维护、难以评估的系统。
更要命的是,RAG 没有“通用最优解”。每家公司的文档结构不同、用户提问方式不同、使用场景不同。于是,一个在 A 公司表现不错的 RAG pipeline,到了 B 公司可能直接失灵。Phil Nash 点出了一个很多人不愿承认的事实:RAG 的难点,不在于你知不知道方法,而在于你有没有一个足够好的起点和可迭代的基础设施。
OpenRAG 想做的,不是黑魔法,而是高质量底座
这正是 OpenRAG 出现的背景。IBM 没有再造轮子,而是把三个成熟的开源项目组合成一个“可以直接用、又不封死你的”RAG 栈。
在最前端,是 Dockling —— 一个来自 IBM 苏黎世研究院的开源文档处理工具。它不只是“把 PDF 转成文本”,而是针对 HTML、Word、幻灯片、表格,甚至音视频都有不同处理管线。更重要的是,它能基于文档层级结构做 chunking,而不是简单按字符数切,这对检索质量影响极大。
中间层,OpenRAG 对 embedding 几乎不设限制:你可以用 OpenAI,也可以用其他云服务,甚至可以全本地离线跑。向量索引用的是基于 disk 架构的开源方案,这意味着你的索引不必全塞进内存,扩展性更现实。
而把这一切“粘”起来的,是 Langflow。这是一个可视化的 AI 流程编排工具,你可以拖拽式地构建 RAG 和 agent。更有意思的是,OpenRAG 强调 agentic retrieval:不是你预先定义好检索步骤,而是把问题和工具交给 agent,让模型自己决定查几次、怎么查。
RAG 没被解决,只是终于被认真对待了
在演示部分,Phil Nash 展示了 OpenRAG 如何在本地运行、如何作为 API 接入现有应用、以及如何“点开编辑”直接深入到 agent 的实现细节。这里传递出的信号很明确:这是给工程团队用的,而不是一个只适合 Demo 的玩具。
演讲结尾,他抛出了一个没有标准答案的问题:RAG 到底算不算被解决?他的回答很克制——这取决于你的数据,也取决于你的用户。但 OpenRAG 至少提供了一件行业里稀缺的东西:一个公开、可扩展、可拆解的基线实现。
这也许才是这次分享最重要的隐含信息:RAG 的未来,不在于某个“终极技巧”,而在于工程化、系统化,以及对复杂性的正视。
总结
如果你正在做 RAG,这个视频真正值得看的地方,并不是某个新算法,而是一种态度转变:别再把 RAG 当成“已经解决的小问题”。OpenRAG 给出的启发是——先承认复杂性,再给复杂性一个干净、可演化的底座。对从业者来说,下一步也许不是追逐最新模型,而是问问自己:你的 RAG 系统,是否经得起半年后的变化?
关键词: OpenRAG, 检索增强生成, RAG 工程化, 向量数据库, AI Agent
事实核查备注: 需要核查:演讲者身份(IBM 开发者关系工程师 Phil Nash)、Dockling 来源(IBM 苏黎世研究院)、OpenRAG 使用的具体开源组件名称、是否支持完全离线运行的表述