Braintrust CEO谈AI落地：RAG、开源与企业真实需求

AI PM 编辑部 · 2024年10月08日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 对话中，Braintrust CEO Ankur Goyal 从自身长期从事 AI 的经历出发，分享了企业在真实场景中使用大模型的经验教训。他并不沉迷炫技，而是反复强调检索增强生成（RAG）、开源模型以及“能否被真正用起来”才是关键。

Braintrust CEO谈AI落地：RAG、开源与企业真实需求

在这期 No Priors 对话中，Braintrust CEO Ankur Goyal 从自身长期从事 AI 的经历出发，分享了企业在真实场景中使用大模型的经验教训。他并不沉迷炫技，而是反复强调检索增强生成（RAG）、开源模型以及“能否被真正用起来”才是关键。

为什么多数AI项目卡在“看起来很酷”这一步

这一段对话之所以重要，是因为 Ankur 一开始就点破了一个行业里常被忽视的事实：很多 AI 项目失败，并不是模型不够强，而是没有解决真实工作流中的问题。他回顾自己“很早就在做 AI 相关工作”，也亲眼见过多轮技术浪潮起伏。早期团队往往沉迷于 demo 阶段，输出“看起来不错”的结果，却很难进入生产环境。

他提到，在企业环境里，AI 系统必须“持续、稳定、可解释地工作”，否则就会被业务团队抛弃。这也是为什么他对“只追求模型能力”的路线保持谨慎。他在节目中大意地说过一句话：“如果一个系统不能被信任，它就不可能被真正使用。”这并非技术问题，而是产品与组织的问题。

这个视角为整期节目定下基调：AI 的价值不在参数规模，而在能否嵌入真实决策和流程中。

RAG不是新概念，但真正做好的人不多

检索增强生成（RAG）是本期反复出现的关键词。RAG 的核心思想，是在大模型生成内容前，先从外部知识库中检索相关信息，以减少幻觉并提升准确性。Ankur 明确指出，“大家都在说自己在做 RAG，但真正把它做好的并不多。”

问题不在概念，而在实现细节。他强调，RAG 不是简单地“接一个向量数据库”，而是涉及数据质量、检索策略、上下文拼接方式等一整套系统工程。如果检索结果本身不可靠，模型生成的内容只会“看起来更自信地出错”。

他还分享了一个观察：很多团队在早期验证时效果很好，但一旦数据规模扩大、文档变复杂，输出质量就迅速下降。这正是 RAG 在企业场景中最容易被低估的难点。

开源模型的真正价值：不是更便宜，而是更可控

在谈到开源模型时，Ankur 的态度相当务实。他并没有把开源描述成“银弹”，而是强调它在特定条件下的独特价值。对企业来说，开源模型最大的优势并不只是成本，而是可控性和可定制性。

他提到，自己看到越来越多团队在评估开源方案，并不是为了完全替代闭源模型，而是作为基础能力进行微调和集成。这种方式能让企业更清楚地理解模型的行为边界。他在节目中用一种很直白的说法表达过类似观点：“你越理解模型，它在生产中就越安全。”

同时，他也提醒，采用开源模型并不意味着更轻松。运维、评估和持续改进，反而对团队提出了更高要求。

从工具到“代理”：为什么闭环比智能更重要

后半段对话逐渐转向 AI agent（智能代理）的概念。Ankur 认为，真正有价值的 agent，并不是一次性给出答案，而是能进入一个“while loop”，不断根据结果调整下一步行动。

他指出，很多所谓的 agent 只是把多个 API 串在一起，缺乏反馈机制。一旦中间步骤出错，系统就会整体失效。在他看来，关键不在于 agent 看起来有多聪明，而在于是否能形成可控的闭环。

他用近似原话总结过这一点：“没有反馈，就没有真正的智能。”这也是他对未来一年行业演进的判断——大家会逐渐从炫目的 agent demo，转向更朴素但可靠的系统设计。

总结

整期对话中，Ankur Goyal 并没有给出夸张的预言，而是反复强调一个朴素的事实：AI 的难点正在从模型能力转移到系统工程和组织落地。无论是 RAG、开源模型，还是 agent，本质都服务于同一个问题——能否在真实环境中长期运行。对读者而言，这期节目最大的启发或许是：与其追逐最新模型，不如先把“可用性”和“可信度”做到极致。

关键词： Braintrust，检索增强生成， RAG，开源模型， AI代理

事实核查备注：视频嘉宾：Ankur Goyal（Braintrust CEO）；节目：No Priors Ep.85；核心技术概念：检索增强生成（RAG）、开源模型、AI agent；所有判断均基于视频讨论的总体观点，未涉及具体模型名称或数值。

返回文章列表