Braintrust CEO谈AI落地:RAG、开源与企业真实需求

AI PM 编辑部 · 2024年10月08日 · 3 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 对话中,Braintrust CEO Ankur Goyal 从自身长期从事 AI 的经历出发,分享了企业在真实场景中使用大模型的经验教训。他并不沉迷炫技,而是反复强调检索增强生成(RAG)、开源模型以及“能否被真正用起来”才是关键。

Braintrust CEO谈AI落地:RAG、开源与企业真实需求

在这期 No Priors 对话中,Braintrust CEO Ankur Goyal 从自身长期从事 AI 的经历出发,分享了企业在真实场景中使用大模型的经验教训。他并不沉迷炫技,而是反复强调检索增强生成(RAG)、开源模型以及“能否被真正用起来”才是关键。

为什么多数AI项目卡在“看起来很酷”这一步

这一段对话之所以重要,是因为 Ankur 一开始就点破了一个行业里常被忽视的事实:很多 AI 项目失败,并不是模型不够强,而是没有解决真实工作流中的问题。他回顾自己“很早就在做 AI 相关工作”,也亲眼见过多轮技术浪潮起伏。早期团队往往沉迷于 demo 阶段,输出“看起来不错”的结果,却很难进入生产环境。

他提到,在企业环境里,AI 系统必须“持续、稳定、可解释地工作”,否则就会被业务团队抛弃。这也是为什么他对“只追求模型能力”的路线保持谨慎。他在节目中大意地说过一句话:“如果一个系统不能被信任,它就不可能被真正使用。”这并非技术问题,而是产品与组织的问题。

这个视角为整期节目定下基调:AI 的价值不在参数规模,而在能否嵌入真实决策和流程中。

RAG不是新概念,但真正做好的人不多

检索增强生成(RAG)是本期反复出现的关键词。RAG 的核心思想,是在大模型生成内容前,先从外部知识库中检索相关信息,以减少幻觉并提升准确性。Ankur 明确指出,“大家都在说自己在做 RAG,但真正把它做好的并不多。”

问题不在概念,而在实现细节。他强调,RAG 不是简单地“接一个向量数据库”,而是涉及数据质量、检索策略、上下文拼接方式等一整套系统工程。如果检索结果本身不可靠,模型生成的内容只会“看起来更自信地出错”。

他还分享了一个观察:很多团队在早期验证时效果很好,但一旦数据规模扩大、文档变复杂,输出质量就迅速下降。这正是 RAG 在企业场景中最容易被低估的难点。

开源模型的真正价值:不是更便宜,而是更可控

在谈到开源模型时,Ankur 的态度相当务实。他并没有把开源描述成“银弹”,而是强调它在特定条件下的独特价值。对企业来说,开源模型最大的优势并不只是成本,而是可控性和可定制性。

他提到,自己看到越来越多团队在评估开源方案,并不是为了完全替代闭源模型,而是作为基础能力进行微调和集成。这种方式能让企业更清楚地理解模型的行为边界。他在节目中用一种很直白的说法表达过类似观点:“你越理解模型,它在生产中就越安全。”

同时,他也提醒,采用开源模型并不意味着更轻松。运维、评估和持续改进,反而对团队提出了更高要求。

从工具到“代理”:为什么闭环比智能更重要

后半段对话逐渐转向 AI agent(智能代理)的概念。Ankur 认为,真正有价值的 agent,并不是一次性给出答案,而是能进入一个“while loop”,不断根据结果调整下一步行动。

他指出,很多所谓的 agent 只是把多个 API 串在一起,缺乏反馈机制。一旦中间步骤出错,系统就会整体失效。在他看来,关键不在于 agent 看起来有多聪明,而在于是否能形成可控的闭环。

他用近似原话总结过这一点:“没有反馈,就没有真正的智能。”这也是他对未来一年行业演进的判断——大家会逐渐从炫目的 agent demo,转向更朴素但可靠的系统设计。

总结

整期对话中,Ankur Goyal 并没有给出夸张的预言,而是反复强调一个朴素的事实:AI 的难点正在从模型能力转移到系统工程和组织落地。无论是 RAG、开源模型,还是 agent,本质都服务于同一个问题——能否在真实环境中长期运行。对读者而言,这期节目最大的启发或许是:与其追逐最新模型,不如先把“可用性”和“可信度”做到极致。


关键词: Braintrust, 检索增强生成, RAG, 开源模型, AI代理

事实核查备注: 视频嘉宾:Ankur Goyal(Braintrust CEO);节目:No Priors Ep.85;核心技术概念:检索增强生成(RAG)、开源模型、AI agent;所有判断均基于视频讨论的总体观点,未涉及具体模型名称或数值。