当DevOps不再“救火”:Traversal如何用AI Agent重塑故障诊断

AI PM 编辑部 · 2025年06月24日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

这场来自 Sequoia AI Ascent 的对谈,围绕 Traversal 如何用 AI Agent 改写传统 DevOps 与根因分析(RCA)展开。文章还原了创始团队对未来工程角色的判断、产品设计背后的方法论,以及为什么“让 AI 顺着问题一路推理”可能比堆监控面板更重要。

当DevOps不再“救火”:Traversal如何用AI Agent重塑故障诊断

这场来自 Sequoia AI Ascent 的对谈,围绕 Traversal 如何用 AI Agent 改写传统 DevOps 与根因分析(RCA)展开。文章还原了创始团队对未来工程角色的判断、产品设计背后的方法论,以及为什么“让 AI 顺着问题一路推理”可能比堆监控面板更重要。

为什么今天做产品,必须押注六个月后的AI?

这一期对谈一开始就抛出了一个让所有工程负责人都无法回避的问题:在 AI 以月为单位进化的时代,产品和系统架构到底该怎么设计?Traversal 的联合创始人直言,“如果你在做产品、设计或核心工程,你必须不断下注,判断六个月后的 AI 会走到哪里,这会直接影响整个架构的搭建方式。”

这不是一句空泛的感慨,而是他们创业过程中的现实约束。传统软件可以围绕稳定假设去优化,但 AI 能力的快速跃迁,迫使团队在一开始就要为“变化”留出空间。Traversal 的思路是:不要把智能固化在规则或面板里,而是围绕“推理过程”来设计系统,让能力升级时,整体架构不需要推倒重来。

这也解释了为什么他们会把大量精力投入到 agentic(代理式)系统上,而不是单点功能。对他们来说,真正的风险不是 AI 不够聪明,而是产品一旦锁死在旧范式里,就再也跟不上下一轮能力跃迁。

DevOps 会消失吗?还是变成更“像人”的工作?

在“快问快答”环节,一个问题引起了强烈共鸣:五年后,DevOps 或 SRE 还会以今天的形态存在吗?Traversal 的回答并不悲观。他们认为,工作内容会发生根本变化,但价值反而会上升。

过去的 DevOps 常被形容为“救火队”,在告警风暴中疲于奔命。Traversal 团队观察到,随着系统复杂度上升,人类已经很难仅凭经验在海量信号中定位问题。AI Agent 的意义,不是替代工程师,而是接管那些高度重复、但又必须严谨执行的调查步骤。

正如他们在对谈中所说,这会让工作“变成一个更有成就感的职业”。工程师不再只是追着指标跑,而是专注于决策、权衡和系统性改进。这也是他们判断:DevOps 不会消失,但会从操作型角色,进化为更偏向理解和判断的角色。

从“看面板”到“顺着因果走”:RCA 正在被重写

Traversal 花了相当篇幅解释一个老概念:Root Cause Analysis(根因分析)。在他们看来,RCA 早已不只是事后写报告,而是一种贯穿故障全过程的能力。

传统可观测性工具,更多停留在“存储和可视化”层:日志、指标、追踪一层层堆叠,但真正的分析仍然依赖人脑。Traversal 的判断是,这一层正是 AI Agent 最适合介入的地方。

他们的 agent 并不是一次性给出答案,而是“做一系列顺序性的调查流程,最终走到答案”。这种方式模拟了资深工程师排查事故的思路:提出假设、验证、再缩小范围。不同的是,Agent 可以不知疲倦地在系统之间来回穿梭。

这也是他们强调的分界线:不是再做一个更漂亮的仪表盘,而是让系统本身具备‘追因果链’的能力。

AI Agent 什么时候最有效?真实事故才是终极考场

当然,Agent 并非万能。Traversal 也坦承,agentic 方法在不同环境下效果差异明显,成功标准也必须被重新定义。对他们来说,最重要的评测方式不是实验室 benchmark,而是“真实线上事故”。

当被问到是否已经有客户在使用 Traversal 时,他们强调,真正的学习来自实战。真实系统的噪声、不完整数据和意外组合,远比任何合成数据集更残酷,也更有价值。

在架构层面,Traversal 的系统还部分建立在多年学术研究之上,而这一点带来的实际效果“连他们自己都有些意外”。理论与工程实践的结合,让 Agent 在复杂场景下依然能保持可解释的推理路径,而不是黑盒输出。

在他们看来,未来的可观测性团队规模可能会缩小,但能力密度会显著提高,而像 Traversal 这样的产品,会成为团队的“智能外脑”。

总结

这场对谈真正有价值的地方,不在于某个具体功能,而在于 Traversal 对工程未来的判断:系统会越来越复杂,但人不必更痛苦。通过把根因分析交给 AI Agent,把工程师从告警噪声中解放出来,DevOps 有机会成为更具判断力和创造力的角色。对所有正在设计下一代工程工具的人来说,这是一种值得认真思考的方向。


关键词: AI Agent, Root Cause Analysis, DevOps, 可观测性, Traversal

事实核查备注: 视频来源:Sequoia AI Ascent;产品名称:Traversal;人物:Anishh、Raj(联合创始人);核心技术概念:AI Agent、Root Cause Analysis(RCA);相关产品提及:Cursor;所有判断与观点均来自视频对谈原意表述