他雇了一个AI工程师24小时,结果最震撼的不是写代码速度

AI PM 编辑部 · 2025年07月08日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还把 AI 当成“更聪明的 Copilot”,这条视频会让你彻底改观。一个真实项目、真实客户、真实生产环境下,AI Agent 不但写代码,还能读懂整个系统、独立做迁移、并行干活,甚至抓出人类找了几个小时的致命 Bug。

他雇了一个AI工程师24小时,结果最震撼的不是写代码速度

如果你还把 AI 当成“更聪明的 Copilot”,这条视频会让你彻底改观。一个真实项目、真实客户、真实生产环境下,AI Agent 不但写代码,还能读懂整个系统、独立做迁移、并行干活,甚至抓出人类找了几个小时的致命 Bug。

最反直觉的一点:真正值钱的不是“写代码”,而是“读代码”

视频一开始,Ras Mic 说了一句很扎心的话:他以为 2025 年自己会多一个朋友,结果多了一个 AI 工程师。这个工程师不只是写代码,而是能“理解整个代码库”。

Devon AI 的 Deep Wiki 功能,是整条视频里最被低估、但可能最有杀伤力的能力。你把一个 GitHub repo 丢进去,它会自动给你生成一整套“代码百科”:架构拆解、模块职责、数据流向,甚至还有 Mermaid 图。

Ras Mic 打开自己一个黑客松项目时,第一反应不是技术震撼,而是情绪震撼——“我真的写过这么多东西吗?”这其实点中了所有工程师的痛点:真正耗时间的,从来不是写新功能,而是理解一个你已经半年没碰、或者根本不是你写的系统。

Deep Wiki 能标出:输入上下文在哪里、哪些 Agent 负责标题/描述/推文/缩略图、哪些地方用 GPT-4o、哪些地方还残留着没删干净的 DALL·E 代码。这不是总结 README,而是把“隐性知识”显性化。Ras Mic 甚至直接说:就冲这一点,$20 的起步价都值。

当 AI 像“同事”一样工作:978 行支付迁移的真实案例

Devon 真正让人起鸡皮疙瘩的地方,是它在真实生产环境里的表现。

Ras Mic 有一个客户项目,需要把支付系统从 Fanbase 迁移到 Polar。注意,这不是 Demo,不是玩具项目,而是涉及真实支付、真实用户的生产代码。整个迁移接近 978 行代码,任何一个小失误,都是事故。

他做的不是“让 AI 一次性写完”,而是像带新人一样协作:
- 指定 repo
- 让 Devon 先出迁移计划
- 人类确认后再动手
- 每一步都生成清晰的 PR

最夸张的是 PR 质量。Devon 不只给 diff,还会给“人类可读”的 checklist、改动说明、甚至结构图。后来 Ras Mic 手动改了几段代码,让 Devon 重新 review,它居然能拉取最新状态、逐条总结“这是你刚刚加的,这是你改的”。

他说了一句很关键的话:“我不是在用工具,我是在跟一个工程师一起干活。”这也是 AI Agent 和 Copilot 之间最本质的差别。

最恐怖的一行代码:AI 几分钟,解决人类几小时的 Bug

视频里有一个几乎被轻描淡写带过的例子,但对工程师来说堪称噩梦。

一个 Apple Pass 的 Bug:生成的 Pass 会在 24 小时后失效。Ras Mic 自己翻了几个小时代码,完全没头绪。最后让 Devon 看了一眼。

结果?几分钟。

Devon 不但定位到问题,还解释了“为什么会这样”,改了一行代码,开了 PR。人类 review,merge,上线,Bug 消失。

这类问题最残酷的地方在于:它不复杂,但极度隐蔽。你不缺知识,你缺的是一个能同时 hold 住全局上下文、又不会累、不会情绪化的“第二双眼睛”。在这一点上,AI Agent 对人类的碾压是结构性的。

并行的 Devon:你第一次体会到“一个人带多个工程师”

最后一个容易被忽略,但极具未来感的点:并行 Agent。

Ras Mic 同时开了两个 Devon Session:一个做支付迁移,一个修 Pass Bug。它们互不干扰、各自推进。这不是多窗口聊天,而是真正的并行执行。

这意味着什么?意味着一个工程负责人,第一次可以在“不加人”的情况下,拉开执行速度。不是压榨工程师,而是把那些高认知、低创造性的任务交给 Agent。

Ras Mic 的结论非常明确:Devon 不适合“vibe coding”,它是给认真做产品、认真上生产的人准备的。无论你是小团队还是大公司,这种 Agent 都开始落在“合理配置”而不是“前沿玩具”的区间里了。

总结

这条视频真正告诉我们的,不是“AI 又进步了”,而是一个更现实的判断:工程工作的重心正在迁移。从“我能不能写”,变成“我如何协调、验证、决策”。

如果你在维护复杂代码库、做真实业务、背线上责任,AI Agent 已经不再是锦上添花,而是生产力杠杆。你不需要立刻全盘押注,但至少该开始思考:哪些任务,已经不值得再由人类亲自熬夜完成了?

也许几年后回头看,2025 年不是 AI 写得多快的一年,而是人类第一次学会“带 AI 工程师”的一年。


关键词: AI Agent, Devon, 代码理解, 生产级AI, GPT-4o

事实核查备注: 1. Devon AI 是否由 Cognition Labs 推出
2. Deep Wiki 功能的具体定价($20 起是否准确)
3. 支付迁移代码量约 978 行
4. Apple Pass 24 小时失效 Bug 的具体原因未在视频中详细展开
5. Devon 使用 GPT-4o 与 GPT Image 模型的描述