AutoGPT 热潮退去6周后，真正有用的不是自动执行，而是这件小事

AI PM 编辑部 · 2023年05月09日 · 8 阅读 · AI/人工智能

AI应用 AI搜索 AI Agent 机器学习 AI工具生成式AI 代码生成对话AI AutoGPT ChatGPT

正在加载视频...

视频章节

AutoGPT 曾被吹成“Baby AGI”的第一步，但短短几周后，开发者集体冷静了。这支视频给出了一个反直觉答案：AutoGPT 最有价值的能力，既不是全自动执行任务，也不是取代人类，而是在你口袋里的“超级大脑外脑”。更重要的是，人们已经开始用它赚钱、做研究、做决策了。

AutoGPT 热潮退去6周后，真正有用的不是自动执行，而是这件小事

AutoGPT 曾被吹成“Baby AGI”的第一步，但短短几周后，开发者集体冷静了。这支视频给出了一个反直觉答案：AutoGPT 最有价值的能力，既不是全自动执行任务，也不是取代人类，而是在你口袋里的“超级大脑外脑”。更重要的是，人们已经开始用它赚钱、做研究、做决策了。

从“Baby AGI”到集体祛魅：AutoGPT 为什么没你想得那么神

时间拨回到 2023 年春天。AutoGPT 和 BabyAGI 几乎在一夜之间刷爆了 GitHub、Twitter 和 YouTube。原因很简单：它们第一次让 ChatGPT 看起来“像个会自己干活的东西”。

相比 ChatGPT，AutoGPT 有三个让开发者兴奋的点：第一，它能联网，信息不再卡在训练截止日期；第二，它会给自己拆解任务，而不是等你一步步指挥；第三，也是最让人浮想联翩的——它能执行任务，甚至调用其他 AI agent。

但六周之后，风向变了。越来越多的用户发现，AutoGPT 很容易陷入循环、自以为完成了任务、或者把一件简单的事“工程化”到不可收拾。期待中的“全自动打工人”，变成了一个需要随时盯着的实习生。

视频里一个很重要的判断是：问题不只在 AutoGPT 本身，而在于“你怎么用它”。尤其是那些开箱即用的 no-code 工具，界面很友好，但你几乎无法控制 agent 的行为边界。结果就是——越泛化，越容易翻车；越具体，越接近生产力。

真正跑通的两件事：联网 + 自我拆解任务

如果一定要给 AutoGPT 打分，这支视频的结论很明确：三大卖点里，真正兑现的只有两个半。

第一是联网能力。AutoGPT 能实时搜索、整理信息，这直接解锁了一整类 ChatGPT 原本做不好的事情，比如最新资料调研、竞品分析、SEO 扫描。这不是“更聪明”，而是“信息源升级”。

第二是自我 prompt、自我拆任务。你给一个目标，它会先列一个 task list，再逐条执行。这一点的意义被很多人低估了。它本质上是在帮人类做“结构化思考”，哪怕最后执行得并不完美，这个过程本身就有价值。

真正掉链子的，是第三点：自动执行复杂任务。视频里反复提到一个现象——AutoGPT 经常把“建议”当成“完成”，或者在多个 agent 之间来回拉扯。结果是，看起来很忙，产出却未必有用。

一个很有洞察的观察是：用户正在从“让 AI 替我搞定一切”，转向“让 AI 把我不擅长的那一小步想清楚”。这也为后面的 iBabyAGI 铺了路。

把 AutoGPT 塞进手机：iBabyAGI 为什么反而更好用

iBabyAGI 的出现，本身就说明了一件事：AutoGPT 不需要更复杂，而是更贴近日常。

开发者 Nate Chan 很早就开始折腾 AutoGPT。他注意到一个被忽略的现实：大多数人不是在电脑前“做 AI”，而是在手机上生活。于是，他做了一个 iPhone 上的 AutoGPT 体验。

早期测试者 Lauren Marie 给出的用例清单，非常“不科幻”，但异常真实：
- 用一个 prompt 生成互动网页
- 做 SEO 分析并给建议
- 生成 3000 美元预算的意大利旅行行程
- 制定健身计划
- 列出自动化销售获客工具
- 写 newsletter 大纲
- 写 Python 脚本发自动邮件

最震撼的一点不是能力，而是成本：使用 GPT-3.5 API，每个任务只要几美分，很多甚至不到 2 美分。

iBabyAGI 的工作方式也很清晰：先生成任务列表，再逐条执行，比如查酒店、找餐厅、给选项。它也会“过度思考”，比如在销售线索场景里开始引入机器学习预测转化率，但最终真正有用的，往往就是那份工具清单。

Lauren 的评价很耐人寻味：不循环、完成目标、输出结构清晰、能追踪花费、方便复制分享。换句话说，它不是最聪明的 agent，而是一个“不会添乱”的 agent。

没人认真聊过的杀手级用法：不是执行，而是头脑风暴

视频里抛出了一个几乎被忽略的结论：AutoGPT 最被低估的用法，是 brainstorming。

作者直言，他对 AutoGPT 从“目标到完整交付”的能力其实挺失望的。但反过来，当你把它当成一个能从 0 到 1 陪你想问题的伙伴，价值立刻就出来了。

他自己做了个对比实验：一个极度宽泛的目标——“做一个 10 万订阅的 newsletter”，结果必然很泛；但当他把问题收紧，比如“根据影响力和触达面，帮我列 AI Breakdown 节目的 10 位潜在嘉宾”，AutoGPT 的表现明显提升。

这里的分水岭不在模型，而在人。越来越多开发者开始重新定义“自动”和“人类参与”的边界。AutoGPT 不该是黑箱执行者，而是外脑：帮你列选项、暴露盲点、逼你做决策。

一句话总结这个新共识：它不是来替你完成工作的，而是来提升你思考质量的。

总结

AutoGPT 这波热潮，最大的价值也许不是技术突破，而是一次集体校准预期。全自动 AI 员工还很远，但“随身的思考放大器”已经成立。对 AI 从业者来说，真正的行动建议很清晰：别再追求一句 prompt 干完所有事，而是把问题拆小、拆具体，用 agent 辅助思考和探索。未来最有价值的工具，很可能不是更自动，而是更懂得什么时候该把控制权还给人。

关键词： AutoGPT， AI Agent， iBabyAGI，生成式AI应用， AI工作流

事实核查备注：需要核查：1）视频发布时间是否为 2023-05-09；2）iBabyAGI 开发者是否为 Nate Chan；3）Lauren Marie 的测试时间是否为 5 月 3 日；4）单次任务成本“不到两美分”基于 GPT-3.5 API 的说法；5）视频中关于 AutoGPT 三大核心能力的原始表述。

返回文章列表