AutoGPT 热潮退去6周后,真正有用的不是自动执行,而是这件小事

AI PM 编辑部 · 2023年05月09日 · 8 阅读 · AI/人工智能

正在加载视频...

视频章节

AutoGPT 曾被吹成“Baby AGI”的第一步,但短短几周后,开发者集体冷静了。这支视频给出了一个反直觉答案:AutoGPT 最有价值的能力,既不是全自动执行任务,也不是取代人类,而是在你口袋里的“超级大脑外脑”。更重要的是,人们已经开始用它赚钱、做研究、做决策了。

AutoGPT 热潮退去6周后,真正有用的不是自动执行,而是这件小事

AutoGPT 曾被吹成“Baby AGI”的第一步,但短短几周后,开发者集体冷静了。这支视频给出了一个反直觉答案:AutoGPT 最有价值的能力,既不是全自动执行任务,也不是取代人类,而是在你口袋里的“超级大脑外脑”。更重要的是,人们已经开始用它赚钱、做研究、做决策了。

从“Baby AGI”到集体祛魅:AutoGPT 为什么没你想得那么神

时间拨回到 2023 年春天。AutoGPT 和 BabyAGI 几乎在一夜之间刷爆了 GitHub、Twitter 和 YouTube。原因很简单:它们第一次让 ChatGPT 看起来“像个会自己干活的东西”。

相比 ChatGPT,AutoGPT 有三个让开发者兴奋的点:第一,它能联网,信息不再卡在训练截止日期;第二,它会给自己拆解任务,而不是等你一步步指挥;第三,也是最让人浮想联翩的——它能执行任务,甚至调用其他 AI agent。

但六周之后,风向变了。越来越多的用户发现,AutoGPT 很容易陷入循环、自以为完成了任务、或者把一件简单的事“工程化”到不可收拾。期待中的“全自动打工人”,变成了一个需要随时盯着的实习生。

视频里一个很重要的判断是:问题不只在 AutoGPT 本身,而在于“你怎么用它”。尤其是那些开箱即用的 no-code 工具,界面很友好,但你几乎无法控制 agent 的行为边界。结果就是——越泛化,越容易翻车;越具体,越接近生产力。

真正跑通的两件事:联网 + 自我拆解任务

如果一定要给 AutoGPT 打分,这支视频的结论很明确:三大卖点里,真正兑现的只有两个半。

第一是联网能力。AutoGPT 能实时搜索、整理信息,这直接解锁了一整类 ChatGPT 原本做不好的事情,比如最新资料调研、竞品分析、SEO 扫描。这不是“更聪明”,而是“信息源升级”。

第二是自我 prompt、自我拆任务。你给一个目标,它会先列一个 task list,再逐条执行。这一点的意义被很多人低估了。它本质上是在帮人类做“结构化思考”,哪怕最后执行得并不完美,这个过程本身就有价值。

真正掉链子的,是第三点:自动执行复杂任务。视频里反复提到一个现象——AutoGPT 经常把“建议”当成“完成”,或者在多个 agent 之间来回拉扯。结果是,看起来很忙,产出却未必有用。

一个很有洞察的观察是:用户正在从“让 AI 替我搞定一切”,转向“让 AI 把我不擅长的那一小步想清楚”。这也为后面的 iBabyAGI 铺了路。

把 AutoGPT 塞进手机:iBabyAGI 为什么反而更好用

iBabyAGI 的出现,本身就说明了一件事:AutoGPT 不需要更复杂,而是更贴近日常。

开发者 Nate Chan 很早就开始折腾 AutoGPT。他注意到一个被忽略的现实:大多数人不是在电脑前“做 AI”,而是在手机上生活。于是,他做了一个 iPhone 上的 AutoGPT 体验。

早期测试者 Lauren Marie 给出的用例清单,非常“不科幻”,但异常真实:
- 用一个 prompt 生成互动网页
- 做 SEO 分析并给建议
- 生成 3000 美元预算的意大利旅行行程
- 制定健身计划
- 列出自动化销售获客工具
- 写 newsletter 大纲
- 写 Python 脚本发自动邮件

最震撼的一点不是能力,而是成本:使用 GPT-3.5 API,每个任务只要几美分,很多甚至不到 2 美分。

iBabyAGI 的工作方式也很清晰:先生成任务列表,再逐条执行,比如查酒店、找餐厅、给选项。它也会“过度思考”,比如在销售线索场景里开始引入机器学习预测转化率,但最终真正有用的,往往就是那份工具清单。

Lauren 的评价很耐人寻味:不循环、完成目标、输出结构清晰、能追踪花费、方便复制分享。换句话说,它不是最聪明的 agent,而是一个“不会添乱”的 agent。

没人认真聊过的杀手级用法:不是执行,而是头脑风暴

视频里抛出了一个几乎被忽略的结论:AutoGPT 最被低估的用法,是 brainstorming。

作者直言,他对 AutoGPT 从“目标到完整交付”的能力其实挺失望的。但反过来,当你把它当成一个能从 0 到 1 陪你想问题的伙伴,价值立刻就出来了。

他自己做了个对比实验:一个极度宽泛的目标——“做一个 10 万订阅的 newsletter”,结果必然很泛;但当他把问题收紧,比如“根据影响力和触达面,帮我列 AI Breakdown 节目的 10 位潜在嘉宾”,AutoGPT 的表现明显提升。

这里的分水岭不在模型,而在人。越来越多开发者开始重新定义“自动”和“人类参与”的边界。AutoGPT 不该是黑箱执行者,而是外脑:帮你列选项、暴露盲点、逼你做决策。

一句话总结这个新共识:它不是来替你完成工作的,而是来提升你思考质量的。

总结

AutoGPT 这波热潮,最大的价值也许不是技术突破,而是一次集体校准预期。全自动 AI 员工还很远,但“随身的思考放大器”已经成立。对 AI 从业者来说,真正的行动建议很清晰:别再追求一句 prompt 干完所有事,而是把问题拆小、拆具体,用 agent 辅助思考和探索。未来最有价值的工具,很可能不是更自动,而是更懂得什么时候该把控制权还给人。


关键词: AutoGPT, AI Agent, iBabyAGI, 生成式AI应用, AI工作流

事实核查备注: 需要核查:1)视频发布时间是否为 2023-05-09;2)iBabyAGI 开发者是否为 Nate Chan;3)Lauren Marie 的测试时间是否为 5 月 3 日;4)单次任务成本“不到两美分”基于 GPT-3.5 API 的说法;5)视频中关于 AutoGPT 三大核心能力的原始表述。