Claude悄悄放出一把“浏览器核武器”,比Agent更狠

AI PM 编辑部 · 2025年12月22日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

Anthropic刚刚发布的Claude Chrome扩展,被不少体验者认为“比OpenAI的Agentic Browser、Perplexity Comet更实用”。它不只是帮你查资料,而是直接接管浏览器、截图、操作网页,甚至还能和Claude Code联动。Riley Brown的实测,意外揭示了AI Agent真正落地的形态。

Claude悄悄放出一把“浏览器核武器”,比Agent更狠

Anthropic刚刚发布的Claude Chrome扩展,被不少体验者认为“比OpenAI的Agentic Browser、Perplexity Comet更实用”。它不只是帮你查资料,而是直接接管浏览器、截图、操作网页,甚至还能和Claude Code联动。Riley Brown的实测,意外揭示了AI Agent真正落地的形态。

不是聊天框升级,而是“把浏览器交给AI”

视频一开始,Riley Brown的反应就很真实:界面多了几个矩形框,Claude开始自己截图、分析页面、生成一份“浏览报告”。这不是常见的AI搜索或摘要,而是Claude获得了浏览器级别的操作权。它能决定点哪里、看什么、怎么走流程。

更反直觉的是,这个扩展当前在Chrome商店的评分只有2.8星。但Riley的评价却是:“This is actually really good.”低分背后不是能力不行,而是这类产品已经超出了大多数普通用户的理解边界——你不是在用工具,而是在“指挥一个数字助理替你上网”。

真正拉开差距的,是“空间感”和上下文连续性

Riley反复强调一个点:Claude的spatial awareness(空间感)。当他让Claude搜索并整理关于自身Chrome扩展的信息时,Claude并不是简单抓取文本,而是通过截图理解页面结构、位置关系,再给出结构化反馈。

这正是很多AI Agent翻车的地方:它们“知道字,但不懂页面”。而Claude在这个扩展里的表现,更像一个真正看着屏幕操作的人。这也是为什么不少人私下评价,它在实际浏览体验上,已经压过了OpenAI的Agentic Browser和Perplexity的Comet——不是模型更聪明,而是浏览器控制这一步做对了

真正让程序员兴奋的:它能连上Claude Code

视频的高潮,不是搜索,而是连接Claude Code。当Riley输入“/chrome”并开始让Claude执行开发任务时,事情变了性质。

他测试了一个最基础的Hello World应用,流程顺畅;随后直接让Claude打开firebase.google.com,创建数据、写入Firestore,返回document ID;接着又让它配置Google登录认证——整个Google Sign-In流程一次通过

这意味着什么?意味着AI不只是“告诉你怎么做”,而是真的替你把活干完。浏览器 + 代码 + 云后台,被串成了一条完整执行链。

Claude这一步,其实是在重新定义AI Agent

视频最后,Riley总结得很克制,但信息量很大:这次他主要验证了两件事——浏览器控制能力,以及与Claude Code的联动。

如果你把这两点放到行业坐标系里看,会发现Anthropic押的是一条和OpenAI略有不同的路线:不是先讲宏大的Agent愿景,而是从开发者最痛的“跨工具执行”开始落地

当AI能稳定地操作真实世界的网页、后台和身份系统时,Agent才不再是演示,而是生产力。Claude的Chrome扩展,很可能是这一阶段最早“能用”的样本。

总结

如果你是AI从业者,这个扩展至少释放了三个信号:第一,浏览器正在成为Agent的主战场;第二,空间理解比参数规模更关键;第三,真正的门槛在于“端到端执行”,而不是单点智能。短期内,你可以关注并亲自测试这类工具;中期来看,能否把Agent安全、稳定地放进真实工作流,才是公司之间真正拉开差距的地方。一个值得思考的问题是:当AI能替你点完所有网页按钮,你的工作边界会被推到哪里?


关键词: Claude Chrome扩展, AI Agent, Claude Code, Anthropic, 浏览器自动化

事实核查备注: 需要核查:1)Chrome商店2.8星评分的时间点;2)与OpenAI Agentic Browser、Perplexity Comet的对比属于体验评价而非官方结论;3)视频中Firestore与Google Sign-In测试是否为完整生产级配置。