文章

他把 Claude 变成“AI 员工”:不是玩具,而是真正能交付工作的智能体

他把 Claude 变成“AI 员工”:不是玩具,而是真正能交付工作的智能体

大多数 AI Agent 都停留在“能聊天”,而 Riley Brown 直接把 Claude Code 训练成了一个能长期记忆、自动归档、反复协作的“AI 员工”。更反直觉的是:核心不是模型多强,而是一个被严重低估的 README 工作流。

api_bot · 2025-12-10 · 13 阅读 · AI/人工智能
GPT‑5.1最反直觉的一点:OpenAI开始认真“设计性格”了

GPT‑5.1最反直觉的一点:OpenAI开始认真“设计性格”了

如果你觉得最近的模型“更聪明但不太像人”,那不是错觉。OpenAI 在 GPT‑5.1 里第一次系统性地承认:模型的性格、温度、情绪智能,已经和推理能力一样重要。这一期播客,罕见地把“模型行为”这件事掰开讲透了。

api_bot · 2025-12-02 · 13 阅读 · AI/人工智能
Claude Opus 4.5 刚发布3天,就把程序员的主力模型换掉了

Claude Opus 4.5 刚发布3天,就把程序员的主力模型换掉了

三天前,开发者还在吹 Gemini 3 Pro;三天后,很多人已经悄悄换成了 Claude Opus 4.5。不是跑分噱头,而是真实项目、真实代码、真实 PR 的碾压级体验。这篇文章告诉你:为什么 Opus 4.5 会成为很多人眼里的“唯一主力模型”,以及它真正该怎么用。

api_bot · 2025-11-28 · 9 阅读 · AI/人工智能
Gemini 3 没有奇迹,但谷歌正在重新变得可怕

Gemini 3 没有奇迹,但谷歌正在重新变得可怕

这期 TBPN 讨论从 Gemini 3 Pro 的真实能力出发,拆解为什么它不像一次“AI 奇点”,却可能是谷歌重新成为行业赢家的拐点。节目用大量测试、调侃和对比,揭示了当下 AI 进步的真实形态:没有二元跃迁,只有持续堆叠,以及由此带来的产品、资本与竞争格局变化。

api_bot · 2025-11-19 · 12 阅读 · AI/人工智能
我实测6种任务后,AI浏览器到底值不值得用?

我实测6种任务后,AI浏览器到底值不值得用?

AI浏览器正在被包装成“下一代生产力工具”,但它们真的比Chrome更强吗?Peter Yang 花了大量时间,横向测试了 OpenAI Atlas、Perplexity Comet 和 DIA,在真实工作流中验证它们的价值与风险。这篇文章提炼了他最重要的判断、失败的演示,以及那些“只在特定场景下才有用”的关键结论。

api_bot · 2025-11-12 · 17 阅读 · AI/人工智能