文章

从助手到协作者:AI Agent七种形态与企业新分工

从助手到协作者:AI Agent七种形态与企业新分工

这期《The AI Daily Brief》并不是在讨论“要不要用AI”,而是直指一个更现实的问题:当AI以“Agent”的形式进入企业,它究竟会接管哪些工作?通过七类Agent框架、企业调研数据和微软等实例,视频给出了一套理解未来工作分工的实用方法。

api_bot · 2025-07-09 · 10 阅读 · AI/人工智能
从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

从自行车上的鹈鹕,看懂2025年上半年大模型真正的拐点

Simon Willison 用一场充满幽默的演讲,回顾了 2025 年前六个月大模型世界的剧烈变化:模型更便宜、更强、本地可跑,也更危险。这篇文章提炼了他最重要的判断、案例和隐忧,帮你快速理解今年 LLM 发展的真实方向。

api_bot · 2025-07-09 · 21 阅读 · AI/人工智能
不止最强模型:AI真正的前沿在成本、速度与取舍

不止最强模型:AI真正的前沿在成本、速度与取舍

ArtificialAnalysis 联合创始人 George Cameron 用真实基准数据揭示:AI 不只有“最强智能”这一条前沿。推理模型的高代价、开源权重的快速逼近、以及成本与速度的数量级差异,正在重塑我们构建 AI 应用的方式。

api_bot · 2025-07-08 · 17 阅读 · AI/人工智能
ChatGPT差点没上线:OpenAI内部一夜决定,意外改写AI历史

ChatGPT差点没上线:OpenAI内部一夜决定,意外改写AI历史

ChatGPT并不是一个精心策划多年的“伟大产品”,而是一次几乎被否掉、名字在上线前夜才拍板、服务器被瞬间打爆的实验性发布。OpenAI高层在这期播客里首次系统复盘:ChatGPT是如何在失控中诞生,又如何逼着整个AI行业重新理解“产品、反馈和智能”。

api_bot · 2025-07-01 · 6 阅读 · AI/人工智能
AI训练算不算侵权?一场判决撬动整个大模型行业

AI训练算不算侵权?一场判决撬动整个大模型行业

一位联邦法官首次明确支持“AI训练属于合理使用”,给Anthropic带来阶段性胜利,也把整个大模型行业的版权争议推到新高度。本文梳理这起判决的关键细节、未解决的风险,以及它为何可能改变AI公司、创作者和法律之间的博弈方式。

api_bot · 2025-07-01 · 9 阅读 · AI/人工智能
OpenAI开发者亲述:语音Agent真正难的不是说话

OpenAI开发者亲述:语音Agent真正难的不是说话

这是一场来自OpenAI开发者体验团队的一线分享。Dominik Kundel系统讲解了语音Agent为何重要、架构如何选择,以及实时语音Agent在延迟、工具调用和安全上的真实挑战,展示了OpenAI最新Agents SDK与实时API背后的设计取舍。

api_bot · 2025-06-29 · 24 阅读 · AI/人工智能
“提示工程已死”:一场由评估器驱动的反直觉实验

“提示工程已死”:一场由评估器驱动的反直觉实验

Nir Gazit用一次真实的RAG机器人优化实验,挑战了“提示工程是一门手艺”的共识。他没有手工打磨prompt,而是用评估器和Agent把效果从0.4推到0.9,给出了一条更像工程、也更可扩展的路径。

api_bot · 2025-06-27 · 25 阅读 · AI/人工智能
Agent 记忆架构:让 AI 从“会说话”走向“可信任”的关键一步

Agent 记忆架构:让 AI 从“会说话”走向“可信任”的关键一步

这场演讲给出了一个清晰判断:未来 AI Agent 的竞争核心不在提示词,而在记忆。MongoDB 的 Richmond Alake 从工程实践出发,系统拆解了 Agent Memory 的定义、类型、架构模式以及检索的重要性,解释了为什么“没有记忆,就没有真正的 Agent”。

api_bot · 2025-06-27 · 21 阅读 · AI/人工智能
当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

当AI学会“作恶”:微软如何用红队Agent测试智能体的底线

在AI Agent快速走向生产环境的当下,微软在AI Engineer大会上展示了一个关键能力:让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示,解释它如何通过自动化攻击策略、评估与防护闭环,帮助工程师构建真正可被信任的AI应用。

api_bot · 2025-06-27 · 21 阅读 · AI/人工智能