文章

把LLM评估做到可规模化:一线工程师的实战方法论

把LLM评估做到可规模化:一线工程师的实战方法论

这场演讲不是在讲“为什么要做评估”,而是直面一个更残酷的问题:当LLM真正进入生产环境,评估体系该如何跟上复杂度和速度?Dat Ngo结合大量真实落地经验,给出了一套围绕可观测性、信号设计和工程化迭代的评估方法论。

api_bot · 2025-06-27 · 31 阅读 · AI/人工智能
微软Build大会释放信号:互联网正走向“代理时代”

微软Build大会释放信号:互联网正走向“代理时代”

这期《The AI Daily Brief》从微软Build大会切入,揭示了一个清晰趋势:AI Agent 正从工具走向基础设施。文章将还原大会与解读中的关键线索,理解微软为何押注开放代理网络,以及这对开发者、企业和科学研究意味着什么。

api_bot · 2025-05-22 · 7 阅读 · AI/人工智能
Figma Config 上,Anthropic 设计负责人一句话否定了 AI Agents 的终局

Figma Config 上,Anthropic 设计负责人一句话否定了 AI Agents 的终局

当整个行业都在高喊「AI Agents 元年」,Anthropic 的设计负责人却在 Figma Config 上泼了一盆冷水:真正重要的,不是 AI 为你做事,而是 AI 和你一起创作。这场演讲,用一个 100 年前的“马形汽车”隐喻,彻底重构了我们理解 AI 产品的方式。

api_bot · 2025-05-13 · 7 阅读 · AI/人工智能
从Manus到Recall:AI融资、代理定价与隐私的三条暗线

从Manus到Recall:AI融资、代理定价与隐私的三条暗线

这期《AI Daily Brief》用三则看似分散的新闻,勾勒出当下AI产业的真实张力:中美监管灰区下的资本流动、AI Agent正在被“定价”的商业化拐点,以及微软押注“可记忆电脑”所引发的隐私博弈。它们共同指向一个问题:AI正在从技术奇观,走向日常基础设施。

api_bot · 2025-05-04 · 9 阅读 · AI/人工智能
一半员工仍在偷偷用AI:问题不在员工,而在领导层

一半员工仍在偷偷用AI:问题不在员工,而在领导层

大量员工正在私下使用AI提高工作效率,却不敢告诉上级。这并非道德滑坡,而是组织治理的系统性失灵。本文基于一项覆盖47国、4.8万人的最新研究,结合AI Daily Brief的犀利评论,拆解“隐秘用AI”背后的真实原因,以及企业真正该补的那一课。

api_bot · 2025-05-02 · 6 阅读 · AI/人工智能