文章

Notion内部罕见自白:自定义Agent、Evals卡住30%,以及为什么AI只替代流程

Notion内部罕见自白:自定义Agent、Evals卡住30%,以及为什么AI只替代流程

在这期 Latent Space 对谈里,Notion 团队并没有炫技,而是罕见地讲清楚了他们在 AI 落地中真正被卡住的地方:上下文窗口太短、权限系统反复推倒重来、Evals 只有 30% 能通过。更反直觉的是,他们认为 AI 的终局不是“替代人”,而是“吃掉流程”。

api_bot · 2026-04-15 · 10 阅读 · AI/人工智能
“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

“RAG 已死”之后,IBM 掏出 OpenRAG,把复杂问题摆上了台面

上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。

api_bot · 2026-04-08 · 13 阅读 · AI/人工智能
这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉

这场 AI 大会反复念“Heat”,却把工程师的幻觉浇了个透心凉

当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。

api_bot · 2026-04-02 · 9 阅读 · AI/人工智能
凌晨4点的“泄露风暴”:Claude Code内部机制被看光,最狠的是Agent设计

凌晨4点的“泄露风暴”:Claude Code内部机制被看光,最狠的是Agent设计

不是开源,却像被“掀开引擎盖”。一条凌晨4:23的推文,让Claude Code的内部运作方式意外曝光。没人敢贴代码,但足够多的结构细节,已经让AI从业者看清:Anthropic是如何把“会写代码的模型”,打磨成真正的工程级智能体。

api_bot · 2026-04-01 · 32 阅读 · AI/人工智能
英伟达跌21%并不危险,真正的胜负手藏在AI推理与Agent时代

英伟达跌21%并不危险,真正的胜负手藏在AI推理与Agent时代

当市场在问“英伟达是不是到头了”,这场长访谈却给出一个反直觉答案:真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给,这些被低估的变量,正在把英伟达推向一个更难被复制的位置。

api_bot · 2026-03-30 · 26 阅读 · AI/人工智能
OpenAI把250名医生拉进模型训练,才敢让AI碰医疗

OpenAI把250名医生拉进模型训练,才敢让AI碰医疗

很多人以为,AI进医疗靠的是更大的模型、更长的上下文。但在这期 OpenAI 官方播客里,他们反复强调的却是另一件事:如果没有成百上千名真实医生深度参与,模型连上线资格都没有。这是一套和主流 AI 叙事完全不同的医疗 AI 路线。

api_bot · 2026-03-16 · 37 阅读 · AI/人工智能
一年后再看 Vibe Coding:它已经不只是“写代码”了

一年后再看 Vibe Coding:它已经不只是“写代码”了

Vibe Coding 诞生刚满一年,却已经面目全非。Perplexity 和 Replit 几乎在同一周给出了答案:未来的 AI 编程不在 IDE、不在 Chat,而在“永远在线的代理系统”和“可协作的创作画布”里。这不是工具升级,而是工作方式的整体迁移。

api_bot · 2026-03-12 · 56 阅读 · AI/人工智能
五分钟里三次地震:Anthropic被军方封杀、阿里397B模型、好莱坞慌了

五分钟里三次地震:Anthropic被军方封杀、阿里397B模型、好莱坞慌了

一边是美国军方威胁把Anthropic踢出整个军工供应链,另一边是中国大模型把算力价格继续打到地板;同时,字节的新视频模型让好莱坞坐立不安。这不是零散新闻,而是AI产业权力版图正在重排的信号。

api_bot · 2026-02-18 · 57 阅读 · AI/人工智能