Notion内部罕见自白:自定义Agent、Evals卡住30%,以及为什么AI只替代流程
在这期 Latent Space 对谈里,Notion 团队并没有炫技,而是罕见地讲清楚了他们在 AI 落地中真正被卡住的地方:上下文窗口太短、权限系统反复推倒重来、Evals 只有 30% 能通过。更反直觉的是,他们认为 AI 的终局不是“替代人”,而是“吃掉流程”。
在这期 Latent Space 对谈里,Notion 团队并没有炫技,而是罕见地讲清楚了他们在 AI 落地中真正被卡住的地方:上下文窗口太短、权限系统反复推倒重来、Evals 只有 30% 能通过。更反直觉的是,他们认为 AI 的终局不是“替代人”,而是“吃掉流程”。
上下文窗口越来越大,很多人开始断言 RAG 已经过时。但在这场来自 IBM 的分享里,演讲者几乎是正面“开怼”:RAG 不但没死,而且远比你想象得复杂。更关键的是,他们把这些复杂性做成了一个开源栈——OpenRAG。
如果你的 MCP Server 在本地跑得很顺,恭喜你——它大概率撑不过生产环境。来自 Lenses 的 AI 工程师直言:糟糕的 MCP 设计,本质上就是安全事故的预演。这场分享揭开了 Agent 接口、上下文、Token 与部署之间那些被严重低估的风险。
当所有人都在谈更强的模型、更自动的代理,AIE Europe Day 2 却用诗歌、摩擦和失败案例不断提醒:真正失控的不是 AI,而是工程师的判断力。这不是一场炫技大会,而是一场对“代理时代”的集体降温。
不是开源,却像被“掀开引擎盖”。一条凌晨4:23的推文,让Claude Code的内部运作方式意外曝光。没人敢贴代码,但足够多的结构细节,已经让AI从业者看清:Anthropic是如何把“会写代码的模型”,打磨成真正的工程级智能体。
当市场在问“英伟达是不是到头了”,这场长访谈却给出一个反直觉答案:真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给,这些被低估的变量,正在把英伟达推向一个更难被复制的位置。
当所有人还在卷模型、卷参数时,Anthropic 团队却踩下了刹车:真正限制 AI Agent 的,不是智力,而是上下文。Claude Code 团队用一个看似“笨”的设计,意外打开了 Agent 时代的天花板。
很多人以为,AI进医疗靠的是更大的模型、更长的上下文。但在这期 OpenAI 官方播客里,他们反复强调的却是另一件事:如果没有成百上千名真实医生深度参与,模型连上线资格都没有。这是一套和主流 AI 叙事完全不同的医疗 AI 路线。
Vibe Coding 诞生刚满一年,却已经面目全非。Perplexity 和 Replit 几乎在同一周给出了答案:未来的 AI 编程不在 IDE、不在 Chat,而在“永远在线的代理系统”和“可协作的创作画布”里。这不是工具升级,而是工作方式的整体迁移。
一边是美国军方威胁把Anthropic踢出整个军工供应链,另一边是中国大模型把算力价格继续打到地板;同时,字节的新视频模型让好莱坞坐立不安。这不是零散新闻,而是AI产业权力版图正在重排的信号。