DeepMind把“灵感”交给AI:Co-Scientist正在重写科学发现的速度
如果一个提示,就能调动“50名科学家”为你工作一天,会发生什么?DeepMind最新展示的 Co-Scientist,不是帮你写论文,而是直接生成可验证的新科学假设,把原本需要数月甚至数年的探索,压缩到几天之内。
如果一个提示,就能调动“50名科学家”为你工作一天,会发生什么?DeepMind最新展示的 Co-Scientist,不是帮你写论文,而是直接生成可验证的新科学假设,把原本需要数月甚至数年的探索,压缩到几天之内。
很多团队以为“主权AI”就是把API换成自托管模型,但真正动手后才发现:最先失控的不是效果,而是架构、流程和工程心智。来自 deepset 的一线经验,讲清楚主权约束下,AI系统到底会在哪些地方坏掉。
为什么今天最强的 AI Agent,跑几个小时就“开始胡来”?Anthropic 两位一线工程师给出的答案,几乎颠覆了很多从业者的直觉:问题不在模型,而在我们构建 Agent 的方式。这场分享,第一次系统拆开了“长时间运行 Agent”真正的技术瓶颈。
如果你还在纠结用 GPT-4 还是更大的模型,IBM 的 Tejas Kumar 已经给了你一个更冷静、也更残酷的答案:真正决定 AI 能不能落地的,不是模型能力,而是 Harness。这场 18 分钟的演讲,把无数工程师踩过的坑一次性摊在台面上。
当所有人都在讨论如何“把 AI 做得更聪明”时,incident.io 的创始工程师却踩中了一个更残酷的现实:真正让 AI 产品崩溃的,从来不是模型能力,而是你根本不知道它为什么会这么回答。这场演讲讲的不是炫技,而是 AI 工程化里最容易被忽视、却最致命的一环。
如果你以为大模型的进步只靠算力和数据,这期对话会让你改观。Anthropic 内部第一位提示工程师现身说法,讲清楚 Claude 的“记忆”“性格”与产品节奏,背后是一套与主流完全不同的构建逻辑。
如果你觉得2026年的AI行业已经进入“稳定期”,这期TBPN会把你直接拉回现实:一边是Figma业绩爆炸、审美成了新护城河;另一边是提示工程被集体嫌弃、AI生成“莫奈”钓翻全网。更狠的是,真正赚钱的AI公司,可能正在你最看不上的地方出现。
如果说 DALL·E 只是“能画”,那 OpenAI 最新一代图像模型已经开始“能干活”了。在最新一期 OpenAI Podcast 中,研究员和产品负责人罕见地同时承认:这是一次范式跃迁,而不是常规升级。为什么他们敢用“文艺复兴”来形容?这期播客给出了非常具体的答案。
如果你还以为“训练模型”是工程师的专属技能,那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实:今天的 AI Agent,不只是用模型,而是能自己选模型、配显存、跑任务,甚至替你把模型训好。
如果你的 AI 还在用一套固定 Benchmark 证明“我很强”,那你已经落后了。Comet ML 的 Vincent Koc 在这场演讲里抛出一个让全场不安的判断:不是模型不够好,而是我们评测 AI 的方式,已经跟不上它进化的速度。