Sam Altman 在 DevDay 说清楚了:未来不是更大的模型,而是会“想”的模型
在这场 DevDay 的 AMA 里,Sam Altman 抛出了一个足以改写 AI 创业和投资逻辑的判断:模型规模不再是核心变量,真正的分水岭是“推理能力”。从 o1、Agent、开源,到创业者会不会被 OpenAI 碾压,他几乎把未来 5 年的底牌摊在了桌面上。
在这场 DevDay 的 AMA 里,Sam Altman 抛出了一个足以改写 AI 创业和投资逻辑的判断:模型规模不再是核心变量,真正的分水岭是“推理能力”。从 o1、Agent、开源,到创业者会不会被 OpenAI 碾压,他几乎把未来 5 年的底牌摊在了桌面上。
在 OpenAI DevDay 的一个并不起眼的社区演讲里,Dust 展示了一件让很多数据团队“后背一凉”的事:不用写 SQL、不用建 Dashboard,只靠一句自然语言,就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo,而是一整套已经跑在真实业务里的“自然语言 BI”。
在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。
在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。
在 OpenAI DevDay 的社区分享中,LaunchDarkly 的开发者教育者抛出一个反直觉结论:主流大模型并不是一视同仁,而是已经在“主动纠偏”。更意外的是,真正有效的反偏见提示工程,并不复杂,甚至有点“反直觉地朴素”。
如果你以为做AI Agent需要博士级研究背景,Swyx用9分钟把这个幻觉击碎:真正决定成败的不是模型,而是你脑中那张“Agent栈”的地图。这场DevDay分享,把过去一年社区最有效的实战经验压缩成一份工程师可直接复用的清单。
很多人还在纠结提示词工程,但真正拉开AI应用差距的,其实是RAG。这门由 Mckay Wrigley 讲授的课程,用一个完整真实项目证明:不懂RAG,你的AI永远只是在“表演智能”。
Menlo Ventures发布的《2024年企业AI现状报告》用一组极具冲击力的数据,揭示了企业生成式AI从“尝试”走向“执行”的关键转折。这不仅是预算增长的故事,更是组织结构、技术路径和长期变革方式正在被重塑的信号。
在这场访谈中,Glean 联合创始人兼 CEO Arvind Jain 详细讲述了企业搜索为何是 AI at Work 最难、也最关键的一环,以及他们如何在大模型之前就打好“数据、权限和排序”的地基。这不仅是一个产品故事,更是一套关于企业级 AI 如何真正落地的方法论。
在这期 No Priors 对话中,Braintrust CEO Ankur Goyal 从自身长期从事 AI 的经历出发,分享了企业在真实场景中使用大模型的经验教训。他并不沉迷炫技,而是反复强调检索增强生成(RAG)、开源模型以及“能否被真正用起来”才是关键。