别再迷信提示工程:保险业如何用DSPy把LLM拉回工程正道
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
这是一场把大语言模型从聊天框带进真实世界的现场实验。演讲者展示了如何用Claude和Amazon Bedrock构建一个能“看、想、做”的Minecraft智能体,并分享了在架构选择、工具编排和可控性上的关键经验。
如果你还以为写应用必须先写代码,这个视频会直接把你拉回现实。Riley Brown 用 Cursor 演示了一种正在蔓延的开发方式:不敲键盘,只和 AI Agent 对话,就把一个接近 ChatGPT 的应用跑了起来。这不是玩具,而是很多程序员已经在用的“Vibe Coding”。
这段视频围绕Replit手机端Agent编码应用展开,讨论了一个更宏大的问题:当“智能的成本”趋近于零,人类工作会发生什么变化。演讲者用真实案例和历史类比,提出“智能版杰文斯悖论”,认为软件开发不会消失,而是迎来一次规模空前的扩张。
不是写代码、不是做PPT,而是直接“开公司”。Greg Isenberg展示了一个极具冲击力的场景:花200美元买ChatGPT Pro,让Operator这个AI Agent登录网站、搜商品、发私信、记表格,几分钟内跑起一个真实可赚钱的生意。这不是未来,而是现在。
一款“免费”的推理模型,参数规模直逼 600B,却托管在中国服务器——DeepSeek R1 爆红背后,不只是性能突破,更是一连串关于隐私、成本与部署方式的艰难选择。这期播客里,前 Apple 工程师把话说得非常直白。
这期来自 Y Combinator 的《Light Cone》并没有讨论模型参数或榜单,而是揭示了一个更隐秘的变化:AI 正在重塑创业的速度、组织形态和价值来源。YC 看到的,不只是“更强的工具”,而是一条正在分岔的未来道路。
在这期访谈中,Granola 创始人 Chris Pedregal 复盘了自己从 Google 离职、切入 AI 会议产品的全过程,并总结了打造成功 AI 产品的五条“隐形规则”。这些规则并非宏大叙事,而是来自真实创业选择、成本约束和用户行为的反复碰撞。
这期《The AI Daily Brief》展示了两个出人意料却极具启发性的AI故事:Google不得不给NotebookLM的AI播客主持人做“情绪管理”,而OpenAI的o1模型则在推理时突然切换语言。这些看似怪异的现象,实际上揭示了大语言模型在提示工程、训练数据和多语言思维层面的深层逻辑。
Google 发布 Veo 2 后,AI 视频生成进入“可用阶段”。本文不纠结谁更强,而是基于视频内容,系统梳理 Veo 2、Sora 等模型已经能实际落地的五个用例,以及它们如何改变广告、内容创作和电影工业的工作方式。