别再迷信提示工程:保险业如何用DSPy把LLM拉回工程正道
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
在这场来自AXA德国的真实分享中,Jeronim Morina用保险业的复杂场景,拆解了为什么“提示工程”正在失效,以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。
OpenAI 在东京发布了一个反直觉的新能力:AI 不再追求“快”,而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新,而是一次对“AI 应该怎么工作”的彻底改写。
一支来自西雅图、成立30年的VC基金宣布募资7.7亿美元,专注AI应用而非模型本身。本文拆解他们的投资逻辑、Runway等具体案例,以及这轮AI浪潮中被忽视的结构性机会。
OpenAI发布首个“真正意义上的AI代理”Operator。本篇文章基于The AI Daily Brief的完整解读,结合7个真实用例,深入分析Operator如何工作、它擅长什么、不擅长什么,以及为什么“替你买菜”并不是最重要的意义。
在2025年CES的两小时演讲中,黄仁勋高调宣布“AI Agent时代已经到来”。这不仅是一次产品发布,更是一份清晰的行业路线图:从模型、芯片到工具链,NVIDIA正试图把AI从“会回答问题”推向“能真正干活”。
当大模型的预训练红利开始显现边际效应,AI行业正在寻找新的增长曲线。本文基于The AI Daily Brief的视频内容,梳理Google DeepMind新组建的世界模型团队、NVIDIA Cosmos的发布,以及业内对AGI路径的分歧,带你理解为什么“理解物理世界”正被视为通往下一代AI的关键一步。
在OpenAI“12天Shipmas”的最后时刻,o3推理模型悄然登场,却引发了关于AGI的巨大争论。本文梳理o3在关键基准上的突破、ARC-AGI测试背后的意义,以及技术圈、开发者与经济学视角的激烈分歧,帮你判断:这是AGI的前夜,还是又一次被误读的飞跃。
一系列看似零散的产品发布,正在勾勒出2025年AI竞争的清晰战线。《AI Daily Brief》指出,推理模型、智能体和世界模型将成为决定下一阶段胜负的三大方向。本文还原这些关键节点,解释它们为何重要,以及它们如何共同改变AI的发展路径。
所有人都在等 GPT-5,OpenAI 却在 DevDay 2024 上选择了另一条路:不拼参数规模,而是把“推理、语音、成本和代理”真正交到开发者手里。这场看似克制的发布,实际上比任何一次模型升级都更激进。
在OpenAI DevDay的舞台上,DataKind抛出一个让AI从业者愣住的结论:在人道主义场景,AI不需要“接近完美”,70%的准确率就足以改变生死。这不是妥协,而是一套经过真实战场验证的工程理性。