文章

“提示工程已死”:一场由评估器驱动的反直觉实验

“提示工程已死”:一场由评估器驱动的反直觉实验

Nir Gazit用一次真实的RAG机器人优化实验,挑战了“提示工程是一门手艺”的共识。他没有手工打磨prompt,而是用评估器和Agent把效果从0.4推到0.9,给出了一条更像工程、也更可扩展的路径。

api_bot · 2025-06-27 · 46 阅读 · AI/人工智能
数据才是真正的护城河:AWS如何构建安全、定制化的生成式AI

数据才是真正的护城河:AWS如何构建安全、定制化的生成式AI

在这场AWS分享中,Mani Khanuja用“跳舞的椰子”作为隐喻,反复强调一个核心观点:生成式AI的差异化不在模型,而在数据。她系统拆解了不同AI应用的数据需求差异,并结合Amazon Bedrock,讲清楚如何在安全、合规的前提下,把数据真正变成企业的竞争优势。

api_bot · 2025-06-27 · 38 阅读 · AI/人工智能
为什么90%的GenAI项目卡在规模化?AWS架构师的7个评估习惯

为什么90%的GenAI项目卡在规模化?AWS架构师的7个评估习惯

AWS首席应用AI架构师Justin Mohler基于多年一线经验指出:生成式AI无法规模化,最大瓶颈不是模型,而是评估体系。本文通过真实失败与逆袭案例,系统拆解他提出的“高效GenAI评估七大习惯”,解释为什么评估不是打分工具,而是发现问题、驱动成功的核心引擎。

api_bot · 2025-06-03 · 28 阅读 · AI/人工智能
为什么AI Agent总翻车?一位工程师的冷静诊断

为什么AI Agent总翻车?一位工程师的冷静诊断

在AI Agent被热烈追捧的当下,Sayash Kapoor给出了一次“泼冷水式”的演讲:Agent并没有我们想象中那么可靠。通过法律、科研和产品落地的真实失败案例,他指出问题不在模型能力,而在评估方法与可靠性工程。

api_bot · 2025-04-17 · 29 阅读 · AI/人工智能
从提示到多智能体:LinkedIn构建GenAI平台的真实路径

从提示到多智能体:LinkedIn构建GenAI平台的真实路径

LinkedIn并非一开始就要打造宏大的GenAI平台,而是在真实产品压力下,一步步演化出支撑AI Agent的基础设施。本文还原Xiaofeng Wang的分享,讲清楚他们为何自建平台、如何从简单Prompt走向多智能体系统,以及这些选择背后的工程与组织洞见。

api_bot · 2025-04-16 · 25 阅读 · AI/人工智能
为什么AI工程正在走向Agent工程:swyx的行业分水岭判断

为什么AI工程正在走向Agent工程:swyx的行业分水岭判断

在这场看似轻松却信息密度极高的演讲中,swyx给出了一个清晰信号:AI工程正在从“调用模型”迈向“构建Agent”。这不仅是技术能力成熟的结果,更是一场关于身份、方法论和产业方向的转变。

api_bot · 2025-03-24 · 34 阅读 · AI/人工智能