文章

Gemini这一年:一次“转折点”背后的模型、组织与未来

Gemini这一年:一次“转折点”背后的模型、组织与未来

这是一次来自Google DeepMind一线的内部复盘。Logan Kilpatrick用不到12分钟,讲清了Gemini过去一年真正的转折点:为什么2.5 Pro意义重大,DeepMind为何从“纯研究”转向“研究+交付”,以及他们眼中多模态、Agent和“无限上下文”的下一站。

api_bot · 2025-07-10 · 37 阅读 · AI/人工智能
“提示工程已死”:一场由评估器驱动的反直觉实验

“提示工程已死”:一场由评估器驱动的反直觉实验

Nir Gazit用一次真实的RAG机器人优化实验,挑战了“提示工程是一门手艺”的共识。他没有手工打磨prompt,而是用评估器和Agent把效果从0.4推到0.9,给出了一条更像工程、也更可扩展的路径。

api_bot · 2025-06-27 · 47 阅读 · AI/人工智能
37次失败后,他们终于跑通了真正能落地的RAG技术栈

37次失败后,他们终于跑通了真正能落地的RAG技术栈

这是一次来自一线AI工程师的真实复盘:经历37次失败后,Jonathan Fernandes 总结出一套可在生产环境稳定运行的RAG技术栈。文章不仅讲清楚每一层该怎么选,更重要的是解释了为什么很多RAG项目会悄无声息地失败。

api_bot · 2025-06-03 · 43 阅读 · AI/人工智能
RAG评测为何失灵:从“局部问答”到结构化推理的转向

RAG评测为何失灵:从“局部问答”到结构化推理的转向

在RAG几乎成为标配的当下,评测却悄然失真。AI21 Labs的Yuval Belfer和Niv Granot通过真实案例指出:我们正在为错误的基准优化系统。本文还原他们的核心论证,解释为什么主流RAG评测无法反映真实世界,并介绍一种以结构化数据为中心的替代路径。

api_bot · 2025-06-03 · 42 阅读 · AI/人工智能
Knowledge Graph Mullet:用混合图思维修剪GraphRAG复杂度

Knowledge Graph Mullet:用混合图思维修剪GraphRAG复杂度

这场演讲中,William Lyon提出了一个颇具画面感的概念——“Knowledge Graph Mullet”,用混合知识图谱的方式,解决GraphRAG在真实应用中过于复杂的问题。通过结合RDF与属性图、Dgraph与DQL,以及具体的新闻数据与AI Agent示例,他展示了一条更可落地的知识图谱+生成式AI路径。

api_bot · 2025-06-03 · 24 阅读 · AI/人工智能
AI应用设计的革命:从“马车”到“火箭船”的转变

AI应用设计的革命:从“马车”到“火箭船”的转变

本文基于Y Combinator Pete Kumman的访谈,深入探讨AI应用为何未能充分释放潜力,揭示系统提示(system prompt)背后的设计误区,并通过真实案例展示如何让AI真正成为用户的“火箭船”。文章还预测了AI工具与用户交互的新范式,对开发者和产品经理极具启发意义。

api_bot · 2025-05-23 · 44 阅读 · AI/人工智能