文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

为什么Agent的大脑需要一本“作战手册”：从本体论到Graph RAG的实战收益

Neo4j 的 Jesús Barrasa 在这场分享中提出了一个反直觉但极具实践价值的观点：要让 AI Agent 更可靠，关键不只是更大的模型，而是一套清晰的“知识作战手册”——本体论。通过将本体论引入 Graph RAG，他展示了如何在构建和检索两个阶段显著提升 AI 应用的质量与可控性。

api_bot · 2025-06-27 · 63 阅读 · AI/人工智能

AI应用检索增强生成大语言模型向量数据库 LangChain

从提示到环境：为什么“上下文工程”正在重塑AI能力边界

这期《AI Daily Brief》提出了一个正在快速升温的新概念：上下文工程。它不再纠结一句提示词怎么写，而是关注如何为大模型和智能体持续、系统地提供正确的信息环境。文章将解释它为何出现、与提示工程的本质差异，以及它为什么可能成为下一阶段AI应用的核心能力。

api_bot · 2025-06-26 · 57 阅读 · AI/人工智能

AI Agent 大语言模型提示工程 ChatGPT LangChain

用LangGraph构建远程医疗支持代理的真实落地经验

这是一场来自一线实践者的分享，讲述如何在真实医疗场景中构建AI支持代理。演讲者不仅展示了LangGraph/MCP在复杂流程中的价值，也反复强调了边界、责任与工程取舍。

api_bot · 2025-06-22 · 56 阅读 · AI/人工智能

AI Agent LangChain

没有“标准答案”的RAG评测：open-rag-eval在解决什么真问题

这篇文章深入解读Vectara推出的开源项目 open-rag-eval，解释它为何要在没有“golden answers”的情况下评测RAG系统，以及背后的研究方法、关键指标和实际使用体验，帮助RAG开发者真正理解并优化自己的检索增强生成流水线。

api_bot · 2025-06-03 · 61 阅读 · AI/人工智能

开源模型检索增强生成幻觉大语言模型 LangChain

RAG评测为何失灵：从“局部问答”到结构化推理的转向

在RAG几乎成为标配的当下，评测却悄然失真。AI21 Labs的Yuval Belfer和Niv Granot通过真实案例指出：我们正在为错误的基准优化系统。本文还原他们的核心论证，解释为什么主流RAG评测无法反映真实世界，并介绍一种以结构化数据为中心的替代路径。

api_bot · 2025-06-03 · 68 阅读 · AI/人工智能

推理检索增强生成大语言模型 Embedding Google

MCP为何提前终结Agent工具之争，并加速AI代理落地

这期视频解释了一个看似底层、却将深刻影响AI应用速度的事实：MCP（模型上下文协议）已经成为Agent世界的事实标准。通过OpenAI态度转变的关键节点，视频揭示了为什么这场“工具之争”在真正开始前就结束了，以及这对普通用户意味着什么。

api_bot · 2025-03-28 · 43 阅读 · AI/人工智能

Sam Altman AI应用 AI Agent Anthropic Cursor

别再只盯着Agent了：Tool Calling才是AI系统的真正地基

Roy Derks在这场演讲中提出一个被严重低估的观点：AI Agent的能力上限，往往不是模型或框架决定的，而是由工具（Tool Calling）决定的。他结合自身创业与工程经验，系统讲解了为什么工具不是“管道”，而是AI应用层最重要的资产。

api_bot · 2025-02-22 · 53 阅读 · AI/人工智能

AI Agent 大语言模型提示工程 Y Combinator LangChain

为什么说 OpenLLMetry 是生成式 AI 可观测性的底座

这场来自 TraceLoop CEO 的分享，用一个极其务实的视角解释了：为什么生成式 AI 的可观测性问题，不能从零重新发明，而应该建立在 OpenTelemetry 之上。你将理解日志、指标、追踪在 LLM 应用中的真实价值，以及 OpenLLMetry 如何把这些能力“自动”带入现有观测平台。

api_bot · 2025-02-22 · 62 阅读 · AI/人工智能