文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

模型没错，是你不会提问：一位AI工程师的提示工程真相

这篇文章还原了 AI Engineer 频道创作者 Dan 关于提示工程的完整方法论：为什么提示工程依然重要、Chain of Thought 和少样本提示为何改变了模型表现，以及在推理模型时代，哪些“老技巧”反而会拖后腿。读完你将知道，问题不在模型，而在你如何与它对话。

api_bot · 2025-02-22 · 78 阅读 · AI/人工智能

推理模型训练 AI Agent 检索增强生成 AI工具

为什么你的大模型评估毫无意义，以及真正可行的修复方法

许多团队投入大量精力做LLM评估，却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲，解释为什么常见的评估体系会“看起来很好、实际上没用”，以及如何通过持续对齐评估器、数据集和真实用户需求，让评估真正产生价值。

api_bot · 2025-02-22 · 64 阅读 · AI/人工智能

AI应用模型训练机器学习 AI Agent 检索增强生成

有了这张地图，AI Agent 评估终于不再靠感觉

这场演讲给 Agent 评估提供了一张系统性的“地图”，把原本模糊的评估问题拆解为可操作的语义与行为维度。它不是教你某个指标，而是教你如何系统性地思考：一个 Agent 到底哪里可能出问题，又该如何衡量。

api_bot · 2025-02-22 · 36 阅读 · AI/人工智能

AI Agent 检索增强生成对话AI

为什么生产级AI推理的未来属于定制化开源模型

Fireworks AI 联合创始人 Dmytro Dzhulgakov 结合自己在 Meta、Google 以及 PyTorch 社区的经历，解释了一个正在发生的转变：生产环境中的 AI 推理，正在从“通用大模型”走向“高度定制的开源模型系统”。这场演讲不仅讨论了成本与性能，更揭示了下一代 AI 产品的真实形态。

api_bot · 2025-02-16 · 54 阅读 · AI/人工智能

推理 AI Agent 检索增强生成生成式AI 模型部署

别再迷信提示工程：保险业如何用DSPy把LLM拉回工程正道

在这场来自AXA德国的真实分享中，Jeronim Morina用保险业的复杂场景，拆解了为什么“提示工程”正在失效，以及DSPy如何把大语言模型重新变成一个可优化、可度量、可工程化的系统。

api_bot · 2025-02-16 · 75 阅读 · AI/人工智能

微调 AI应用机器学习强化学习神经网络

当Claude走进Minecraft：一个可控AI Agent的真实诞生

这是一场把大语言模型从聊天框带进真实世界的现场实验。演讲者展示了如何用Claude和Amazon Bedrock构建一个能“看、想、做”的Minecraft智能体，并分享了在架构选择、工具编排和可控性上的关键经验。

api_bot · 2025-02-15 · 68 阅读 · AI/人工智能

AI应用 AI Agent 开源模型检索增强生成模型部署

Character AI风暴：当陪伴型AI撞上安全、伦理与巨头博弈

这篇文章还原了Character AI从技术理想到争议中心的全过程：未成年人安全危机、与谷歌的生死博弈、创始人回归巨头的交易真相，以及陪伴型AI走向生成式色情的失控边缘。

api_bot · 2025-01-29 · 55 阅读 · AI/人工智能

AI应用检索增强生成生成式AI AI伦理对话AI

OpenAI DevDay 给了一个残酷真相：AI 应用不是先省钱，而是先“烧准”

当 GPT-4o mini 把 32k 成本从 120 美元打到 0.6 美元，很多人以为 AI 规模化已经变成“选便宜模型”的问题。但 OpenAI 在 DevDay 现场泼了一盆冷水：真正决定你能不能活下来的，不是成本，而是你是否先把准确率做到“商业可接受”。这场演讲，几乎是在拆穿所有 AI 应用的幻想。

api_bot · 2024-12-17 · 57 阅读 · AI/人工智能