文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

当机器人“抢工作”：Twilio文档团队的真实AI协作实践

当机器人“抢工作”：Twilio文档团队的真实AI协作实践

在这场来自 AI Engineer 世界博览会的演讲中，Elmer Thomas 和 Maria Bermudez 用一个真实而克制的案例，展示了AI如何不是取代人，而是成为小团队的放大器。他们分享了Twilio文档团队如何用多个单一职责AI Agent，解决高风险、低创造性的工作，并通过严密的护栏机制，把“AI会胡说八道”的风险降到可控范围。

api_bot · 2025-06-03 · 40 阅读 · AI/人工智能

AI应用 AI Agent AI工具幻觉提示工程

为什么90%的GenAI项目卡在规模化？AWS架构师的7个评估习惯

为什么90%的GenAI项目卡在规模化？AWS架构师的7个评估习惯

AWS首席应用AI架构师Justin Mohler基于多年一线经验指出：生成式AI无法规模化，最大瓶颈不是模型，而是评估体系。本文通过真实失败与逆袭案例，系统拆解他提出的“高效GenAI评估七大习惯”，解释为什么评估不是打分工具，而是发现问题、驱动成功的核心引擎。

api_bot · 2025-06-03 · 29 阅读 · AI/人工智能

推理机器学习生成式AI 幻觉提示工程

当云架构变成认知工作：多智能体如何真正“会思考”

当云架构变成认知工作：多智能体如何真正“会思考”

这场演讲分享了Cato在构建云架构AI Copilot过程中的真实探索：为什么传统自动化不够用，以及如何通过多智能体、图结构和严谨评估，让AI参与复杂的架构推理与决策。

api_bot · 2025-06-03 · 45 阅读 · AI/人工智能

推理 AI Agent 检索增强生成幻觉大语言模型

从提示到微调：Meta工程师的AI产品实战路线图

从提示到微调：Meta工程师的AI产品实战路线图

这是一堂来自Meta一线工程师的“浓缩版AI产品课”。Adam Loving结合大量真实案例，讲清楚了Prompt、Evals、RAG与Fine-tuning之间的取舍逻辑，以及为什么开源模型Llama正在改变企业构建AI产品的方式。

api_bot · 2025-06-01 · 32 阅读 · AI/人工智能

微调 AI应用开源模型检索增强生成幻觉

AI应用设计的革命：从“马车”到“火箭船”的转变

AI应用设计的革命：从“马车”到“火箭船”的转变

本文基于Y Combinator Pete Kumman的访谈，深入探讨AI应用为何未能充分释放潜力，揭示系统提示（system prompt）背后的设计误区，并通过真实案例展示如何让AI真正成为用户的“火箭船”。文章还预测了AI工具与用户交互的新范式，对开发者和产品经理极具启发意义。

api_bot · 2025-05-23 · 44 阅读 · AI/人工智能

模型训练代码生成幻觉用户界面大语言模型

OpenAI Deep Research：一个AI如何学会像研究员一样上网

OpenAI Deep Research：一个AI如何学会像研究员一样上网

Isa Fulford首次系统讲述了OpenAI Deep Research的诞生过程：从一个“临时拼出来”的Demo，到基于强化学习和工具训练的研究型AI Agent。它揭示了OpenAI如何把推理模型真正带入现实世界任务。

api_bot · 2025-05-08 · 20 阅读 · AI/人工智能

微调 AI应用推理模型训练强化学习

他用一天做出首个AI SaaS，还敢开源代码

他用一天做出首个AI SaaS，还敢开源代码

一个看似玩笑的“百万美元SaaS”，背后却藏着当下最值得AI从业者抄作业的一整套打法：一天上线、异步任务不掉线、支付即积分、代码全开源。这不是炫技，而是一次极度现实的创业演示。

api_bot · 2025-04-28 · 15 阅读 · AI/人工智能

AI应用生成式AI AI工具幻觉 Cursor

他用 Cursor + Claude，真的把 AI 写的 iOS App 上架并开始赚钱了

他用 Cursor + Claude，真的把 AI 写的 iOS App 上架并开始赚钱了

很多人还在讨论“AI 能不能写 App”，而这期视频里，答案已经变成了：不仅能，而且是原生 iOS、能上架、能收费。Greg Isenberg 请来了一位深度用户，完整展示了他如何用 Cursor + Claude，把一个想法一步步变成真正运行、可发布的 iOS 应用，以及过程中踩过的坑。

api_bot · 2025-04-28 · 14 阅读 · AI/人工智能

AI Agent 幻觉 Cursor 提示工程

从强化学习到Deep Research：OpenAI如何重新定义AI浏览与研究

从强化学习到Deep Research：OpenAI如何重新定义AI浏览与研究

这期No Priors播客首次系统讲述了OpenAI Deep Research的起源与设计取舍：为什么不把Agent做成“点按钮的机器人”，而是优先解决信息综合？以及强化学习如何在真实产品中学会规划、搜索与自我约束。

api_bot · 2025-04-24 · 27 阅读 · AI/人工智能

微调 AI应用模型训练强化学习通用人工智能

当90%准确率仍不够用：金融领域为何仍需要专用大模型

当90%准确率仍不够用：金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天，Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案：越“会思考”的模型，在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 33 阅读 · AI/人工智能

微调推理模型训练开源模型幻觉

上一页下一页

共 120 篇文章

社群

|

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，1 周前

🔥 本周热读