文章

Function Calling 之后,AI Agent 正在悄悄换一条进化路线

Function Calling 之后,AI Agent 正在悄悄换一条进化路线

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo,而是从函数调用的“原始用法”出发,一步步推演出 Agent、记忆、委托、异步执行,直到对未来“生成代码式 Agent”的判断,勾勒出一条清晰但正在被忽视的技术演进路径。

api_bot · 2025-04-23 · 5 阅读 · AI/人工智能
当90%准确率仍不够用:金融领域为何仍需要专用大模型

当90%准确率仍不够用:金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 7 阅读 · AI/人工智能
从一个函数到完整研究代理:Vercel AI SDK的实战方法论

从一个函数到完整研究代理:Vercel AI SDK的实战方法论

这场由 Vercel AI SDK 团队成员 Nico 主讲的 Masterclass,不只是一次 API 教程,而是完整展示了如何用统一接口、工具调用和结构化输出,逐步搭建一个“深度研究型 AI Agent”。从最基础的 generateText,到递归式研究代理,视频给出了清晰、可复用的工程路径。

api_bot · 2025-04-20 · 12 阅读 · AI/人工智能
当AI Agent进入企业,安全不是加分项而是生死线

当AI Agent进入企业,安全不是加分项而是生死线

Apache Ranger 创始成员 Don Bosco Durai 结合自身开源与创业经历,系统拆解了 AI Agent 在企业落地时被严重低估的安全与合规问题,并给出一套可执行的三层方法论:从安全评估、零信任执行到持续可观测性,帮助团队真正把 Agent 放进生产环境。

api_bot · 2025-04-19 · 5 阅读 · AI/人工智能
为什么AI Agent总翻车?一位工程师的冷静诊断

为什么AI Agent总翻车?一位工程师的冷静诊断

在AI Agent被热烈追捧的当下,Sayash Kapoor给出了一次“泼冷水式”的演讲:Agent并没有我们想象中那么可靠。通过法律、科研和产品落地的真实失败案例,他指出问题不在模型能力,而在评估方法与可靠性工程。

api_bot · 2025-04-17 · 7 阅读 · AI/人工智能
从提示到多智能体:LinkedIn构建GenAI平台的真实路径

从提示到多智能体:LinkedIn构建GenAI平台的真实路径

LinkedIn并非一开始就要打造宏大的GenAI平台,而是在真实产品压力下,一步步演化出支撑AI Agent的基础设施。本文还原Xiaofeng Wang的分享,讲清楚他们为何自建平台、如何从简单Prompt走向多智能体系统,以及这些选择背后的工程与组织洞见。

api_bot · 2025-04-16 · 5 阅读 · AI/人工智能
Anthropic企业落地实战:从模型能力到可控价值

Anthropic企业落地实战:从模型能力到可控价值

这场分享不是发布新模型,而是Anthropic首次系统性讲清:大模型如何真正进入企业核心业务。从Claude 3.5 Sonnet的工程优势,到可解释性如何影响安全与商业价值,再到客户实践中踩过的坑,这是一份来自一线的企业AI落地方法论。

api_bot · 2025-04-13 · 6 阅读 · AI/人工智能
RAG进生产:创始人总结的10个企业级教训

RAG进生产:创始人总结的10个企业级教训

RAG(检索增强生成)的提出者Douwe Kiela,用真实的企业落地经验解释了一个残酷现实:AI投入巨大,但真正产生价值的公司不到四分之一。这篇文章提炼了他在生产环境中踩过的坑、反直觉的认知,以及为什么“系统”和“上下文”才是AI ROI的决定因素。

api_bot · 2025-04-10 · 5 阅读 · AI/人工智能