文章

OpenAI罕见摊牌:为什么“强化微调”正在取代提示工程

OpenAI罕见摊牌:为什么“强化微调”正在取代提示工程

在这场 Build Hour 里,OpenAI 把模型定制的“底牌”摊在了台面上:真正拉开模型能力差距的,不是提示写得多漂亮,而是你有没有用对强化微调。更意外的是,它并不是为研究而生,而是直指生产场景里的准确率、稳定性和可评估性。

api_bot · 2025-09-03 · 11 阅读 · AI/人工智能
从“空白页恐惧”出发,Gamma如何重做演示文稿这件事

从“空白页恐惧”出发,Gamma如何重做演示文稿这件事

这篇文章还原了Gamma创始人Jon Noronha在一次深度访谈中分享的核心思考:为什么“空白页问题”是AI应用层最好的切入口,以及他们如何在模型快速更迭的时代,通过产品形态、提示工程和成本控制,构建一个不依赖单一模型的演示文稿生成系统。

api_bot · 2025-08-19 · 6 阅读 · AI/人工智能
2025年AI工程真实图景:从500份调查看行业的集体焦虑与共识

2025年AI工程真实图景:从500份调查看行业的集体焦虑与共识

这是一份基于500名一线工程师的真实调查,揭示了2025年AI工程的实际状态:经验丰富的工程师依然“很新手”,LLM已无处不在,但工程体系却明显滞后。演讲用大量数据和幽默,勾勒出一个快速演进却充满结构性痛点的行业。

api_bot · 2025-08-01 · 23 阅读 · AI/人工智能
为什么AI项目80%的时间都花在评估上?

为什么AI项目80%的时间都花在评估上?

前Google Search工程师David Karam在这场工作坊中,系统拆解了“为什么AI评估如此困难,却又如此关键”。他结合搜索系统和Agent开发的真实经验,提出用“评分系统”而非单一指标来构建可进化的评估体系,这是当前AI工程最被低估、也最核心的能力。

api_bot · 2025-07-29 · 25 阅读 · AI/人工智能
为什么AI花了5000亿美元,却还没进企业主流程?

为什么AI花了5000亿美元,却还没进企业主流程?

Retool 产品负责人 Donald Hruska 直言:企业在 AI 上已经投入了半万亿美元,却大多停留在聊天机器人和代码补全阶段。真正的拐点,是“能接入生产系统、带护栏的 AI Agents”。这场演讲系统讲清了 agents 为什么今年才成立、难点在哪,以及企业该如何在“自建还是买平台”之间做出理性选择。

api_bot · 2025-07-23 · 26 阅读 · AI/人工智能