文章

OpenAI开发者亲述:语音Agent真正难的不是说话

OpenAI开发者亲述:语音Agent真正难的不是说话

这是一场来自OpenAI开发者体验团队的一线分享。Dominik Kundel系统讲解了语音Agent为何重要、架构如何选择,以及实时语音Agent在延迟、工具调用和安全上的真实挑战,展示了OpenAI最新Agents SDK与实时API背后的设计取舍。

api_bot · 2025-06-29 · 24 阅读 · AI/人工智能
把“机器人前台”做成真人对话:实时视频AI的工程真相

把“机器人前台”做成真人对话:实时视频AI的工程真相

这场由 Pipecat 与 Tavus 联合分享的演讲,罕见地从工程一线拆解了“实时对话视频 AI”为什么过去很糟、现在终于可行,以及真正的难点不在模型本身,而在编排与部署。读完你会理解,一个 600 毫秒响应的对话式视频系统,究竟是怎样被搭出来的。

api_bot · 2025-06-27 · 22 阅读 · AI/人工智能
语音助手只是起点:Anthropic、Meta与OpenAI的三条AI分叉路

语音助手只是起点:Anthropic、Meta与OpenAI的三条AI分叉路

这期《AI Daily Brief》看似是功能更新合集,实则揭示了三家AI巨头的不同野心:Anthropic用语音模式试探“真正的AI助理”,Meta用组织重构对抗内部迟滞,而OpenAI则悄然布局“用ChatGPT登录一切”的平台化未来。

api_bot · 2025-06-07 · 4 阅读 · AI/人工智能
他为什么说ChatGPT设计得很糟,并亲手“修好”了它

他为什么说ChatGPT设计得很糟,并亲手“修好”了它

这支演讲并不是吐槽ChatGPT功能不够强,而是直指一个更少被讨论的问题:设计。演讲者通过真实演示,指出ChatGPT在语音与文本、多模型协作上的割裂体验,并展示如何用现成API重构一个“更像人类交流”的AI界面。

api_bot · 2025-06-03 · 20 阅读 · AI/人工智能
AI Agent 真正落地前,为什么评估框架才是生死线

AI Agent 真正落地前,为什么评估框架才是生死线

在 AI Agent 工具爆发的当下,Aparna Dhinkaran 提醒行业:真正决定成败的不是你能不能“做出 Agent”,而是你是否知道它在真实世界里有没有正确工作。这场演讲系统拆解了 Agent 的结构、评估方法,以及语音与多模态时代带来的全新挑战。

api_bot · 2025-04-23 · 20 阅读 · AI/人工智能
14%股权、算力同盟与芯片博弈:AI产业的真实权力结构正在浮现

14%股权、算力同盟与芯片博弈:AI产业的真实权力结构正在浮现

这期《AI Daily Brief》串联了四条看似分散却高度相关的新闻:Google持有Anthropic约14%股权、AI Agent公司Manis入华、阿里发布情绪识别模型R1 Omni,以及Intel更换CEO并再度传出与台积电的复杂方案。它们共同勾勒出一个现实:在AI时代,真正的竞争已从模型能力转向资本、算力与地缘政治的综合博弈。

api_bot · 2025-03-20 · 15 阅读 · AI/人工智能
当语音开始“像人一样说话”:Sesame与下一代计算平台的前夜

当语音开始“像人一样说话”:Sesame与下一代计算平台的前夜

一款名为Sesame的语音AI演示,引发了从“技术突破”到“人类关系变化”的巨大讨论。本文通过拆解真实演示、关键技术细节和行业判断,解释为什么有人称它为“语音AI的GPT-3时刻”,以及语音代理为何可能成为下一代计算平台。

api_bot · 2025-03-05 · 4 阅读 · AI/人工智能