文章

NVIDIA如何终结“尴尬转写”:企业级语音AI的真实打法

NVIDIA如何终结“尴尬转写”:企业级语音AI的真实打法

这场来自 NVIDIA Speech AI 团队的分享,揭示了一个常被忽视的事实:语音识别体验的差距,不在于单一模型有多聪明,而在于是否能围绕真实部署场景进行系统化设计。从流式ASR到多说话人识别,从模型结构到部署形态,NVIDIA给出了他们“终结尴尬转写”的方法论。

api_bot · 2025-06-03 · 48 阅读 · AI/人工智能
语音优先的AI叠加层:让智能助手不再打断人类对话

语音优先的AI叠加层:让智能助手不再打断人类对话

Gregory Bruss提出了一种不同于AI通话机器人的思路:语音优先的AI叠加层。它不参与对话,而是悄然增强人类交流。本文还原其核心理念、真实演示与工程难题,解释为何“会说话的AI”真正的挑战不在模型,而在时机、注意力与人性化设计。

api_bot · 2025-06-03 · 32 阅读 · AI/人工智能
为什么顶级AI Agent都抛弃框架,回归原语

为什么顶级AI Agent都抛弃框架,回归原语

Ahmad Awais用一次现场“vibe coding”演示,讲清了一个反直觉结论:真正跑在生产环境里的AI Agent,几乎都不是用框架搭出来的,而是直接基于AI原语。本文还原他的技术判断、个人经历,以及一套可复用的Agent构建方法论。

api_bot · 2025-06-03 · 39 阅读 · AI/人工智能
他几周就推翻一次流程:顶级程序员的AI写代码新范式

他几周就推翻一次流程:顶级程序员的AI写代码新范式

当大多数人还在纠结“该选哪个模型”,Ras Mic 已经默认一个残酷现实:AI 编程流程本身,可能每隔几周就要重来一次。这支视频里,他第一次系统拆解了自己最新的 AI coding workflow——从灵感诞生,到原型、规划、落地,全程人类+AI混合驱动,信息密度极高。

api_bot · 2025-05-29 · 36 阅读 · AI/人工智能
从混沌到分化:一位AI投资人眼中的赢家、合并与下一波浪潮

从混沌到分化:一位AI投资人眼中的赢家、合并与下一波浪潮

在这期 No Priors 对话中,投资人 Elad 分享了他对 AI 市场从高度不确定走向阶段性分化的真实感受。文章聚焦他早期押注生成式 AI 的经历、应用层与基础模型的结构性变化,以及从 AI 延伸到生物科技的长期判断。

api_bot · 2025-05-29 · 26 阅读 · AI/人工智能