反叛Transformer:Cartesia如何用新架构重塑实时语音AI
这期 No Priors 对话了 Cartesia 联合创始人 Karan Goel 与 Albert Gu,讲述他们为何挑战 Transformer 架构,并将 SSM 等研究成果带入实时语音产品。文章聚焦他们的技术判断、创业动机,以及低延迟语音 AI 的真实落地方向。
这期 No Priors 对话了 Cartesia 联合创始人 Karan Goel 与 Albert Gu,讲述他们为何挑战 Transformer 架构,并将 SSM 等研究成果带入实时语音产品。文章聚焦他们的技术判断、创业动机,以及低延迟语音 AI 的真实落地方向。
外界还在热议“Apple Intelligence 会不会用上 Llama”,苹果却悄悄给了 Meta 一个否定答案。这不是一次简单的合作流产,而是暴露了苹果、Meta、Google 在 AI 时代完全不同的野心分工,以及一条正在成形的 AI 行业潜规则。
消失半年后,OpenAI 前首席科学家 Ilya Sutskever 终于现身——不是回归大厂,而是亲手创立一家“只做一件事”的公司:安全超级智能。没有产品、没有收入、没有妥协,这不是常规创业,而是一场对整个 AI 产业逻辑的挑战。
这期 No Priors 对话中,Stanford 计算机科学助理教授、Voyage AI 联合创始人兼 CEO Tanguma 回顾了自己从理论研究到创业的关键转折,并系统阐述了他对检索增强生成(RAG)、向量数据库以及大语言模型未来形态的判断。
当所有公司都在高喊“我们接入了大模型”,Stripe却在一场看似低调的分享中,给出了完全不同的答案:真正决定AI能不能落地的,不是模型能力,而是你有没有把它驯化进金融级基础设施。这场分享,透露了Stripe内部如何用Transformer、RAG和安全机制,把AI变成“可用、敢用、长期用”的生产力。
在这期No Priors播客中,OpenAI Sora项目的三位负责人首次系统阐述了他们的核心判断:高保真、可扩展的视频生成模型不仅是创作工具,更可能是通向通用人工智能的关键路径。本文提炼了他们关于世界模型、规模化方法与创作者反馈的独特洞见。
如果你还以为2023年的AI关键词是“全面起飞”,这13张图会让你重新校准认知:开源模型数量首次占据主流,但性能差距仍在;AI投资总体下滑,钱却疯狂涌向生成式AI;而所谓“全球AI竞赛”,在数据面前几乎成了一边倒的游戏。
这是一家仅成立一年的欧洲AI创业公司,却频繁被拿来与OpenAI对标。通过与Mistral AI CEO Arthur Mensch的深度对话,这期播客揭示了Mistral在开源、效率、分发与监管上的一整套反直觉选择,以及这些选择背后的技术与商业逻辑。
这期来自Y Combinator的《Light Cone》节目,通过对OpenAI Sora式生成视频的现场讨论,揭示了生成式AI从“科幻”走向工程现实的关键变化,也分享了YC创业公司在训练基础模型、控制成本和寻找应用落点时的真实经验。
Blackwell 不是一块更快的 GPU,而是一次对 AI 未来路线的公开摊牌:10–100 倍性能跃迁、万亿参数模型、机器人和空间计算,全都被打包进同一个平台。更重要的是,NVIDIA 正在悄悄改变自己的商业定位。