2025年是聊天代理的终点?ElevenLabs用“声音”给了AI第二次生命
当所有产品都在往聊天框里挤时,Luke Harries却在台上泼了一盆冷水:纯聊天的AI,不够未来。真正的拐点,是给Agent一副“会听、会打断、会共情”的声音。这不是炫技,而是一次产品形态的升级。
当所有产品都在往聊天框里挤时,Luke Harries却在台上泼了一盆冷水:纯聊天的AI,不够未来。真正的拐点,是给Agent一副“会听、会打断、会共情”的声音。这不是炫技,而是一次产品形态的升级。
当大多数公司还在纠结“要不要用 AI”,Airbnb 已经悄悄把 60% 的代码交给了 AI 写。但 Brian Chesky 在这期访谈里抛出的真正炸点,并不是效率提升,而是:AI 正在重塑“创始人模式”、消费者产品形态,以及下一代设计师的生存方式。
Manus为什么能在发布后迅速引爆市场、候补名单破百万、邀请码被炒到高价?答案不在模型参数,而在一次临时决定的产品视频、一个“让AI自己动手”的设计理念,以及一套完全不同于传统软件的产品方法论。
这一季财报最反直觉的不是“AI赚了多少钱”,而是:赚得越多,投资人越焦虑。Google暴涨、Meta暴跌、Amazon继续疯狂砸钱,Microsoft稳得像老干部——AI叙事第一次出现明显分叉。这不是一轮简单的科技股行情,而是一场关于“谁能把AI变成真钱”的公开对赌。
一次凌晨2点到6点的对话,让小米大模型负责人罗福莉彻底改观:AI 已经不只是“能聊”,而是开始替人工作、改变研究节奏。OpenClaw 发布后,她意识到,一个新的技术范式其实已经悄悄发生。
这场对谈抛出一个反直觉观点:在生成式 AI 时代,真正的“创作者”可能不是你。模型更像一场永远即兴的演出,而人类,正在从创作者变成高级观众与合作者。这不是贬低,而是一次创作范式的重置。
把 Gemma 4 直接跑在 iPhone 上,而且速度能到 40 tokens/s——这不是概念演示,而是已经能用的体验。Adrien Grondin 用 MLX 展示了边缘大模型的临界点:不靠云、不等网络,AI 开始真正住进你的手机。
当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。
在 Latent Space 的这期访谈里,Mistral 团队抛出了一个让很多企业不舒服的观点:你用得越多闭源模型,手里沉淀多年的私有数据价值就越被浪费。同时,他们正式发布了自家的语音生成模型 Voxal(或 Voxtral)TTS,并罕见地深入讲清了音频模型在架构、token 与部署层面的真实难题。
过去三年,ChatGPT几乎成了AI的代名词。但这支视频抛出一个刺眼的信号:Claude正在用一整套“Agent化”的更新,悄悄改变竞争规则。从OpenClaw的诞生到Claude Co-work的研究预览,这不只是功能更新,而是产品方向的转向。