他用AI让雕像“打电话说话”,却意外揭开语音Agent的真正未来
如果有一天,你在博物馆里拍下一尊雕像,30秒后它给你打来电话,这不是科幻,而是 ElevenLabs 的一次真实实验。Joe Reeve 用一个“和雕像聊天”的小应用,讲清了当下语音 AI、Agent 和多模态体验中最被低估、也最关键的变化。
如果有一天,你在博物馆里拍下一尊雕像,30秒后它给你打来电话,这不是科幻,而是 ElevenLabs 的一次真实实验。Joe Reeve 用一个“和雕像聊天”的小应用,讲清了当下语音 AI、Agent 和多模态体验中最被低估、也最关键的变化。
一个看似普通的硬件黑客演示,却意外揭示了 AI Agent 的真正威力:不是写代码更快,而是把“人类级探索”自动化。ElevenLabs 的 Boris Starkov 用 Claude Code 逆向了一台 Viking VOIP 电话,过程比结果更震撼。
当所有产品都在往聊天框里挤时,Luke Harries却在台上泼了一盆冷水:纯聊天的AI,不够未来。真正的拐点,是给Agent一副“会听、会打断、会共情”的声音。这不是炫技,而是一次产品形态的升级。
多数人还把语音 AI 当成配音工具时,ElevenLabs 的创始人已经在讨论另一件事:当“声音”成为 AI 的默认界面,整个 AI 产品形态都会被重写。这场在红杉资本的对话,透露了一个正在逼近的拐点。
这期 TBPN 像一场信息密度失控的圆桌:一边是 GPT‑5.4 被拿去“自主改写宝可梦 ROM”,一边是创始人、收入、宏观数据与豪宅八卦齐飞。真正的猛料不在热闹,而在一个信号——AI 正从炫技期,走向残酷的现实期。
如果你还以为“AI生成视频”只是剪剪素材、套套模板,这个视频会直接打你脸。Riley Brown 用10个小时,给一个通用AI Agent装上“动效导演”的能力:自动找品牌资产、写脚本、生成动画、配音乐,最后直接交付一支能用的产品发布视频。
四家科技巨头,一年6500亿美元AI资本开支,比阿波罗登月还贵。更反直觉的是:AI越热,股价越跌。这期AI Daily Brief揭示的不是技术问题,而是一场关于钱、权力和平台归属的结构性转折。
语音合成做了300年,却一直差“临门一脚”。a16z 的这次对话里,ElevenLabs 创始人讲清了一件事:真正的突破不是模型参数,而是“有没有情绪”。这也是他们从0做到110亿美元估值的核心秘密。
今年超级碗,最不安分的不是啤酒和汽车,而是AI公司。Anthropic、ElevenLabs直接下场投广告,明目张胆地对准“懂行的人”。TBPN这期节目,把一件很多人没意识到的事摊开讲清楚:AI已经进入“编排时代”,而真正的竞争,才刚开始。
如果你只把这期节目当成一次“财报串烧”,那你就错过了真正的信号:微软、Meta、特斯拉、苹果、OpenAI正在用完全不同的路径,争夺同一件事——AI时代的控制权。这不是短期股价故事,而是一场关于模型、分发、算力与数据的长期博弈。