从波兰烂配音到全球配音工厂,ElevenLabs把声音做成了基础设施
一家公司不是从AI论文起家,而是从“看不下去的烂配音”出发。Stripe Sessions 现场,ElevenLabs 的 Hugo 用一场几乎不剪辑的现场 demo,展示了语音 AI 如何从“工具”进化成“生产线”。这不只是声音更像人,而是内容全球化的方式正在被重写。
一家公司不是从AI论文起家,而是从“看不下去的烂配音”出发。Stripe Sessions 现场,ElevenLabs 的 Hugo 用一场几乎不剪辑的现场 demo,展示了语音 AI 如何从“工具”进化成“生产线”。这不只是声音更像人,而是内容全球化的方式正在被重写。
没有GPT‑5、没有搜索引擎,甚至Sam Altman都没上台——这场OpenAI春季发布会让不少人失望。但真正看懂的人意识到:GPT‑4o不是一次普通升级,而是在悄悄重写“人和电脑如何互动”的底层规则。
如果你还把 AI 当成“聊天框”,这篇文章会让你意识到自己已经落后了一代。一个让 UI 会“自己长出来”的 SDK、一个被严重低估的免费算力池,以及一个几乎统一所有大模型的 API 入口。
大多数人以为下一代 AI 的竞争点是“谁更聪明”,但 Hume 给出了一个更危险、也更现实的答案:谁更懂你的情绪。它不只是听你说什么,而是判断你此刻的愤怒、失落或困惑,并据此精准回应。这可能是对话 AI 的巨大飞跃,也可能是“亲密操纵”的起点。
在这场演讲中,吴恩达系统性地阐述了为什么“Agentic Workflow(智能体工作流)”将成为下一阶段AI应用的核心。他通过真实实验、失败与惊喜并存的案例,说明迭代、反思和多智能体协作,正在比单次更强模型更重要。
不是科幻,也不是口号。伯尼·桑德斯公开提出:AI带来的生产力提升,应该直接换成“每周32小时、薪水不变”。这一次,AI第一次被推到“社会契约”层面的核心位置。
一首20秒生成、几乎不用调参的AI歌曲,在X上拿下16万播放——这不是炫技,而是一个信号:AI音乐已经跨过“能用”和“好用”的分水岭。这期视频里,Riley Brown展示了他认为“目前最强”的AI音乐生成工具,以及一个很多人还没意识到的内容创作拐点。
一通“拜登语音”差点影响选民投票,白宫终于坐不住了:开始讨论对所有官方沟通进行加密验证。更反直觉的是,这套思路来自区块链,而不是传统媒体监管。与此同时,AI 在巴基斯坦却被用来“解封”被关押的政治声音——这不是科幻,是正在发生的现实。
如果你还停留在“AI 视频就是抽帧+鬼畜”的认知里,那这条 OpenAI 的新视频会直接把你拉进现实。Sora 展示的不是更清晰的画面,而是对物理世界、角色一致性和叙事能力的跃迁——很多人看完的第一反应只有一句话:这不该是 2024 年该出现的东西。
在Sam Altman“被开又复职”风波后,很多人以为OpenAI会被企业客户抛弃。结果恰恰相反:OpenAI的年化收入已经冲到20亿美元,速度快到让亚马逊、谷歌、Meta当年的曲线都显得“保守”。更值得关注的是,这背后真正改变AI行业格局的,并不只是OpenAI一家。