语音AI真正的难点不在模型:ElevenLabs创始人讲透这门生意的底层逻辑
当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。
当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。
在 Latent Space 的这期访谈里,Mistral 团队抛出了一个让很多企业不舒服的观点:你用得越多闭源模型,手里沉淀多年的私有数据价值就越被浪费。同时,他们正式发布了自家的语音生成模型 Voxal(或 Voxtral)TTS,并罕见地深入讲清了音频模型在架构、token 与部署层面的真实难题。
过去三年,ChatGPT几乎成了AI的代名词。但这支视频抛出一个刺眼的信号:Claude正在用一整套“Agent化”的更新,悄悄改变竞争规则。从OpenClaw的诞生到Claude Co-work的研究预览,这不只是功能更新,而是产品方向的转向。
“我觉得 AI 很混乱。”这是 Greg Isenberg 在这期 59 分钟大师课里的第一句话,也是一句让无数从业者沉默的实话。Agent、MCP、技能、记忆、工具权限——这些被包装成“未来工作方式”的概念,其实大多数人并没真正搞懂。这篇文章带你把 AI Agent 拆到不能再拆,看看真正有用的到底是什么。
如果你觉得AI行业已经没什么新鲜事了,这期TBPN会狠狠打你的脸:Meta悄悄收购社区产品、NVIDIA持续押注新一代模型公司、Claude开始“教你改代码”,而AI写作的风向,正在发生一次危险又真实的反转。
如果你还在纠结谁会赢下大模型之战,这期 a16z 给了一个更冷静、也更残酷的答案:模型只是起点,真正拉开差距的是分发、上下文和平台锁定。从 ChatGPT、Claude、Gemini 的分化,到 Agent、语音、AI 浏览器的崛起,这份 Top 100 报告讲清了消费级 AI 下一阶段的胜负手。
一个几乎没有团队的创始人,用一个AI产品,在短短一个月内跑到100万美元ARR。更反直觉的是:他不是在“做工具”,而是在把“公司本身”交给AI运行。这期 Latent Space 的对话,几乎是一次关于“自运行公司”未来的现场演示。
这不是又一个聊天机器人。Greg Isenberg第一次上手 Perplexity Computer,就让它自动找CEO、写邮件、做竞品监控、盯投资人,还真的把邮件发出去了。更炸的是:它不是“工具”,而是开始接管原本属于人的整套工作流。
当所有人都在谈 AGI、AI Agent 和代码自动化时,TBPN 却泼了一盆冷水:AI 之所以“还没炸”,不是能力不行,而是最基础的产品体验没做好。这支视频点破了几个被忽视、却足以引爆下一轮用户增长的关键细节。
大多数人用AI,只是在“问问题”。Riley Brown 在这条视频里做了一件更激进的事:把AI变成能接管真实工作的“数字员工”。OpenClaw 的7个技能,看似零散,却拼出了下一代工作流的完整形态。