当Siri求助Gemini:苹果、谷歌与AI权力重组
这段视频用短短几分钟,串起了三条看似分散却高度相关的AI战线:苹果可能让Gemini成为新Siri的大脑、谷歌搜索向“行动型代理”迈进,以及马斯克对苹果和OpenAI的诉讼风波。它揭示的不是单一产品胜负,而是大厂在生成式AI时代如何重新分工、结盟与对抗。
这段视频用短短几分钟,串起了三条看似分散却高度相关的AI战线:苹果可能让Gemini成为新Siri的大脑、谷歌搜索向“行动型代理”迈进,以及马斯克对苹果和OpenAI的诉讼风波。它揭示的不是单一产品胜负,而是大厂在生成式AI时代如何重新分工、结盟与对抗。
这是一场关于GPT-5、AI定价、语音与多模态未来的深度对话。嘉宾结合自己在ChatGPT和多家产品团队的经验,拆解了AI产品从SaaS走向“用量时代”的关键转折,以及为什么语音可能被严重低估。
多数人还在卷聊天机器人时,Greg Isenberg 已经把注意力放在一个更“土”、却更赚钱的方向:让 AI 接电话。他在视频里毫不避讳地分享了多个正在变现的语音 AI 代理思路,几乎都不是高科技炫技,而是扎扎实实解决没人愿意做的脏活累活。
Conviction 创始合伙人 Sarah Guo 在 2025 年初的演讲中,给出了她对 AI 创业与技术演进的判断:真正的拐点不在模型本身,而在应用层、工作流理解以及“非薄封装”的产品设计。这篇文章提炼了她对 AI Agent、多模态、推理成本和创业护城河的关键洞见。
这场演讲聚焦一个几乎所有语音AI用户都遇到过的问题:系统为什么总是在你还没说完时插话。演讲者从“轮次控制”这一被低估的核心难题出发,拆解了语音活动检测、语义预测到最终决策的整条技术链路,解释为什么这不是一个靠调参就能解决的问题。
这是一场关于实时语音AI的“反直觉”分享:模型能力并不是决定体验的关键,延迟才是。来自 OpenAI 和 Daily 的工程师,用一次紧张又好笑的现场 Demo,拆解了语音 AI 成败背后的真实技术逻辑。
语音智能体迟迟未能大规模落地,并非模型不够强,而是缺乏系统性的评测方法。Coval 创始人 Brooke Hopkins 结合自己在自动驾驶评测体系中的经验,提出用大规模仿真、持续评测和概率化指标,解决语音代理“不可靠、不敢放权”的核心难题。
这场演讲来自 Daily 联合创始人 Quinn,对 Pipecat 这一开源语音 Agent 框架的来龙去脉做了一次“工程师视角”的速览。它不仅讲清了语音 AI 真正难的地方在哪,也解释了为什么企业在语音 Agent 上,越来越重视开源、可控和中立的技术栈。
曾被骂“作弊工具”“脑腐烂制造机”的 ChatGPT,如今被 OpenAI 教育负责人称为“世界上最大的学习平台”。更反直觉的是:真正改变教育的不是答案生成,而是一种全新的“AI 导师”模式。这期播客里,学生、学校和 OpenAI 罕见站在同一条线上。
Anthropic为Claude Code引入周度限流,引爆重度开发者社区的不满。这一事件不仅暴露了Agent式AI工具的真实成本,也折射出整个行业在“强智能该如何定价”上的集体困惑。