从GPT-5定价到语音AI：一位规模化专家的真实判断

AI PM 编辑部 · 2025年08月26日 · 8 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一场关于GPT-5、AI定价、语音与多模态未来的深度对话。嘉宾结合自己在ChatGPT和多家产品团队的经验，拆解了AI产品从SaaS走向“用量时代”的关键转折，以及为什么语音可能被严重低估。

这是一场关于GPT-5、AI定价、语音与多模态未来的深度对话。嘉宾结合自己在ChatGPT和多家产品团队的经验，拆解了AI产品从SaaS走向“用量时代”的关键转折，以及为什么语音可能被严重低估。

这一段讨论从GPT-5的发布反应谈起，为什么“所有人都在用，而且用途五花八门”并不让嘉宾感到惊讶。这很重要，因为它揭示了一个被反复低估的事实：当模型能力跨过某个阈值，真正的变化不发生在技术圈，而发生在普通用户身上。

嘉宾直言，“你看到的GPT-5现象，在我看来一点都不意外。”原因并不在于某个具体功能，而在于模型已经足够通用、足够稳定，可以被嵌入几乎任何认知型任务中。从写作、总结，到内部工具、产品原型，使用场景的爆炸本身就是信号。

他回忆自己早期参与ChatGPT相关工作的经历时提到，真正困难的从来不是让模型‘看起来很聪明’，而是让它在大量真实用户、真实需求下依然可靠。这也是为什么GPT-5带来的震撼，更像是规模效应的显现，而非单点突破。

这一判断为后面的定价、界面和多模态讨论打下了基础：当产品不再是“给少数专家用”，所有旧规则都会开始失效。

定价是整场对话中最具体、也最“血淋淋”的部分之一。这之所以重要，是因为几乎所有AI创业公司都会在这里踩坑。

嘉宾回忆自己第一次写产品规格、讨论定价时的背景：在SaaS时代，“按人头（seat-based）收费”几乎是默认选项，简单、好卖、也容易被采购接受。但进入AI时代后，价值的产生方式发生了变化——不再取决于“多少人登录”，而是“模型帮你干了多少活”。

问题在于，买家并没有立刻跟上这种变化。他提到一个反复出现的心理障碍：“买家总是会对看不见的用量产生抗拒。”用token、调用次数或计算量计费，在逻辑上合理，但在销售层面极其困难。

因此，嘉宾并没有给出一个‘正确答案’，而是分享了一个现实判断：短期内，seat-based定价依然会存在，因为它足够简单；但长期来看，AI产品一定会向更贴近实际价值的混合模式演进。这不是理念问题，而是公司能否规模化生存的问题。

当话题转向多模态时，语音被单独拎出来强调。这一部分尤为关键，因为它直接挑战了当前“以文本为中心”的AI产品直觉。

嘉宾明确表示：“我很高兴你提到语音，因为我觉得它被严重低估了。”原因并不在于技术炫酷，而在于交互成本。打字、切窗口、复制粘贴，本质上都在打断人类原本的思考流，而语音有机会成为最低摩擦的入口。

他举了几个生活化的场景：头脑风暴、教育辅导、甚至是陪孩子学习。这些场景里，用户并不想‘操作一个工具’，而是想‘对话’。一旦模型能自然地接话、追问，甚至“先开口”，整个体验会发生质变。

更重要的是，语音并不是孤立存在的。它与工具调用、多模态理解结合后，可能成为把AI嵌入真实工作流的关键纽带。这也是他判断“未来很多界面会慢慢消失”的背景前提。

在对话后半段，嘉宾多次提到一个趋势：传统UI的重要性正在下降。这一点之所以重要，是因为它直接影响创业者该把资源投向哪里。

他的观点很直接：“UI会越来越不重要。”并不是说体验不重要，而是显性的界面会被对话、自动化和后台决策所取代。用户关心的不是点了哪个按钮，而是问题有没有被解决。

这也解释了他对“Agent被过度炒作”的保留态度。在他看来，很多所谓Agent的问题不在模型，而在工作流本身就是断裂的。如果底层流程没有被重构，再聪明的Agent也只能在局部打转。

对创业者而言，这意味着真正的机会不在做一个更漂亮的壳，而在深入某个具体场景，把AI变成不可替代的流程节点。

在GPU、人才竞争等话题上，嘉宾的态度明显更冷静。这一部分的价值在于，它把讨论从“应该做什么”拉回到“能不能做到”。

他提到一个反问式的判断：“你到底要把这些GPU指向哪里？”算力不是抽象资源，而是昂贵且稀缺的现实约束。这直接影响产品路线，而不仅是技术选择。

谈到OpenAI和大厂竞争时，他并不认为会出现简单的赢家通吃。相反，他认为最终受益的可能是更多第三方——模型足够好之后，真正拉开差距的是数据、分发和对场景的理解。

这也是他对创业环境保持乐观的原因之一：模型能力的提升，正在把门槛从‘是否能做’转移到‘是否看得足够清楚’。

这场对话真正有价值的地方，不在于对某个模型或公司下判断，而在于一套清醒的方法论：看清用户真实行为，而不是技术指标；尊重定价和工作流中的人性摩擦；以及对被低估形态（如语音）保持开放。对AI从业者和创业者来说，这些判断比任何单一产品发布都更耐用。

关键词： GPT-5， AI定价，语音AI，多模态， ChatGPT

事实核查备注：视频来源：RedpointAI播客；讨论模型：GPT-5、ChatGPT；涉及公司：OpenAI；核心概念：seat-based定价、用量计费、多模态、语音交互、GPU算力；引用语句均为基于视频语义的原意转述，未引入具体数值或未确认人名。