从GPT-5定价到语音AI:一位规模化专家的真实判断

AI PM 编辑部 · 2025年08月26日 · 8 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一场关于GPT-5、AI定价、语音与多模态未来的深度对话。嘉宾结合自己在ChatGPT和多家产品团队的经验,拆解了AI产品从SaaS走向“用量时代”的关键转折,以及为什么语音可能被严重低估。

从GPT-5定价到语音AI:一位规模化专家的真实判断

这是一场关于GPT-5、AI定价、语音与多模态未来的深度对话。嘉宾结合自己在ChatGPT和多家产品团队的经验,拆解了AI产品从SaaS走向“用量时代”的关键转折,以及为什么语音可能被严重低估。

GPT-5的“全民使用”,并不是意外

这一段讨论从GPT-5的发布反应谈起,为什么“所有人都在用,而且用途五花八门”并不让嘉宾感到惊讶。这很重要,因为它揭示了一个被反复低估的事实:当模型能力跨过某个阈值,真正的变化不发生在技术圈,而发生在普通用户身上。

嘉宾直言,“你看到的GPT-5现象,在我看来一点都不意外。”原因并不在于某个具体功能,而在于模型已经足够通用、足够稳定,可以被嵌入几乎任何认知型任务中。从写作、总结,到内部工具、产品原型,使用场景的爆炸本身就是信号。

他回忆自己早期参与ChatGPT相关工作的经历时提到,真正困难的从来不是让模型‘看起来很聪明’,而是让它在大量真实用户、真实需求下依然可靠。这也是为什么GPT-5带来的震撼,更像是规模效应的显现,而非单点突破。

这一判断为后面的定价、界面和多模态讨论打下了基础:当产品不再是“给少数专家用”,所有旧规则都会开始失效。

AI定价的核心冲突:简单 vs. 真实价值

定价是整场对话中最具体、也最“血淋淋”的部分之一。这之所以重要,是因为几乎所有AI创业公司都会在这里踩坑。

嘉宾回忆自己第一次写产品规格、讨论定价时的背景:在SaaS时代,“按人头(seat-based)收费”几乎是默认选项,简单、好卖、也容易被采购接受。但进入AI时代后,价值的产生方式发生了变化——不再取决于“多少人登录”,而是“模型帮你干了多少活”。

问题在于,买家并没有立刻跟上这种变化。他提到一个反复出现的心理障碍:“买家总是会对看不见的用量产生抗拒。”用token、调用次数或计算量计费,在逻辑上合理,但在销售层面极其困难。

因此,嘉宾并没有给出一个‘正确答案’,而是分享了一个现实判断:短期内,seat-based定价依然会存在,因为它足够简单;但长期来看,AI产品一定会向更贴近实际价值的混合模式演进。这不是理念问题,而是公司能否规模化生存的问题。

为什么语音,可能是被低估最严重的AI形态

当话题转向多模态时,语音被单独拎出来强调。这一部分尤为关键,因为它直接挑战了当前“以文本为中心”的AI产品直觉。

嘉宾明确表示:“我很高兴你提到语音,因为我觉得它被严重低估了。”原因并不在于技术炫酷,而在于交互成本。打字、切窗口、复制粘贴,本质上都在打断人类原本的思考流,而语音有机会成为最低摩擦的入口。

他举了几个生活化的场景:头脑风暴、教育辅导、甚至是陪孩子学习。这些场景里,用户并不想‘操作一个工具’,而是想‘对话’。一旦模型能自然地接话、追问,甚至“先开口”,整个体验会发生质变。

更重要的是,语音并不是孤立存在的。它与工具调用、多模态理解结合后,可能成为把AI嵌入真实工作流的关键纽带。这也是他判断“未来很多界面会慢慢消失”的背景前提。

界面正在退场,工作流才是战场

在对话后半段,嘉宾多次提到一个趋势:传统UI的重要性正在下降。这一点之所以重要,是因为它直接影响创业者该把资源投向哪里。

他的观点很直接:“UI会越来越不重要。”并不是说体验不重要,而是显性的界面会被对话、自动化和后台决策所取代。用户关心的不是点了哪个按钮,而是问题有没有被解决。

这也解释了他对“Agent被过度炒作”的保留态度。在他看来,很多所谓Agent的问题不在模型,而在工作流本身就是断裂的。如果底层流程没有被重构,再聪明的Agent也只能在局部打转。

对创业者而言,这意味着真正的机会不在做一个更漂亮的壳,而在深入某个具体场景,把AI变成不可替代的流程节点。

算力、人才与现实约束:冷水同样重要

在GPU、人才竞争等话题上,嘉宾的态度明显更冷静。这一部分的价值在于,它把讨论从“应该做什么”拉回到“能不能做到”。

他提到一个反问式的判断:“你到底要把这些GPU指向哪里?”算力不是抽象资源,而是昂贵且稀缺的现实约束。这直接影响产品路线,而不仅是技术选择。

谈到OpenAI和大厂竞争时,他并不认为会出现简单的赢家通吃。相反,他认为最终受益的可能是更多第三方——模型足够好之后,真正拉开差距的是数据、分发和对场景的理解。

这也是他对创业环境保持乐观的原因之一:模型能力的提升,正在把门槛从‘是否能做’转移到‘是否看得足够清楚’。

总结

这场对话真正有价值的地方,不在于对某个模型或公司下判断,而在于一套清醒的方法论:看清用户真实行为,而不是技术指标;尊重定价和工作流中的人性摩擦;以及对被低估形态(如语音)保持开放。对AI从业者和创业者来说,这些判断比任何单一产品发布都更耐用。


关键词: GPT-5, AI定价, 语音AI, 多模态, ChatGPT

事实核查备注: 视频来源:RedpointAI播客;讨论模型:GPT-5、ChatGPT;涉及公司:OpenAI;核心概念:seat-based定价、用量计费、多模态、语音交互、GPU算力;引用语句均为基于视频语义的原意转述,未引入具体数值或未确认人名。