40分钟,用AI造一个“会说话的角色”,为什么这类应用正在悄悄赚钱

AI PM 编辑部 · 2024年10月01日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

有人用AI做语音角色应用,外表像玩具,实际却在稳定赚钱。Greg Isenberg 用一场不到40分钟的实操,展示了一个反直觉事实:今天的AI创业,拼的早已不是模型能力,而是你把“无聊技术”组合成“有情绪的产品”的能力。

40分钟,用AI造一个“会说话的角色”,为什么这类应用正在悄悄赚钱

有人用AI做语音角色应用,外表像玩具,实际却在稳定赚钱。Greg Isenberg 用一场不到40分钟的实操,展示了一个反直觉事实:今天的AI创业,拼的早已不是模型能力,而是你把“无聊技术”组合成“有情绪的产品”的能力。

看起来像玩具,却在“印钞”的AI应用

视频一开场,Greg Isenberg 就抛出一个极具挑衅性的判断:“现在最赚钱的一批 AI 应用,看起来都像玩具。” 不是企业级SaaS,不是复杂工作流,而是语音角色、陪聊、互动式AI。

这句话之所以刺耳,是因为它直接戳中了很多从业者的盲区。我们习惯把“严肃”“复杂”“技术含量高”与商业价值画等号,但现实恰恰相反——用户愿意持续付费的,往往是那些能产生情绪连接的产品。

语音角色类应用正是典型代表:一个有性格、有声音、有一点“人味”的AI,比一个功能强但冷冰冰的工具,更容易被反复打开。Greg 的判断很直接:这不是短期噱头,而是一种被严重低估的产品形态。

真正的门槛,不在模型,而在“拼装能力”

整场视频最有价值的地方,并不是某个炫酷功能,而是他展示的开发路径本身:你几乎不需要写“AI核心代码”。

他们做的事情非常朴素:下载一个现成的代码仓库,用 Next.js 搭前端,用 Cursor 辅助开发逻辑,再接入 Daily 的语音 Bot 服务。大语言模型只负责一件事——生成文本回复。

真正发生魔法的地方在后面:Daily 在后端把 LLM 的文本结果,直接管道式地送进 TTS(文本转语音)。你听到的“角色声音”,并不是模型有多聪明,而是链路足够顺。

这也是一个重要信号:AI 应用的竞争优势,正在从“谁的模型更强”,转向“谁的产品拼装得更快、更顺、更自然”。 模型能力被快速商品化之后,工程整合和体验设计,反而成了护城河。

Function Calling:让语音AI“看起来像懂你”

在中段演示中,Greg 特意停下来讲了一点:Function Calling。

这并不是一个新概念,但在语音场景里,它的效果被严重低估。通过函数调用,AI 不只是“说话”,而是能在对话中触发具体行为、获取特定信息,再把结果自然地说出来。

用户的感知是这样的:这个语音角色,好像真的在“听我说话、理解我需求、然后去做了一件事”。

技术上,它可能只是一次函数返回、一次状态更新;体验上,却是从“语音播报”跨越到“可互动角色”的关键一步。这也是为什么 Greg 强调:不要小看这些看似基础的能力,它们决定了用户会不会觉得‘这东西有点意思’。

从电脑到手机:决定产品命运的最后一步

视频后半段有一个不太起眼、但极其重要的瞬间:Greg 把这个语音角色应用,直接在手机上跑了起来。

他的反应只有一句话:“This is super exciting.” 但这句话背后,是无数 AI 项目失败的分水岭。

很多 Demo 在电脑上看起来不错,一到手机就崩:延迟、权限、交互、场景不成立。而语音角色这种产品,天然就是为移动端而生的——戴着耳机、碎片时间、低认知负担。

当他把手机递给别人试用时,事情已经发生变化:这不再是一个“给程序员看的 Demo”,而是一个可以被真实用户把玩的产品原型。而这,往往就是从“有趣项目”走向“能赚钱应用”的起点。

总结

这场不到40分钟的演示,真正传递的不是某个技术教程,而是一种创业信号:AI 的下半场,属于那些会做“轻产品”的人。语音角色、情绪陪伴、互动体验,这些看起来不够严肃的方向,反而更容易形成付费习惯。

如果你是开发者,最现实的行动建议是:停止纠结模型细节,去练习“拼装”——前端、语音、TTS、Function Calling,把链路跑顺。如果你是产品或创业者,应该重新思考:你的 AI 产品,有没有一个让用户产生情绪连接的入口?

最后留一个判断:未来一年,最先跑出来的 AI 应用,很可能不是更强的工具,而是更会“陪人说话”的角色


关键词: 语音AI, 文本转语音, 大语言模型, AI应用, Function Calling

事实核查备注: 需要核查:视频发布时间是否为2024-10-01;视频标题中提到的工具(Cursor、Next.js、Daily Bots)是否均在视频中实际演示;Greg Isenberg 关于“AI应用在赚钱”的原话表述。