Suno 与 Mikey Shulman:AI 如何把音乐创作还给普通人

AI PM 编辑部 · 2024年05月30日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一篇基于 RedpointAI 访谈的视频深度文章,聚焦 AI 音乐公司 Suno 的产品理念与技术取舍。你将看到 Suno CEO Mikey Shulman 如何理解“创作的快乐”、为什么音乐是下一代 AI 的关键媒介,以及他们在模型训练、交互方式和社区构建上的真实思考。

Suno 与 Mikey Shulman:AI 如何把音乐创作还给普通人

这是一篇基于 RedpointAI 访谈的视频深度文章,聚焦 AI 音乐公司 Suno 的产品理念与技术取舍。你将看到 Suno CEO Mikey Shulman 如何理解“创作的快乐”、为什么音乐是下一代 AI 的关键媒介,以及他们在模型训练、交互方式和社区构建上的真实思考。

从一首即兴 Trap 歌开始:AI 音乐为何突然爆发

这期播客的开场并不寻常。主持人当场让 AI 生成一首“关于无监督学习的弹跳 Trap 歌”,几秒钟后,一段完整的音乐就播放了出来。这不是炫技,而是 Suno 想传达的核心信息:音乐创作的门槛,已经被 AI 彻底击穿。

Mikey Shulman 直言,AI 正在“完全改变音乐行业”,而 Suno 是其中最具病毒式传播力的产品之一。到访谈时,Suno 已拥有超过 1000 万用户生成过歌曲,并完成了 1.25 亿美元的新一轮融资。相比传统音乐软件依赖复杂工作流,Suno 选择从一句话、一个想法开始,让用户“先听到结果,再决定要不要继续创作”。

他提到一个让自己印象极深的夜晚:在一次内部或朋友聚会中,不同背景的人用 Suno 即兴创作音乐,那种纯粹的兴奋感,让他想起童年第一次接触音乐的状态。正如他所说:“音乐本来就应该是好玩的,而不是先学三年软件再开始。”这一价值判断,几乎贯穿了 Suno 所有产品决策。

把“内心的小孩”还给大人:Suno 的产品哲学

为什么大多数成年人不再创作音乐?在 Mikey 看来,问题不在于审美,而在于工具。他指出,今天有“非常多品味极好的人”,却被 Ableton、Pro Tools 这类专业软件挡在门外。流程复杂、空白画布效应(blank canvas problem),让很多人还没开始就已经放弃。

Suno 的解法是重构创作起点。用户可以用文本提示开始,也可以哼一段旋律、上传声音、甚至通过视觉或情绪来触发音乐生成。Mikey 强调:“提示不应该只是一段文字,人类表达音乐的方式远不止这一种。”

他分享了一个私人故事:自己经常和儿子一起用 Suno 做音乐。“和别人一起创作,是我人生中最快乐的时刻之一。”正因为这种体验太过珍贵,Suno 才希望把它“重新带回给成年人”,让创作变成一种日常而非专业行为。

在用户使用方式上,他们观察到两类典型人群:一类是“为生活配乐”,为情绪、节日或特殊时刻生成音乐;另一类是 power users,真正沉浸在反复生成、调整和打磨的过程中。Suno 的目标,是同时服务这两端,而不是只做玩具或只做工具。

技术取舍:延迟、评估与 GPU 才是硬仗

在看似浪漫的音乐创作背后,是一整套非常“工程化”的取舍。Mikey 反复提到一个关键词:延迟(latency)。如果生成音乐需要等待太久,创作的情绪就会被打断。因此,Suno 在基础设施上必须支持接近流式的音频生成,这对 GPU 部署和系统扩展提出了极高要求。

在模型评估上,他们并不迷信传统指标。Mikey 直言:“美感很重要,而美感无法完全自动化评估。”Suno 大量依赖人工反馈,包括内部评审和 Discord 社区的即时反馈,用来判断模型是否真的在“变好听”。

谈到模型训练和未来方向,他确认融资的核心用途之一就是持续训练更强的音乐模型,但并未夸大技术细节或时间表。相比参数规模,他更关心的是模型是否真正服务于表达。

在定价层面,Suno 也在探索 AI 产品不同于传统 SaaS 的模式。音乐生成的边际成本接近于零,但价值并不等于零。如何在“人人可用”和“可持续商业”之间找到平衡,是他们仍在试探的问题。

音乐作为第一类媒介:多人创作与互动未来

比单人创作更重要的,是连接。Mikey 明确表示,Suno 正在把“多人”作为一等公民来设计:既包括同步的 jam session,也包括异步协作。音乐不再是文件,而是沟通方式。

他设想了多种场景:Twitch 主播和观众一起实时生成音乐;数字演唱会根据观众情绪变化;甚至在体育场中,音乐成为互动体验的一部分。在这些设想里,音乐是沟通语言,而不是背景音。

当被问及开源、IP 和艺术家授权等敏感问题时,Mikey 的态度相对克制。他承认行业仍在快速演化,但强调“同意与尊重”必须是前提。这也是 Suno 选择通过社区而非单向发布来学习的原因。

访谈的结尾,大家再次用 Suno 生成了一段音乐作为收尾。这种从头到尾的“现场创作”,本身就是 Suno 想证明的事情:AI 音乐不是未来概念,而是已经发生的日常体验。

总结

这次对话最有价值的地方,不在于某个模型参数或功能清单,而在于 Suno 对“为什么要创作音乐”的重新回答。通过降低门槛、尊重美感、重视延迟和社区反馈,Suno 正试图把音乐从专业领域,重新变成一种人类本能的表达方式。对所有关注 AI 应用的人来说,这是一堂关于产品直觉与技术现实如何共存的生动案例。


关键词: AI音乐, Suno, 多模态生成, 音乐创作, GPU基础设施

事实核查备注: 视频来源:RedpointAI;嘉宾:Mikey Shulman(Suno CEO);关键事实:Suno 用户数超 1000 万;融资金额 1.25 亿美元;讨论技术点包括延迟(latency)、GPU 扩展、人工美学评估、多人创作;未明确提及具体模型参数或估值数字。