Suno 与 Mikey Shulman：AI 如何把音乐创作还给普通人

AI PM 编辑部 · 2024年05月30日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

这是一篇基于 RedpointAI 访谈的视频深度文章，聚焦 AI 音乐公司 Suno 的产品理念与技术取舍。你将看到 Suno CEO Mikey Shulman 如何理解“创作的快乐”、为什么音乐是下一代 AI 的关键媒介，以及他们在模型训练、交互方式和社区构建上的真实思考。

Suno 与 Mikey Shulman：AI 如何把音乐创作还给普通人

这是一篇基于 RedpointAI 访谈的视频深度文章，聚焦 AI 音乐公司 Suno 的产品理念与技术取舍。你将看到 Suno CEO Mikey Shulman 如何理解“创作的快乐”、为什么音乐是下一代 AI 的关键媒介，以及他们在模型训练、交互方式和社区构建上的真实思考。

从一首即兴 Trap 歌开始：AI 音乐为何突然爆发

这期播客的开场并不寻常。主持人当场让 AI 生成一首“关于无监督学习的弹跳 Trap 歌”，几秒钟后，一段完整的音乐就播放了出来。这不是炫技，而是 Suno 想传达的核心信息：音乐创作的门槛，已经被 AI 彻底击穿。

Mikey Shulman 直言，AI 正在“完全改变音乐行业”，而 Suno 是其中最具病毒式传播力的产品之一。到访谈时，Suno 已拥有超过 1000 万用户生成过歌曲，并完成了 1.25 亿美元的新一轮融资。相比传统音乐软件依赖复杂工作流，Suno 选择从一句话、一个想法开始，让用户“先听到结果，再决定要不要继续创作”。

他提到一个让自己印象极深的夜晚：在一次内部或朋友聚会中，不同背景的人用 Suno 即兴创作音乐，那种纯粹的兴奋感，让他想起童年第一次接触音乐的状态。正如他所说：“音乐本来就应该是好玩的，而不是先学三年软件再开始。”这一价值判断，几乎贯穿了 Suno 所有产品决策。

把“内心的小孩”还给大人：Suno 的产品哲学

为什么大多数成年人不再创作音乐？在 Mikey 看来，问题不在于审美，而在于工具。他指出，今天有“非常多品味极好的人”，却被 Ableton、Pro Tools 这类专业软件挡在门外。流程复杂、空白画布效应（blank canvas problem），让很多人还没开始就已经放弃。

Suno 的解法是重构创作起点。用户可以用文本提示开始，也可以哼一段旋律、上传声音、甚至通过视觉或情绪来触发音乐生成。Mikey 强调：“提示不应该只是一段文字，人类表达音乐的方式远不止这一种。”

他分享了一个私人故事：自己经常和儿子一起用 Suno 做音乐。“和别人一起创作，是我人生中最快乐的时刻之一。”正因为这种体验太过珍贵，Suno 才希望把它“重新带回给成年人”，让创作变成一种日常而非专业行为。

在用户使用方式上，他们观察到两类典型人群：一类是“为生活配乐”，为情绪、节日或特殊时刻生成音乐；另一类是 power users，真正沉浸在反复生成、调整和打磨的过程中。Suno 的目标，是同时服务这两端，而不是只做玩具或只做工具。

技术取舍：延迟、评估与 GPU 才是硬仗

在看似浪漫的音乐创作背后，是一整套非常“工程化”的取舍。Mikey 反复提到一个关键词：延迟（latency）。如果生成音乐需要等待太久，创作的情绪就会被打断。因此，Suno 在基础设施上必须支持接近流式的音频生成，这对 GPU 部署和系统扩展提出了极高要求。

在模型评估上，他们并不迷信传统指标。Mikey 直言：“美感很重要，而美感无法完全自动化评估。”Suno 大量依赖人工反馈，包括内部评审和 Discord 社区的即时反馈，用来判断模型是否真的在“变好听”。

谈到模型训练和未来方向，他确认融资的核心用途之一就是持续训练更强的音乐模型，但并未夸大技术细节或时间表。相比参数规模，他更关心的是模型是否真正服务于表达。

在定价层面，Suno 也在探索 AI 产品不同于传统 SaaS 的模式。音乐生成的边际成本接近于零，但价值并不等于零。如何在“人人可用”和“可持续商业”之间找到平衡，是他们仍在试探的问题。

音乐作为第一类媒介：多人创作与互动未来

比单人创作更重要的，是连接。Mikey 明确表示，Suno 正在把“多人”作为一等公民来设计：既包括同步的 jam session，也包括异步协作。音乐不再是文件，而是沟通方式。

他设想了多种场景：Twitch 主播和观众一起实时生成音乐；数字演唱会根据观众情绪变化；甚至在体育场中，音乐成为互动体验的一部分。在这些设想里，音乐是沟通语言，而不是背景音。

当被问及开源、IP 和艺术家授权等敏感问题时，Mikey 的态度相对克制。他承认行业仍在快速演化，但强调“同意与尊重”必须是前提。这也是 Suno 选择通过社区而非单向发布来学习的原因。

访谈的结尾，大家再次用 Suno 生成了一段音乐作为收尾。这种从头到尾的“现场创作”，本身就是 Suno 想证明的事情：AI 音乐不是未来概念，而是已经发生的日常体验。

总结

这次对话最有价值的地方，不在于某个模型参数或功能清单，而在于 Suno 对“为什么要创作音乐”的重新回答。通过降低门槛、尊重美感、重视延迟和社区反馈，Suno 正试图把音乐从专业领域，重新变成一种人类本能的表达方式。对所有关注 AI 应用的人来说，这是一堂关于产品直觉与技术现实如何共存的生动案例。

关键词： AI音乐， Suno，多模态生成，音乐创作， GPU基础设施

事实核查备注：视频来源：RedpointAI；嘉宾：Mikey Shulman（Suno CEO）；关键事实：Suno 用户数超 1000 万；融资金额 1.25 亿美元；讨论技术点包括延迟（latency）、GPU 扩展、人工美学评估、多人创作；未明确提及具体模型参数或估值数字。

返回文章列表