Suno创始人谈AI音乐:我们要抢在“坏未来”之前

AI PM 编辑部 · 2025年01月26日 · 13 阅读 · AI/人工智能

正在加载视频...

视频章节

这次对话里,Suno CEO Mikey Shulman不仅解释了AI如何生成音乐,更直面一个尖锐问题:如果不主动设计“好未来”,AI音乐很可能走向对艺术家和人类体验都不友好的方向。本文带你理解Suno的技术逻辑、产品哲学,以及他们真正想改变的,不只是音乐制作门槛。

Suno创始人谈AI音乐:我们要抢在“坏未来”之前

这次对话里,Suno CEO Mikey Shulman不仅解释了AI如何生成音乐,更直面一个尖锐问题:如果不主动设计“好未来”,AI音乐很可能走向对艺术家和人类体验都不友好的方向。本文带你理解Suno的技术逻辑、产品哲学,以及他们真正想改变的,不只是音乐制作门槛。

如果我们不做,别人就会做一个更糟的未来

为什么一家AI音乐公司的创始人,会如此严肃地谈“好未来”和“坏未来”?在Mikey Shulman看来,这并不是道德姿态,而是现实判断。他直言不讳地描述了自己最不想看到的场景:“有人做一个AI,让我能无限生成听起来像我最喜欢的艺术家的歌,而那位艺术家一分钱都拿不到。”

在他看来,这种未来并非技术上不可避免,而是设计选择的结果。另一个他强烈反对的方向,是“极端个性化”的音乐世界——每个人登录后,只听到完全为自己定制、对别人毫无意义的音乐。他用一个极具冲击力的比喻形容这种体验:“那就像音乐版的色情内容,非常反社会,也非常孤立。”

Suno试图构建的,是相反的路径。Mikey反复强调一个核心判断:如果AI能让“多十亿人真正更投入音乐”,这不可能是对艺术家的坏事。“我挑战任何人解释,为什么十亿人更爱音乐,会对艺术家有害。”这是他对外界质疑AI音乐“伤害创作者”的正面回应,也奠定了Suno所有产品选择背后的价值观。

从物理系到AI金融,再到音乐:一条意外但必然的创业路径

Suno的诞生,并不是一个“从第一天就要颠覆音乐产业”的故事。恰恰相反,它来自一连串看似偏离主线的选择。Mikey从4岁开始学音乐,学钢琴,高中和大学在乐队里弹贝斯,但毕业后却离开了音乐,去读物理学位,又进入一家做金融领域机器学习的公司。

那家公司叫Kensho,主要做文本和自然语言处理。真正的转折点,来自一个“极不性感”的音频项目:自动转录财报电话会议。在这个过程中,团队突然意识到一件事——声音这个媒介,比文本有趣得多,却又明显落后于文本技术的发展水平。

他们本身都是音乐人,下班后还会在联合创始人的地下室即兴Jam。于是,一个原本并不在计划中的念头逐渐清晰:为什么音频,尤其是音乐,一定要比文本AI落后这么多?尽管很多人提醒他们“音乐不是一条好走的创业路径”,他们还是无法说服自己去做更安全的选择。“音乐太特别了,也太好玩了。”最终,他们离开原公司,创立了Suno,一家专注于音乐生成的AI公司。

音乐模型如何工作:和文本一样,又完全不同

从技术上看,Suno并没有刻意神秘化自己的模型。Mikey坦率地说,他们用的依然是Transformer架构,这一点和大语言模型并无本质区别。真正的难点,在于“音频该如何被切分成Token”。

在文本世界里,Token可以近似理解为“词”或“子词”;而音频是连续信号,每秒要采样大约5万次。一分钟的音频,原始数据量巨大,直接建模几乎不可行。Suno的核心能力之一,就是设计一种类似音频Codec的方式,把连续声音离散化并大幅降采样,同时尽量不损失关键信息。

在这个过程中,模型并不知道什么是乐器、什么是12平均律、什么是人声或伴奏。它只知道“声音”,并学习预测“下一小段声音会是什么”。Mikey形容这点时说得很直白:就像文本模型预测下一个词一样,音乐模型预测的是下一个声音片段。

但音乐和文本的根本差异在于评判标准。文本有相对明确的“对或错”,而音乐完全基于品味和主观感受。“规模并不能解决一切问题。”他提醒,不要简单把OpenAI或Anthropic在文本上的成功方法,原封不动套用到音乐上。

音乐不该只是背景音:Suno想把音乐变成一种“可参与”的体验

在Mikey看来,今天大多数人对音乐的使用方式,被严重低估了。音乐无处不在,但往往只是背景音:工作时的播放列表、通勤路上的随机推荐。这种“被动消费”,并没有体现音乐真正的价值。

Suno想改变的,正是这一点。他把理想中的音乐体验,类比为一种游戏:它是互动的、有创造性的,最好还能和朋友一起完成。未来,人们甚至不会区分“创作”和“消费”,而是简单地说:“我今天花了一小时在音乐上。”

这种理念,也体现在产品数据上。Suno曾公开过一个关键数字:已经有2500万人在平台上生成过歌曲,而且其中绝大多数人是第一次“真正创作音乐”。Mikey特别关注一个指标:新用户是否会在用完10首免费歌曲后,触碰到付费墙。“如果他们走到那里,说明他们刚刚享受了15分钟的快乐。”

在功能层面,他最喜欢的不是最炫技的模型升级,而是“Cover”功能——对同一首歌做不同版本的改编。这并非一开始就有强烈的用户呼声,而是在反复听到“能不能就保持不变,只改一点点”之后,团队意识到,这背后有巨大的大众需求。

总结

这次对话最打动人的地方,并不在于Suno能生成多好听的歌,而在于Mikey Shulman对“方向感”的执着。他清楚地知道,AI音乐不可避免,但它走向哪里,取决于今天的选择。与其放任一个剥夺艺术家、让音乐变得孤立的未来,不如主动设计一个让更多人参与、创造、分享音乐的世界。这种对产品、技术和文化同时负责的态度,或许正是Suno真正的护城河。


关键词: Suno, AI音乐, 生成式AI, Transformer, 音乐创作

事实核查备注: 人物:Mikey Shulman(Suno CEO兼联合创始人);公司:Suno、Kensho、OpenAI、Anthropic;产品与技术:Transformer、Token、音频离散化、Cover功能;数字:约2500万人在Suno生成过歌曲、每秒约5万次音频采样;平台:Discord社区最初为主要产品形态。