文丨海克财经,作者 | 范东成
现在全球的人工智能技术真是发展得飞快。
就在2025年12月11日,OpenAI又推出了新一代的GPT-5.2,紧接着在2025年8月8日发布的GPT-5后不久。仅仅三个月后,他们又更新到了GPT-5.1,现在又来了新版本。这一系列动作,被解读为OpenAI对于谷歌在2025年11月18日发布的Gemini 3的强劲挑战的积极应对。
如今,全球顶尖的人工智能公司正在利用他们的技术优势,迅速占领写作、绘画、音乐等多个创意领域。尤其是音乐,这不仅涉及到人们的情感表达,还关乎复杂的版权问题,这可真是备受关注。
谷歌的DeepMind在2024年5月和YouTube联手推出了一个AI音乐创作工具,叫做Music AI Sandbox。使用这个工具,用户可以创作和优化音乐作品,并且一键上传到YouTube。到了2025年4月,谷歌又推出了新一代音乐制作模型Lyria 2,并将它集成在Music AI Sandbox中。Lyria 2支持以文本提示生成完整的歌曲,包括旋律、编曲和人声,风格多样。
根据《The Information》在2025年10月的报道,OpenAI也在秘密研发AI音乐生成工具,并与美国知名的茱莉亚学院的学生合作,标注乐谱,以构建高质量的模型训练数据。
技术的飞跃让AI音乐开始在各大音乐排行榜上崭露头角。
以Spotify为例,在2025年11月的Spotify Viral 50榜单上,AI音乐多次出现。其中,一首热门歌曲《Walk My Walk》的播放量竟然超过了640万。由美国诗人泰莉莎(Telisha Nikki Jones)利用AI音乐生成平台Suno创作的虚拟歌手Xania Monet,在Spotify上拥有超过120万的听众,她的热门曲目《How Was I Supposed to Know?》甚至进入了美国著名音乐榜单Billboard。

在国内,从2025年2月使用DeepSeek创作的《七天爱人》,到2025年10月和11月在B站热度飙升的《美猴亡》《Money Back My Home》,再到抖音上的热门AI歌曲《远山少年》《不能不想你》,这些歌曲的播放量都在百万以上,甚至有的超过了1000万。
这些作品的火爆吸引了市场对AI音乐生成平台的关注。
海外市场中,比较有名的AI音乐生成平台有Suno和Udio。这两家公司都专注于依据文字描述直接生成包含人声、歌词和编曲的完整歌曲。
Suno成立于2022年,目前已经推出了V5版本,并在2025年11月获得了Menlo Ventures的2.5亿美元(约合人民币17.6亿元)投资,公司估值达到24.5亿美元(约合人民币172.8亿元)。

而Udio则是由谷歌的前研究人员创立,2024年4月上线后立刻引起了市场的关注,并迅速获得了超过1000万美元(约合人民币7000万元)的投资。

在国内,字节跳动推出的海绵音乐、网易云音乐的天音AI、阿里的Inspire Music以及昆仑万维的天工SkyMusic等公司也在积极布局这一市场。
AI音乐大幅降低了创作的技术门槛,让更多人能够参与进来,给整个行业注入了前所未有的活力。不过,争议也随之而来,部分听众对AI创作的作品存在天然的抵触情绪,版权问题在法律和伦理方面也亟待解决。AI音乐在飞速发展的同时,还需克服不少挑战。
新意源于技术
如今,国内已有很多质量相对较高的AI音乐作品逐渐被大众所接受。
比如在B站上火得一塌糊涂的《美猴亡》。博主“漫游会议室”在2025年10月发布了一段视频,名为“大圣深夜崩溃,悲情演唱《美猴亡》”,该视频播放量已超过1344万次,并被纳入B站的“每周必看”榜单。视频中,经典剧集《西游记》中的孙悟空形象戴着耳机,在录音棚里演唱这首歌,而词曲和演唱者都是孙悟空本人。
AI音乐的崛起与创新之旅
大家一定听过《美猴亡》这首歌吧!它强烈的摇滚风格和独特的歌词吸引了不少粉丝。在B站的评论区,大家纷纷赞叹这首歌的词曲质量,比如“他们杀死了美猴王,用虚名,用香火,用金光”这样的歌词让人印象深刻。《美猴亡》的流行也促使了许多音乐博主的翻唱,像是歌手曾一鸣的翻唱视频,播放量已经突破了114万。
在B站的主页上,有个博主叫“漫游会议室”,他除了在B站上传这些歌曲外,还把它们授权到了网易云音乐。《美猴亡》在网易云音乐的摇滚榜单上多次跻身前三,说明了它的受欢迎程度。因为这首歌在词曲和情感表达上都做得很出色,一些用户甚至怀疑它不是AI创作的。不过,博主已经明确把这些歌曲放在自己创建的“《西游记》AI歌曲”合辑里。
其实,AI作品的高产也是其受欢迎的一个原因。根据海克财经的观察,从2025年10月20日到11月2日,“漫游会议室”每天发布一首歌曲,都是以《西游记》角色的视角写的,包括黑熊精、高翠兰、哮天犬、玉兔精等角色,至今已发布26首,B站的总播放量更是超过了6315万。由于这些歌曲的作词、作曲和演唱都由AI完成,网友们戏称它们为“3A大作”。

同时,还有一首热门AI歌曲《Money Back My Home》,是B站博主“猫爷说道AIGC”在2025年11月发布的,播放量已经超过481万。博主表示,这首歌的歌词是他自己写的,其他部分都是AI创作的。
AI音乐的迅猛发展得益于技术的进步。
回想2022年11月,ChatGPT的出现让很多开发者开始关注AI音乐领域。ChatGPT不仅是自然语言处理技术的新里程碑,还展示了AI在各个领域的合作能力。这种能力让我们看到了AI与人类之间的协作潜力。
需要提到的是,ChatGPT的基础是神经网络结构的Transformer,而Suno也是如此,只不过一个专注于文字,一个专注于音乐。音乐其实是一种有规律的声波,这些声波可以被转化为电信号,并与模型中的基本单元token对应。音乐的各种元素,比如节奏、和声、旋律、歌词和唱腔音色,都能转化为token序列,这个过程叫做tokenization,也就是token化。
不过,把歌曲转化为token会面临数据量的挑战。以CD质量的音频为例,44.1kHz的采样率意味着每秒要对模拟音频信号进行44100次采样,一首3分钟的歌曲就会有近800万次采样。如果每次采样都对应一个token,产生的数量显然会让模型训练变得相当困难。因此,Meta、谷歌等大公司推出了高效的神经音频编解码工具,可以将原始采样压缩数十到数百倍再进行token化,这样才能让AI音乐广泛应用。
2025年1月,Suno的创始人兼CEO迈克·舒尔曼(Mikey Shulman)在接受20VC播客采访时提到,他们的创新点不在于模型架构,而在于音频标识方法。他们花了很多时间来解决音频token化的问题,并借鉴了开源社区的经验。
创作能力的飞跃
AI音乐的能力可以说是日新月异的。
在2023年,多模态技术还未突破瓶颈,尽管压缩了音频采样数量,但还是难以把节拍、速度、和声、情感、乐器和歌词等丰富的音乐元素统一编码。因此,AI在音乐创作方面的能力主要集中在人声的模拟上。
比如“AI孙燕姿”的走红,就是一个典型案例。2023年4月,有网友上传了AI模仿孙燕姿声音的演唱视频,翻唱了《红豆》《发如雪》《爱在西元前》等歌曲,有些视频的播放量已经超过300万。这引发了讨论,孙燕姿本人也表示,她觉得自己很难与AI竞争,AI让人变得“可预测”“可定制”,她只能选择做自己。
同样的情况也发生在歌曲《Heart on My Sleeve》上。它模仿了著名歌手Drake和The Weeknd的声音和风格,发布后迅速在TikTok、Spotify等平台走红,但很快就遭到了两位歌手所属的环球音乐的侵权指控,并被要求下架。
随着多模态技术的进步,生成音乐变得越来越简单。到2024年3月,有人把连花清瘟胶囊的说明书输入Suno,结果AI生成了一首完整的歌曲,尽管旋律结构简单,中文发音也略显生硬,但这已经足以证明AI的能力。
技术的提升让AI能处理更大、更精准的数据量,能够容纳更多的多模态元素。
2024年3月推出的Suno V3版本和同年4月上线的Udio,都具备了一键生成音乐的能力,但作品还带有明显的“AI味”,在旋律、发音和情感等方面还有很大的提升空间。而到了2025年,Suno V5和新版Udio制作的作品整体性非常强,听起来与人类创作几乎无差,许多作品在音乐行业中处于中上水平。
专业音乐人的看法也很有参考价值。
例如,B站音乐博主“呆若木一在此”发布了一段关于“AI能否打败音乐人”的视频,邀请了新生代歌手吕彦良、秦凡淇试听AI改编他们的原创曲目,甚至请了歌手刘恋等音乐人参与不同版本编曲的盲选。其中几位评委竟然把票投给了AI编曲。视频中,曾获台湾金曲奖最佳新人奖提名的吕彦良感慨,AI的音乐创作能力超过了99%的人,甚至很多音乐从业者的水平都不如AI。

国内知名游戏音乐制作公司小旭音乐的CEO卢小旭也有类似的看法,他在多个公开场合都称赞AI音乐,认为AI音乐必将重构音乐行业。小旭音乐成立于2006年,曾为《QQ斗地主》《天龙八部》《诛仙》等超过1000款游戏制作了音乐,2024年还专门成立了AI音视频团队“小旭AI Studio”。
更值得注意的是,AI音乐技术的创新仍在加速。
以前,AI一键生成音乐的模式让创作变得不可控,用户难以进行针对性调整。然而,Udio在2025年6月首创了可视化编辑工具Sessions,能够智能识别歌曲结构,让用户可以对具体段落进行调整,同时还能自动将修改融入整体作品,确保创作的一致性。Suno在2025年9月推出V5之后,又推出了数字音频工作站Suno Studio,用户可以在其中精细调整多个音轨,对任意段落进行编辑或根据指令重新生成。
AI音乐:技术进步让作品更像人类创作
你知道吗?AI音乐的制作变得越来越专业,作品的质量也随之提高,听上去“AI味”几乎消失了。根据Deezer和益普索在2025年11月发布的调查,来自法国、英国、加拿大等8个国家的9000多名受访者中,有97%的人竟然分不清AI生成的音乐和人类创作的作品。

根据海克财经的消息,现在AI音乐已经能够模拟出现场演出的感觉,甚至可以直接生成Live版本的歌曲。
说到Live版本,就是指那些歌手或乐队在现场演出的录音,通常包括观众的欢呼声、掌声,以及乐手和歌手的即兴发挥和现场的回响。只要在Suno或Udio中输入像“Acoustic”(原声)或“Live Concert Recording”(现场录音)这样的提示,就能生成带有现场氛围的音乐作品。
透明度问题亟待改善
科技的进步确实改变了AI音乐的商业模式。
从创作者的角度来看,AI音乐已经从早期的量产模式,转向了现在追求精品的方向。之前有些人利用AI生成工具大量制作粗糙的音乐,借此在音乐平台上赚取收益。比如,在2024年9月被起诉的迈克尔·史密斯(Michael Smith),他利用AI工具大规模生成了数十万首歌曲,并将这些作品上传到Amazon Music、Spotify等多个平台,同时还用伪造的流媒体播放量来获取版税,这个案件涉及金额超过1000万美元(大约7000万元人民币)。
如今,很多创作者开始使用AI生成高质量的音乐作品。比如B站的《美猴亡》和《Money Back My Home》就是这样;还有在抖音上大火的AI歌曲《不能不想你》,这首歌的创作者“浮生未歇”在视频中提到,版权收益达到了80万元。
不过,Spotify允许AI音乐获得版权分成,而国内各大音乐平台的政策却不尽相同。比如,腾讯音乐旗下的酷狗和QQ音乐,AI音乐的创作者无法签约,也没有收益;网易云音乐则能签约,但AI作品不分成;而字节旗下的汽水音乐则对AI音乐给予收益支持。
尽管在听觉上差别不明显,但还是有不少用户对AI生成的歌曲感到介意。因此,在目前技术尚未完善的情况下,很多创作者会选择不主动标注作品为AI生成,来避免平台审核。例如,B站的博主“SevenTeamMusic”就做过一个实验,简单微调歌曲后,AI作品就能被判定为人类创作。
如果AI只是部分参与创作,经过分段调整并由创作者重录和精修,那么平台进行技术审核就会变得更加困难。国内乐队“灵活就业”的主创王博龙在播客中提到,他们的热门作品《创作者中心》和《菠菜去打工》中都有使用Suno等AI工具参与创作的经历,有时候他只要哼一小段旋律,AI就能把整首歌曲的编曲完成。据海克财经观察,该乐队在网易云音乐上已上传超过30首歌曲,且都没有标注为AI音乐。

汽水音乐则推出了明确的AI音乐激励计划,为AI作品提供播放收益。通常来说,AI作品符合“神曲”的创作逻辑,具有非常吸引人的旋律,短视频平台也非常适合这种作品的传播,尤其是与抖音的合作,让汽水音乐在AI音乐的发展中占得先机。B站、小红书等平台上也有不少教程教用户如何利用AI工具创作音乐并上传到汽水音乐以获取收益。
创作者们对汽水音乐的重视,和该平台用户的快速增长有很大关系。根据Quest Mobile的数据显示,2025年9月,汽水音乐在国内在线音乐APP中用户规模排名第四,月活跃用户数达到1.2亿,同比增长90.7%。而排名前三的则是酷狗音乐(2.1亿)、QQ音乐(1.9亿)和网易云音乐(1.5亿)。

不过,AI音乐在版权问题上依然面临不少挑战。
在2024年6月,全球三大唱片公司:环球音乐、华纳音乐和索尼音乐,都对Suno和Udio提起了诉讼,理由是这些AI平台使用了未经授权的音乐进行训练。而到了2025年10月和11月,Udio与环球音乐、华纳音乐达成和解,准备推出一个完全授权的订阅制AI平台,用户可以在遵循规定的前提下使用授权的音频和作品进行创作,并建立版税分成模式。Suno也在2025年11月与华纳音乐达成和解,计划合作推出完整授权的新模型。而索尼音乐的诉讼仍在继续。
AI音乐:创作与版权的新挑战
版权问题不是仅限于模型训练和内容生成的阶段,它直接关系到最终作品的版权归属。想象一下,当你用AI工具把自己的哼唱或者歌词扩展成一首完整的歌时,这个音乐作品其实是人类的创意、算法的执行,还有海量训练数据的结合,结果就让人很难判断版权到底该归谁,是原始音乐的创作者、平台,还是最终的用户呢?
为了应对AI音乐的标识难题,谷歌推出了一项名为SynthID的水印技术,运用在Lyria2及其他AI工具生成的音频里。这个SynthID水印是普通用户感受不到的数字水印,目的就是在不影响听觉体验的情况下,让AI创作的内容能够被辨识出来。
AI音乐的出现不仅仅是技术上的革新,它可能会从根本上改变音乐产业的商业模式。从创作和授权的上游,到分发和推广的中游,再到消费和互动的下游,这一切都可能会被重新审视。虽然还有很多关键问题需要解决,比如训练数据的版权归属、人机协作的创作伦理,以及听众对这些新音乐的情感认同和价值判断,但毫无疑问,AI音乐已经成为音乐产业必须面对的一个不远的现实。
