



统筹|胡广欣 梁喻
文|羊城晚报全媒体记者 胡广欣 李丽 龚卫锋 实习生 张婉晴
图|羊城晚报全媒体记者 梁喻
6月28日,第十四期岭南大讲堂特邀中央音乐学院教授、博导、音乐人工智能系主任李小兵,带来《AI来了,音乐的未来在哪里?》主题分享。
根据腾讯音乐研究院《2025华语数字音乐年度白皮书》,AI生成音乐在平台入库新歌中的占比,已从2024年的5.2%上升至2025年的21.4%。与此同时,全球最大的AI音乐生成平台之一Suno,日均生成歌曲已超过700万首。
当AI能够23秒写出一首儿童歌曲、生成足以以假乱真的人声演唱时,一个根本性的问题浮现:艺术还是人类的专属领地吗?当机器的创作能够让人感动落泪,“艺术的主体只能是人”这一传统观念还能否成立?带着这些问题,李小兵教授结合自己多年来在音乐人工智能领域的研究实践,分享了他的观察与思考。以下是本次讲座的实录。
本次活动是岭南大讲堂的第十四期,由中共广东省委宣传部指导,羊城晚报报业集团主办,中共广州市委宣传部、广东省博物馆(广州鲁迅纪念馆)协办。
现状:AI正深刻改变音乐行业
几年前,我作了一首歌叫《我们》。通过网络联系了全世界各艺术院校的10000名师生和200多名乐手,各自用手机录制自己的演唱和演奏部分,传到服务器后,用AI将所有音轨进行对齐和后期处理。这在以往是不可能完成的任务,但借助AI,我们做到了。而这还只是人工智能初级阶段的技术。
过去长期的判断是机器没有情感,因而无法创作艺术。但在技术跃迁的今天,机器与人类的创作之间是否还存在本质区别?基于对这一问题的思考,中央音乐学院在2019年正式成立音乐人工智能系,开始系统研究人工智能对作曲、作曲技术理论、音乐学、音乐表演、音乐教育、音乐管理、音乐科技六个二级学科和七个专业方向的影响。
几年下来的研究成果,让我们看到了一些必须正视的事实。
AI在作曲层面的能力已经不逊色于专业音乐人。2023年至2024年,Suno、Udio等人工智能作曲系统相继面世,世界为之震惊。三四年过去,国外的流行音乐排行榜上已经有大量人工智能曲目了。而具体到中央音乐学院,我们早在2019年已开发出音乐大模型,当时23秒钟就能写出一首非常好的儿童歌曲;此后我们开发了交响乐生成模型,能在短时间内生成复杂的交响乐。我认为,未来将出现大量人工智能作曲或人机交互的曲目。
AI演唱和声音克隆越来越真实,正在冲击表演领域。AI合成音质好,自然度高,音准、节奏没有任何瑕疵。面对面的现场表演不会被替代,但作品一旦通过媒体传播,人机边界就完全模糊了。
音乐、AI与脑科学的结合正在打开全新的可能。作为能快速影响人情绪的音乐,是如何作用于大脑的?我们联合协和医院,在国家自然科学基金会的资助下进行研究,目前开发出“央音一号”脑机接口设备,可以把人的负面情绪从7分降到2分,未来希望能用于睡眠改善、疼痛缓解、青少年注意力训练这些领域。音乐、人工智能和脑科学的交叉,可能诞生我们想象不到的新应用。
我是一名人文主义者,但当机器的创作已经能够感动受众时,“艺术的主体只能是人”这一传统观念便需要被重新审视。在这个时代,我们要有更大的胸怀去拥抱AI。
思考:AI是否会带来新一轮“文艺复兴”?
基于这些实践和观察,我想提出一个新概念——“机文主义”。它不是一套理论教条,而是一个重新思考人机协同创作中主体性的框架。我把它分为两个层面。
第一个是结构层,也就是现实层面。传统人文主义强调人是意义的唯一来源,但“机文主义”认为意义可以通过人机交互协同完成。
第二个是未来层面。如果有一天人工智能具备了高度复杂的认知结构,甚至出现了某种形式的“自我表征”和“意识体验”,那机器能不能成为创作的主体之一?如果真的有那一天,机器就不只是工具,而是参与构建世界的潜在主体。
14世纪,文艺复兴在意大利佛罗伦萨发源,产生了人文主义。今天人工智能的出现,会不会引发一场新的文艺复兴?人是不是正在从意义的唯一来源转向意义生成跟参与塑造者呢?我们得仔细思考这个问题。
当然,这也带来了伦理和版权的问题。人工智能算不算音乐家?作品的归属怎么处理?版权保护的是人的权利,如果作品大部分是机器生成的,还有没有版权?50年后,也许大部分作品都是人机交互或机器生成的,那时候版权制度怎么运作?这都需要专业人士抓紧时间研究。
人工智能对产业的影响同样巨大。现在有一种概念叫OPC,就是一个人的公司——未来一个人驾驭智能体就能成为一个公司。我们据此提出OPMC——即一个人的音乐公司。未来音乐产业将重新洗牌,大型集团是否还能存在都不一定,有可能被一个拥有AI赋能的人颠覆,因为人不可能像人工智能那样快捷地处理多模态问题。
未来:人类未来的艺术将站在AI肩上前行
人工智能技术无疑会极大程度地改变这个世界,但我认为不用害怕。在我看来,未来音乐有三条路径并行发展。
第一,传统意义上的音乐仍会继续有自己的空间。第二,科技将赋能传统意义上的音乐并使之创新发展,人机交互的音乐作品将成主流。第三,新的科技将催生出全新的音乐形态,独立发展。就像冶炼技术出现后有了管弦乐,电子技术出现后有了电子音乐,人工智能也会催生一种我们目前还想象不出的新音乐形态。
具体怎么面对未来?我有几个建议。
第一,守住本源,坚守艺术性和人文关怀。我始终坚定——艺术的核心是人,人工智能是帮助人类的,不是替代人类的。
第二,重点培养我们的审美意识、情感表达能力和社会责任感。当AI消解了技术的门槛,审美便变得更加重要。国家现在大力推进美育教育,这是一个非常正确的方向,未来不管哪个行业,审美好的人一定做得更好。
第三,面对未来,不要害怕。我认为人机协同是不可逆的趋势,大家应该积极使用AI,每天与它交流、训练它,无需感到恐慌。
关于人工智能与人类的关系,仍有太多未解之谜。当机器参与创造意义,当艺术有可能不再专属于人类,那么,我们究竟是在通过艺术理解自身,还是在逐渐失去这种能力?也许“机文主义”,就是这一问题被意识到的那一刻。我始终相信,人工智能是帮助人类的、赋能人类的,而非替代人类。我身边的科学家、艺术家无一不持此观点。未来的音乐,将站在AI巨人的肩上前行;人类未来的艺术,同样如此。
【观众提问】
提问一:人们对AI音乐的争议中,版权问题一直是一个核心焦点。您怎么看当前AI音乐在版权界定、训练数据来源以及作品归属上的争议?未来这种问题可能如何被解决?
李小兵:这个问题确实很棘手,全世界都没有准备好。
先看训练数据的问题。大模型训练用了海量数据,但训练是在自己的机房里完成的,外人根本查不到。版权方说你用了我的作品,训练方说我没有,你怎么证明?这是一个死结。Suno被几家大版权公司告过,最后有的不了了之,有的说可以分一点钱,但众说纷纭,没有定论。
再看一个更根本的争议。一派人认为,机器学了别人的作品来生成新东西,应该交版权费。另一派人认为,人类也是从小学习贝多芬、莫扎特,学完了知识变成自己的,然后署自己的名,机器也是这么学的,凭什么不行?这个说法听起来似乎也有道理。
现行法律体系下,著作权是为人设定的,主体是人,所以机器自主生成的内容不受版权保护。但人机交互产生的作品,人的选择、对话、编辑参与了创作,归属问题就非常模糊了。
至于如何解决,我觉得很难。有一种思路是用AI技术去检测哪些是人写的、哪些是机器写的。我的学生做过这个方向,但我们发现检测模型只对当前版本有效,三个月后AI一升级,旧检测模型就完全失效了。这和随机猜没什么区别,所以我叫停了这个项目。
说到底,现在版权的制度已经跟不上时代了。用老制度去套新问题,没有意义。未来十年后,也许大部分作品都是人机交互甚至机器生成的,我们今天争论的这些问题,回头看可能会觉得很可笑。这不是法律能单独解决的,需要全社会重新思考创作、所有权和人的主体性这些根本问题。
提问二:我是一名大二音乐表演专业学生,同时辅修计算机。招收研究生和博士生团队时,您更看重学生的音乐背景还是计算机科技背景?
李小兵:关于招生,我们分两个方向:一个是音乐人工智能专业,招收计算机或人工智能背景的理科生,但他们同时有较好的音乐基础;另一个是电子音乐作曲方向,招收音乐背景出身、同时掌握一定计算机技术的人。文科背景爱计算机,理科背景爱音乐——把这两类人交叉在一起,才能做成音乐人工智能这个交叉学科。
提问三:如果机器有了自主意识,要认可它的主体地位吗?这是对人的主体地位的消解和解构吗?
李小兵:这是一个哲学观上的考量,其实我没有正确答案。如果机器成为主体,传统人文主义就瓦解了。但我更希望它是一种“拓展性的人文主义”——机器学习了人,人机交互产生了新东西,但仍然在人文主义框架下。现在学术界的主流共识是AI赋能人类,即使到了那一步,人类仍然拥有对世界把控的最高权力。
提问四:AI在歌词的情感表达上能超过人类吗?
李小兵:我认为未来会的,至少是平分秋色。人工智能的历史不长,但已经令我们觉得非常厉害了,再给它一点时间,它还能走得更远。我始终认为,要以开放的心态拥抱人工智能。比如蒸汽机出来了,火车比人跑得快了,但这就意味着火车比人厉害吗?不一定。人类能做更高阶的事。
提问五:人工智能大大降低了音乐创作的门槛,音乐院校的师生面临着相当大的冲击。请问您怎么看待这个问题?
李小兵:创作分两种:一种是出于热爱、表达生活,一种是职业创作。人工智能让前者的门槛大大降低,后者则正面临深刻冲击。
我认为未来音乐学院会两极分化——专门培养职业音乐家的专业可能会收缩,但承担全民美育的音乐学院会越来越多。美育太重要了,一端极其专业,一端极其普及。
美国也一样。伯克利音乐学院的校长告诉我,他们也在改变。未来招生,审美敏感度可能是最重要的,技术反而不那么重要了——因为技术可以后期训练,但审美和灵性是天生的。
目前,中央音乐学院在硕士、博士阶段取消了作曲四大件的笔试,本科还保持着传统方式。全世界都在准备迎接这个变化,但改变必须循序渐进。
提问六:现在AI已经可以生成完整歌曲了,未来有没有可能出现一种新的、由AI独创的音乐风格?
李小兵:有可能。AI有泛化能力。很多人跟AI聊天的时候会发现有“AI幻觉”,但这对创作来说很好。未来可能会出现一些人类过去不太容易组织的音乐形态,比如超复杂节奏、跨文化混合音色、实时互动结构、根据身体数据变化的音乐、没有固定版本的流动歌曲。这些可能会形成新的审美类型。
但一种风格能不能成立,不只看AI能不能生成,还要看有没有人类听众接受、命名、传播、使用它。风格不是技术单独创造的,而是技术、创作者、听众和社会共同形成的。
提问七:为什么创作者对AI态度这么暧昧?
李小兵:创作者对AI暧昧,是因为AI同时带来诱惑和威胁。一方面,它确实提高效率、打开想象力、降低成本;另一方面,它又可能稀释创作者的劳动价值,冲击版权体系,甚至模仿个人风格和声音。
所以很多人实际在用,但不愿意公开承认。因为公开承认以后,可能被质疑“不真诚”“偷懒”“不是自己写的”。这背后反映的是一个制度空白:我们还没有形成一套体面的AI使用说明机制。
我认为未来不应该把问题简化成“用了AI就是不纯粹”。更重要的是区分:AI参与了什么?人完成了什么?是否使用了未经授权的数据?是否侵犯了别人的声音和风格?是否对听众做了基本披露?
当这些规则建立起来,创作者就不必暧昧。AI可以被正当地使用,也必须被负责任地使用。
提问八:AI如此迅猛发展,对于音乐人而言,坚持“手搓”创作还有意义吗?
李小兵:当然有意义。手工创作的意义不会因为AI出现而消失。就像摄影出现之后,绘画没有消失;电子音乐出现之后,乐器演奏没有消失;数字录音出现之后,现场音乐也没有消失。
“手搓”的价值在于,它保留了人的身体经验、时间投入、技艺痕迹和精神专注。未来它可能不再是唯一的创作方式,但会成为一种更有辨识度的选择。
真正的问题不是“手搓”还是AI,而是作品有没有价值。有人完全手写,也可能平庸;有人使用AI,也可能有新的表达。关键在于创作者是否有自己的审美判断和精神立场。