“冷门歌手”孙燕姿终于在半夏时节,借助AI技术,迎来了一轮翻红。
编者按:本文来自微信公众号 财经E法(ID:CAIJINGELAW),作者:张剑,编辑:郭丽琴,创业邦经授权转载。
《民法典》规定,对自然人声音进行商业化使用,应获得权利人同意。但由于场景太新,对于AI歌手侵权的责任判定,目前尚没有具体案例。
“冷门歌手”孙燕姿终于在半夏时节,借助AI技术,迎来了一轮翻红。
由AI化的“孙燕姿”“翻唱”的《发如雪》《那些花儿》《成都》等歌曲在B站、抖音、快手等短视频平台“出圈”。截至发稿前,“AI孙燕姿”已经在抖音和B站两个平台,达到了千万级播放量。
“AI孙燕姿”已经在抖音平台达到千万播放量
“翻红”的背后,是技术达人借助于发布在开源社区的技术工具,对歌手的声音进行AI生成,让自己喜欢的歌手“翻唱”其他歌手的经典曲目。这些翻唱内容,也属于当下正火爆全球的AIGC(人工智能生成内容)的一种形式。
但这样的AI应用场景可能造成的侵权已经引发担忧。
那么,AI歌手的翻唱行为是如何实现的,是否会造成侵权,会引发哪些重大风险?
01“AI孙燕姿”如何实现?在各视频和短视频平台,都可以轻松搜到AI歌手的内容,“翻唱”后的内容均是由用户自行上传。
在抖音平台,不仅有AI孙燕姿和AI林俊杰,还有AI许嵩、AI邓紫棋等。在另一个短视频平台快手,一名用户从5月初开始至今已经上传近20首AI孙燕姿“翻唱”的歌曲,且仍在更新中。
虽然对“翻唱”效果的评价并不一致,但上传者和欣赏者都在感叹AI技术的强大。公开消息显示,上述AI歌手“翻唱”的火爆,得益于技术的进步。So-VITS-SVC是其中的核心(目前使用量最大的是4.0版本),这项技术发布在全球最大的开源社区——Githubb。
在Github的So-VITS-SVC公共页面,发布者介绍称,So-VITS-SVC只是歌曲转换领域的一个项目,目前已经正式停止维护并存档。但是仍有其他爱好者创建了自己的分支,并继续维护,进行了重大更改。财经E法注意到,在5月13日,有发布者上传了5.0版本。
在发布者提供的全指引中,步骤包括预训练模型文件、数据集准备、剪辑音乐、重新采集到44100Hz和单声道、自动将数据集拆分为训练集和验证集并生成配置文件、训练等。大致为首先对声音数据进行预处理,得到音频数据集。接下来,使用得到的数据集训练模型,得到模型后,提供一个输入源歌声(任何歌手都可以),使用模型进行推理并完成替换。发布者还提供了包含“预处理”“训练”“替换”的整个操作过程的设置参数、所需文件和其他软件。
发布者也设置了警告与免责声明。其中提出,项目为开源、离线项目,SvcDevelopTeam的所有成员及本项目的所有开发者和维护者(以下简称贡献者)对本项目没有控制权,从未向任何组织和个人提供过任何形式的帮助。因此,所有基于本项目训练的AI模型和合成音频与项目贡献者无关。由此产生的一切问题由用户自行承担。
发布者指出,使用此技术项目进行开发,应自行解决数据集的授权问题。使用非授权数据集进行训练所造成的任何问题及由此产生的一切后果由开发者自行承担。该项目仅以学术交流为目的而设立。它不适用于生产环境。任何在视频平台上发布的基于sovits的视频,必须在描述中明确注明用于变声,并注明语音或音频的输入源,例如使用他人发布的视频或音频,将人声分离为转换的输入源,必须提供清晰的原始视频或音乐链接。如果使用自己的声音或其他商业人声合成软件合成的声音作为转换的输入源,也必须在描述中说明。
02潜在侵权情形事实证明,技术发布者的免责声明具有前瞻性。伴随AI歌手的火爆,对其可能造成的侵权风险的担忧也在增加。
现有的AI歌手内容,一般直接使用某个歌手的声音,演唱其他歌手的歌曲。《民法典》规定,自然人的声音也是一项权利。中央民族大学法学院副教授熊文聪对财经E法分析,歌手的音色是一种财产性的人格要素,是公开权的客体,受到《民法典》的保护,应参照适用有关姓名权、肖像权的商业化利用相关规则。
目前由用户上传到短视频平台的AI歌手“翻唱”作品,均可能涉及商业化使用。广东环球经纬律师事务所律师方梓楠对财经E法表示,声音权参照肖像权保护的有关规定在《民法典》中界定明确。对自然人声音进行商业化使用,均应获得权利人同意。”
除了用户上传相关作品,也存在软件开发者(短视频平台)的商业化使用的情形。对此,方梓楠认为,相较而言,短视频平台及平台上的用户对自然人声音的开发使用可能对应了不同场景,所以需要取得的授权范围也会有所不同。
一方面歌手本人的声音使用需要授权,另一方面,AI歌手演唱别人的歌曲,是否合理使用也不可回避。方梓楠认为,按照《著作权法》的规定,是否合理使用的界定明晰。具体来说,如果指明作者及作品名称,且不影响作品正常使用,并未不合理损害作者权益的前提下,对音乐作品的合理使用所包括的场景为:第一,个人私下使用AI歌手演唱;第二,为介绍作品或说明问题(如介绍AI演唱技术现状)适当引用音乐作品;第三,免费提供AI歌手表演(但不能涉及广播或信息网络传播等方式)。
但如果不是上述合理使用的场景,利用AI歌手演唱的使用者需按《著作权法》规定取得词曲作者同意,如若AI歌手演唱的形式还涉及对其他歌手此前表演的模仿,还需取得相应表演者的授权。
财经E法注意到,目前在各短视频平台出现的AI歌手“翻唱”作品,上传者在标注提醒方面表现不一:有的没有任何提示,是由平台通过系统提示“疑为Ai作品,请谨慎甄别”。有的则在作品介绍部分以“AI合成”“机器人翻唱”等标签进行提醒。
对于“翻唱“这一概念,熊文聪认为,如果使用AI技术模拟知名歌手的音色进行歌曲演唱,只有对既有词曲音乐作品进行二度演唱的情形,才是翻唱。若模拟歌手的音色,用AI技术“演唱”自己创作的歌曲,则不属于翻唱。如何区分使用是否合理?熊文聪表示,基本原则是,商业性使用一般应认定为侵权,因为交易成本并不高。而如果确实是个人学习、欣赏的目的使用或基于教学、科研目的使用的,则可能构成合理使用,不构成侵权。
03更大风险是什么在AI歌手之前,基于元宇宙的“虚拟人”也火爆一时,同样也引发了“侵权”质疑。2022年初的一场跨年晚会中,“邓丽君”虚拟人横空出世,在舞台上与真实世界的歌手深情对唱。虽然这一创意是呼应了公众对邓丽君的怀念,但一个法律问题仍被热议:用虚拟人重塑已故艺人进行表演,是否需要其家人授权?
元宇宙场景同样涉及了名誉权、肖像权、著作权、继承权等多方面法律责任问题。更为严重的是,在元宇宙火爆之时,还曾出现潜在的违法犯罪问题。2021年12月,meta公司元宇宙平台“Horizon Worlds”测试期间,一名女性测试者称她在虚拟世界里遭到了性骚扰。2022年2月6日,meta公司宣布将推出“个人边界”(Personal Boundary)功能,此功能将建立一个环绕在虚拟人物身边圆圈范围,对他人保持安全距离,以避免不必要的触碰与互动。
无论元宇宙还是当下火爆的AIGC(人工智能生成内容),各种隐忧客观存在。
方梓楠认为, AIGC的应用想象空间很大,如果滥用,可能带来诸多引人担忧的风险。例如,可能会存在利用AIGC实施诈骗、敲诈勒索、提供伪证、寻衅滋事、制造淫秽色情物品等犯罪。
2023年1月,《互联网信息服务深度合成管理规定》(下称《管理规定》)正式实施,4月11日,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》(下称《征求意见稿》)。广东财经大学法学院教授姚志伟对财经E法表示,上述两个AI监管新规,对于AI歌手这一场景已有监管思路。但由于场景太新,如果AI歌手侵权该如何判定责任,目前尚没有具体案例。
《管理规定》第16和17条对于服务提供者进行信息披露作出了规定。其中,第16条规定,深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,并依照法律、行政法规和国家有关规定保存日志信息(隐性披露)。第17条规定,深度合成服务提供者提供合成人声、仿声等语音生成或者显著改变个人身份特征的编辑服务,可能导致公众混淆或者误认的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示深度合成情况。
姚志伟分析,在AI歌手场景中,现在已经出现的各类AI歌手,用户在上传发布的视频中有“AI孙燕姿”、“AI林俊杰”等介绍。对于观看者来说,可以注意到这是AI合成的,在一定程度上可以起到披露作用。
虽然技术项目发布者在GitHub页面列出了免责条款,但姚志伟认为,这一条款并不一定有效,AI歌手这一新兴场景如果涉及侵权问题,在短期内尚较难形成清晰一致的观点。姚志伟分析,人工智能生成的内容如果侵权,责任划分仍然是一个复杂的情况。“使用者、模型提供者、应用部署者等多方主体均可能被涉及,且生成过程存在黑箱,将导致因果关系难以判定。”
姚志伟建议,《征求意见稿》已经对法律责任作了界定和划分,下一步可以根据技术应用的具体场景,出台配套制度,以准确界定场景中每一个角色及其应承担的义务。
在上述两部监管新规的具体实施运用层面,方梓楠认为,《征求意见稿》的制定背景是为了应对以ChatGPT为代表的AIGC的技术冲击。从内容来看,《征求意见稿》侧重于对生成内容的质量及合法性进行规制。具体到AI合成人声场景,《征求意见稿》第七条要求,生成式人工智能产品的训练数据不得包含侵犯知识产权的内容、包含个人信息的应征得信息主体的同意。这意味着,该条规定一旦通过,如果真人歌手拒绝将其个人声源作为训练数据,对应的AI歌手就无法生成。
另外,《征求意见稿》第十三条要求服务提供者建立内容投诉机制,第十五条更要求服务提供者应在3个月内通过优化训练等方式防止侵权内容的再次生成。若这两条规定得以保留,则真人歌手也可根据具体情况提出投诉,维护其个人权益。