新智元报道
编辑:耳朵 乔杨最近在各个视频平台,AI成为二创赛道新流量密码。
从歌手到手游角色,再到动漫人物,AI配音在互联网上无处不在。
歌手能够跨时空合作,最爱的动漫形象也能唱歌给你听,评论区纷纷表示:双厨狂喜!豪庭!小八妈妈这次真的要夸你了!
AI技术的迅速发展为人们所共睹,运用AI智能生成声音、图片、视频的技术,也大有不可阻挡之势。
AI配音在视频制作领域的用途不止在于二创,随着一大批生成式AI产品的问世,AI配音已经能满足简单的自媒体创作。
视频制作软件上,AI配音朗读音效多达七八十种。
对音质要求较低且时间较短的配音工作,逐渐被AI配音取代。
近年来,AI颠覆传统行业几乎成为大势所趋,前有Anthropic参谋长坦言自己职业生涯或许只剩三年,后有ChatGPT替换掉60人编辑团队。
许多原本需要依靠人力完成的工作任务正逐步被AI所取代,现在配音行业也将要加入这一行列。
面对行业新动荡,人们不禁会问,配音员们该何去何从?
「永不塌房」的配音演员?
一家语音初创公司ElevenLabs在今年二月Sora推出之后,用AI给Sora经典视频完成配音。
6月25日,ElevenLabs又马不停蹄推出AI阅读App。
向各位介绍 ElevenLabs 阅读器应用程序。使用最高质量的人工智能语音,随时随地收听任何文章、PDF、ePub 或任何文本。
并且,经过测评,这款App也获得了用户极高的评价。
听听我们几位测试者的意见:
总的来说,它非常完美。发音、语调、口音、流畅度都非常棒。
在过去的几周里,我们有幸使用了你们的移动阅读器服务,感觉非常棒。它非常适合审阅文件和草稿、赶进度,而且最近加入的不同语音也让我们有了一次奇妙的体验。
能够在大量文章中保持语气和语调,证明了这款应用程序的功能强大,有别于市场上的同类产品。
并且当有人质疑AI配音能否真实传达情绪时,评论区也cue到Elevenlabs产品和GPT-4o。
我认为人类配音演员永远都有存在的必要,尤其是那些需要真实情感和细微差别的配音。
人工智能配音很适合播报或旁白,但我不认为它们能真正捕捉人声的灵魂。
我听过 Elevenlabs 的工作样本,非常出色,而即将推出的 GPT-4o 的语音功能甚至更胜一筹。
AI配音通常使用了一项被称为Deepfake Voice的技术,可以在音调和相似度上非常准确地复制人声。
这项技术为配音工作带来了很多便利,一方面降低了成本,另一方面可以在配音演员无法完成工作时,模拟声音代替工作。
如此一来,出场费高昂且又有塌房危险的真人CV的确警铃大作:AI价廉物美,我们呢?
配音演员的职业危机
配音演员表示,他们的工作即将被AI完全取代,商业配音和电台角色已经开始被廉价的GenAI克隆声音所取代。
从事广告、有声读物和视频游戏工作的普通演员担心,由于人工智能声音克隆的兴起,他们有可能被克隆自己的声音,或者完全失去工作。
Cooper Mortlock是一名澳大利亚配音演员,他在Covid-19流行之初就开始从事配音工作。
Cooper Mortlock说,他参与的一个动画项目克隆了他的声音,并在工作停止后未经同意使用了他的声音。
他表示,这将削弱那些试图在配音行业立足的新晋配音演员的工作。
Cooper Mortlock说,「这不仅限制了艺术家本身的机会,也限制了项目的创意范围。」
因为按照固定程序运作的AI没有机会出现意外或惊喜,人工智能正在利用已经存在的事物,在此基础上对其进行重新利用,缺少配音过程偶然性碰撞的火花。
换句话来说,使用人工智能语音生成对话将缺乏使用人类配音演员进行脚本对话所带来的创造力。
Cooper Mortlock用生动的比喻描述,「它像海洋一样宽广,却像水坑一样浅薄。」
「例如,比较一下最近一些非常注重故事叙事和人物性格的电子游戏,比如《赛博朋克 2077》、《巫师 3》、《博德之门3》.....这些游戏都是如此精雕细琢。」
到目前为止,人工智能语音克隆在处理非美式口音时常常会遇到困难。例如,澳大利亚人的声音往往带有美国口音的转调。
现在,新的配音服务可以提供一整套不同年龄段澳大利亚人的不同口音。
Cooper Mortlock希望,这种「虽迟但到」是澳大利亚人不放弃自己声音的一个信号。
澳大利亚配音演员协会(AAVA)告诉一个调查人工智能的议会委员会,估计有5000名本地配音演员面临失业风险。
该组织指出,一家全国性广播网络公司正在积极投资取代人类配音演员的技术。
在其提交的材料中,该组织批评这一公司的行为纯属「过河拆桥」。
「一个在过去100里,依靠配音艺术家为其媒体带来质量、可信度和人性的行业的参与者,却做出了令人失望的举动」。
协会主席Simon Kennedy告诉澳大利亚《卫报》,人工智能的出现及其对语音产业的影响,是成立该组织的部分催化剂。
但他表示,他们「并不反对技术,我们当然也不反对人工智能」。该组织只是希望围绕技术的使用制定公平的规则,并保护人们的声音不被人工智能滥用。
对于配音演员来说,有声读物将首先成为配音演员工作被取代的一种危险的预兆。
Simon Kennedy说,「有声读物是前沿领域,因为其材料数量庞大,制作有声读物的公司认为使用AI配音可以节省成本。」
但换个角度来想,如果朗读书籍的声音是人工智能的,内容情感的表达会不会受到影响?
Simon Kennedy补充道,「如果是人工智能语音,我认为人们会发现大家懒得听有声读物了。」
人们只会说,「对于机器讲故事我没啥感觉。」
Simon Kennedy说,对于希望减少人工配音工作的机构来说,企业工作和教育材料使用AI配音只是大树的一个枝桠,但AI配音广告等更广阔的领域还难以取代。
「大型广告商需要的是高质量,AI配音在相当长的一段时间内还不会纳入广告商的考虑。」
去年,据澳大利亚《卫报》报道,澳大利亚软件开发商Replica Studios从演员那里获得了120个声音的视频游戏开发许可,当视频游戏中使用克隆演员的声音时,该公司将向演员支付费用。
今年1月,该公司与美国演员工会(Screen Actors Guild)签署了一份协议,称这是一种合乎道德的人工智能语音使用方式,并且所有内容都获得了授权。
对于出售自己声音授权的配音演员,Simon Kennedy表示,出售声音授权的配音演员,他们并没有考虑自己的长期规划。
「我认为他们并没有真正考虑到后果,声音现在作为你自己的数字克隆存在于市场中,基本上会抢走你本可以自己得到的工作。」
配音演员的权益保障
那么,取代归取代,这种取代是否在合法区间内也是值得关注的问题。
5月16日,美国配音演员Paul Lehrman连同另一位配音演员Linnea Sage在纽约联邦法院对人工智能初创公司Lovo提起了诉讼,指控该公司利用AI非法复制和使用他们的声音。
案件起诉书在2020年,Lehrman接受了一份工作,提供一组一次性的语音样本。
几年之后,他听到了自己在YouTube视频和播客上解说的声音,尽管他从未为这些视频配音。
他们声称,Lovo欺骗他们提供声音样本后,未经许可销售他们声音的AI版本。这两位演员还试图联合其他声音被窃取的人进一步发起集体诉讼。
也就是说,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成也可能构成侵权。
五一劳动节时,著名配音演员夏磊转发微博,呼吁利用「声音水印」技术保护配音演员的合法权益。
夏磊,著名配音演员,代表作《仙剑奇侠传3》茂茂,《全职高手》喻文州,《恋与制作人》许墨不仅在中国,上文提到的AAVA也呼吁制定法律,对如何使用人工智能声音的同意进行明文规定,确保艺术家获得公平的报酬,并规范如何使用他们的声音(如果获得许可)。配音演员在影视、游戏、动漫等作品中本质上是角色的「赋魂师」,通过共情角色的命运,来进行自我认知的诠释和表达,他们的劳动成果也理应得到尊重。
同时,配音演员通过人类对情感的把握,通过声音与角色共鸣、与观众交流,这不仅仅是单纯机械式模仿人类声色、情感、语言停顿表达就可以完全取代人类的地方。
参考资料:https://www.theguardian.com/technology/article/2024/jun/30/ai-clones-voice-acting-industry-impact-australia