功能|配音声音不好听?魔音工坊给你的声音“一键美颜”

阐述各类配音问题 , 以及“声音混血”的应用、技术和未来想象空间 。
配音问题困扰了很多人 , 用户主要有一些这样的困扰:
1、声音不好听 。
2、 普通话不标准 。
3、没有专业的录音设备和安静的录音环境。
4、 找真人配音太贵了 。
5、自己配音太麻烦了 , 还花费时间 。
为解决以上这些配音困扰 , 可以选择使用软件配音 , 让不同的AI配音员竭诚为你服务 。 比如人工智能公司出门问问推出AI配音神器——魔音工坊 , 目前拥有上百种音色可供选择 。 女主播里 , 既有御姐 , 也有萝莉 , 更有甜美可爱的 , 也有情感电台风的 。 男主播里 , 既有类似毒舌风格的解说员 , 也有磁性浑厚的 , 更有支持多种风格的「百变舰长」 。
不过对配音而言 , 目前一个大的场景是段视频配音 , 除了声音好听 , 其实还有一个需求是声音能做到个性化 , 也就是不雷同 , 有独家特色 。 为了解决这个问题 , 魔音工坊也推出了面向用户的声音定制服务 。 需要合作的自媒体人 , 既可以选择克隆自己或者朋友的声音 , 也可以让魔音工坊去帮忙寻找主播 。
其中 , 有一些用户 , 自身的声音不算太好听或不标准 , 很自然地会产生“能不能帮我给声音一键美颜?”的需求和想法 。 也就是说 , 为自己的声音进行一层“滤镜美颜” , 在自身声音的基础上 , 让用户的声音更专业一些 , 听着舒服一些 , 但依然可听出来是自己的声音 。
声音「一键美颜」的AI技术原理
我们知道 , 声音的音色是和人的发音器官相关的 , 而声音的节奏和韵律等 , 则是可以后天习得的 。 读个播音专业 , 或者是业余参加个配音培训班 , 都可以改进自己的声音品质 。 那么 , AI技术是否可以帮用户做到「一键美颜」呢?答案是显然的 , 这个技术就是说话人转换 , 魔音工坊里 , 产品功能叫做「声音转换」 。
说话人转换(属于voice conversion技术的一小类) , 它的功能是把A的说话风格(节奏和韵律等)迁移到B上 。 转换后的声音 , 会有B的音色 , 并拥有A的节奏和韵律等信息 。 我们尝试给这个功能取了几个不同的名字 , 大家也可以称之为声音的「移花接木」 , 「鹦鹉学舌」功能 , 听名字可能就会「顾名思义」一番 , 联想到它的功能 。
这个功能得益于出门问问的MeetVC技术 。 同时采用出门问问自研语音识别技术(wenet等) , 去除发音人音色信息 , 得到与音色无关的内容信息 , 经过encoder-decoder(编码-解码)变声模型训练 , 从而获取目标发音人的音色信息 , 最终经过声码器得到语音 。 原理框架图如下所示:

功能|配音声音不好听?魔音工坊给你的声音“一键美颜”
文章图片

打造DIY的“声音混血”神器
有了声音转换之后 , 魔音工坊做了几个事情:
1 , 给魔音工坊自研的一些声音 , 开发了一些“混血模型” 。 比如魔音平台最火的男声叫做魔天轮 , 最火的女声是魔伊莉 , 我们就会训练两个模型 , 蒋魔伊莉的节奏嫁接到魔天轮上 , 让魔天轮保持磁性的音色的同时 , 也有魔伊莉独有的柔情节奏 。
2 , 面向用户提供“声音混血”服务 。 如果某位用户的音色不错 , 只是播音基础不太好 , 读起来没有很好的节奏 。 这时候 , 我们可以让他进棚录制一定的数据 , 然后魔音训练他的模型 , 并让用户选择一位他喜欢的主播 , 从而帮他训练一个混血模型 , 嫁接某个AI主播专业的节奏感和韵律给他 , 从而让他的AI声音听起来更舒服 , 却听着像他 。
我们都知道 , 颜值经济早已经到来 。 人们未来变得好看 , 购买各种化妆品、保养、美容 , 大家都愿意为美付费 。 而声音和视觉一样 , 都有着天然的魅力 。 人们喜欢看好看的帅哥美女 , 也喜欢听好听的声音 。 如果某个人拥有惊人的外貌 , 却天生一把公鸭子嗓 , 不免会让人心生感叹 。 因此 , 我们认为 , 未来 , 声音的美容也会成为爱美人士的新需求 。 如果希望天然的 , 那就是接受声音的培训 , 就如同音乐苗子经过培训成长为专业歌手 , 不好听的声音 , 经过配音 , 也会变得更加悦耳 。
对于直播、短视频、有声书里的声音 , 则未来借助技术 , 如何有效低成本地美化声音 , 将成为趋势 。 而说话人转换技术 , 以及在声音克隆时提供的声音混血服务 , 必将逐渐流行 。 正如美容需要参照高颜值明显的五官比例 , 声音混血则需要采样声音好听(专业的一般比较好听 , 但是非专业也可能好听)的主播的说话风格和节奏 。 魔音工坊正在和各路好声音合作(包括知名支持人、主播、配音演员等) , 构建业界领先的声音商店 , 从而学习到好声音的各种知识 , 为更好地提供声音混血服务提供优质样本 。
【功能|配音声音不好听?魔音工坊给你的声音“一键美颜”】欢迎有独特配音需求的自媒体从业者 , 有声书主播和魔音工坊合作 , 通过克隆自己的好声音 , 或者开发定制美化版本的声音 , 来提高内容制作过程中的配音效率 , 为繁荣中国的有声内容添砖加瓦 。

    推荐阅读