娱乐|想要提前知晓诺奖结果,首先你得会画画( 五 )



娱乐|想要提前知晓诺奖结果,首先你得会画画
本文图片

颜色查找表 。 在左边找到输入的颜色 , 在右边对应位置找到输出的颜色 , 即可完成美白 。   来源:AI科技大本营
此外 , 脸部器官的美型就是基于人脸关键点 , 识别出了不同的器官 , 然后对各个器官实施不同的形变调整策略(眼睛变大、鼻翼变小等等) 。 而美妆处理也需要基于人脸关键点 , 对嘴唇、脸部等不同部位采取不同的渲染手段 。
而人物形象动漫化 , 或迁移到其它风格 , 一般来说 , 基于机器学习算法(比如对抗神经网络GAN)可以很好的实现 , 感兴趣的朋友可以继续探索 , 在这里就不再详述啦 。
05
声音也想被捕捉特征
正当小编准备收工 , 这时候传来了一个声音——
(声音:“难道我不配被捕捉特征的吗?”)
在一篇无声的推送里 , 想要展示一段声音 , 那必然是这样的:
声音的时域波形图 。 上面为女声 , 下面为男声 。  
来源:知乎@DBinary
相比较肖像而言 , 声音的特征其实还是比较简单的 。 它没有眼睛鼻子耳朵嘴巴 , 而是一个又一个“循环出现的小波”——如上图框线中所示——这就是声音的内部结构“基波” 。 基波的时域长度被称作“基音周期” , 其倒数为基音频率 。 在上图中 , 女声的基音周期约为2ms , 男声的基音周期约为5ms 。
现在很多变声软件都能实现“男变女”、“大叔变萝莉”了 , 而其核心原理 , 便是重建原始声音的声波形状 , 使之尽可能地接近目标声音的波形 。 这在“时域波形图”下很难实现 , 需要通过傅里叶变换得到“频域波形图”——

娱乐|想要提前知晓诺奖结果,首先你得会画画
本文图片

声音的频域波形图 。 左边为女声 , 右边为男声 。
来源:知乎@DBinary
频域波形图展示了声音的更多细节 。 它由一系列亮线组成 , 频率从下往上依次增高 , 颜色越亮表示能量在这个频率越集中 。 最底部的亮线代表的是基音频率 , 这根线也最亮 , 说明基波的确是声音的主要特征 。 其往上数 , 依次是第一泛音、第二泛音……原来除了基波 , 还有别的频率的声波在刻画一个声音 。
上面的两张图片说明 , 男声频谱图的亮线较女声的更加密集 , 且基音频率更低 。 这与男女声的频谱范围数据是一致的——男声频率范围更小 , 且频率更低 。

娱乐|想要提前知晓诺奖结果,首先你得会画画
本文图片

男女声的频谱范围(单位:Hz)

推荐阅读