本文图片
颜色查找表 。 在左边找到输入的颜色 , 在右边对应位置找到输出的颜色 , 即可完成美白 。 来源:AI科技大本营
此外 , 脸部器官的美型就是基于人脸关键点 , 识别出了不同的器官 , 然后对各个器官实施不同的形变调整策略(眼睛变大、鼻翼变小等等) 。 而美妆处理也需要基于人脸关键点 , 对嘴唇、脸部等不同部位采取不同的渲染手段 。
而人物形象动漫化 , 或迁移到其它风格 , 一般来说 , 基于机器学习算法(比如对抗神经网络GAN)可以很好的实现 , 感兴趣的朋友可以继续探索 , 在这里就不再详述啦 。
05
声音也想被捕捉特征
正当小编准备收工 , 这时候传来了一个声音——
(声音:“难道我不配被捕捉特征的吗?”)
在一篇无声的推送里 , 想要展示一段声音 , 那必然是这样的:
声音的时域波形图 。 上面为女声 , 下面为男声 。
来源:知乎@DBinary
相比较肖像而言 , 声音的特征其实还是比较简单的 。 它没有眼睛鼻子耳朵嘴巴 , 而是一个又一个“循环出现的小波”——如上图框线中所示——这就是声音的内部结构“基波” 。 基波的时域长度被称作“基音周期” , 其倒数为基音频率 。 在上图中 , 女声的基音周期约为2ms , 男声的基音周期约为5ms 。
现在很多变声软件都能实现“男变女”、“大叔变萝莉”了 , 而其核心原理 , 便是重建原始声音的声波形状 , 使之尽可能地接近目标声音的波形 。 这在“时域波形图”下很难实现 , 需要通过傅里叶变换得到“频域波形图”——
本文图片
声音的频域波形图 。 左边为女声 , 右边为男声 。
来源:知乎@DBinary
频域波形图展示了声音的更多细节 。 它由一系列亮线组成 , 频率从下往上依次增高 , 颜色越亮表示能量在这个频率越集中 。 最底部的亮线代表的是基音频率 , 这根线也最亮 , 说明基波的确是声音的主要特征 。 其往上数 , 依次是第一泛音、第二泛音……原来除了基波 , 还有别的频率的声波在刻画一个声音 。
上面的两张图片说明 , 男声频谱图的亮线较女声的更加密集 , 且基音频率更低 。 这与男女声的频谱范围数据是一致的——男声频率范围更小 , 且频率更低 。
本文图片
男女声的频谱范围(单位:Hz)
推荐阅读
- 娱乐性|新华全媒+|探秘冬奥会“黑科技”:当冰壶遇上人工智能
- 娱乐|华为智慧屏迎来“影音娱乐”场景三大升级
- 新机|2021年末骁龙8系新机频发,想要一款性能体验好的旗舰该怎么选?
- 收入|Sensor Tower:娱乐应用全球年度收入超 91 美元,再创新高
- 娱乐|SensorTower:视频&直播 App 成 2021年娱乐类主流,TikTok占最多
- 市场|折叠屏手机想要爆红,光靠华为、小米、OPPO还不够,还缺苹果
- 同行人|外地抵(返)牡人员 请使用“牡疫控”提前填报
- 哈曼卡顿|明晚发 小米12/Pro带你提前看 | 一加10Pro开启预约
- 蔡司|影像新王vivo X70 Pro+评测:想要的都有了
- 评价|OPPO Find N首批用户评价出炉 想要入手,这些体验和配置要知道