函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法( 二 )


其中 ω = 2π/T 是角频率 , α_0/2 是直接分量 ,

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

是正弦(余弦)分量的系数 。 具体来说 , 当周期信号呈方波时 , 有:

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

并推导出方波 s(t) 的 FS
【函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法】
函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

注意到当信号被限制在单个周期内时 , 符号函数与方波等同:

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

因此 , 符号函数也可以被分解为正弦(余弦)函数的组合 , 并且其导数如下:

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

然后 , 该研究提出使用上述等式 (8) 替换 STE 中的导数 , 以在反向传播期间更好地逼近符号函数 。
当将信号从空间域转换到频域 , 使用无限项时 , FS 分解是符号函数的无损表征 , 因此等式 (6) 可以重写为:

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

其中 , n 是 FS 的项数 , 相应的导数是:

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

然后该研究进一步证明了随着 n 的增加 , 估计值

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

和 s(t)之间的均方误差会逐渐减小 , 并在 n → ∞ 时收敛到 0 。
为了进一步补偿细微的逼近误差 , 该研究在训练阶段添加了一个噪声适应模块来细化梯度 。

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

实验及结果
为了展示 FDA-BNN 优越的性能 , 该研究在 CIFAR-10 数据集上进行了评估实验 , 实验结果如下表所示 。

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

消融实验
为了验证所提方法中每个组件的有效性、噪声适应模块和超参数的影响 , 该研究进行了一系列的消融实验 。
首先 , 该研究使用 ResNet-20 架构在 CIFAR-10 上实验验证正弦模块和噪声适应模块的效果 , 结果如下表所示 。

函数|NeurIPS 2021 | 华为诺亚Oral论文:基于频域的二值神经网络训练方法
文章图片

推荐阅读