Binary neural networks - A survey

Yd Wen2026/5/10大约 2 分钟

压缩深层网络的方法可以分为五类：

其压缩深层网络的原理是：

利用二值化技术，可以通过将层切换为全精度或 1 位来轻松验证层的重要性。如果某层二值化后性能大幅下降，则可以断定该层处于网络的关键路径上。

研究[62,67]表明，神经元的数量比位宽更重要，在深度神经网络中可能不需要使用实值神经元，这与生物神经网络的原理类似。

常识是，第一层和最后一层应保持较高的精度，这意味着这些层在神经网络的预测中发挥着更重要的作用。

该综述试图利用二值神经网络的性质，将其分为不优化量化函数的朴素二值化和包括最小化量化误差、改进损失函数和减小梯度误差的优化二值化。

参考资料