Multi-bit spiking neural networks (SNNs) have recently become a heated research spot, pursuing energy-efficient and high-accurate AI. However, with more bits involved, the associated memory and computation demands escalate to the point where the performance improvements become disproportionate. Based on the insight that different layers demonstrate different importance and extra bits could be wasted and interfering, this paper presents an adaptive bit allocation strategy for direct-trained SNNs, achieving fine-grained layer-wise allocation of memory and computation resources. Thus, SNN's efficiency and accuracy can be improved. Specifically, we parametrize the temporal lengths and the bit widths of weights and spikes, and make them learnable and controllable through gradients. To address the challenges caused by changeable bit widths and temporal lengths, we propose the refined spiking neuron, which can handle different temporal lengths, enable the derivation of gradients for temporal lengths, and suit spike quantization better. In addition, we theoretically formulate the step-size mismatch problem of learnable bit widths, which may incur severe quantization errors to SNN, and accordingly propose the step-size renewal mechanism to alleviate this issue. Experiments on various datasets, including the static CIFAR and ImageNet datasets and the dynamic CIFAR-DVS and DVS-GESTURE datasets, demonstrate that our methods can reduce the overall memory and computation cost while achieving higher accuracy. Particularly, our SEWResNet-34 can achieve a 2.69\% accuracy gain and 4.16$\times$ lower bit budgets over the advanced baseline work on ImageNet. This work is open-sourced at \href{https://github.com/Ikarosy/Towards-Efficient-and-Accurate-Spiking-Neural-Networks-via-Adaptive-Bit-Allocation}{this link}.


翻译:多比特脉冲神经网络(SNNs)近年来成为研究热点,旨在实现高能效与高精度的人工智能。然而,随着比特数的增加,相关的内存与计算需求急剧上升,导致性能提升与资源消耗不成比例。基于不同层具有不同重要性、额外比特可能被浪费或产生干扰的洞察,本文提出了一种针对直接训练SNN的自适应比特分配策略,实现了对内存与计算资源的细粒度逐层分配,从而提升SNN的效率与准确性。具体而言,我们将权重与脉冲的时间长度及比特宽度参数化,使其可通过梯度进行学习与控制。为应对可变比特宽度与时间长度带来的挑战,我们提出了改进的脉冲神经元,其能够处理不同的时间长度、支持时间长度梯度的推导,并更好地适应脉冲量化。此外,我们从理论上阐述了可学习比特宽度可能引发的步长失配问题,该问题可能导致SNN产生严重的量化误差,并据此提出了步长更新机制以缓解此问题。在包括静态CIFAR与ImageNet数据集以及动态CIFAR-DVS与DVS-GESTURE数据集在内的多种数据集上的实验表明,我们的方法能够在降低总体内存与计算成本的同时实现更高的准确率。特别地,我们的SEWResNet-34在ImageNet数据集上相比先进基线工作,实现了2.69%的准确率提升,同时比特预算降低了4.16倍。本工作已在\\href{https://github.com/Ikarosy/Towards-Efficient-and-Accurate-Spiking-Neural-Networks-via-Adaptive-Bit-Allocation}{此链接}开源。

0
下载
关闭预览

相关内容

【CVPR2019】弱监督图像分类建模
深度学习大讲堂
38+阅读 · 2019年7月25日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关资讯
【CVPR2019】弱监督图像分类建模
深度学习大讲堂
38+阅读 · 2019年7月25日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员