典型文献
具有混合奖惩信号的脉冲时间依赖可塑性算法
文献摘要:
近年来,具有生理学基础的脉冲时间依赖可塑性(Spiking Timing-Dependent Plasticity,STDP)规则在脉冲神经网络中得到了越来越多的应用.由STDP规则和奖惩机制相结合的R-STDP(reward-modulated STDP)学习算法在改善脉冲神经网络的性能上有良好的效果.但R-STDP算法在训练多层脉冲神经网络时,仍存在反馈信号仅作用于网络末层、中间层无法获得有用奖惩信号.为此,利用 自编码器的无监督特性,提出一种具有混合奖惩信号的MR-STDP(Mix Reward-modulated STDP)算法.在中间层中增加重构层以够建基于卷积自编码器的奖惩信号因子模型,通过比较卷积层和重构层的神经元脉冲发放时间,获取中间层网络权重调整的指导因子信号.指导因子信号是对比层间自编码器的输入层与重构层的相同位置神经元所发放的脉冲序列相似性度量指标,并将其与R-STDP相结合,使得中间层能够获得权重指导信号.在MNIST和COVID-19 CT数据集上的实验结果表明,该方法取得了比R-STDP更高的精度,且中间层网络的学习效率大幅提高.
文献关键词:
脉冲神经网络;脉冲时间依赖可塑性;图像识别;卷积自编码器
中图分类号:
作者姓名:
陈运享;冯忍;陈云华
作者机构:
广东工业大学计算机学院,广东广州510006
文献出处:
引用格式:
[1]陈运享;冯忍;陈云华-.具有混合奖惩信号的脉冲时间依赖可塑性算法)[J].微电子学与计算机,2022(09):20-25
A类:
B类:
脉冲时间依赖可塑性,生理学,Spiking,Timing,Dependent,Plasticity,STDP,脉冲神经网络,奖惩机制,reward,modulated,中间层,得有,无监督,MR,Mix,Reward,卷积自编码器,信号因子,因子模型,卷积层,权重调整,输入层,脉冲序列,相似性度量,度量指标,MNIST,学习效率,图像识别
AB值:
0.277327
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。