分销赏收藏举报申诉 / 9

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 约束重编程单元数量的忆阻器阵列闭环重映射算法.pdf

约束重编程单元数量的忆阻器阵列闭环重映射算法.pdf

上传人：自信****多点

文档编号：762431

上传时间：2024-03-06

格式：PDF

页数：9

大小：1.08MB

《约束重编程单元数量的忆阻器阵列闭环重映射算法.pdf》由会员分享，可在线阅读，更多相关《约束重编程单元数量的忆阻器阵列闭环重映射算法.pdf（9页珍藏版）》请在咨信网上搜索。

1、第 35 卷第 6 期计算机辅助设计与图形学学报 Vol.35 No.6 2023 年 6 月 Journal of Computer-Aided Design&Computer Graphics Jun.2023 收稿日期:2021-11-16;修回日期:2022-05-15.基金项目:国家自然科学基金(61834006,62174048,62027815),中央高校基本科研业务费专项资金(PA2022GDSK0067).刘军(1978),男,博士,副教授,硕士生导师,CCF 会员,主要研究方向为数字系统设计自动化集成电路测试、嵌入式系统;缪伟伟(1997),男,硕士研究生,主要研究方向

2、为高可靠性嵌入式系统;吴玺(1978),女,博士,讲师,主要研究方向为机器学习;任福继(1959),男,博士,教授,博士生导师,主要研究方向为智能机器人.约束重编程单元数量的忆阻器阵列闭环重映射算法刘军1,2),缪伟伟1,2),吴玺1,2),任福继3)1)(合肥工业大学计算机与信息学院合肥 230601)2)(合肥工业大学情感计算与先进智能机器安徽省重点实验室合肥 230601)3)(Graduate School of Advanced Technology and Science,University of Tokushima Tokushima 7708502 Japan)()摘

3、要:忆阻器阵列能够有效地加速神经网络中的矩阵运算,但会受到老化的影响,导致忆阻器阵列计算精度不满足要求.为了继续使用忆阻器阵列,提出一种基于重编程忆阻单元数量约束的闭环重映射算法.首先根据忆阻器阵列的老化分布得出行偏差矩阵;然后以行偏差矩阵中的最小值为起始点开始映射,直至重映射关系形成闭环;通过在映射过程中设置行偏差约束,使得重映射后的行偏差总和尽可能小,达到提高计算精度的目的;通过对重编程单元数量进行约束,尽可能减少需要重新编程的忆阻单元数量,减轻重编程造成的忆阻器阵列老化.在Pytorch上采用MINST数据集进行仿真测试的实验结果表明,所提算法不仅能够有效地提高忆阻器阵列的计算精度,而且

4、与国际上同类方法相比,在达到相同计算精度的前提下,最多可以减少 75.43%的重编程单元数.关键词:忆阻器阵列;闭环重映射;神经网络;忆阻器老化中图法分类号:TP389.1 DOI:10.3724/SP.J.1089.2023.19475 A Closed-Loop Remapping Algorithm for Memristor-Based Crossbar with a Constraint on the Number of Reprogramming Cells Liu Jun1,2),Miao Weiwei1,2),Wu Xi1,2),and Ren Fuji3)1)(School

5、 of Computer Science and Information Engineering,Hefei University of Technology,Hefei 230601)2)(Anhui Province Key Laboratory of Affective Computing and Advanced Intelligent Machine,Hefei University of Technology,Hefei 230601)3)(Graduate School of Advanced Technology and Science,University of Tokush

6、ima,Tokushima 7708502 Japan)Abstract:Memristor-based crossbar can effectively accelerate matrix-vector multiplication in neural network.However,the accuracy of crossbar may seriously decrease due to aging.Memristor-based crossbar will not meet the requirements of accuracy and cannot be used.To conti

7、nue using the crossbar,this paper proposes a closed-loop remapping algorithm with a constraint on the number of reprogramming cells.Firstly,the row devia-tion matrix is obtained according to the aging distribution of memristor-based crossbar.The remapping algorithm starts from the minimum value of r

8、ow deviation matrix until a closed-loop is formed.With the row deviation con-straint during remapping process,the sum of row deviations is as small as possible to improve accuracy.Besides,the number of reprogramming cells can be greatly reduced to alleviate aging of crossbar with a constraint on re-

9、programming cells.Experimental results show that the proposed technique can effectively improve accuracy.Compared with other techniques,it can also reduce the number of reprogramming cells by up to 75.43%while achieving the same accuracy.第 6 期刘军,等:约束重编程单元数量的忆阻器阵列闭环重映射算法 971 Key words:memristor-base

10、d crossbar;close-loop remapping;neural network;aging of memristor 神经网络中存在大量的矩阵乘法运算,随着神经网络的不断加深,利用传统处理器实现矩阵乘法会导致计算时间过长和能耗过大.新型器件忆阻器为实现矩阵乘法提供了一种更高效的方式1,能够以 1O的时间复杂度实现矩阵乘法,且具有极低的能耗2-3.利用忆阻器阵列实现矩阵乘法,首先需要将神经网络中的权值矩阵n mW映射为忆阻器电导矩阵n mG;然后将输入向量转换为电压12,nV VVV,第j列的输出电流1njijiiIgV,即为输入向量与权值矩阵第j列的乘积结

11、果.为了便于后续部分的表述,本文将权值矩阵n mW中的权值称为理想权值,忆阻器电导矩阵n mG中的电导值称为实际权值.利用忆阻器阵列加速神经网络计算分为映射和计算 2 个阶段.其中,映射阶段将神经网络的理想权值映射为忆阻器阵列的实际权值;计算阶段将输入向量转换为电压施加在忆阻器阵列上,进而得到神经网络计算结果.在映射阶段,将理想权值映射到忆阻器阵列上的方法有 2 种:(1)在线训练4.直接在忆阻器阵列上实现梯度下降算法训练理想权值;(2)软件训练和在线调整的结合.该类方法首先在软件上训练神经网络权值,并将训练好的理想权值映射为忆阻器电导值;然后对忆阻器电导值进行在线调整,以提高计算精度.上述

12、2 种方法都需要对忆阻器进行反复编程.在编程过程中,电压脉冲被施加到忆阻器上会引起忆阻器内导电细丝的变化.多次编程后会导致其可编程电导范围降低,这种效应被称为老化5-7.当忆阻器老化后,理想权值可能会超出忆阻器的可编程电导范围,从而导致实际权值和理想权值之间存在偏差.例如,忆阻器初始电导范围为0,1,理想权值为 0.2;忆阻器未老化时,实际权值可以被编程为0.2,没有权值偏差;当多次编程后,电导范围变为0.3,0.8,此时理想权值超出了忆阻器可编程电导范围,实际权值无法被编程为 0.2,此时实际权值只能被编程为 0.3,会产生权值偏差.为了延缓忆阻器的老化,文献8提出只更新忆阻器阵列中梯度较大

13、的权值的方法,以此减少权值更新的次数.除了忆阻器阵列上权值的频繁更新,高温也会加速忆阻器的老化.大权值映射到忆阻器阵列时会产生比小权值更大的热量,文献9-10提出将大权值均匀分散到忆阻器阵列上的方法.可以避免大权值聚集在某些区域而造成此区域温度过高的现象,使热量分布更加均匀,延缓忆阻器阵列的老化.上述方法的解决思路是在映射阶段延缓忆阻器的老化.但在计算阶段,由于不断对忆阻器阵列施加电压进行计算,同样会造成忆阻器阵列老化.而当理想权值超出忆阻器老化后的可编程电导范围时,会导致实际权值与理想权值存在偏差,造成计算精度降低;并且随着忆阻器阵列使用时间的增加,老化程度会不断加深,忆阻器的可编程电导范围

14、越来越小,实际电导值与目标电导值的偏差越来越大,最终忆阻器阵列将完全无法使用.老化将导致忆阻器阵列的计算精度不满足要求,无法使用,此时若将忆阻器阵列抛弃,则会造成很大的浪费.为了避免器件浪费,本文提出一种约束重编程单元数的闭环重映射算法(closed-loop remapping algorithm with constraint on the number of reprogramming cells,RACR),通过重新确定理想权值和忆阻器阵列的映射关系,尽可能多地将理想权值映射到未超出忆阻器可编程电导范围的单元上,降低忆阻器老化对计算精度的影响,使其能够继续使用.RACR 以行偏差为指标

15、来衡量老化对计算精度的影响,行偏差越小,表示老化对计算精度的影响越小.通过设置行偏差约束,使重映射后的行偏差之和尽可能小.闭环重映射算法首先根据忆阻器阵列的老化分布,得到理想权值矩阵映射到忆阻器阵列的行偏差矩阵;然后以最小行偏差对应的理想权值行为起始边开始匹配,直至形成满足约束条件的闭环重映射关系,使重映射后的行偏差总和尽可能小,降低老化对忆阻器阵列的影响,提高计算精度.此外,为了避免忆阻器阵列老化程度的进一步加深,需要减少重映射中重新编程的忆阻单元数量.如果重映射前和重映射后映射到一个忆阻单元上的理想权值的大小相等,那么此忆阻单元编程后的实际权值也是相等的,可以不对该忆阻单元进行重编程.因此

16、,RACR 通过约束重编程忆阻单元数量,避免重映射过程中重新编程的忆阻单元数量过多而加深忆阻器阵列的老化.972 计算机辅助设计与图形学学报第 35 卷 1 RACR 1.1 RACR 整体流程 RACR 整体流程如图 1 所示,下面具体阐述该流程.图 1 RACR 整体流程(1)根据忆阻器阵列中所有忆阻器老化后的可编程电阻范围信息,得到行偏差矩阵n nS.本文中忆阻器阵列的老化分布指忆阻器阵列中所有忆阻器老化后的可编程电阻范围.忆阻器老化后的可编程电阻范围为5,7 aged,maxfresh,maxaged,minfresh,min,RRf T tRRg T t(1)其中,aged,max

17、R和aged,minR分别表示忆阻器老化后的最大电阻和最小电阻,fresh,maxR和fresh,minR分别表示初始状态下忆阻器的最大电阻和最小电阻,T表示温度,t表示忆阻器的累积编程时间,f 和 g 表示基于阿伦尼乌斯公式的老化函数.在实际应用中,忆阻器温度T和施加电压计算的累积时间t均可由实测得到6.行偏差矩阵n nS的第i行第j列元则为 aged,minaged,maxaged,minaged,max10,if min,otherwiseikjkjkmijikikjkjkkGwGswGwG 其表示理想权值矩阵n mW的第i行映射到忆阻器阵列第j行产生的理想权值和实际权值的偏差之和.其中

18、,ikw表示理想权值矩阵第i行第k列的权值;aged,minjkG和aged,maxjkG分别表示忆阻器阵列第j行第k列的单元老化后的最小电导值和最大电导值.当ikw在对应忆阻单元的可编程电导范围内时,权值偏差为0;否则,权值偏差为ikw与忆阻单元最大电导值和最小电导值的最小差值.ijs越小,意味着老化对忆阻器阵列计算精度的影响越小.(2)计算重编程单元数矩阵n nC,其第i行第j列元素为,1mi jijkkce,其表示理想权值矩阵n mW第i行重映射到忆阻器阵列第j行所需的重编程忆阻单元数量.为了便于下文表述,在算法中使用ix表示理想权值矩阵的第i行,jy表示忆阻器阵列第j行.本文针对的是理

19、想权值行与老化后忆阻器阵列行的重映射,而在未重映射前,忆阻器阵列第j行jy也是由理想权值矩阵n mW的某一行映射而成的.假设在重映射前,jy由理想权值矩阵的第t行tx映射而成;重映射后,jy由理想权值矩阵的第i行ix映射而成.ijc为ix与tx中相同位置上不相等的理想权值数量.若ikw,tkw分别为ix和tx中的第k个权值,当iktkww时,1i jke,表示此忆阻单元需要重新编程;否则,0i jke,表示此忆阻单元不需要重编程.(3)在行偏差增量以及重编程单元数阈值TC的约束下,执行闭环匹配重映射算法.行偏差增量用于对重映射过程施加行偏差约束,使确定的重映射关系满足行偏差约束,保证重映射后忆

20、阻器阵列的计算精度.RACR初始时,将TC设置为最大值,然后不断调整,计算闭环匹配重映射后的计算精度,当达到最高计算精度时,记此时的为;然后将TC调整为最小值,固定,不断增大TC,判断重映射后忆阻器阵列的计算精度是否大于阈值,若小于,则继续增大TC,再执行闭环匹配重映射,直至计算精度大于等于,输出重映射结果.以此使重映射后的忆阻器阵列在满足计算精度要求的同时,尽可能减少重编程忆阻单元数,减轻对忆阻器阵列的老化.RACR中,行偏差约束等于行偏差增量加上理想权值矩阵第i行映射到忆阻器阵列的最小行偏差 min,1,2 ijisOjm.这是因为不同权第 6 期刘军,等:约束重编程单元数量的忆阻器阵列

21、闭环重映射算法 973 值矩阵行映射到忆阻器阵列行的行偏差大小可能存在较大差异,如果只通过一个全局的行偏差阈值约束整个算法的行偏差,很可能会出现某些理想权值行的iO就已经大于行偏差阈值,造成该权值行无法在行偏差约束下完成重映射.而如果将行偏差阈值设置得过大,则可能会造成重映射后忆阻器阵列的计算精度无法满足要求.所以只通过一个全局的行偏差阈值对所有理想权值行的匹配进行约束是十分困难的.因此,在RACR中行偏差阈值为iO,表示为权值行ix的最小行偏差加上行偏差增量,等同于对每个理想权值行ix的匹配设置特定的行偏差阈值,可以改变来调整对重映射结果的行偏差约束,避免重映射算法结果的行偏差总和过大,导致

22、忆阻器阵列的计算精度较低.和TC是根据对计算精度和重编程单元数的具体要求自定义的.下面介绍闭环匹配重映射算法.1.2 闭环匹配重映射算法闭环匹配重映射算法的思想是以当前行偏差矩阵中的最小值对应的理想权值行为起始边,使理想权值行与忆阻器阵列行形成满足重编程单元数约束和行偏差约束的闭环重映射关系.在闭环匹配中,当理想权值行无法在约束条件下确定重映射关系时,会将上一次暂时确定的重映射关系破坏,并回溯到上一次确定重映射关系前的状态接着匹配,直至形成满足约束条件的闭环重映射关系,以此优化全局的重映射结果,提高重映射后的忆阻器阵列计算精度.闭环匹配重映射算法通过确定多个闭环重映射关系,使所有的理想权值行

23、与忆阻器阵列行确定重映射关系.闭环匹配重映射算法的伪代码如算法1所示.算法 1.闭环匹配重映射算法.输入.重编程单元数矩阵n nC,行偏差矩n nS,行偏差增量,重编程单元数阈值TC,重映射前的理想权值行的映射关系unremap_wgtn,重映射前忆阻器阵列行的映射关系unremap_ memn.输出.重映射结果.Step1.初始化.将 remapn数组全部设置为1,ST为空栈,0c.Step2.对未确定重映射关系的理想权值行进行匹配:Step2.1.在当前n nS矩阵中找到最小值,将其行序号赋给i,初始化1u;Step2.2.迭代匹配直至1u 且 remapi为1:Step2.2.1.can

24、Matched(,)n njiS,通过 canM-atched 算法得到理想权值第i行重映射的忆阻器阵列行序号;Step2.2.2.若0j,则更新状态.ST.push(i,n nS),remapi=j,ijccc,将n nS第i行和第 j 列的元素全部置为,i更新为 unremap_memj;Step2.2.3.若=0j,此时若 ST 为空,将u设置为 0;否则,ST 内容出栈,回溯到前一状态,令i ST.pop()i,ST.pop()n nn nSS,remap ji,remap i 1,ijccc;Step2.3.若0u,则表示无法在约束下确定重映射关系,维持重映射前的映射关系.remap

25、i=unre-map_wgti;Step2.4.清空堆栈ST.算法1的Step1对数组remapn、堆栈ST和整型变量c进行初始化;remapn数组用于存储算法中得到的理想权值行与忆阻器阵列的重映射关系;堆栈ST用于存储暂时确定重映射关系的理想权值行的序号和更新前的行偏差矩阵n nS状态的数据对,便于后续回溯时恢复之前的状态信息;c记录需要重新编程的忆阻单元数量.下面通过具体例子阐述算法1的执行过程.假设行偏差矩阵n nS和重编程单元数矩阵n nC分别为 04 41.41.50.30.60.41.51.20.30.51.41.50.42.10.51.20.4和S4 403233022.2204

26、3220C 重编程单元数阈值T8C;行偏差增量1.重映射前的映射关系为unremaped_wgt ii,unremaped_mem ii.数组unremaped_wgt ij表示重映射前ix映射到jy上,数组unremaped_ mem ji表示重映射前映射到jy上的理想权值行为ix.算法1的Step2.1是令i等于n nS中最小值所在行的行序号.如在 04 4S中最小值为130.3s,因此1i.算法1的Step2.2.1通过canMatched算法得到在重编程单元数约束和行偏差约束下,ix重映射到忆阻器阵列的哪一行,详见算法2.若能够找到满足约束条件的重映射关系,则返回对

27、应的忆阻器阵列的行序号j,即ix可以暂时与jy建立重映射关系;若无法重映射,即ix与任一忆阻器阵列行都不能够满足约束条件,则返回0.例如,在执行canMatched(1,04 4S)时,04 4S第1行的最小值为974 计算机辅助设计与图形学学报第 35 卷 13s,算法2首先判断理想权值行1x重映射到忆阻器阵列行3y是否满足约束条件.此例中,1x与3y的匹配满足约束条件,如表1第1行所示;此时 canMatched算法返回值为3,并且canMatched(1,04 4S)执行完成后n nS矩阵变为 14 41.41.50.60.41.51.20.3.0.51.41.50.42.10.51.

28、20.4S 其中,13s值设置为.表 1 RACR 执行过程序号 pqxy 行偏差约束iO 重编程单元数c 堆栈 ST 1 13xy 0.30.3 1 028 (1)4 4(1,)S 2 34xy 0.40.4 1 428 (1)(3)4 44 4(1,),(3,)SS 3 42xy 0.50.4 1 628 (3)(5)(1)4 44 44 4(3,),(,),(1,)SSS4 4 21xy 0.40.3 1 838 5 41xy 2.10.4 1 6 31xy 0.50.4 1 228 (1)(7)4 44 4(1,),(3,)SS 7 24xy 0.30.4 1 428 8 42xy

29、0.50.4 1 628 算法 2.canMatched算法.输入.理想权值行序号i,行偏差矩阵n nS.输出.确定重映射关系的忆阻器阵列行序号.Step1.将t初始化为 0.Step2.当0t 且n nS中的第i行的最小值不等于时,迭代执行如下步骤:Step2.1.令 j 为n nS第i行的最小值所在列的序号;Step2.2.若ijisO且TijccC,将t置为 1;Step2.3.将ijs 置为.Step3.若1t,则确定了满足约束条件的重映射关系,返回 j;否则,返回 0.算法1的Step2.2.2和Step2.2.3根据canMatched算法返回的值执行不同的操作.如canMatch

30、ed(1,04 4S)返回值为3,则令remap1=3,表明1x暂时与3y建立重映射关系.此外,还需要将1(i的值)和矩阵 14 4S(n nS)入栈,并将 14 4S的第1行和第3列中的所有元素全部设置为,矩阵为 24 40.41.50.3.0.51.40.42.10.50.4S 入栈的目的是当canMatched算法的返回值为0时,可以通过出栈回溯到上一步,并将暂时建立的ix与jy的重映射关系破坏.在后续步骤中,将为ix重新寻找另外一个忆阻器阵列行进行重映射,优化算法的全局结果.上一步已经暂时确定了1x与3y的重映射关系,并更新相应状态.由于3y重映射前对应的理想权值行为3x,不是起始理想

31、权值行1x,尚未形成闭环重映射关系,下一步要确定3x与忆阻器阵列的哪一行建立重映射关系.要确定理想权值行3x的重映射关系是因为在重映射前3x是映射到3y的,而重映射后1x映射到3y,破坏了3x与3y的映射关系,RACR需要在本次闭环内确定3x的重映射关系.若3x无法在本次闭环中找到满足约束条件的重映射,则需要将1x与3y的重映射关系破坏,重新为1x寻找满足约束条件的映射关系.但是,若3x不在本次闭环内确定重映射关系,当在其他闭环内以3x为起始边无法确定满足约束条件的重映射关系时,RACR中需要将3x强制映射到3y,即维持3x重映射前的映射关系,此时需要将1x与3y的重映射关系以及之后确定的所有

32、重映射关系破坏,导致算法执行时间过长.故在1x确定与3y的重映射关系后,会接着确定3x的重映射关系.执行canMatched(3,24 4S)后,可以暂时确定3x与4y的重映射关系,矩阵n nS变为 34 40.41.50.3.0.51.42.10.50.4S 如表1第2行所示.返回算法1后,3(i的值)和矩阵 34 4S(n nS)将入栈,并将 34 4S的第3行和第第 6 期刘军,等:约束重编程单元数量的忆阻器阵列闭环重映射算法 975 4列全部设置为,矩阵为 44 40.41.50.32.10.50.4S.上一步暂时确定了3x与4y的重映射关系.重映射之前,4y的权值是由4x映射而成的

33、,因此接下来确定4x重映射到忆阻器阵列的哪一行.执行 canMatched(4,44 4S)过程中,可以暂时确定4x与2y的重映射关系,矩阵n nS变为 54 40.41.5.2.1S 如表1的第3行所示.返回算法1后,4(i的值)和矩阵 54 4S(n nS)将入栈,并将 54 4S的第4行和第2列全部设置为,矩阵 64 4S为 64 40.4S.上一步暂时确定了4x与2y的重映射关系.重映射之前,2y的权值是由2x映射而成的,接下来确定2x重映射到忆阻器阵列的哪一行.执行canMatched(2,64 4S)过程中可以发现,2x重映射到1y不满足重编程单元数的约束条件,如表1第4行所示.此

34、时,算法将回溯到第3行,将(4,54 4S)出栈,并将4x与2y的映射关系作废,执行算法1,得到4i,54 4n nSS.执行canMatched(4,54 4S)时,发现4x重映射到1y不满足行偏差的约束条件,如表1第5行所示.因此,继续回溯到第2行,将(3,34 4S)出栈,3x与4y的映射关系作废,接着执行算法1,得到3i,34 4n nSS.执行canMatched(3,34 4S)后,3x与1y建立重映射关系,矩阵n nS变为 74 4S,即 74 40.41.5.2.1S 如表1第2行所示.返回算法1后,3(i的值)和矩阵 74 4S(n nS)将入栈,并将 74 4S的第3行和第

35、1列全部设置为,矩阵为 84 40.4.S 至此,确定了1331,xyxy的重映射关系.在最初的映射关系中,1x是映射到1y的.而RACR算法所形成的新的映射关系中,是以1x为起始点,1y为终点,即1331xyxy,形成了一个闭环,因而称为闭环匹配重映射.形成一个闭环后,84 4S中还有理想权值行尚未确定重映射关系,继续执行算法1.在矩阵 84 4S中找到一个最小权值,使用其对应的理想权值行作为新的闭环的起始点,重复上面例子中闭环的形成过程,直至形成另一个闭环重映射关系.如表1第7行和第8行所示,建立了重映射关系2442,xyxy,2442xyxy为新的闭环.本例中,算法通过确定2个闭环重映射

36、关系,使所有的理想权值行与忆阻器阵列行之间确定了重映射关系.算法1的Step2.3表示当起始理想权值行无法在重编程单元数和行偏差约束下确定重映射关系时,则维持重映射前的映射关系,不对其进行重编程,以减少重编程单元数,避免加深忆阻器阵列的老化.下面介绍如何确定RACR的执行时机.在计算阶段,随着施加电压执行的计算次数的增加,忆阻器阵列的老化程度不断加深,忆阻器阵列的计算精度也会随计算次数的增加而降低得越快5.若将执行RACR的计算次数间隔设为固定值,则会显著降低忆阻器阵列的计算效率.例如,在忆阻器阵列老化程度较轻的时候,可能执行10 000次计算后计算精度会从95%降低到90%;但是当忆阻器阵列

37、老化程度较深时,可能执行5 000次计算后就会使计算精度从95%降低到90%.如果执行RACR的计算精度阈值为90%,设定每隔5 000次计算就执行一次RACR,那么当老化程度较轻时,忆阻器阵列的计算精度可能在93%时就执行了RACR,会造成极大的浪费,显著降低忆阻器阵列的计算效率.因此,可以利用测试操作得到忆阻器阵列的计算精度信息,再通过多项式拟合预测最佳执行RACR的时机.首先,每隔固定的计算次数就对忆阻器阵列执行一次测试操作,得到忆阻器阵列的计算精度信息.当执行多次测试操作后对得到的数据进行多项976 计算机辅助设计与图形学学报第 35 卷式拟合,可以获得忆阻器阵列的计算精度与计算次

38、数k的经验函数,fk.然后,利用,fk预测当降低到设定的精度阈值时还需执行的计算次数remapk,即再执行remapk次计算就执行RACR.若remapk,即在执行RACR前还会执行测试操作,则在测试操作时利用得到的计算精度信息重新进行多项式拟合,以得到新的经验函数,fk,利用,fk重新预测remapk;若remapk,则在remapk次计算操作后直接执行RACR.执行RACR后,之前得到的计算精度信息全部清空,需要重新通过测试操作得到计算精度信息来进行多项式拟合,以预测下一次执行RACR的时机.2 实验结果和分析 2.1 实验设置为了评估RACR的效果,本文在Pytorch上构建了一个多层

39、卷积神经网络,采用MINST数据集对其进行仿真测试.卷积神经网络包括3个卷积层和1个全连接层,原始神经网络的计算精度为97.65%.本文中计算精度指使用神经网络对MINST数据集仿真得到的分类精度.4层神经网络对应的忆阻器阵列规模分别为8 9,16 72,32 144和1568 10;输入图像的大小为28 28;忆阻器的电阻范围为10 k1 M,忆阻器阵列中忆阻单元之间的导线电阻为2.5.实验中,模拟忆阻器老化后的可编程电导范围为 12aged,maxfresh,max21aged,minfresh,min22e,0,.e,0,jkjkjkj

40、kjkjkGGNGGN 其中,1jk和2jk表示忆阻器的老化分布;2表示忆阻器老化分布的显著性.通过调整2模拟不同的老化程度,分析不同老化程度下忆阻器阵列计算精度的变化.2.2 实验结果图2所示为使用3种映射算法后忆阻器阵列计算精度的对比,其中,KM算法和贪心算法精度曲线分别为使用文献11和文献12中的映射算法后的计算精度曲线.可以看出,与KM算法和贪心算法相比,RACR在不同老化程度下取得的计算精度均更高;并且随着老化程度的加深,RACR在计算精度上的优势越明显,KM算法和贪心算法的计算精度会随着老化程度的加深而出现显著降低.图 2 3 种映射算法的计算精度对比图式(1)计算出的老化分布

41、与实际的老化分布存在一定偏差,由文献1可知,两者的偏差很小,仍可以用计算出的老化分布来模拟忆阻器阵列的实际老化分布.本文将利用模拟的老化分布得到的重映射结果应用在实际老化分布中,验证通过模拟的老化分布得到的重映射结果在实际老化分布中是否仍有效,结果如图3所示.实验中,将实际忆阻器老化后的可编程最大可编程电导和最小可编程电导分别设置为 aged,maxaged,maxactulsimulaged,minaged,minactulsimul1.1GGGG 其中,aged,maxsimulG和aged,minsimulG分别表示通过公式计算出的忆阻器老化后的最大可编程电导和最小可编程电导,和表示0.

42、10,0.10的随机值.从图3可以看出,即使实际老化分布与模拟的老化分布存在一定偏差,但是对于计算精度的影响很小.图 3 模拟和实际老化分布的计算精度对比图表2所示为在不同老化程度下,RACR将精度修复到与KM算法和贪心算法同等精度时所需的重编程单元数,其中,重编程单元数百分比指所需重新编程的忆阻单元数量与总体忆阻器阵列单元数量的比值.由于KM算法和贪心算法执行重映射时会对整个忆阻器阵列进行重新编程,因此这2种算法的重编程单元数百分比为100%;而RACR 第 6 期刘军,等:约束重编程单元数量的忆阻器阵列闭环重映射算法 977 表 2 3 种映射算法的结果对比%KM算法 RACR 贪心算

43、法 RACR 2 重映射前精度精度重编程单元数百分比精度重编程单元数百分比精度重编程单元数百分比精度重编程单元数百分比 1 49.75 92.30 93.9749.33 90.30 91.55 34.01 2 45.40 91.40 93.1040.44 86.30 86.90 38.03 3 42.00 90.30 90.7633.31 81.90 89.15 26.98 4 38.55 88.95 90.7443.83 76.80 87.50 26.93 5 35.40 86.55 87.9349.00 70.80 84.10 24.57 6 33.50 84.20

44、100 86.6041.50 64.10 100 80.45 24.57 考虑重编程会加深忆阻器阵列的老化,因此在保证计算精度的同时尽可能减少重编程单元数.从表2可以看出,与KM算法和贪心算法相比,RACR在计算精度接近的同时,最多可以分别减少66.69%和75.43%的重编程单元数,减轻了重编程对忆阻器阵列老化的影响.图4为24时,重编程单元数阈值TC和行偏差增量对计算精度的影响.可以看出,忆阻器阵列计算精度并不会随着行偏差增量的减小而一直提高;设置得过大或过小时,RACR的计算精度都处在较低的水平,因此需要在适当的范围内找到最佳的行偏差增量,以得到最高的计算精度.获得最佳的行偏差增

45、量方法如下:执行 RACR时,可以在计算出行偏差矩阵后,再计算行偏差矩阵每行的行偏差与当前行的最小行偏差的差值,每行的差值表示候选的行偏差增量.例如,对于行偏差矩阵04 4S（）,理想权值第1行的最小行偏差1O为0.3,则行偏差矩阵第1行的行偏差与1O的差值分别为1.1,1.5,0,0.3;依次计算第2,3,4行的差值,分别为0.1,1.2,0.9,0,0.1,1.0,1.1,0和1.7,0.1,0.8,0,将所有的差值按照升序排列,从中选择一个中间值为初始行偏差增量.然后,先选择更大的差值作为行偏差增量,如果可以提高忆阻器阵列的计算精度,就继续选择更大的差值作为新的行偏差增量,直至连续多次增

46、大行偏差增量仍无法再提升计算精度;再选择比初始值更小的差值作为行偏差增量,如果能提升计算精度,则继续选择更小的值作为行偏差增量,直至连续多次减小行偏差增量仍无法提升计算精度,结束算法.最后,得到忆阻器阵列计算精度最高时的行偏差增量.从图4中还可以看出,随着TC的增大,计算精度总体呈现上升的趋势.因此当得到最佳行偏差增量后,先将TC设置为最小值,再不断增大TC直至计算精度超过设定的阈值,输出RACR的重映射结果,以此在满足计算精度要求的同时,尽可能减少重编程单元数,避免加深忆阻器阵列的老化.图 4 相关参数对计算精度的影响 3 结语本文提出的RACR尽可能在忆阻器上重新映射未超出可编程电导范

47、围内的理想权值,降低老化带来的计算精度损失,从而继续利用忆阻器阵列,避免器件浪费.该算法以最小行偏差对应的理想权值行为起始边开始匹配,使重映射后的行偏差总和尽可能小;利用优先闭环匹配的特点实现优化全局重映射结果的目的,并且利用行偏差约束和重编程单元数阈值实现对重映射关系的计算精度约束和重编程单元数约束,在提高计算精度的同时尽可能减少重映射中重新编程的忆阻单元数量.实验结果表明,相比于其他算法,RACR在达到相同计算精度的同时,最多可以减少75.43%的重编程忆阻单元数量.参考文献(References):1 Jo S H,Chang T,Ebong I,et al.Nanoscale memr

48、istor device as synapse in neuromorphic systemsJ.Nano Letters,2010,10(4):1297-1301 978 计算机辅助设计与图形学学报第 35 卷 2 Hu Fei,You Zhiqiang,Liu Peng,et al.Circuit design of con-volutional neural network based on memristor crossbar ar-raysJ.Journal of Computer Research and Development,2018,55(5):1097-1107(in C

49、hinese)(胡飞,尤志强,刘鹏,等.基于忆阻器交叉阵列的卷积神经网络电路设计J.计算机研究与发展,2018,55(5):1097-1107)3 Prezioso M,Merrikh-Bayat F,Hoskins B D,et al.Training and operation of an integrated neuromorphic network based on metal-oxide memristorsJ.Nature,2015,521(7550):61-64 4 Hu M,Li H,Chen Y R,et al.BSB training scheme implemen-tat

50、ion on memristor-based circuitC/Proceedings of the IEEE Symposium on Computational Intelligence for Security and Defense Applications.Los Alamitos:IEEE Computer Society Press,2013:80-87 5 Degraeve R,Fantini A,Roussel P,et al.Quantitative endurance failure model for filamentary RRAMC/Proceedings of S

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 约束编程单元数量忆阻器阵列闭环映射算法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。