基于深度学习的SM4密码算法新型区分器.pdf
《基于深度学习的SM4密码算法新型区分器.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的SM4密码算法新型区分器.pdf(14页珍藏版)》请在咨信网上搜索。
1、2023 年 7 月 Journal on Communications July 2023 第 44 卷第 7 期 通 信 学 报 Vol.44 No.7基于深度学习的 SM4 密码算法新型区分器 王慧娇,张鑫,韦永壮,李灵琛(桂林电子科技大学计算机与信息安全学院,广西 桂林 541004)摘 要:针对大状态分组密码区分器的数据复杂度、时间复杂度和存储复杂度较高的问题,提出了一种建立长分组和长密钥分组密码算法深度学习区分器模型的方法,构建了 SM4 算法的神经区分器。借鉴密文差分能够提升区分器性能的思想,将密文对之间的部分差异信息作为训练数据的一部分,设计了神经区分器新数据输入结构,采用残差
2、神经网络模型建立神经区分器,对长分组的训练数据集进行数据预处理。同时,针对所构建的区分器存在高特异度和低敏感度的现象,提出了一种模型再学习的改进策略。实验结果表明,基于深度学习的区分器模型获得了 9 轮 SM4 神经区分器,其 49 轮区分器的准确率最高可达 100%、76.14%、65.20%、59.28%、55.89%和53.73%,所获得的差分神经区分器的复杂度和准确率远优于传统差分区分器,也是目前已知针对 SM4 密码算法最好的神经区分器,证明了深度学习方法在长分组密码安全性分析上的有效性和可行性。关键词:分组密码;深度学习;神经区分器;SM4 算法;复杂度 中图分类号:TN918 文
3、献标志码:A DOI:10.11959/j.issn.1000436x.2023141 Novel distinguisher for SM4 cipher algorithm based on deep learning WANG Huijiao,ZHANG Xin,WEI Yongzhuang,LI Lingchen School of Computer Science and Information Security,Guilin University of Electronic Technology,Guilin 541004,China Abstract:A method was p
4、roposed to construct a deep learning distinguisher model for large state block ciphers with large-block and long-key in view of the problem of high data complexity,time complexity and storage complexity of large state block cipher distinguishers,and the neural distinguishers were constructed for SM4
5、 algorithm.Drawing inspi-ration from the idea that ciphertext difference could improve the performance of distinguishers,a new input data format for neural distinguisher was designed by using partial difference information between ciphertext pairs as part of the train-ing data.The residual neural ne
6、twork model was used to construct the neural distinguisher.The training dataset for large blocks was preprocessed.Additionally,an improved strategy for model relearning was proposed to address the high spe-cificity and low sensitivity of the constructed distinguisher.Experimental results show that t
7、he proposed deep learning model for SM4 can achieve 9 rounds neural distinguisher.The accuracy of 49 rounds distinguishers can reach up to 100%,76.14%,65.20%,59.28%,55.89%and 53.73%respectively.The complexity and accuracy of the constructed dif-ferential neural distinguisher are significantly better
8、 than those of traditional differential distinguishers,and it is currently the best neural distinguisher for the block cipher SM4 to our knowledge.It also proves that the deep learning method is effective and feasible in the security analysis of block cipher of large block.Keywords:block cipher,deep
9、 learning,neural distinguisher,SM4 algorithm,complexity 收稿日期:20230419;修回日期:20230713 通信作者:韦永壮,walker_ 基金项目:国家自然科学基金资助项目(No.62162016);广西自然科学基金资助项目(No.2019GXNSFGA245004);广西科技重大专项基金资助项目(桂科 AA22068072);桂林电子科技大学研究生教育创新计划基金资助项目(No.2022YCXS088)Foundation Items:The National Natural Science Foundation of Chin
10、a(No.62162016),The Natural Science Foundation of Guangxi(No.2019GXNSFGA245004),The Science and Technology Major Project of Guangxi(No.AA22068072),Innovation Project of GUETGraduate Education(No.2022YCXS088)172 通 信 学 报 第 44 卷 0 引言 当前各种智慧系统1、物联网系统2以及大数据系统3蓬勃发展,数据和信息已成为这些系统的基础。在开放的网络环境下,信息在存储与传播中面临着严峻的
11、安全问题,而对数据加密之后再进行传输已经成为保密通信的基本模式。分组密码以其加解密结构一致、效率高以及软硬件实现优势,现已成为网络通信中保证数据机密性的核心算法。在分组密码设计以及后续的应用中,对其安全性进行评估是必不可少的环节。分组密码必须能够抵抗已知的密码分析才能获得强大的安全性。目前,常见的分组密码安全性分析方法主要有差分密码分析4、线性密码分析5、积分密码分析6、零相关线性密码分析7等。其中,差分密码分析是迄今为止攻击分组密码最有效的工具之一,由 Biham 等4提出。通过研究加密过程中特定明文差分的概率传播特性,利用算法迭代过程中差分统计的不平衡分布,将密文与随机置换区分开,再利用统
12、计量进行密钥恢复,其中寻找一个有效的区分器是密钥恢复的关键。深度学习(DL,deep learning)方法在各个领域(如图像处理8、自然语言处理9、辅助医疗10等)都取得了不俗的成绩。在密码学领域中引入深度学习方法也一直是研究人员的关注点。文献11评估了深度学习方法和密码学之间的各种关系,并提出了在密码分析中使用深度学习的一些可能研究方向。文献12将深度学习应用于黑箱密码分析,提出了针对 SPECK32/64 的改进型差分攻击,开创了深度神经网络辅助密码分析的先例。文献13提出了一种使用深度学习模型来扩展经典区分器的框架,并在 SPECK、SIMON 和 GIFT64 上实现。文献14采用多
13、层感知器(MLP,multilayer perceptron)和卷积神经网络(CNN,convolutional neural net-work)构建 TEA 和 RAIDEN 密码的神经区分器。文献15构建了 PRESENT 密码 36 轮的神经区分器。文献16使用神经网络给出 GIMLI、ASCON、KNOT 和 Chaskey 这 4 种密码的几种区分方法,同时证明每种区分器都具有较低的复杂度。文献17提出了 DES、Chaskey 和 PRESENT 的神经区分器,使用具有相同差分的多个密文对作为输入,增加了提取衍生特征的模块,以提高区分器的准确性。文献18基于 Inception 神
14、经网络提出了构建神经区分器的方法,得到了 SIMECK32/64 的 912 轮区分器。SM4 分组密码是中国无线局域网认证和隐私基础设施国家标准19。文献20提出了 SM4 的一种5 轮迭代差分特征,并对 16 轮 SM4 进行矩形攻击,同时也证明了 SM4 有 12 个 18 轮的差分特征。文献21阐明了 6 轮、7 轮和 12 轮 SM4 中活跃 S 盒的最小数量,并给出了 19 轮 SM4 的约 214个差分特征,最终通过 2118个选择明文对 23 轮 SM4 进行攻击。文献22基于混合整数线性规划(MILP,mixed integer linear programming)的自动化
15、搜索方法,研究了 8 bit S 盒 MILP 建模问题。文献23提出了一种新型的针对 SM4 算法的故障攻击,该攻击通过在加密算法后 4 轮中注入故障从而诱导缩减加密算法的迭代轮数,利用所得到的错误密文即可恢复出完整轮密钥信息。表 1 列出了 SM4 的部分现有攻击方式和攻击轮数。表 1 SM4 的部分现有攻击方式和攻击轮数 攻击方式 攻击轮数 文献 矩形攻击 16 文献20 差分分析 22 文献20 差分分析 23 文献21 差分分析 19 文献22 故障注入攻击 32 文献23 综上所述,将深度学习方法运用于分组密码的区分器构建中,对密码区分器构建过程采用较一致的方法进行建模,不仅降低了
16、区分器构建的复杂度,提升了密码分析的效率,也能为分组密码安全性分析提供新的理论和技术手段。本文基于深度学习工具,采用差分密码分析的攻击思想,即发现分组密码在迭代过程中存在的差分不均匀性,提出了构建分组密码 SM4 的神经区分器模型的方法。首先构建了 SM4 的 8 轮神经区分器;其次受文献24的启发,对神经区分器的输入结构进行了重新设计,在不增加数据格式长度的同时提高了区分器的准确率并将区分器的轮数提高至9 轮。与文献22中使用 MILP 建模搜索的差分特征相比,本文构建的神经区分器在复杂度和准确率方面具有明显优势;与文献25相比,本文构建的 SM4 算法的神经区分器具有较高的轮数和准确率,并
17、针对构建的区分器提出了一种模型再学习的改进策略,实验验证了该改进策略对模型的精度和敏感度有一定提升。第 7 期 王慧娇等:基于深度学习的 SM4 密码算法新型区分器 173 1 预备知识 1.1 神经网络 深度学习作为机器学习的一个分支,通过使用深度神经网络主要应用于数据分类任务中。设x为数据集n中的一个样本,n 为数据域的维度,0,1,s?为类别标签域,分类任务的主要目标是对n中的样本 x,根据中的标签进行分类,记为n。神经网络的性能主要由误差函数来判断,常见的误差函数采用预测数据与真实数据的欧氏距离来衡量,定义为 2Er()()()xG xF x(1)其中,G 为真实分布,F 为预测分布。
18、为了量化网络模型对所有训练数据的误差,需要对整个训练数据集的误差函数求平均值,即损失函数Loss,定义为 11LossEr()LiixL(2)其中,L为训练样本的个数。神经网络的目标是最小化损失函数Loss。Loss函数由一系列网络中的可训练参数w和b参数化,其中,w为网络的权重,b为偏置。神经网络的训练阶段为一个数值优化问题,使用一种迭代方法将Loss(,)w b最小化,该方法也称为网络的优化器,其中最典型的方法是梯度下降法,表示为 (1)()()(1)()()Loss()Loss()ttttttbbbwww (3)其中,为学习率,是控制训练过程速度的超参数。训练数据通过正向传播得到神经网络
19、的预测值,然后基于预测值和真实值的差距通过反向传播更新训练参数的取值,从而达到最小化损失函数Loss。卷积神经网络是深度学习中的一个重要范式,其主要操作为卷积运算,网络的基本构件有卷积层、非线性层、池化层和全连接层26。卷积层旨在学习输入的特征表示,将正向传播的输出应用于损失函数并通过反向传播更新权重参数。通过多次迭代稳定损失后,训练过程结束。设lkw和lkb分别为第l层第k个过滤器的权重向量和偏置,,li jx为第l层(,)i j处的输入切片,则卷积神经网络第l层在位置(,)i j处的第k个特征值,li j kz为 T,lllli j kki jkzbwx(4)非线性层的主要目的是将激活函数
20、引入卷积神经网络的非线性层,提取非线性特性。典型的激活函数为Sigmoid、Tanh以及ReLU。设激活函数为()f,将卷积特征值,li j kz经过激活函数后的输出定义为 ,()lli j ki j ktf z(5)池化层通常位于2个卷积层之间,通过缩小结果特征值以获得平移不变性。全连接层位于网络的末端,用于执行分类任务。此外,卷积神经网络中可以使用一些功能层,例如,可以在卷积层之后应用批归一化(BN,batch normalization),以减少内部协变移位,这可以有效地防止梯度消失问题,并加快网络训练速度。残差网络(ResNet)是最具代表性的CNN之一,由He等27提出。ResNet
21、可以训练更深的CNN模型以实现更高的准确性。核心思想是在前一层和后一层之间建立“跳跃连接”,由一系列残差块组成,分为直接映射和残差两部分。残差块表示为 1()lllxxF x(6)其中,()lF x为残差部分,一般由2个或3个卷积运算组成;lx是直接映射部分。通过重新排列ReLU和BN的激活功能,可以设计出许多残差块变体。残差连接的思想是将输出表示为输入与输入的一个非线性变换的线性叠加。图1给出了残差连接结构。这种残差跳跃式的结构使某一层的输出可以直接跨过几层作为后面某一层的输入,其意义在于叠加多层网络而不降低模型的准确率。图 1 残差连接结构 1.2 SM4 算法描述 SM4分组密码是由国家
22、密码管理局建立的密码标准。SM4算法的加密结构为广义非平衡Feistel,其分组长度和密钥长度均为128 bit,加密轮数和密钥扩展轮数均为32。SM4分组密码算法的128 bit174 通 信 学 报 第 44 卷 明文X分为4个32 bit单元,即明文片段(X0,X1,X2,X3)。经过32轮加密和一次反序变换后输出密文Y,即(X35,X34,X33,X32)。SM4分组密码加解密结构相同,唯一不同的是解密密钥为加密密钥的逆序,图2给出了SM4分组密码算法的加密结构。SM4分组密码的加密结构由5个组件构成:轮函数(F)、合成置换(T)、非线性变换()、线性变换(L)以及S盒(Sbox)。图
23、 2 SM4 分组密码算法的加密结构 32轮的加密中间状态为123(,)iiiiXXXX,设轮密钥为rki,则轮函数F定义为 123123 (,rk)(rk)iiiiiiiiiiF XXXXXT XXX(7)其中,合成置换函数T为323222的可逆变换,由和L组成。非线性变换 由4个并行的S盒构成,每个S盒的输入都是固定的8 bit,通过查表将8 bit输 入 值 转 换 为8 bit输 出 值。设 输 入0132(,)Aa a a a,输出0123)(,Bb b b b,其中,ia和ib为8 bit,则非线性变换表示为 01230123()(,)(Sbox(),Sbox(),Sbox(),S
24、box()BAbbbbaaaa(8)线性变换L执行32 bit移位操作,其输入值为非线性变换的输出B,L定义为 ()(2)(10)(18)(24)CL BBBBBB(9)SM4加密过程使用的轮密钥由加密密钥0123(,)KK KK生成,其密钥扩展算法如下。设主密钥0123MK(MK,MK,MK,MK),令 012300112233(,)(MKFK,MKFK,MKFK,MKFK)KK KK(10)则轮密钥为 4123rk(CK),0,1,31iiiiiiiKKT KKKi(11)其中,()(13)(23)TL BBBB,FKi(i=0,1,2,3)为系统参数,CKi(i=0,1,31)为固定参数
25、。1.3 差分分析及区分器 差分密码分析由Biham等4提出,通过研究特定明文对的差分值在加密过程中的概率传播特性,即找到一条高概率差分路径,将加密数据与随机置换进行区分。定义 1 差分路径28。差分路径也称为差分特征、差分轨迹。设2,nx x,一个r轮分组密码算法的差分路径定义为 01rxxx (12)其中,0 x是输入对00(,)x x的差分,(1)ixir 是第i 轮输出对(,)iix x的差分。定 义 2 差 分 概 率28。r 轮 差 分 特 征01,rxxx 的概率是指当明文0 x和子密钥1,rkk独立、均匀随机时,明文对0 x和0 x的差分为0 x的条件下,第(1)iir 轮输出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 SM4 密码 算法 新型 区分
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。