基于路径特征和支持向量机算法的硬件木马检测技术.pdf
《基于路径特征和支持向量机算法的硬件木马检测技术.pdf》由会员分享,可在线阅读,更多相关《基于路径特征和支持向量机算法的硬件木马检测技术.pdf(12页珍藏版)》请在咨信网上搜索。
1、基于路径特征和支持向量机算法的硬件木马检测技术冯 燕 陈 岚*(中国科学院微电子研究所 北京 100029)摘 要:硬件木马攻击成为当前集成电路(IC)面临的严重威胁。针对硬件木马电路具有隐蔽、不易触发以及数据集不均衡等特点,该文提出对门级网表进行静态分析的硬件木马检测技术。基于电路可测性原理建立涵盖节点扇入数、逻辑门距离、路径数、节点扇出数的硬件木马路径特征,简化特征分析流程;基于提取的路径特征,使用支持向量机(SVM)算法区分电路中的木马节点和正常节点。提出训练集双重加权技术,解决数据集不均衡问题,提升分类器的性能。实验结果表明,分类器可以用于电路中的可疑节点检测,准确率(ACC)达到99
2、.85%;训练集静态加权有效提升分类器性能,准确率(ACC)提升5.58%;与现有文献相比,以36%的特征量,真阳性率(TPR)降低1.07%,真阴性率(TNR)提升2.74%,准确率(ACC)提升2.92%。该文验证了路径特征和SVM算法在硬件木马检测中的有效性,明确了数据集均衡性与检测性能的关系。关键词:硬件木马;路径特征;支持向量机;静态加权中图分类号:TN406文献标识码:A文章编号:1009-5896(2023)06-1921-12DOI:10.11999/JEIT220500Hardware Trojan Detection Based on Path Feature andSup
3、port Vector MachineFENG Yan CHEN Lan(Institute of Microelectronics of Chinese Academy of Sciences,Beijing 100029,China)Abstract:Hardware Trojan attack has become a serious threat to Integrated Circuit(IC).Hardware Trojans arehidden,rare triggered and the data-sets of Trojan benchmarks are unbalanced
4、,a hardware Trojan detectionmethod that performs a static analysis in gate-level netlist is presented.The path-feature based on the principleof design-for-test is proposed to simplify the analysis of feature.Based on the path-feature extracted in acircuit,the nets are classified into two groups with
5、 the Support Vector Machine(SVM)machine learning.Ituses the double-weighting method of training-set to improve the performance of the classifier.Experimentalresults demonstrate that this method can be used to detect the suspicious nets in circuits and the ACCuracy(ACC)can achieve up to 99.85%.The st
6、atic weighting method improves the performance of the classifier andthe improvement of accuracy can achieve up 5.58%.Compared with the existing reference,the size of feature isonly 36%,True Positive Rate(TPR)is decreased by 1.07%,True Negative Rate(TNR)is increased by 2.74%and ACC is increased by 2.
7、92%respectively.This work verifies the efficiency of path-feature and SVM machinelearning for Hardware Trojan detection and clarifies the relationship between the balance of data-sets and thedetection performance.Key words:Hardware Trojan;Path feature;Support Vector Machine(SVM);Static weighting 1 引
8、言随着半导体供应链的全球化趋势,大量第三方知识产权(Intellectual Property,IP)核、标准单元库、电子设计自动化工具、外包服务等卷入集成电路设计流程,其中可能涉及不可信的第三方实体,他们有机会在硬件设计中植入恶意电路,这给集成电路设计带来极大的安全隐患1。硬件木马是集成电路设计或制造过程中植入的恶意电路的统称,其电路结构一般包括触发和负载两个部分,当触发条件满足时,攻击者可以通过硬件木马实施改变电路功能、泄露敏感信息、降低电路性能、拒绝服务等攻击2。为了有效地解决硬件木马给集成电路带来的安全隐患,许多硬件木马检测技术被提出。根据其所处的阶段,可以将木马检测技术分为硅前检测和
9、硅 收稿日期:2022-04-22;改回日期:2022-09-22;网络出版:2022-09-29*通信作者:陈岚第45卷第6期电 子 与 信 息 学 报Vol.45No.62023年6月Journal of Electronics&Information TechnologyJun.2023后检测3。硅前检测是在芯片制造前对设计进行安全验证,主要方法有代码覆盖率分析、形式验证、结构分析、逻辑测试(基于模拟)、功能分析等。硅后检测是在芯片制造后对芯片进行木马检测,分为破坏性检测和非破坏性检测;前者主要有逆向工程方法,后者主要有逻辑测试(基于自动测试机台)方法和旁路信号分析方法,旁路信号分析方法
10、关注的参数包括功耗特性4、路径延时5等。根据已知规则,在设计流程的每个阶段,每提前一步检测出故障,成本下降1个数量级。因此,硅前检测方法可以减少芯片制造后检出木马带来的经济损失和设计迭代,受到学术界的广泛关注。机器学习在各研究领域的显著成功,引起学术界探索其解决硬件木马攻击的潜力68,学者期望通过硬件木马特征与机器学习算法的结合,在硅前自动高效地检出硬件木马。Hasegawa等人913提出基于逻辑电路节点特征的木马检测方法,作者采用不同的机器学习算法,文献9使用支持向量机(Support Vector Machine,SVM)对5个逻辑特征进行学习,误识别情况较高;文献10同时使用SVM和神经
11、网络对5个逻辑特征进行学习;文献11,12分别使用随机森林和多层神经网络对11个逻辑特征进行学习,文献11特征冗余量大,平均木马检出率只有68.32%,文献12尝试不同的中间层组合,找到检测结果最好的组合。文献13在文献11进行检测节点分类的基础上,提取假阴性和假阳性邻近节点特征进行第2次节点分类,分类结果最好,但是由于只考虑RS232系列电路,结果不具有通用性。Salmani等人14根据可控制性和可观察性测度(Sandia Controllability/Observability AnalysisProgram,SCOAP)15,采用K均值聚类分析方法对节点进行分类,检测结果中有2个木马电
12、路未被检出。文献16提出将SCOAP经K均值聚类后的类间距离特征和电路规模特征(原语、与门、或门的数目)结合形成4维节点特征,然后使用SVM算法对4维特征进行分析,区分正常节点和木马节点。文献17组合SCOAP测度、信号概率、电路规模形成节点特征,使用K最近邻法和SVM算法对特征进行分析。文献16,17涉及多维度特征和两种机器学习算法,实现较为复杂。Liu等人18首次提出基于木马电路和宿主电路的结构化特征的木马检测方法,木马电路特征表征木马结构的罕见性,宿主电路特征采用SCOAP测度表征宿主电路中植入位置的罕见性,该方法有较低的假阳性率和较高的准确率。文献19提出多维结构特征和基于最近邻不平衡
13、数据分类算法,借助SVM算法建立硬件木马检测模型,该方法以门单元为分析对象,分析过程繁杂。与上述文献探索多种特征维度、采用多种机器学习算法不同,本文提出路径特征和SVM算法结合的硬件木马检测技术,基于电路中提取的有标签路径特征构建SVM分类器,使用静态双重加权的方法构建均衡训练集,以提高分类器性能。主要完成以下几方面内容:(1)提出粗粒度电路抽象方法和路径特征提取方法,路径特征以路径终点(或路径起点)为分析对象,减少特征冗余量,简化特征分析过程;(2)建立SVM算法在有监督学习方式下的训练模型,使用数据预处理、内核函数选取、训练集静态加权参数调优等方式提升模型性能;(3)建立路径特征提取、数据
14、预处理、训练集静态加权、交叉验证、SVM学习及分类等流程;(4)使用SVM分类器对测试集数据进行分析和检测,验证硬件木马检测技术的适用性和有效性。2 硬件木马检测技术 2.1 路径特征分析硬件木马具有隐蔽性特征,越复杂的硬件木马,需要使用越多的输入节点、越低的节点触发概率、以及越深的逻辑来实现更加罕见触发条件,本文正是利用这些特征来检测硬件木马的存在。基于木马特征的检测方法大多是基于门级网表展开的,分析效率随着电路规模呈指数级增长,而且以电路节点为分析对象时,某个节点可能在邻近节点的分析过程中反复出现,带来冗余特征的同时进一步降低分析效率。本文将门级网表抽象为由扫描链分割的子电路区域,以子电路
15、区域的触发器输入或者初级输出为分析对象,提取硬件木马特征,简化分析过程,提高分析效率。从扫描测试原理可知,待测电路可以看作由多条扫描链和扫描链之间的组合逻辑组成,通过扫描链可以将组合逻辑的输入置为任意需要的初始状态。待测电路被抽象为由扫描链分割的子电路区域,如图1(a)所示的组合逻辑1和组合逻辑2。子电路区域包含多个逻辑锥,图1(b)为一个逻辑锥示意图,最左边为逻辑锥的锥底,一般选取路径的起点作为锥底,如初级输入、触发器输出;最右边为逻辑锥的锥顶,一般选取路径的终点作为锥顶,如触发器输入、初级输出等。当初级输入和伪初级输出确定时,组合逻辑的输入也被确定。初级输入出现0和1的概率为(1/2,1/
16、2),由于扫描链的关系,伪初级输出出现0和1的概率也是(1/2,1/2)。根据信号概率计算公式20,节点Y为0和1的概率为(169/256,87/256)。可见,影响节点Y信号概率的因素包括输入节1922电 子 与 信 息 学 报第 45 卷点数目、输入节点信号概率、逻辑门代数关系、逻辑门距离。逻辑门代数关系决定信号概率计算公式,本文不考虑逻辑门代数关系对信号概率的影响,换言之,在划分子电路区域时,保留扫描触发器之间的路径,丢弃组合逻辑的实现细节。逻辑门距离(记为L)表征输出节点受输入节点影响的大小和概率,逻辑门距离越小的输入节点,改变输出节点的可能性越大;逻辑门距离越大的输入节点,改变输出节
17、点的可能性越小。如果一个电路或逻辑门传输一个潜在的、恶意的信号,则它的一些或全部输入节点相对输出节点的逻辑门距离较大。本文所提硬件木马特征如表1所示,其中特征17跟节点的扇入和逻辑门距离有关,它们的值越大表明节点触发概率越低;特征8与节点扇出有关,正常电路可能影响很多电路,但是硬件木马电路只会影响硬件木马负载。因为当硬件木马影响多条路径时,被检测出的机会较大。如果是隐式触发型硬件木马,其中间级的信号仅能影响该硬件木马的下一级电路。经过电路抽象后,对于图1(b)所示表 1 木马特征序号特征描述1fan_in节点Y的扇入数目2max_disY的所有扇入中逻辑门距离的最大值3max_inL=max_
18、dis的路径数目4max_1_inL=max_dis-1的路径数目5max_2_inL=max_dis-2的路径数目6max_3_inL=max_dis-3的路径数目7max_4_inL=max_dis-4的路径数目8fan_out节点Y的扇出数目 图 1 子电路区域和逻辑锥示意图第6期冯 燕等:基于路径特征和支持向量机算法的硬件木马检测技术1923电路,只需要分析节点Y的特征,不需要重复考虑节点D/E/F/G/H的特征,大大降低冗余特征量。2.2 基于SVM算法的硬件木马检测技术f:x yxyy=1y=1所提硬件木马检测技术如图2所示。采用SVM算法进行硬件木马检测,左边为学习流程,右边为分
19、类流程。两个流程都要进行路径特征提取和数据预处理,学习流程提取的路径特征的数据标签已知,分类流程所取的路径特征的数据标签未知。数据集分割后,学习流程以有监督的方式对有标签的训练集数据进行训练和验证,产生分类器(或称为训练模型)。分类流程使用分类器预测目标节点 的标签,表征目标节点是正常节点,表征目标节点是木马节点。(1)路径特征提取。路径特征提取分为路径集合提取和特征提取两个步骤。以路径终点为目标的路径提取流程如图3所示。首先,建立设计中所有路径终点的集合S=S0,S1,SN,N为所有路径终点的数目,路径终点可以是初级输出,也可以是触发器的数据输入。对于每个路径终点Si,沿着路径Pj回溯,直到
20、遇到路径起点时停止。路径起点可以是初级输入,也可以是伪初级输出。记录次路径回溯的相关信息,包括路径起点以及路径起点和路径终点之间的逻辑门等信息。重复上述步骤,直到遍历当前路径终点的M条路径,以及遍历S集合中的N个路径终点。用同样的方法获得以路径起点为目标的路径。特征提取是指从路径信息文件中提取表1所示的硬件木马特征,每个路径信息文件包含当前路径终点(或路径起点)的所有路径信息。特征提取通过编写Python程序处理路径信息文件实现。(2)数据预处理。当选用不同规模的测试基准电路作为训练集时,电路之间的隔离被打破,所有节点的路径特征被放在一起分析,它们不能表征所属电路的规模属性。为了提高数据的质量
21、,保障模型学习的效果,对所提取的路径特征进行预处理。本文所用的数据预处理方法如式(1)所示 图 2 硬件木马检测流程1924电 子 与 信 息 学 报第 45 卷y=x(1)x其中,为模块内节点的路径特征,为该特征对应的模块规模属性因子。(3)数据集分割。数据预处理之后,需要对数据集进行分割,得到训练集和测试集。训练集用于训练模型的构建;测试集用于训练模型的评估,测试集不参与训练。论文采用随机抽样的留出法分割数据集。首先打乱原始数据的排列,然后随机选取50%的数据作为训练集;剩下50%的数据作为测试集。(4)训练集加权。SVM模型训练效果取决于样本数据的均衡性,本文选择Trust-HUB be
22、nch-marks网站21提供的RS232系列电路和ISCAS89系列电路作为基准电路,这里存在两个不均衡问题。首先,模块尺寸不均衡,RS232系列电路规模较小,ISCAS89系列电路规模较大,最小电路和最大电路的面积比为3.95%,因此RS232电路节点数在训练集中的占比比较小,对训练模型的主导作用也比较小。其次,硬件木马电路中木马节点数目相对正常节点数目来说是非常小的,属于非平衡数据集,以本文所选的基准电路为例,数据集分割后,训练集样本数据为5107个,其中,阳性样本数据为16个。对于非平衡数据集,多数类样本会主导模型训练的过程,削弱少数类样本的作用,降低训练模型对少数类样本的判别能力。因
23、此,需要通过减少多数类样本量(欠采样)或者增加少数类样本量(过采样)的方法构造平衡数据集。NinNitNn+S Mi=0NniNt+S Mi=0Nti为了验证数据集均衡性与检测性能的关系,本文构造4种数据集进行实验:无加权、模块尺寸加权、数据标签加权(即过采样)、双重加权。假设训练集有Nn个正常节点和Nt个木马节点,无加权指的是SVM对原始训练数据进行学习。模块尺寸加权指的是对小规模电路进行加权,假设小规模电路i有正常节点和个木马节点,SVM就对个正常节点和个木马节点进行学习,S为模块尺寸加权参数,M为小规模电路个数。数据标签加权指的是对少数类样本进行加权,SVM对Nn个正常节点和(L+1)N
24、t个木马节点进行学习,L为数据标签加权参数。双重加权指的是同时考虑模块尺寸加权和数据标签加权。(5)K-折交叉验证。本文采用K-折交叉验证法评估训练的模型是否有效。K-折交叉验证将训练集数据分为K个子集,每次选择一个子集作为验证集,其余K1个子集作为训练集,这样就得到K个训练集和验证集。对它们重复K次训练和验证,得到K组结果,它们的平均值是最终模型验证结果。如果模型验证结果不理想,返回到前述步骤进行参数调整。(6)模型效果评估。模型效果评估使用测试集数据评估训练模型在实际应用中的泛化能力,测试集数据不参与训练。如果效果不理想,返回到前述步骤进行参数调整。(7)度量指标。K-折交叉验证和模型效果
25、评估用于判定训练模型是否达标,本文选择的度量指标包括真阴性率(True Negative Rate,TNR)、真阳性率(True Positive Rate,TPR)、精确率(Precision)、准确率(ACCuracy,ACC)和F1值(F1-measure),具体表示如式(2)式(6)所示。其中,TN指被正确地预测为阴性的样本数量,TP指被正确地预测为阳性的样本数量,FN指阳性被错误地预测为阴性的样本数量,FP指阴性被错误地预测为阳性的样本数量,GN指真阴性的样本数量,GP为真阳性的样本数量TNR=TNGN=TNTN+FP(2)TPR=R=TPGP=TPTP+FN(3)图 3 路径提取流
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 路径 特征 支持 向量 算法 硬件 木马 检测 技术
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。