一种基于机器学习的物联网终端识别技术模型.pdf
《一种基于机器学习的物联网终端识别技术模型.pdf》由会员分享,可在线阅读,更多相关《一种基于机器学习的物联网终端识别技术模型.pdf(5页珍藏版)》请在咨信网上搜索。
1、中国科技信息 2024 年第 10 期CHINA SCIENCE AND TECHNOLOGY INFORMATION May.2024-108-四星推荐随着我国电力物联网加快建设,大量物联网终端设备接入电网内部网络,这些终端分布广、数量多、计算资源受限、带来了巨大的网络安全风险。本文主要针对某电力公司 8 类实际应用中典型物联终端设备,通过抓取海量数据并与物联终端通用协议类型进行对比,提取特征信息,采用多种机器学习算法分别建立设备指纹模型并开展分类实验分析,并通过实验数据与实际场景情况的对比验证,证明了基于包长度统计特征值的随机森林算法在物联网终端识别与威胁检测上的可行性。物联网终端设备识别
2、模型建模流程与方法物联网终端设备识别的整体流程如图 1 所示。首先是流量采集和标记数据收集,可通过主动探测和被动抓取两种方式来生成带标记的网络行为特征数据集。所收集的信息包括但不限于 IP 报文报头信息、协议握手信息、数据报文大小序列、数据报文时间序列等。通过对基于不同算法的分类器性能进行评估,选择最合适的分类器模型,在此基础上试图自动生成分类规则,最后进行性能测试与调优。典型终端数据采集电力物联网终端主要包括输电、变电、配电类终端和综合能源服务终端。结合某电力公司物联终端接入情况,本文选取了 8 类典型的智能终端开展分析研究与实验,包括测温装置、覆冰在线监测装置、汇聚终端、智能视频终端、综合
3、行业曲线开放度创新度生态度互交度持续度可替代度影响力可实现度行业关联度真实度一种基于机器学习的物联网终端识别技术模型全 靓 李 树全 靓1 李 树21.湖南机电职业技术学院2.国网湖南省电力公司信息通信公司基金项目:湖南省教育厅科学研究项目基于PSO-CNN 的冷压焊接质量预测模型设计与应用研究(项目编号:23B0970)。图 1 物联网终端设备识别流程图-109-CHINA SCIENCE AND TECHNOLOGY INFORMATION May.2024中国科技信息 2024 年第 10 期四星推荐能源终端、智能头盔、巡检机器人、输电线路智能监测装置,部分终端如图 2 所示。上述 8
4、类典型智能终端涵盖某电力物联网主要场景,数据采集地点包括变电站、配电站现场及安全接入网关、实验室环境等,采集方式主要为旁路镜像流量,使用 Wireshark进行抓包并与物联终端通用协议类型进行对比分析。本文收集终端指纹数据集如表 1 所示。流量采集过程中,设备之间拓扑结构如图 3 所示。在流量获取阶段,使物联网设备在云端控制器或者人为指令控制的情况下进行某些特定的动作,本实验中,使用 Wireshark工具完成对物联网终端代理的流量数据抓取。特征提取完整的网络流量包具备所有网络传输行为信息,从流量包中提取出设备的唯一指纹,用于设备识别,特征信息主要从包头和有效负载中提取。这些特征信息组成特征向
5、量F=(f1,f2,f3,fn),特征向量 F 表示每个数据包的特征信息,如表 2 所示。本实验中,主要选取了数据包长度和包时间间隔的统计特征来作为特征向量进行训练分类器模型,采用基于Python 的开源工具 Tsfresh 计算包长度时间序列特征。表 2 物联网终端设备流量特征示例类型特征连接层LLC/ARP网络层协议IP/ICMP传输层协议TCP/UDP应用层协议HTTP/HTTPS/DHCP/DNS/SSDP其他包大小/目标 IP 地址/使用的端口通过采集一个周期中一系列流量包的包长度并将其标记为序列 S=(x1,x2,x3,xn)。我们使用如下 10 个特征来构建分类器:绝对能量值、平
6、均值、中位数、样本偏度、标准差、方差、傅里叶变换系数、小波分析分析系数、样本熵和包数量。其中,序列 S 的绝对能量值是所有包长度的平方和,计算公式如下:=nixE12 (1)样本偏度计算公式如下:1)(103=nxSskewni (2)快速傅里叶变换系数计算公式如下:(3)小波分析分析系数计算公式如下:=2222412exp132axaxacwe_coeff (4)其中 a 是小波宽度参数,本实验中设置 a=2。分类算法选取及性能评估方法第一种考虑的机器学习分类算法为随机森林算法,主要考虑其方法实现简单、精度高、抗过拟合能力强、支持并行计算的优点。其次,主要考虑几种神经网络算法。神经网络由一组
7、相互连接的计算单元组成,这些计算单元称为神经元,如图 4 所示。目前常见的网络结构有多层感知器网络(MLP),卷积表 1 典型物联终端指纹信息表终端类型厂商型号流量采集方式协议类型测温装置覆冰在线监SL600E-1变电站现场抓取GDW244hCSxxxx、Sl600e:测装置长川SL600E-2安全接入平台抓取hCCxxxx西门子 S7-PLC,汇聚终端配电现场抓取nDPI智能视频安全接入平台抓取通用视频流协议综合能源JZDL-8000A实验室环境抓取485 集中器 4000智能头盔金铸电力JZDL-8003LER-3000A实验室环境抓取MQTT(imei、devid)巡检机器人输电线路智鲁
8、能智能LER-3000CDMI100-uSI5001变电站现场抓取协议较多能监测装置维思DWP500-SC501安全接入平台抓取协议较多(a)智能视频终端和智能头盔(b)巡检机器人图 2 某电力公司物联终端示例中国科技信息 2024 年第 10 期CHINA SCIENCE AND TECHNOLOGY INFORMATION May.2024-110-四星推荐神经网络(CNN),循环神经网络(RNN),其特点如表3 所示。表 3 神经网络特点算法名称特点多层感知器利用每层更少的神经元拟合更加复杂的函数卷积神经网络空间扩展,神经元与特征卷积循环神经网络时间扩展,神经元与多个时间输出计算考虑到物
9、联网终端的数据包在发送的过程中具有相互关联性,因此选取 RNN 网络结构。此外,根据相关参考文献研究结果,考虑采用k近邻算法、支持向量机等机器学习算法开展对比研究。在进行分类算法的验证时,采用常用的10折交叉验证法。通过估计这10次计算得出的正确率的均值以评估算法精度。在一些情况下,上述过程会重复多次,并将其结果再次平均作为最终的评估结果。之所以采取“10 折”作为计算次数,是由于在许多文献中均采取了该数值,具有普遍广泛的应用依据。实验分析与结论基于前述步骤构造数据集后,我们利用机器学习方法来训练分类器模型对设备进行识别分类。共设置 3 个实验。实验一以 UNSW 公开测试数据和采集的物联网终
10、端设备流量数据为输入,主要对比研究随机森林(RF)、k 近邻算法(KNN)、多层感知器(MLP)和支持向量机(SVM)的分类准确性;实验二以 UNSW 公开测试数据和 8 类典型物联网终端设备流量数据为输入,主要研究所采取的 10 个统计特征值对分类准确性的贡献大小;实验三以 8 类典型物联网终端设备流量数据为输入,通过对比研究使用随机森林和LSTM 神经网络训练模型的分类结果的混淆矩阵,观察 8 类典型物联网终端设备在实际应用中分类准确性。通过上述三个实验,可分析得到最适用于本文中物联网终端设备的机器学习分类算法,以及统计特征值的选取建议,并以实际应用结果予以验证。测试数据集为充分验证分类算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 机器 学习 联网 终端 识别 技术 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。