云框架超大规模资源处理下无线传感网络数据异常检测_李红映.pdf
《云框架超大规模资源处理下无线传感网络数据异常检测_李红映.pdf》由会员分享,可在线阅读,更多相关《云框架超大规模资源处理下无线传感网络数据异常检测_李红映.pdf(6页珍藏版)》请在咨信网上搜索。
1、第 卷 第 期 年 月传 感 技 术 学 报 .项目来源:年浙江省公益技术研究计划项目();年教育部产学合作协同育人项目()收稿日期:修改日期:,(,;,):,:;:;:云框架超大规模资源处理下无线传感网络数据异常检测李红映,张天荣(浙江农林大学信息与教育技术中心,浙江 杭州;浙江树人大学信息化建设处,浙江 杭州)摘 要:为解决无线传感网络数据异常检测方法精度低、网络能量消耗大等问题,提出基于云框架的大规模无线传感网络数据异常检测方法。在云框架超大规模资源处理下,通过自适应过采样法消除冗余数据;运用数据集成、标准化等预处理数据样本,计算协方差矩阵,从高到低排列特征矢量贡献率;采用二进制粒子群方
2、法优化初始森林中的孤立树,挑选初始森林中精度最高、差异度最大的孤立树组建最佳孤立森林,通过异常分数法检测数据特征异常情况,输出对应样本异常概率。实验部分对所提方法、图信号处理法和分层聚合法进行检测率、虚警率、接电能耗、耗时等指标对比,结果表明,所提方法有效降低了节点能耗,数据异常检测速率快、正确率高,具备优秀的适用性与可靠性。关键词:云框架;无线传感网络;异常检测;孤立森林;数据预处理中图分类号:文献标识码:文章编号:()得益于微型计算机技术与无线通信技术的快速发展,无线传感器网络应运而生,作为人类从物理世界得到数据信息的关键工具,在农业、工业方面得到广泛应用。但无线传感网络节点资源有限,极易
3、受外界环境影响或者遭受攻击者的恶意入侵,导致数据被篡改,即便密码、安全路由等技术能一定程度上增强网络的安全性,但依旧缺少可靠方法检测网络数据异常情况,很难保证无线传感网络应用的有效性。怎样快速精准地完成数据异常检测,是现阶段传感网络安全领域的热门问题。近年来,传感器数据流异常检测作为监控系统的基本组成部分,受到越来越多的关注。传统的基于统计的异常检测方法不能准确识别出与正常数据分布相似的异常数据。随着机器学习技术的发展,为了实现准确高效的异常检测,基于聚类、卷积神经网络和循环神经网络的无监督、监督和半监督异常检测算法不断被提出。相关领域学者对此展开了研究。卢光跃等依据传感器方位特点组建图信号传
4、 感 技 术 学 报第 卷模型,使用图信号低通滤波前后的平滑度之比获得统计检验量,利用统计检验量和判决门限完成异常节点评估。但该方法需要较大的数据样本作为训练集,计算效率会受到一定负面影响。等在节点层采用 方法聚类数据,通过 近邻算法把正常簇信息返回到底层节点,以此划分异常数据。但此方法着重分析数据的空间相关性,没有融合数据流统计特征,异常检测精度不高。本文提出一种基于云框架的大规模无线传感网络数据异常检测方法。为确保数据完整性,在云框架下实施无线传感网络数据采集,预处理数据并提取特征点,通过改进孤立森林算法解决异常数据检测计算复杂、能耗多等问题,在仿真实验中验证了所提方法的实用性。基于云框架
5、的无线传感网络数据采集无线传感网络信号信噪比低,采集到的数据频带位置变动较多,需要预先平滑处理数据的边缘频率分布。云框架下,将无线传感网络数据的边缘频率分布矢量表示为:()()()()?()()()式中:代表局部方差均值,()为数据点方差,()是边缘频率波动临界值。倘若无线传感网络数据特征样本点是,将数据处理范围内的数据特征样本点看作参照数据,运用模糊规则描述传感网络中的数据点有效距离,记作:()()式中:表示模糊指数,()代表两个相邻数据点的距离均值。数据采集时,冗余数据会严重干扰正常数据的采集与处理,为最大限度消除无线传感网络数据采集时的外界干扰,准确提取无线传感网络实时信息,在云框架基础
6、上完成数据采集工作。云框架能处理超大规模资源数据,不同板块之间互相配合,用户利用终端系统就能获得所需服务,借助云端进行无线传感网络信息采集与处理。云框架全局结构如图 所示。在云框架内采用自适应过采样方法,依照冗余数据本身的分布特点产生冗余数据集合,剔除该集合即可获得干净的网络数据信息。推算全部小类样本需要产生的数据样本个数,针对每个小类样本,使用欧式距离计算样本的相邻间距,获得冗余图 云框架示意图数据的密度值:()式中:表示第 类样本的在相邻间距内属于大类样本的样本值,为常数。由此,将冗余数据量定义成:()是消除冗余数据的最佳状态,在此前提下,将云框架下无线传感网络数据采集解析式描述为:()式
7、中:是无线传感网络节点总和,是样本点与相邻点之间的权重。无线传感网络数据预处理与特征提取 数据预处理数据预处理是把数据转变成容易聚类的模式,便于后续异常数据分类与检测。预处理包含数据集成、标准化与归一化三个步骤。数据集成就是将不同来源、特征的数据汇聚成大数据的过程,解决数据的分散性与异构性。利用数据仓库技术处理数据分散性,此技术核心作用是把分散在不同数据源内的数据提取至中心数据库,便于操控大规模数据集。数据异构性会在异常数据筛查环节中造成混乱失效的局面,无法确保数据异常检测的可靠性,本文通过制定转换规则来改善异构性弊端。数据格式不同,其权衡标准也不尽相同,会对后续异常检测结果精度造成不良影响。
8、需要对数据实施标准化处理,把初始数据从多元空间变换至统一的标准化空间。这里选用 法实现标准化处理,过程为:推导出数据集 ,的均值?:?()第 期李红映,张天荣:云框架超大规模资源处理下无线传感网络数据异常检测 式中:是数据集内第 个数据,是数据集中的数据总和。使用式()完成对数据集 的标准化处理:?(?)()式中:代表数据集 内第 个数据标准化后的形态。归一化为一种简化运算模式,把有量纲的解析式通过转换变成无量纲解析式。常用的归一化策略涵盖线性函数法、反余切函数法、对数函数法等,本文选用线性函数法内的最大最小值进行归一化处理,让变换后的数值处在,区间,计算过程为:()式中:是数据集 内第 个数
9、据归一化后的表达形式,是数据集的最大值,是数据集的最小值。特征提取数据特征提取是获取全部待检测数据的实际特征,即特征矢量,运用特征矢量划分正常数据和异常数据。主成分分析是特征提取中使用次数最多的方法之一,在初始数据集内挑选较少但具备代表性的变量。主成分分析法下数据特征提取流程如下:倘若具备 个样本点,第 个样本是,均值向量矩阵是,则协方差矩阵表达式为:()协方差矩阵 中,前 个最大非零特征值相对的标准正交特征矢量是,将标准正交特征矢量推导公式记作:()式中:是正交特征矢量总和,为矩阵特征值。利用式()计算各特征的贡献率,从高到低排列特征矢量,并将最大的特征矢量值看作数据特征。()改进孤立森林下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 框架 超大规模 资源 处理 无线 传感 网络 数据 异常 检测 李红映
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。