基于PCA-RF模型的冲击地压预测.pdf
《基于PCA-RF模型的冲击地压预测.pdf》由会员分享,可在线阅读,更多相关《基于PCA-RF模型的冲击地压预测.pdf(7页珍藏版)》请在咨信网上搜索。
1、第39 卷第4期2023年8 月Journal of Harbin University of Commerce(Natural Sciences Edition)哈尔滨商业大学学报(自然科学版)Vol.39 No.4Aug.2023基于PCARF模型的冲击地压预测郭浩,杨超宇(安徽理工大学经济与管理学院,安徽淮南2 32 0 0 0)摘要:为了提高冲击地压危害预测的准确性,基于主成分分析法和随机森林算法,构建了由主成分分析方法优化的随机森林模型,分析静态冲击地压数据并处理异常值,通过数据标准化处理、计算相关系数矩阵及累计方差贡献率,提取出5个主要特征.利用优化的随机森林模型训练冲击地压数据集
2、,使模型参数不断得到优化.以混淆矩阵中的准确率作为评估指标,将优化的随机森林模型与单一随机森林模型进行比较分析.实验结果表明,优化的随机森林模型比单一随机森林模型具备更好的效果,其准确率达到了88.9%,高于单一的随机森林模型,进而得出结论,即优化的随机森林模型能有效地对冲击地压危害进行预测,通过随机森林优化模型,一定程度上有效缩减冲击地压危害预测的时间.关键词:主成分分析;随机森林;冲击地压;混淆矩阵;机器学习;分类预测中图分类号:TD324文献标识码:A文章编号:16 7 2-0 9 46(2 0 2 3)0 4-0 413-0 6Prediction of rock burst base
3、d on PCA-RF modelGUO Hao,YANG Chaoyu(School of Economics and Management,Anhui University of Science&Technology,Huainan 232000,China)Abstract:In order to improve the accuracy of rockburst hazard prediction,based on theprincipal component analysis method and random forest algorithm,a random forest mod
4、eloptimized by the principal component analysis method was constructed.The static rockburstdata was analyzed and the abnormal values were processed.Five main features wereextracted through data standardization,calculation of correlation coefficient matrix andcumulative variance contribution rate.The
5、 optimized random forest model was used to trainthe rockburst data set,so that the model parameters are continuously optimized.Taking theaccuracy rate in the confusion matrix as the evaluation index,the optimized random forestmodel is compared with the single random forest model.The experimental res
6、ults show thatthe optimized random forest model has a better effect than the single random forest model,收稿日期:2 0 2 2-10-0 4.基金项目:国家自然科学基金(No.61873004,多源传感器环境下基于异构特征信息融合的行为识别)作者简介:郭浩(1999),男,硕士生,研究方向:冲击地压分类预测;杨超宇(198 1-),男,安徽理工大学教授,博士,研究方向:计算机信息技术应用.414.and its accuracy rate reached 88.9%,which was h
7、igher than the single random forestmodel.The results showed that the optimized random forest model could effectively predictthe rockburst hazards.Through the random forest optimization model,the time for predictingrockburst hazards was effectively reduced to a certain extent.Key words:principal comp
8、onent analysis;random forest;rockburst;confusion matrix;machine learning;classification prediction冲击地压16,又称为“冲击矿压”,在煤矿开采过程中,由于工作面的条件发生改变,导致巷道严重变形,煤岩受到破坏而引起的动力灾害1。目前,我国大部分矿务局均曾出现冲击地压事件,2 0 0 4 2 0 14年,大约出现35起,30 0 名工人身亡和10 0 0 余名职工伤亡2.2 0 2 0 年2 月2 2 日,山东能源集团龙煤矿4人不幸遇难,煤矿治理成为解决冲击地压问题的关键.冲击地压受到多种因素影响,如
9、围岩应力,切向应力,弹性能以及煤体本身因素等,姜福兴3基于应力等因素对冲击危险性进行分析和评估.在多因素影响冲击地压的条件下,提出多种机器学习模型用来预测冲击地压.预测冲击地压的模型有SVM、K NN、RF、XG B、G B、NB6),以及神经网络算法,如BP神经网络7,深度神经网络8 等等.国内外研究中,陶杰41利用模糊预测模型对冲击地压进行预测.李明亮用KNN、SVM、RF、LD A等六个机器学习模型9对岩爆等级进行预测,发现LDA模型能起到和实际等级相同的预测效果.谢学斌基于GA-XGB模型对冲击地压进行分类预测研究10.毕娟使用一种R型因子分析Fisher判别的预测模型,目的是提高预测
10、准确性.BOKE基于优化朴素贝叶斯模型对冲击地压进行分类预测12.学者都使用相应的模型对冲击地压进行了相应的冲击地压预测,但有些模型采用的数据集存在差异,其预测标准可能存在不同.本文基于优化的随机森林模型(PCA-RF)实现冲击地压的预测分类,对冲击地压数据预处理,选取出六个参数和标签值,利用主成分分析法对冲击地压数据集进行特征降维,构建优化的随机森林模型,对实验结果比较分析,将混淆矩阵及准确率作为模型评估指标.实验表明,PCA-RF模型准确率为8 8.9%,RF模型的准确率为7 7.8%,证实了哈尔滨商业大学学报(自然科学版)PCARF模型比RF模型拥有更好的预测效果,从而实现对冲击地压危害
11、的有效预测.1随机森林优化模型1.1随机森林算法RF算法5是基于Bagging思想的集成学习理论和随机子空间的一种多分类模型,是Bagging算法的改进版.RF使用了CART决策树为弱学习器,CART作为RF使用的弱学习器,CART分类树用基尼系数确定最佳特征,并确定该特征的最佳二值切分点,Gini(D)值越小,数据集D的纯度越高.基尼系数见式(1).Gini(D)=P(1-P)=1-P(1)其中:y为类别数,p(k)为一个样本被归类进第k类的概率,但RF计算也存在着缺陷,在噪声较大的类型或回归问题上很轻易发生过拟合现象,并且针对有各种取值属性的数据,取值分布较多的属性会对随机森林形成更大的影
12、响,所以随机森林在这些数据结果上出现的属性权值是不可信的.这也是单一的RF算法存在的缺陷.而PCA(Pr i n c i p a l C o m p o n e n tAnalysis)算法可以解决这一问题.1.2基于主成分分析算法优化为克服单一RF算法的弊端,基于PCA14算法对其进行优化并组合,使得优化后模型训练时间缩短,正确率比单一模型正确率更高.优化步骤如下:1)对数据进行去中心化,从而防止数据的差值太大而对实验产生影响;2)对数据样本进行标准化,标准化公式如式(2)所示,为总体数据平均值,N为样本总数,为标准差,通过此步骤消除数据之间量级不同带来的影响;3)计算样本相关系数矩阵D,通
13、过相关系数矩阵来获得变量与变量之第39卷第4期间的关系.相关系数矩阵如式(3)所示,其中:X是样本矩阵X(np)中第i列的所有元素,X。是样本矩阵X(np)中第j列的所有元素,x;为第i列的平均值,x,为第j列的平均值;i=j=1,2p.运算相关系数矩阵后,计算级别变量特征值入和特征向量t,并在求算出入值后再依大小顺序排列.这里还涉及计算的方差贡献率和累计方差贡献率,在当累计的方差贡献率达到了某一个百分比值后,其中的一些比较重要的变量就大体上就能够用来代表了整个数据集中的信息容量.最后一步是根据方差贡献率进行特征的选择并进行降维。Z=X-nn(xci-x,)?1(xgj-x,)2c=D=(dg
14、)pxp以上公式建立在X(n p)(p 值为6)原始矩阵转换Y(np)矩阵的基础上.通过主成分分析提取样本数据主成分,并且对数据进行预处理,消除了不同取值的数据对RF模型的影响,进而利用RF模型进行冲击地压的分类,这样组合的模型能够达到训练时间缩短,收敛速度提高,从另外一方面又提高了分类准确率的目的.因此将主成分分析与随机森林结合在一起,优劣互补,能够很好解决冲击地压预测分类问题.1.3模型结构与流程基于PCA-RF算法的模型,如图1所示,该模型主要涉及三个部分,即样本数据处理、数据特征降维、模型的训练及预测.首先通过对数据进行异常值处理,剔除样本偏差大的数据,尽可能使得样本数据更加平均,选取
15、合适的特征和标签,对标签进行分类并替换为数字标签,如原数据的标签为None、Li g h t、M o d e r a t e、St r o n g,需将原始标签替换为数字标签,依次为0、1、2、3.其次通过预处理过后的数据进行标准化,求得相关系数矩阵并计算方差贡献率,通过方差贡献率选取符合条件的几个成分,从而实现数据特征降维的目的.最后利用RF模型进行训练和预测,其中测试训练时,需设定模型循环迭代的次数,对模型产生的实验结果进行分郭浩,等:基于PCA-RF模型的冲击地压预测选取特征一提取标签(2)冲击地压数据图1PCA-RF算法模型Figure 1 The PCA-RF model(3)2数据
16、分析及预处理2.1数据来源通过相关文献10,13的查找及收集,共采集100条数据,数据特征分别为W。(弹性能指数)、Q。(单轴抗压强度)、,(单轴抗拉强度)、。(最大切向应力)、SCF(应力系数)、BCF(脆性系数).以数字代替原有标签,从无到强烈分别是None0、Light-1、M o d e r a t e-2、St r o n g-3.见表1.本文数据将冲击地压等级划分为四类,分别为无、轻度、中度、强冲击地压.四类占比依次为2 4.2 4%、2 6.26%29.29%、2 0.2%.如表2 所示,当围岩无任何现象发生时,为无冲击地压;当围岩出现破裂并伴随微弱声音则为轻度冲击地压;围岩破裂
17、程度更高伴随岩体松散则为中度冲击地压;围岩出现严重变形则为强冲击地压.2.2数据整体分析在图2 中,纵坐标依次分别为。Q,、SC F、BCF、We t,横坐标依次为None、Li g h t、M o d e r a t e、Strong四种强度.图中纵坐标为。和BCF数据比较集中,异常点较少.其余四类均出现超出上边缘的异常点,其中 SCF中 Strong类型和We中None类型异常点较多.415.析和评估。数据标准化计算相关系数主成分计算计算方差贡献率PCA对数据降维数据异常值处理冲击地压数据RF建模数据训练测试模型模型评估循环送代PCA-RF模型预测416.编号1234:99100轻度(Li
18、ght)中度(Moderate)强(Strong)哈尔滨商业大学学报(自然科学版)表1冲击地压数据Table 1Rock burst dataSCF54.213455.41768923650130:51.5132.057.2852Table 2Standard classification of rock burst等级无(None)第39卷BCFWet9.090.47.30.318.30.3860.38:6.333.7表2 冲击地压等级标准划分表特点无现象发生围岩出现破裂现象,有微弱的声音围岩出现更为严重的变形和破裂现象,伴随岩体的松散围岩严重变形,对巷道产生极大的影响,伴随强烈的爆破声和轰
19、鸣声数字标签原始标签157.0824.119.328.43521.675:0.3920.860.1414.0522224.6321.30ModerateModerateModerateModerate:ModerateNone15.0F2002001501506100500NoneLight Moderate StrongRockburst intensity32一0NoneLight Moderate StrongRockburst intensity2.3数据预处理对其异常值进行取中位数处理,并对整体数据进行标准化,标准化公式参考式(2),之后计算相关系数矩阵,相关系数矩阵如表3所示.在表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PCA RF 模型 冲击 地压 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。