基于高斯过程回归的软件可靠性模型.pdf
《基于高斯过程回归的软件可靠性模型.pdf》由会员分享,可在线阅读,更多相关《基于高斯过程回归的软件可靠性模型.pdf(10页珍藏版)》请在咨信网上搜索。
1、Operations Research and Fuzziology 运筹与模糊学运筹与模糊学,2023,13(4),2840-2849 Published Online August 2023 in Hans.https:/www.hanspub.org/journal/orf https:/doi.org/10.12677/orf.2023.134284 文章引用文章引用:熊天骏,杨剑锋,王震.基于高斯过程回归的软件可靠性模型J.运筹与模糊学,2023,13(4):2840-2849.DOI:10.12677/orf.2023.134284 基于高斯过程回归的软件可靠性模型基于高斯过程回归
2、的软件可靠性模型 熊天骏熊天骏1,杨剑锋,杨剑锋1,2*,王,王 震震1 1贵州大学数学与统计学院,贵州 贵阳 2贵州理工学院大数据学院,贵州 贵阳 收稿日期:2023年6月2日;录用日期:2023年7月29日;发布日期:2023年8月3日 摘摘 要要 传统软件可靠性模型通常过于依赖假设条件,难以适应复杂的实际情况。为此,本文提出了一种基于高传统软件可靠性模型通常过于依赖假设条件,难以适应复杂的实际情况。为此,本文提出了一种基于高斯过程回归斯过程回归(Gaussian Process Regression,GPR)的软件可靠性非参数模型。该模型结合了机器学习和高的软件可靠性非参数模型。该模型结
3、合了机器学习和高斯过程核,从失效数据中提取样本特征之间的相关关系。与传统可靠性模型相比,本文提出的模型具有斯过程核,从失效数据中提取样本特征之间的相关关系。与传统可靠性模型相比,本文提出的模型具有更广泛的应用效果。通过对两组真实数据进行对比分析,结果显示本文提出的可靠性模型具有更好的拟更广泛的应用效果。通过对两组真实数据进行对比分析,结果显示本文提出的可靠性模型具有更好的拟合效果和预测能力。合效果和预测能力。关键词关键词 软件可靠性模型,高斯过程回归,非参数模型,机器学习软件可靠性模型,高斯过程回归,非参数模型,机器学习 A Software Reliability Model Based o
4、n Gaussian Process Regression Tianjun Xiong1,Jianfeng Yang1,2*,Zhen Wang1 1School of Mathematics and Statistics,Guizhou University,Guiyang Guizhou 2School of Big Data,Guizhou Institute of Technology,Guiyang Guizhou Received:Jun.2nd,2023;accepted:Jul.29th,2023;published:Aug.3rd,2023 Abstract Traditio
5、nal software reliability models often rely too much on assumptions and are difficult to adapt to complex practical situations.Therefore,this paper proposes a nonparametric model of software reliability based on Gaussian Process Regression(GPR).The model combines machine learning and Gaussian process
6、 kernels to extract correlations between sample features from failed data.Compared with the traditional reliability model,the model proposed in this paper has *通讯作者。熊天骏 等 DOI:10.12677/orf.2023.134284 2841 运筹与模糊学 a wider application effect.Through the comparative analysis of the two sets of real data
7、,the re-sults show that the reliability model proposed in this paper has better fitting effect and prediction ability.Keywords Software Reliability Model,Gaussian Process Regression,Nonparametric Model,Machine Learning Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under th
8、e Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/licenses/by/4.0/1.引言引言 软件可靠性是衡量软件系统在指定时间段内无故障地执行其预期功能的能力的指标,这是软件开发和维护的一个关键方面,因为软件故障可能会产生严重的后果,例如经济损失、声誉损害,甚至安全隐患,可靠的软件可以一致和准确地执行其预期功能,而不会造成任何意外或不良结果。软件可靠性受各种因素的影响,例如软件的复杂性、代码的质量、测试和验证过程以及操作环境。随着软件系统变得越来越复杂和互联,研
9、究其可靠性变得越来越具有挑战性。所以对软件可靠性的模型选择以及预测其未来增长趋势显得尤为重要,过去已有很多软件可靠性模型被提出,绝大多数模型是基于非齐次泊松过程(NHPP)类的软件可靠性模型。Yang 等1介绍了关于NHPP 类开源软件可靠性增长模型的极大似然估计。Jelinski 等2介绍了软件可靠性的研究。Zhang 等3分析了影响软件可靠性的因素。最经典的模型为 G-O 模型,Jeske 等4提出了关于 G-O 模型的极大似然估计。Lavanya 等5研究了通过 aco 与 mle 的方法去估计 G-O 模型中的参数。同样用的很多的为 ISS 模型,对于 SRGM 没有透明的解释用于累积
10、软件误差的方差估计,Lee 等6提出了利用 ISS 来建立具有置信区间的 SRGM。Erto 等7提出了一种新的广义下的 ISS 模型,它的特点是允许对每个故障函数的非单调故障率建模。Sagar 等8结合了威布尔分布方法和 ISS 模型。Pradhan 等9提出将测量工作量函数(TFF)作为时间变化故障率参与到广义 ISS 模型中。Wang 等10考虑将 ISS 模型引入开源软件可靠性模型。Shrivastava 等11通过考虑变化点前后的不同分布函数,开发了一个框架,将变化点纳入混合软件可靠性增长模型的开发中。Yang 等12提出一种考虑故障检测和纠错过程的屏蔽数据开源软件增长可靠性模型框架
11、。为了解决大规模复杂软甲的可靠性预测和分析问题,软件可靠性模型需要具备处理多个参数的能力,贝叶斯网络表现出很强的适应涉及复杂变异因素的问题的能力,Bai 等13开发了一个扩展的马尔可夫贝叶斯网络,用于对具有操作配置文件的软件可靠性预测进行建模。Ruggeri 等14对贝叶斯软件可靠性建模进展进行了介绍。Wiper 等15分析了软件可靠性模型,其中软件度量形式的协变量信息可用性,使用神经网络回归,根据故障间隔时间或故障次数来估计模型中的故障率。Aktekin 等16开发了一个在软件可靠性方面调试不完善的模型,用贝叶斯分析,获取模型参数。机器学习(ML)技术在软件可靠性预测中的应用已经显示出细致而
12、显着的结果,Jaiswal 等17提出了使用 ML 技术进行软件可靠性预测,并根据选定的性能标准对其进行评估。Habtemariam 等18介绍了利用机器学习技术预测软件可靠性的系统文献综述。Mohanty 等19采用机器学习技术,来准确预测软件可靠性。Open AccessOpen Access熊天骏 等 DOI:10.12677/orf.2023.134284 2842 运筹与模糊学 综上所述,本文的想法在于利用 GPR 模型来面对大规模复杂软件系统的可靠性预测和分析问题,增强预测的准确性,基于高斯过程回归的可靠性建模可以通过从历史数据中学习参数来计算复杂软件系统的初始可靠性。余下部分主要
13、如下,第二章主要介绍了高斯过程回归的软件可靠性建模以及模型评价标准,第三章是案例分析,以及与 G-O 模型、ISS 模型的对比。第四章是结论。2.基于高斯过程回归的软件可靠性模型基于高斯过程回归的软件可靠性模型 2.1.高斯过程回归的软件可靠性建模高斯过程回归的软件可靠性建模 高斯过程回归是来自于贝叶斯方法的一种非参数模型,高斯过程定义了一个先验函数,该函数在观察到先验分布中的一些值后转换为后验函数。本文只对一维高斯回归进行解释,对于训练集(),1,2,3,iiZX Yik=?。iX为输入数据,iY为对应的输出数据。目的是通过样本来学习,经过训练后,得出iX和iY的函数关系,并用新的测试集*i
14、X来预测*iY。将训练集(),1,2,3,ttZW Mts=?。其中W为时间,tM为 t 时刻的累计故障数,将Z代到(1)式,对于给定 S 组训练样本12,SWW WW=?有回归方程如下:()()()()0,0,nMf WNf Wgpk W W2=+(1)其中,W为学习样本,M为对应输出数据;()0,gpk W W是均值为 0、协方差为 K 的高斯过程;由于高斯回归不需要先验知识,所以是从数据中训练后得到先验分布:()()20,nMNK W WI+(2)而高斯回归中任意有限维的随机变量都服从高斯分布,所以对新输入的时间*W以及对应预测故障数*M也服从上述高斯分布,所以:()()()()*,0
15、,nK W WIK W WMNMK W W K W W2+,(3)再取边缘分布,有:()()()()*2*,covnp M W M WN M m MM=(4)其中,*M的均值()()()1*2m,nMK W WK W WIM=+(5)协方差()()()()()1*2*cov,nMK W WK W WK W WIK W W=+(6)又上述可知,由于讲高斯过程中的均值预设为 0,所以完全由协方差函数决定,即可以通过(6)来算出预测值*M以及其方差,所以协方差函数的选取尤为重要,本文选用的是径向基(RBF)核函数作协方差函数,RBF 是使用的最多的一种核函数,用于机器学习中的各种任务,如分类、回归和
16、聚类。2.2.模型评价标准模型评价标准 本文将提出的 GPR 模型与 G-O 模型、ISS 模型进行对比。选用 RMSE 和 MAE 作为评价模型拟合程熊天骏 等 DOI:10.12677/orf.2023.134284 2843 运筹与模糊学 度的指标:均方根误差(RMSE):预测值与实际值偏差的平方和与观察次数 m 比值的平方根:()2*1RMSEmiiiYYm=(7)其中iY为实际值,*iY为预测值。RMSE 更小说明效果更好。平均绝对误差(MAE):*11MAEmiiiYYm=(8)其中iY为实际值,*iY为预测值。m 为回归数据的个数,MAE 越小表示模型的表现更好。3.案例分析案例
17、分析 3.1.数据介绍数据介绍 3.1.1.数据集数据集 1 本文选取两组数据进行研究,各数据均来自用户缺陷跟踪系统。数据集 1 为 TOMCAT 服务器软件,Apache Tomcat,通常简称为 Tomcat,是由 Apache 软件基金会开发的开源 Web 服务器和 servlet 容器。它用于为 Java 应用程序提供服务,并为运行基于 Java 的 Web 应用程序(如 JavaServer Pages(JSP)和 Java Servlets)提供环境。本文从缺陷系统中提取了 TOMCAT3-11 的 2000 年 8 月到 2023 年 5 月共计 274 个月的数据,失效数据表如
18、表 1 所示。其中第 1193 月作为训练集,第 194274 月作为预测集。Table 1.Accumulated failure data of TOMCAT3-11 表表 1.TOMCAT3-11 的累计失效数据 时间/月 累计 生效数 时间/月 累计 生效数 时间/月 累计 生效数 时间/月 累计 生效数 时间/月 累计 生效数 时间/月 累计 生效数 1 3 53 2174 101 3054 149 4171 202 5233 250 5758 2 31 54 2192 102 3066 150 4198 203 5256 251 5775 3 57 55 2225 103 3074
19、 151 4212 204 5266 252 5782 4 78 56 2245 104 3090 152 4245 205 5278 253 5787 5 113 57 2262 105 3111 153 4261 206 5288 254 5795 6 144 58 2284 106 3123 154 4283 207 5305 255 5796 7 174 59 2293 107 3145 155 4307 208 5322 256 5799 8 210 60 2312 108 3164 156 4365 209 5331 257 5806 9 244 61 2337 109 3174
20、157 4389 210 5346 258 5811 10 288 62 2357 110 3194 158 4401 211 5353 259 5814 11 324 63 2378 111 3207 159 4420 212 5361 260 5819 12 390 64 2399 112 3273 160 4438 213 5373 261 5825 13 436 65 2430 113 3294 161 4454 214 5383 262 5832 14 515 66 2454 114 3327 162 4491 215 5393 263 5836 15 590 67 2480 115
21、 3356 163 4504 216 5401 264 5840 熊天骏 等 DOI:10.12677/orf.2023.134284 2844 运筹与模糊学 Continued 16 659 68 2496 116 3389 164 4526 217 5413 265 5852 17 689 69 2512 117 3452 165 4559 218 5431 266 5856 18 739 70 2528 118 3465 166 4579 219 5443 267 5861 19 807 71 2549 119 3495 167 4602 220 5449 268 5867 20 859
22、 72 2558 120 3516 168 4623 221 5463 269 5875 21 896 73 2571 121 3539 169 4639 222 5469 270 5881 22 932 74 2588 122 3585 170 4661 223 5480 271 5886 23 977 75 2605 123 3616 171 4689 224 5493 272 5900 24 1025 76 2624 124 3645 172 4711 225 5504 273 5906 25 1084 77 2634 125 3662 173 4729 226 5507 274 590
23、7 26 1152 78 2647 126 3695 174 4747 227 5511 27 1217 79 2671 127 3717 175 4775 228 5523 28 1258 80 2691 128 3738 176 4808 229 5537 29 1303 81 2709 129 3751 177 4827 230 5551 30 1373 82 2738 130 3778 178 4841 231 5573 31 1421 83 2761 131 3804 179 4850 232 5590 32 1486 84 2777 132 3833 180 4867 233 56
24、05 33 1525 85 2797 133 3857 181 4877 234 5611 34 1561 86 2817 134 3871 182 4928 235 5620 35 1589 87 2850 135 3887 183 4949 236 5636 36 1623 88 2869 136 3903 184 4973 237 5648 37 1670 89 2876 137 3919 185 4982 238 5656 38 1698 90 2887 138 3937 186 4991 239 5675 39 1731 91 2901 139 3970 187 5003 240 5
25、680 40 1762 92 2915 140 3997 188 5031 241 5684 41 1799 93 2926 141 4022 189 5044 242 5695 42 1840 94 2939 142 4040 190 5058 243 5705 43 1876 95 2957 143 4065 191 5066 244 5715 44 1906 96 2978 144 4085 192 5086 245 5723 49 2053 97 2992 145 4108 193 5102 246 5727 50 2086 98 3008 146 4118 194 5119 247
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 过程 回归 软件 可靠性 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。