基于遗传算法优化C-LSTM模型的心律失常分类方法.pdf
《基于遗传算法优化C-LSTM模型的心律失常分类方法.pdf》由会员分享,可在线阅读,更多相关《基于遗传算法优化C-LSTM模型的心律失常分类方法.pdf(8页珍藏版)》请在咨信网上搜索。
1、前 言随着社会经济的发展,人口老龄化与城镇化进程的加速,居民不健康的生活方式日益突出,心血管疾病发病率持续上升。据统计,中国因心血管疾病死亡的人数占城乡居民死亡人数比例超过 40%1。因此,重视并加强心血管疾病的预防、诊断及治疗显得尤为重要。心律失常是最常见的心血管疾病之一,通常是指心律起源部位、心搏频率、节律以及冲动 传 导 等 任 一 异 常。心 电 图(Electrocardiogram,ECG)作为一种表征人体心脏状况的生理电信号,在发生心律失常时,ECG信号会呈现出具有反常形态和节律的波形2。因此,在临床上医生根据ECG诊断病人是否患有心血管疾病。但由于心电信号具有高度非线性且为毫伏
2、量级的信号,故人工诊断易出现误诊和漏诊的情况。而基于计算机辅助诊断的心电信号分析系统可有效缩短诊断时间与提升诊断准确度。近些年随着人工智能技术的发展,出现了许多基于机器学习3-6和深度学习7-12的心律失常分类方法。基于深度学习的分类算法在生物医学信号分类系统中应用越发广泛并取得良好的效果,其中大多数方法采用 CNN、LSTM 或它们组合而成的 CNN-LSTM网络 6。比如Kiranyaz等 7 最早将一维卷积(1D-CNN)用于心律失常分类,该模型由3层卷积层和2层全连基于遗传算法优化C-LSTM模型的心律失常分类方法王巍,丁辉,夏旭,吴浩,张迎,郭家成重庆邮电大学光电工程学院,重庆 40
3、0065【摘要】结合遗传算法全局寻优的特点提出一种GC-LSTM模型,该模型通过特定遗传策略的遗传算法自动迭代搜寻C-LSTM模型最佳超参数配置。利用遗传迭代结果配置模型,并按照医疗仪器促进协会制定分类标准在MIT-BIH心律失常数据库上进行验证。经过测试,本文提出的 GC-LSTM 模型在分类准确率(99.37%)、灵敏度(95.62%)、精确度(95.17%)、F1值(95.39%)上相较于手动搭建模型均有所提升,且与现有主流方法相比亦具备一定优势。实验结果表明该方法在避免大量实验调参的同时取得较好的分类性能。【关键词】心律失常分类;遗传算法;GC-LSTM模型;超参数【中图分类号】R31
4、8【文献标志码】A【文章编号】1005-202X(2024)02-0233-08Arrhythmia classification method based on genetic algorithm optimization of C-LSTM modelWANG Wei,DING Hui,XIA Xu,WU Hao,ZHANG Ying,GUO JiachengSchool of Optoelectronic Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,ChinaAbstr
5、act:AGC-LSTM model is proposed based on the characteristics of global optimization of genetic algorithm.The modelautomatically and iteratively searches the optimal hyper-parameter configuration of the C-LSTM model through the geneticalgorithm of a specific genetic strategy,and it is configured using
6、 the genetic iteration results and validated on the MIT-BIHarrhythmia database according to the classification criteria of the Association for the Advancement of MedicalInstrumentation.The testing shows that the classification accuracy,sensitivity,accuracy and F1 value of GC-LSTM modelare 99.37%,95.
7、62%,95.17%and 95.39%,respectively,higher than those of the manually established model,and it is alsoadvantageous over the existing mainstream methods.Experimental results demonstrate that the proposed method can achievebetter classification performance while avoiding a large number of experimental p
8、arameters.Keywords:arrhythmia classification;genetic algorithm;GC-LSTM model;hyper-parameter【收稿日期】2023-08-12【基金项目】重 庆 市 科 技 局 产 业 化 项 目(CSTC2018JSZX-CYZTZX0211,CSTC2018JSZX-CYZTZX0048)【作者简介】王巍,博士后,教授,研究方向:数字多媒体信号处理及VLSI设计,E-mail:DOI:10.3969/j.issn.1005-202X.2024.02.017第41卷第2期2024年 2月中国医学物理学杂志Chinese
9、 Journal of Medical PhysicsVol.41 No.2February 2024医学信号处理与医学仪器-233接层构成,且卷积模块均采用较小的卷积核进行运算,最终在MIT-BIH数据库中实现99%的心室异常节拍分类准确率。Ihsanto等8提出一种21层的深度可分离卷积神经网络对ECG进行分类,该模型仅采用 MIT-BIH 心律失常数据库中 22%的数据进行训练,其余 78%数据用于 16类别分类测试,最终达到99.8%的平均准确率。Rajpurkar等9建立一个34层的单通道残差网络用于单导联心电信号的心律失常分类系统,使用超规模数据量的心电信号数据集训练网络。在心律失
10、常10分类任务中,该模型出现了超过专家诊断准确率的情况。Yildirim10使用4种不同类型的LSTM网络对MIT-BIH数据库中ECG进行5分类,主要验证带有小波序列的双向LSTM网络分类性能优于 LSTM 和双向 LSTM,且达到 99.39%的分类准确率。Lu等11提出一种基于 CNN-LSTM 网络模型的心律失常分类算法,该设计利用深度CNN提取ECG信号的形态学特征,然后通过LSTM学习形态学特征的时间相关性,深入挖掘内在特征。实验结果表明,该方法显著缩短分类时间,分类准确率达96%以上。Madan等12将1D的ECG信号转换为2D比例图像,进行噪声滤除和特征提取,结合二维卷积神经网
11、络和 LSTM 网络提出一种 2D-CNN-LSTM模型的心律失常分类方法,该方法极大提升了分类模型的平均灵敏度和特异性。虽然上述模型在心律失常分类问题上达到很高的分类准确度,但模型的分类性能高度依赖于网络结构和超参数设定13。传统形式的模型搭建依赖于研究者的经验以及对数据特性的认识程度,同时还需大量的实验才能获取最终模型。这不仅会消耗大量时间,且不能保证模型达到最优。因此近些年陆续有关于优化深度学习模型的方法被提出。钱龙等14提出一种基于遗传算法(Genetic Algorithm,GA)优化LSTM网络的胎儿心电信号提取方法,利用GA求取 LSTM 网络的部分超参数,得到网络的最优组合,相
12、较于未经优化的LSTM模型在准确率、敏感度、精确度、F1值上均有超过2%的性能提升。Li等15提出一种基于GA优化反向传播神经网络权重值的方法,用于ECG信号的6分类任务,在分类准确率和精确度上分别实现1.67%和1.23%的提升。Maghawry等16提出一种基于GA优化的CNN网络权重值的方法,相较于未优化的CNN网络,精确度提升2.06%,准确率提升4.42%。但上述方法均只采用单种模型,无法同时关注到ECG信号的时间与空间特性。因此,本文提出一种基于GC-LSTM模型的心律失常分类方法。首先对心电信号进行小波阈值变换去噪与心拍分割;其次搭建CNN与LSTM网络的组合模型C-LSTM17
13、作为心律失常分类初始模型,对心电信号在形态和时序层面的特征进行深入提取,提升模型分类性能;然后选择模型中最重要的几个超参数组成遗传迭代的个体,将生成的个体分别代入初始模型进行训练,训练完成后采用特定遗传策略对当前种群进行迭代优化,直到满足模型性能需求后退出迭代;最后利用经过预处理后的心拍数据对遗传迭代所得最优配置下的C-LSTM模型进行训练与测试,得到一个遗传迭代设定范围内的最优心律失常分类模型。1 GA优化C-LSTM模型1.1 C-LSTM模型由CNN和LSTM组合而成的C-LSTM模型首次在文献 17 中被提出,且将其用于文本情感和问题分类,其结构如图1所示。通过1D-CNN提取词语中的
14、特征,并将提取到的特征序列送入LSTM模型中以学习语句中的长程依赖性。经验证,该模型的性能优于单一的CNN或LSTM模型。1.2 GAGA由美国Holland教授于1960年基于达尔文进化论提出,是一种针对不同问题选择不同遗传算子不断迭代进化的群智能优化算法18。相较于其他优化算法,GA可实现对解空间的全局搜索,通过特定的选择、交叉、变异策略实现种群的迭代,克服易陷入局部最优解的缺点。传统遗传算法步骤为:(1)确定问题参数:指定需要遗传算法搜寻的参数;(2)编码:对目标参数进行编码,其中常用编码方式有二进制、格雷码、实数编码等方式;(3)种群初始化:随机生成若干种群;(4)个体适应度评价:根据
15、选定适应度函数,对生成的种群依次进行适应度计算;(5)选图1 C-LSTM模型结构Figure 1 C-LSTM model structure中国医学物理学杂志第41卷-234择、交叉、变异:依据适应度对个体择优录取,并进行交叉、变异操作获取更优解;(6)群体更新:待更新个体数量达到目标时完成群体更新,进入下一次迭代;(7)当满足退出条件时,遗传迭代结束。1.3 GA优化C-LSTM模型本文采用 GA 对 C-LSTM 模型的结构参数进行优化,优化流程主要分为C-LSTM模型搭建与训练和GA迭代优化两个部分。其中C-LSTM部分逐个将遗传迭代后的个体用于搭建分类网络,并采用同一组心电数据进行
16、模型训练,训练完成后输出模型的平均分类准确率作为该个体适应度。GA迭代优化模块将根据每个个体适应度通过对应遗传策略生成性能更优的种群。整体算法流程如图2所示,基本思路如下:(1)准备模型训练所需心电信号数据,并构建1D-CNN、LSTM、全连接层函数;(2)确定卷积层数、全连接层数、卷积核大小和个数、LSTM以及全连接层神经元个数为待优化参数,设定每个参数遗传迭代搜寻范围,具体设定如表1所示,同时为了提升遗传迭代速度,本文采用可变长实数编码方式对个体进行编码,每个个体基因数控制在614个;(3)设定GA所需种群大小、交叉率、变异率等参数如表 2所示,其中种群大小为20,交叉率设定为50%,变异
17、率设定为10%;(4)初始化种群,依照设定种群大小和优化参数范围随机初始化生成20个个体,组成初代种群;(5)进行初始化个体层级配置,逐个完成初始化个体训练,并得到训练后模型的平均分类准确率作为该个体适应度;(6)选择,为了保证GA的收敛速度和种群中个体基因的优良性,本文采用精英保留和轮盘赌方式相结合的选择策略,首先将该种群内适应度最高的个体选中,然后剩余个体采用轮盘赌方式执行选择;(7)对选择出的个体执行复制、交叉和变异。复制是为了保证种群基因的优良性,交叉将父代基因进行重组生成下一代个体,变异是为了引入当前种群外的基因,防止迭代进入局部最优解,由于优化参数中包含层级参数,层级参数的变化会引
18、起个体基因数的变化,因此只针对非层级参数执行交叉和变异,同时为了保证不破坏层级结构属性,只执行相同层级参数单点匹配交叉方式,具体交叉和变异方式如图3所示;(8)将执行复制、交叉、变异后的个体组成新种群,并将该类个体逐个对模型进行层级参数配置,进行训练得到个体适应度;(9)以步骤(5)(8)进行循环,在完成50次迭代后结束循环,并输出迭代过程中适应度最高的个体,用于后续对比实验。导入心电数据构建卷积层函数构建LSTM函数构建全连接层函数导入层级参数开始确定优化参数与编码方式随机初始化种群,Gen=0Gen=50?适应度计算i=0i=20?依据适应度执行选择适应度最高个体选择两个个体选择一个个体执
19、行交叉执行复制执行变异复制结果加入新种群交叉结果加入新种群变异结果加入新种群i=i+1Gen=Gen+1种群更新输出结果结束YNNY开始模型训练输出验证集准确率C-LSTM部分GA部分图2 优化流程Figure 2 Optimization flowchart第2期王巍,等.基于遗传算法优化C-LSTM 模型的心律失常分类方法-2351.4 最终模型结构利用经过GA优化后输出的最优个体搭建本文的心律失常分类模型,具体模型结构如图4所示。模型主要由输入层、卷积层、最大池化层、LSTM层以及全连接层组成。其中输入层将心拍信号输入分类网络;卷积层提取心拍信号中的形态特性;最大池化层对卷积层提取到的特
20、征进行特征降维,减少运算量的同时防止网络过拟合;LSTM提取心电信号的时序特性;全连接层用于整合前面网络所获取的特征,并输出心拍类型。模型结构详细参数如表3所示。模型主要包含3层一维卷积神经网络、3个最大池化层、1个LSTM层、2个全连接层。卷积神经网络均采用ReLU作为激活函数,卷积核个数分别为16、42、35,卷积核大小分别为37、18、29;最大池化层均采用大小为31的池化单元,以步长为2进行移动;LSTM层包含126个LSTM单元;第一个全连接层包含85个神经元与LSTM层进行连接,并通过 ReLU 函数输出;最后通过大小为 4,激活函数为Softmax的全连接层进行类型输出。2 实验
21、设置与结果分析2.1 数据集与预处理本文实验数据来源于MIT-BIH心律失常数据库(MIT-BIHArrhythmia Database)19,该数据库中包含48条采样频率为360 Hz且超过30 min的双通道动态心电信号记录,其中由于MLII导联方式的数据经过修正,因此本文只采用MLII导联方式获取数据进行实验。原始心电信号包含工频干扰、基线漂移和肌电干扰等噪声优化参数卷积层数全连接层数卷积核个数卷积核大小LSTM神经元个数全连接层神经元个数初始值范围141381284643225632128表1 优化参数Table1 Optimization parametersGA参数种群大小个体基因
22、数迭代次数交叉率变异率单个个体训练次数设定值20614500.50.15表2 GA参数设置Table 2 GA parameter setting32a1c1d123A1C1D1选择a2 a3A2b1 b2 b3d2B1B2D2 D323A1C1D1A2 B1 B2D2D3CNN层数FC层数卷积核个数卷积核大小LSTM神经元个数FC神经元个数选择变异种群23a1C1d1a2B1B2d2 D3交叉23A1C2D1A2 B1 B2D2D3图3 交叉、变异策略Figure 3 Crossover and variation strategiesConv1D+ReLUMaxPoolingConv1D+
23、ReLUMaxPoolingConv1D+ReLUMaxPoolingDesen+ReluDesen+SoftmaxInput layerLSTMLSTMLSTMLSTM.LSTMNSVF卷积神经网络长短期记忆网络图4 最终模型结构图Figure 4 Final model structure中国医学物理学杂志第41卷-236源所引入的噪声,这些噪声会影响ECG特性20。本文采用基于Daubechies4为小波基的小波变换对心电信号进行8层分解,并通过VisuShrink阈值去噪后重构的方式实现噪声滤除。然后对滤除噪声后的心电信号进行心拍分割,由于该数据库中的心电信号均由心脏领域权威专家在每个
24、心拍的R波位置进行心拍类型标注,因此可直接在标注位置进行心拍分割。对于每条心电信号在R波位置前取100个样本点,向后取150个样本点组成一个完整心拍。将经过预处理的心拍数据,按照医疗仪器促进协会(Association for the Advancement ofMedical Instrumentation,AAMI)标准进行重新分类为N、S、V、F、Q 5类,由于Q类型为未知类型心拍且数量较少,因此本文只针对N、S、V、F 4类心拍进行分类研究,具体分类详情如表4所示。2.2 评估实验为了验证提出的 GA 优化 C-LSTM 模型结构的有效性。本文通过人工调参方式搭建两组C-LSTM模型的
25、对比网络,对比网络中层级参数均采用2的指数形式进行设置。且对比模型的层数以本文最终模型为基准,设置更深的网络C-LSTM1与更浅的网络C-LSTM2,具体参数如表5与表6所示。其中卷积层与非最后一层全连接层均采用ReLU作为激活函数,最大池化层采用与最终模型相同结构,最后的输出层采用Softmax作为激活函数。搭建好两组模型后,将经过预处理后的心电信号按照6:2:2的比例划分训练集、验证集以及测试集,将每个模型采用同一批数据作为训练集、验证集和测试集。且每个网络均采用Adam优化器进行训练,学习率设置为0.001,网络批处理大小为128,训练次数为100。在同等训练条件下,对3组网络进行性能测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 遗传 算法 优化 LSTM 模型 心律失常 分类 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。