基于F-Score特征选择的癫痫脑电信号识别方法.pdf
《基于F-Score特征选择的癫痫脑电信号识别方法.pdf》由会员分享,可在线阅读,更多相关《基于F-Score特征选择的癫痫脑电信号识别方法.pdf(6页珍藏版)》请在咨信网上搜索。
1、 技术应用 58*基金项目:国家自然科学基金(61976059,61640213)本文引用格式:凌宇,杜玉晓,李向欢.基于 F-Score 特征选择的癫痫脑电信号识别方法J.自动化与信息工程,2023,44(5):58-62;73.LING Yu,DU Yuxiao,LI Xianghuan.Epileptic EEG signal recognition method based on F-Score feature selectionJ.Automation&Information Engineering,2023,44(5):58-62;73.基于 F-Score 特征选择的癫痫脑电信号
2、识别方法*凌宇 杜玉晓 李向欢 (广东工业大学,广东 广州 510006)摘要:随着癫痫脑电信号自动检测算法研究地不断深入,需要处理的特征维度也不断增加,且冗余特征增大了算法的复杂度,导致算法性能下降。为此,提出一种基于 F-Score 特征选择的癫痫脑电信号识别方法。首先,从原始癫痫脑电信号数据集中提取特征,并计算每个特征的 F-Score 统计值;然后,根据分类模型的分类准确率,通过序列前向搜索方法,选择最优特征集;最后,利用支持向量机和逻辑回归分类模型进行实验,并与传统的特征降维方法 PCA 进行对比。实验结果表明,本文方法可有效降低特征矩阵的维数,提高算法运算效率。关键词:F-Scor
3、e;PCA;特征提取;特征选择;癫痫脑电信号识别 中图分类号:R742.1 文献标志码:A 文章编号:1674-2605(2023)05-0009-06 DOI:10.3969/j.issn.1674-2605.2023.05.009 Epileptic EEG Signal Recognition Method Based on F-Score Feature Selection LING Yu DU Yuxiao LI Xianghuan (Guangdong University of Technology,Guangzhou 510006,China)Abstract:With the
4、 continuous deepening of research on automatic detection algorithms for epileptic EEG signals,the number of feature dimensions to be processed continues to increase,and redundant features increase the complexity of the algorithm,leading to a decrease in algorithm performance.To this end,a method for
5、 epileptic EEG signal recognition based on F-Score feature selection is proposed.Firstly,extract features from the original epileptic EEG signal dataset and calculate the F-Score statistical value for each feature;Then,based on the classification accuracy of the classification model,the optimal feat
6、ure set is selected through a sequence forward search method;Finally,experiments were conducted using support vector machines and logistic regression classification models,and compared with the traditional feature dimensionality reduction method PCA.The experimental results show that the proposed me
7、thod can effectively reduce the dimensionality of the feature matrix and improve the computational efficiency of the algorithm.Keywords:F-Score;PCA;feature extraction;feature selection;epileptic EEG signal recognition 0 引言 目前,癫痫的临床诊断主要以脑电图(electro-encephalogram,EEG)为依据。随着计算机技术的飞速发展,人们开始利用计算机处理癫痫脑电信号
8、。计算机处理癫痫脑电信号的基本原理是提取癫痫脑电信号的特征并进行分类1,应用较多的分类方法是机器学习算法。在机器学习算法中,理论上认为特征越多,分类性能就越好。然而,大量特征可能存在冗余,降低分类模型的准确率。机器学习算法的基础是特征选择,从原始数据特征集中筛选出最优特征子集,可降低特征矩阵的维度2,提高算法的运算效率。目前,常用的特征选择方法可分为过滤式和封装式3。其中,过滤式方法通过设置阈值对特征评价进行筛选;封装式方法通过机器学习算法来寻找特征评价。常用的特 凌宇 杜玉晓 李向欢:基于 F-Score 特征选择的癫痫脑电信号识别方法 2023 年 第 44 卷 第 5 期 自动化与信息工
9、程 59 征评价标准有相关系数4和互信息5。文献6先利用极限学习机对非线性特征进行评价,再利用多目标演化算法来筛选最优子集。为全面反映癫痫脑电信号,需要从原始脑电信号中提取多个维度的特征,包括时域、频域、时频域和非线性特征7,导致原始癫痫脑电信号特征集中有许多冗余特征。为此,本文提出一种基于 F-Score 特征选择的癫痫脑电信号识别方法。首先,利用F-Score 对原始脑电信号的特征进行评价;然后,采用序列前向搜索方法,以分类模型的分类准确率为反馈来寻找最优的特征子集。1 特征提取与特征选择算法 1.1 PCA 特征降维 主分量分析(principal component analysis,
10、PCA)是一种常用的数据降维方法8,它将原始数据集中的多维特征映射到低维空间,从而减少数据的维度。PCA 可以减少计算量,提高算法的运算效率,消除噪声,提高模型的泛化能力;但可能丢失重要的特征信息,影响算法的准确率。1.2 F-Score 特征选择 F-score 是一种通过计算类内间距来衡量特征分类能力的方法,由 HUANG 等9于 2006 年提出,可有效实现特征选择。假设Xk(k=1,2,3,N)为特征集中的所有特征,n+、n为特征样本的正负实例数量,则特征集中的第个特征的F-Score 计算公式10为()()()()2222,111111llllinnk iik iikkxxxxFxx
11、xxnn+=+=+(1)式中:lx为该特征样本在特征集中的平均值,lx+、lx分别为该特征样本在正负样本上的平均值,,k ix+、,k ix分别为第 k 个正负类样本在第 i 个特征上 的值。在进行特征选择时,采用序列前向搜索方法来搜索最优特征子集,即依据一定的评价标准,从原始特征集中选择可以使评价标准最好的特征加入到最优特征子集S 中。1.3 癫痫脑电信号特征提取 特征提取是癫痫脑电信号分类算法的重要步骤,提取特征的好坏直接影响癫痫脑电信号分类模型的分类效果11。本文提取的癫痫脑电信号特征包括峰度和偏态、Hjorth 参数、功率谱密度、香农熵、谱熵、近似熵等。1)峰度和偏态12。峰度(Kur
12、tosis,K)用来表示采样点分布的陡峭程度,在波形图上描述波峰尖锐程度的特征。偏态(Skewness,S)用来表示信号的偏斜程度,与正态分布进行比较,往左偏是左偏态,往右偏是右偏态。峰度和偏态的计算公式分别为()4411/1NiiKXXSDN=(2)()3311/1NiiSXXSDN=(3)式中:SD为信号标准差,X为信号均值。2)Hjorth 参数13包括活动性(Activity)、移动性(Mobility)和复杂性(Complexity)3 个参数,计算公式为 2activityASD=(4)mobilitySDMSD=(5)complexitySDSDCSDSD=(6)式中:SD为一阶
13、差分信号的标准差,SD 为二阶差分信号的标准差。3)功率谱密度(power spectral density,PSD)14用来表示信号的能量特征,计算公式为 1NiisXPSDf=(7)式中:Xi为癫痫脑电信号,fs为脑电信号的频率。4)香农熵(ShEn)15又被称为信息熵,可以对 60 信号中包含的信息量进行度量,而信息量大小可以表示信息的不确定程度,计算公式为()ln()hhfShEnP XP X=(8)式中:Ph为概率密度函数的周期图估计。5)谱熵(SpEn)16用于量化信号的规律性和顺序性,计算公式为 1()ln()logffffSpEnP XP XN=(9)式中:Nf为频率分量个数,
14、Pf为概率密度函数。6)近似熵(ApEn)17用来表示脑电信号的复杂性和规律性,计算公式为 1()()EEddApEnrr=(10)式中:()Edr为相邻两点之间的相似度,r 为相似距离。与其他特征相比,近似熵具有抗干扰性强、数据量依赖较小等特点。1.4 分类模型 癫痫脑电信号分类算法的分类模型采用支持向量机(support vector machine,SVM)和逻辑回归(logistic regression,LR)机器学习分类模型。1)SVM 模型在解决高维问题以及小样本的分类问题中应用广泛,其可将线性不可分的问题映射到高维空间,并在高维空间中寻求一个超平面,将低维线性不可分问题转换为高
15、维空间的线性可分问题18。但在高维空间中如何计算内积成为一个难题,为此SVM 引入核函数,将在高维空间中的内积运算转化为低维空间中的输入核函数运算。本文采用的核函数为径向基函数,即()2(,)exp,0ijijK x xxxg=(11)2)LR 模型用来预测输出变量的取值或者事件发生的概率19,通常用来解决分类问题,其表示简单、准确率高,模型中使用正则化项能够避免过拟合。LR的表达式模型是一个线性函数,其输入特征与对应的权重向量相乘,再使用logistic sigmoid 函数将结果映射到01 之间的概率空间。1.5 算法步骤 假设从原始癫痫脑电信号中提取的特征集为F=(f1,f2,.,fi)
16、输出的最优特征子集为 S,基于 F-Score的特征选择算法流程如图1 所示。原始特征集F最优特征子集S(空集)计算F-Score值并进行降序排序,构成特征集Fl取出F1中第i个特征放入最优特征子集S,记为Si输出最优特征子集S将Si输入分类模型中,计算分类模型的判据值KiKiKi1删除该特征将该特征添加到最优特征子集S中Fl为空YNNY 图1 基于F-Score 的特征选择算法流程图 基于F-Score 的特征选择算法具体步骤为:1)对特征集 F 中的每个特征进行基于 F-Score算法的特性评价,计算每个特征的F-Score 值;2)将每个特征的 F-Score 值降序排序,重新构建特征集
17、F1;3)每次从特征集F1中取出F-Score 值最大的特征放入最优特征子集S,如果特征集F1为空,算法结束,否则继续执行下一步;4)将特征子集 S 输入到分类模型中进行分类,以分类模型的K 为判据;假设当前的特征集为 Si,分类模型的判据值为Ki,从F1中取出当前F-Score 值最大的特征加入 Si中,记为 Si+1,同样计算 Si+1的判据值Ki+1;5)比较Ki与Ki+1,如果Ki+1 Ki,表示这个特征对分类效果起不到正向促进作用,将这个特征从 S中去除,并返回步骤3);如果Ki+1 Ki,表示这个特凌宇 杜玉晓 李向欢:基于 F-Score 特征选择的癫痫脑电信号识别方法 2023
18、 年 第 44 卷 第 5 期 自动化与信息工程 61 征可以提高分类效果,将这个特征保留在 S 中,并返回步骤3);6)直到遍历特征集F1的所有特征,生成的特征集S 即为最优特征子集。2 实验结果及分析 本文实验仿真采用 MATLAB 实现。实验对比PCA 和F-Score 2 种特征选择算法在SVM 和LR 2种分类模型上的性能。2.1 实验数据 本文采用的EEG数据集来自伯恩大学的Bonn数据集。Bonn 数据集中包含 Set A、Set B、Set C、Set D、Set E 5 组数据,选取Set A(正常脑电信号)和Set E(癫痫脑电信号)2 组进行分类实验。Set A 和Set
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Score 特征 选择 癫痫 电信号 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。