基于模态注意力图卷积特征融合的EEG和fNIRS情感识别.pdf
《基于模态注意力图卷积特征融合的EEG和fNIRS情感识别.pdf》由会员分享,可在线阅读,更多相关《基于模态注意力图卷积特征融合的EEG和fNIRS情感识别.pdf(11页珍藏版)》请在咨信网上搜索。
1、DOI:10.3785/j.issn.1008-973X.2023.10.008基于模态注意力图卷积特征融合的 EEG 和 fNIRS情感识别赵卿,张雪英,陈桂军,张静(太原理工大学信息与计算机学院,山西太原030024)摘要:为了提升情感识别的准确率,从情绪视频引起的脑电(EEG)和功能近红外(fNIRS)数据中提取每个通道的信号之间的联系,并提出基于模态注意力多路图卷积神经网络(MA-MP-GF)的特征融合情感识别方法.将 EEG和 fNIRS 数据构建为图结构数据,通过多路图卷积分别对每种模态的信号进行特征提取;利用模态注意力图卷积层融合不同模态通道间的连接信息.模态注意力机制可以赋予不
2、同模态节点不同权重,使得图卷积层能够更加充分提取不同模态节点间连接关系.对采集的 30 个被试的 4 类情感数据进行实验测试,与仅 EEG 和仅 fNIRS 单模态识别结果相比,所提出的图卷积融合方法能够获得更高的识别准确率,分别提升了 8.06%、22.90%;与当前常用的 EEG-fNIRS 融合方法相比,所提出的图卷积融合方法的平均识别准确率提升了 2.76%7.36%;图卷积融合方法在加入模态注意力后识别率最高提升了 1.68%.关键词:图卷积神经网络;脑电;功能近红外;模态注意力;多模态融合;情感识别中图分类号:TP391文献标志码:A文章编号:1008973X(2023)10198
3、711EEG and fNIRS emotion recognition based on modality attentiongraph convolution feature fusionZHAOQing,ZHANGXue-ying,CHENGui-jun,ZHANGJing(College of Information and Computer,Taiyuan University of Technology,Taiyuan 030024,China)Abstract:Afeaturefusionemotionrecognitionmethodbasedonmodalityattenti
4、onmulti-pathconvolutionalneuralnetworkwasproposed,extractingtheconnectionbetweenthesignalsofeachchannelfromtheelectroencephalogram(EEG)andfunctionalnearinfraredspectroscopy(fNIRS)datainducedbyemotionalvideotoimprovetheaccuracyofemotionrecognition.TheEEGandfNIRSdatawereconstructedasgraphstructuredata
5、,andthefeatureofeachmodesignalwasextractedbymulti-pathgraphconvolution.Theinformationofconnectionbetweendifferentmodalchannelswasfusedbymodalityattentiongraphconvolution.Themodalityattentionmechanismcangivedifferentweightstodifferentmodalnodes,thusthegraphconvolutionlayercanmorefullyextracttheconnec
6、tionrelationshipbetweendifferentmodalnodes.Experimentaltestswerecarriedoutonfourtypesofemotionaldatacollectedfrom30subjects.ComparedwiththeresultsofEEGonlyandfNIRSonly,therecognitionaccuracyoftheproposedgraphconvolutionfusionmethodwashigher,whichincreasedby8.06%and22.90%respectively.Comparedwiththec
7、urrentcommonlyusedEEGandfNIRSfusionmethod,theaveragerecognitionaccuracyoftheproposedgraphconvolution fusion method was improved by 2.76%7.36%.The recognition rate of graph convolution fusionmethodincreasedby1.68%afteraddingmodalityattention.Key words:graphconvolutionneuralnetwork;electroencephalogra
8、m;functionalnearinfraredspectroscopy;modalityattention;multi-modalfusion;emotionrecognition收稿日期:20221126.网址: EEG-fNIRS 情感识别研究.orcid.org/0000-0003-3035-9420.E-mail:通信联系人:张雪英,女,教授.orcid.org/0000-0002-2035-0329.E-mail:第57卷第10期2023年10月浙江大学学报(工学版)JournalofZhejiangUniversity(EngineeringScience)Vol.57No.10
9、Oct.2023情感识别在人机交互领域具有广阔的应用前景,当前基于大脑信号进行情感识别及交互的研究得到广泛关注1.情感的产生变化和大脑皮层的神经活动2以及血氧浓度变化具有一定关联3.脑电(electroencephalogram,EEG)和功能近红外(functionalnearinfraredspectroscopy,fNIRS)具有相对便携、灵活和廉价的特性,可以同时采集互不干扰,应用前景广泛4.EEG 信号可以反映大脑皮层神经元的电活动,fNIRS 信号反映出大脑皮层的血氧浓度变化,这 2 种信号反映了大脑神经活动的不同方面,两者皆可客观地表征大脑的情感认知过程.脑电情感识别领域的研究主
10、要基于公开的DEAP5与 SEED6情感数据库.Shen 等7提出四维卷积递归神经网络方法;Cui 等8将 CNN 与BiLSTM 相结合,在 SEED 数据集上的准确率达到 94.82%;fNIRS 情感识别研究主要基于自建非公开数据库;Bandara 等9使用与 DEAP 相同的刺激材料建立 fNIRS 情感数据库;Hu 等10使用视频片段刺激建立了 fNIRS 数据库,对离散情感进行两两分类聚类,证明 fNIRS 可以区分细分的积极情绪.单模态情感识别仍存在特征提取不足及识别准确率不高的问题.因此将 EEG 与 fNIRS 进行融合,挖掘二者之间的相关性和互补性11是后期研究的重点.Su
11、n 等12提出 P 阶多项式方法融合 EEG 和fNIRS 信号,对运动想象和心算的二分类识别率相比单模态有明显提升;Deligani 等13提出基于互信息的特征选择方法,将 EEG 和 fNIRS 特征进行筛选得到融合特征集,并对 ALS 患者与健康者进行分类;王恩慧14使用 fNIRS 特征对 EEG 信号进行筛选,得到新特征集后进行情感分类;Sun 等15将 EEG 和 fNIRS 特征直接拼接之后使用 SVM 进行分类;吴文一16使用主成分分析法对拼接的EEG 和 fNIRS 特征矩阵进行降维.以上研究中双模态融合后分类识别率均显著提高.EEG 和 fNIRS 是多通道信号,若将各通道
12、作为节点,各通道特征作为节点特征,相关通道之间的关系看作边,则 EEG 与 fNIRS 实质上是图结构数据.图卷积神经网络(graphconvolutionalneur-alnetworks,GCN)是一类专门处理图结构数据的神经网络.Li 等17提出自组织图卷积模型,根据不同卷积层自动提取出脑电特征生成脑电连接图,实现情感分类.Song 等18提出动态图卷积情感识别模型,图的结构可以进行动态变化,使得图卷积层可以更好地提取 EEG 电极之间的连接信息.以上研究表明,图卷积神经网络能够有效地提取 EEG 信号各通道间连接信息.图卷积神经网络可以分为频谱域图卷积(如 GCN19、Cheb-Net
13、20)以及空间域图卷积(如 GraphSAGE21、GAT22).频域图卷积是从频域出发,参考传统的信号处理方法,引入滤波器来定义图卷积.空间域图卷积对每个节点的邻居节点进行某种方式的加权求和,得到新的节点特征.注意力机制通过对信号特征中与情感显著相关的信息分配较大的权重,来提高情感识别性能.张静等23提出频-空注意力机制,综合脑电信号在时间、空间和频率 3个维度的信息,提高情感识别的准确率.Song 等24提出注意力 LSTM,将注意力系数分别加在 LSTM的不同结构上,对 3 种生理信号分别进行特征提取,最终拼接实现多模态融合.本研究将模态注意力机制加入图卷积融合方法中,来学习不同模态不同
14、通道信号的权重.当前 EEG-fNIRS 特征级融合方法大多使用拼接、张量融合的方法,这些方法仅仅考虑不同模态特征向量整体间的融合,而忽略了 EEG 和fNIRS 各通道信号之间的差异与联系.针对当前没有公开的 EEG-fNIRS 情感数据库的现状,本研究设计实验并采集了 30 名被试在情感视频诱发下的 EEG 和 fNIRS 数据,在提出模态注意力多路图卷积模态融合方法.在 GraphSAGE 图卷积层中,引入所提的模态注意力机制,并利用 Graph-SAGE 图卷积层融合 EEG 和 fNIRS 信号各通道特征.在融合时,赋予 EEG 和 fNIRS 的不同通道以不同的权重,更加有针对性地
15、进行模态融合,从而提升情感识别率.1方法介绍1.1 数据采集如图 1 所示为数据采集与特征提取的流程图,主要包括情感电影片段选取、数据采集、信号预处理以及特征提取.情感电影片段选取EEG-fNIRS数据采集EEG 和fNIRS信号预处理EEG 和fNIRS特征提取图 1 EEG-fNIRS 数据采集与处理的流程图Fig.1FlowchartofEEG-fNIRSdataacquisitionandprocessing1988浙江大学学报(工学版)第57卷Schaefer 等25研究了电影片段在诱发情绪方面的可靠性和效率,表明带有情感的电影片段可以使受试者产生代入感,并引发情感共鸣,是良好的情感
16、激发材料.本研究初步选取包含悲伤、高兴、中性和恐惧这 4 种情感的 80 个电影片段,每种情感有 20 个电影片段.通过观看者填写 SAM问卷的方式26,在愉悦度(pleasure,P)、激活度(arousal,A)和支配度(dominance,D)3 个维度对每个视频片段进行打分,选择每种情感下与目标情感得分距离最小的前 15 个视频,经过筛选最终得到 60 个视频.共有 30 名被试(15 男,15 女,平均年龄 24.11.5 岁,视听力均正常,均为右利手)参与实验数据录制.参与录制前每位受试者均填写了个人基本信息以及知情同意书.受试者被要求头上佩戴脑电-功能近红外测量帽,坐姿调整到舒适
17、的位置,认真观看即将开始的电影片段,并尽可能避免明显的动作.实验在屏蔽室中进行.根据国际 10-20 系统,使用 ESINeuroScan 系统从 62 通道电极帽以 1000Hz的采样率记录脑电信号;根据设计的光极位置,使用慧创医疗设备公司研发的 NirSmart 便携式近红外脑功能成像系统以 11Hz 的采样率记录受试者额叶和颞叶的功能近红外信号.2 种信号记录同时进行.如图 2 所示,一个受试者的实验总共有 60 次.每次试验中播放一段视频,视频时长 12min,视频结束之后的 30s 填写自我评估表,以确认视频片段是否成功激发对应情感.实验 1实验 2实验 k实验 59实验 6012
18、min情感电影片段 30 s自我评估打分图 2 EEG-fNIRS 情感数据的采集流程Fig.2CollectionprocessofEEG-fNIRSemotionaldata1.2 特征提取对于采集的脑电信号和功能近红外信号,需要预处理后才能进行下一步的特征提取.对于脑电信号要进行信号重参考、去基线以及 0.150.0Hz滤波处理,再使用独立成分分析(independentcom-ponentanalysis,ICA)去除脑电信号中的伪迹,并将信号降采样至 200Hz.将脑电信号划分为 5 个频段:(14Hz),(48Hz),(814Hz),(1430Hz),(3050Hz),随后对每个频
19、段的脑电信号提取特征.对于采集的 fNIRS原始光密度信号进行基线校正以及 0.010.20Hz带通滤波,通过修正的 Beer-Lambert 定律27计算得到氧合血红蛋白(HbO)以及脱氧血红蛋白(HbR)浓度变化.分别计算每个频段的特征.功率谱密度(powerspectraldensity,PSD)28表示脑电信号在不同频段的平均能量:PSD=?w+z()exp(j2f)d?2.(1)zf式中:为脑电信号,为时间,为频率.使用快速傅里叶变换(fastfouriertransform,FFT)计算信号的离散傅里叶变换(discretefouriertransform,DFT),使用 200
20、个采样点的窗估计得到每个频段的功率谱密度.微分熵(differentialen-tropy,DE)29是脑电信号的一种非线性特征,是香农信息熵在连续变量上的推广形式,即DE=w+P(z)ln(P(z)dz.(2)P(z)式中:为概率密度函数.z N(,2)假设脑电信号服从正态分布:,微分熵特征计算式为DE=w+12exp(z)222ln12exp(z)222 dz=12ln2e2.(3)式中:为标准差,为均值,e 为常数.与脑电信号不同,fNIRS 信号的变化是相对缓慢的.为了适应这一特点,采用均值、最大值、最小值、线性回归斜率以及方差这 5 个统计特征点作为 fNIRS 信号的特征集.均值反
21、映 HbO/HbR浓度水平;最大值、最小值反映 HbO/HbR 浓度曲线本身的特点;方差反映 HbO/HbR 浓度的波动情况;线性回归斜率则反映 HbO/HbR 浓度整体变化趋势.EEG 与 fNIRS 信号均按 1s 分段,最后得到EEG 的特征矩阵大小为 4845625,得到 fNIRS的 HbO/HbR 特征矩阵大小为 4845185.1.3 EEG-fNIRS 图数据构建A为了能够将数据输入图卷积神经网络,必须将 EEG 和 fNIRS 信号转为图结构数据.图结构数据是节点和边的集合,记为 G=(V,E),其中 V 为节点的集合,E 为边的集合.将 EEG 和 fNIRS 信号的每个通
22、道看作节点,每个通道求得的特征作为节点特征,得到特征矩阵 X;将通道与通道之间的连接关系作为边,求得邻接矩阵,这样就将 EEG和 fNIRS 信号抽象为图结构数据.图结构数据的特征矩阵 X 由提取的脑电 DE、第10期赵卿,等:基于模态注意力图卷积特征融合的 EEG 和 fNIRS 情感识别J.浙江大学学报:工学版,2023,57(10):19871997.1989APSD 特征以及 fNIRS 统计特征所构成.邻接矩阵通过计算两两通道信号之间的皮尔逊相关系数得到.Bao 等30将皮尔逊相关系数作为图卷积网络的邻接矩阵,在 EEG 情感识别中取得较好效果.皮尔逊相关系数可以度量 2 个时间序列
23、之间的相关性,计算式为a,b=Cov(a,b)ab=gi=1(aia)(bib)gab.(4)式中:为相关系数,a、b 分别为 2 个通道的特征向量,Cov(a、b)为向量 a 和 b 的协方差,g 为向量中元素的个数.由于 EEG 和 fNIRS 是 2 种不同采样率的信号,对 EEG 原始信号进行平均降采样至11Hz,使之与 fNIRS 信号的采样率一致;利用皮尔逊相关系数计算每 1s 信号两两通道之间的相关性,并构建 EEG-fNIRS 通道邻接矩阵.Achard等31指出在稀疏的 fMRI 脑网络中,当实际连接数等于全部可能连接数的 20%时,通常会最大限度地提高网络拓扑的效率;当选择
24、保留 EEG-fNIRS 邻接矩阵全部连接的 20%时,由于直接选取全局最相关的 20%连接,连接可能会聚集于某个区域,同样重要但相关系数稍微较弱的区域可能被忽略.整个邻接矩阵分为 EEG-EEG、fNIRS-fNIRS 以及EEG-fNIRS 子矩阵,分别在每个子矩阵中选取相关系数最大的前 20%连接进行保留,最终得到图数据特征矩阵 X(4845985),邻接矩阵 A(48459898),两者之间一一对应.1.4 图卷积融合模型如图 3 所示为 MA-MP-GF(modalityattention-multipath-graphconvolutionfusion)双模态融合情感识别框架.将
25、EEG 和 fNIRS 构建为图结构数据,计算各通道特征和各通道的相关性关系,分别以节点特征矩阵和邻接矩阵的形式输入 MA-MP-GF 模型中实现 2 种模态的融合情感识别.本研究提出基于多路模态注意力图卷积融合的情感识别模型 MA-MP-GF,如图 4 所示,依次由图特征提取、图特征融合以及分类器模块构成.EEG 信号fNIRS信号EEG-fNIRS图数据MA-MP-GF模型识别结果图 3 双模态融合情感识别框架Fig.3Frameworkofbimodalfusionemotionrecognition1.4.1图特征提取模块GraphSAGE21图卷积是一种空间域图卷积,其算法的核心在于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 注意 力图 卷积 特征 融合 EEG fNIRS 情感 识别
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。