分销赏收藏举报申诉 / 10

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于BERT与注意力机制的方面级隐式情感分析模型.pdf

基于BERT与注意力机制的方面级隐式情感分析模型.pdf

上传人：自信****多点

文档编号：1878241

上传时间：2024-05-10

格式：PDF

页数：10

大小：5.85MB

《基于BERT与注意力机制的方面级隐式情感分析模型.pdf》由会员分享，可在线阅读，更多相关《基于BERT与注意力机制的方面级隐式情感分析模型.pdf（10页珍藏版）》请在咨信网上搜索。

1、D0I:10.13878/ki.jnuist.20220914001杨春霞卓韩煜除陈启岗马文文基于BERT与注意力机制的方面级隐式情感分析模型摘要在方面级情感文本中存在部分不含情感词的评论句，对其情感的研究被称为方面级隐式情感分析.现有分析模型在预训练过程中可能会丢失与方面词相关的上下文信息，并且不能准确提取上下文中深层特征，本文首先构造了方面词感知BERT预训练模型，通过将方面词引入到基础BERT的输入嵌入结构中，生成与方面词信息相关的词向量；然后构造了语境感知注意力机制，对由编码层得到的深层隐藏向量，将其中的语义和句法信息引入到注意力权重计算过程，使注意力机制能更加准确地分配权重到与方面词

2、相关的上下文.对比实验结果表明，本文模型的效果优于基线模型.关键词方面级情感分析；隐式情感分析；门控循环单元；注意力机制;BERT模型中图分类号TP391文献标志码A收稿日期2 0 2 2-0 9-14资助项目国家自然科学基金（6 12 7 32 2 9,51705260）；江苏省高校青蓝工程创新团队作者简介杨春霞,女，博士，教授,研究方向为自然语言处理韩煜（通信作者），硕士生，研究方向为自然语言处理1南京信息工程大学自动化学院/江苏省大数据分析技术重点实验室/大气环境与装备技术协同创新中心，南京，2 10 0 440引言方面级情感分析（Aspect-BasedSentimentAnalysi

3、s，A BSA）属于情感分析中的细粒度任务，目的在于预测评论中某个具体方面的情感极性.互联网的高速发展大大提升了舆论的产生和传播速度,评论中所包含的情感指向性和应用价值也成为关注的热点2.在常见的评论句中，存在着不少没有明确情感词的评论，却依旧可以清晰地表达情感.为了与带有明显情感倾向词的方面级显式情感区别开，将此类文本命名为方面级隐式情感.例如 HavingUSB3is whyIbought thisMini.句中方面词 USB3并没有对应的情感词，但仍可以清楚地感受到对该方面的积极情感.如今互联网中存在大量类似的委婉评论，而开展方面级隐式情感分析研究可以有效提升对这些评论的理解，从中获得的

4、数据可用于舆论分析、商品价格预测、民众心理分析等.相比于显式情感,隐式情感的研究主要有以下两个难点：一是缺乏情感词导致情感语义特征不易识别；二是隐式情感与上下文中的主观表达联系更加紧密，导致对语义的理解难度加大.早期隐式情感分析的研究主要基于构建隐式情感数据集或者构建隐式情感词典.Russo 等3提出在研究的语料中存在着隐含的情感极性,并提供了隐式情感数据集.Choi等4通过构造相应的EffectWordNet情感词典，检测到语料中的隐式情感.然而情感词典存在着更新代价大、效率不高等缺点，因此已经逐渐被更加高效的神经网络模型所取代.为了方便提取句子中的语义信息，目前隐式情感研究通常会对输入句进

5、行词向量化处理.词向量模型主要分为静态和动态两种.静态词向量模型的主要功能是为每个词提供固定的词向量，如Word2Vec5和Glove模型,但它们不适用于一词多义的文本,因此出现了动态词向量模型.动态词向量模型能够依据同一个词在不同语境中与其他词之间的联系而建模,并生成对应的词向量,如 ELMo7模型.近年出现的预训练模型如BERT(Bidirectional Encoder Represen-tations fromTransformers）8 也属于动态词向量模型，Li等9 利用BERT预训练模型和外部语料库知识来增强模型识别情感语义特征的能力,将方面级文本中的显式与隐式情感标签相匹配,有

6、效地捕获了上下文中的隐含情感知识，得到了更好的方面级隐式情感分类结果.但是该模型需要额外添加方面词遮掩任务才能感知方面词信息，这导致其在使用BERT进行预训练的过程中可能会丢失与方面词相杨春霞，等.基于BERT与注意力机制的方面级隐式情感分析模型.552YANG Chunxia,et al.Aspect-based implicit sentiment analysis model based on BERT and attention mechanism.关的上下文信息,并且在后续的编码过程中很难弥补这种损失.上下文感知模型与注意力（Attention）机制相结合的方法也在隐式情感分析中取得

7、了不错的效果，其主要原理是先对句子中的上下文信息进行建模，再依据不同信息的权重去度量它们的重要程度.Klinger等10 1 提出一个共享任务，对一个自动标记的Twitter数据集，要求系统在不需要捕获情感词特征的情况下能够识别其中的情感极性，参赛的前三名都采用BiLSTM与注意力机制相融合的模型，而他们的区别在于：Balazs等1采用基于深层的语境化（ELMo）表示编码词语信息；Chronopoulou等12 使用预训练模型的权重来初始化网络的特定层;Rozental 等13在大规模文本的基础上训练语言模型并获取词向量作为输入.此外在方面级显式情感分析中，杨春霞等14融合深度双向门控循环单元

8、（Deep Bi-directional Gated Recurrent Unit,DBGRU）与注意力机制进行情感分类任务，通过实验说明DBGRU能更加高效地提取深层语义特征.受其启发,本文尝试将DBGRU与注意力机制相融合，用于提取方面级隐式情感中的深层特征.然而一般注意力机制存在无法有效利用深层特征中语境信息的缺点，导致其不能准确提取与方面词相关的深层情感特征。本文提出一种融合深度双向门控循环单元及语境感知注意力机制的方面词感知BERT(DeepBi-di-rectional Gated Recurrent Unit Context-Aware AttentionAspect-Aware

9、 BERT,DCAB模型，主要贡献如下：1)本文改进了基础BERT的输入嵌人部分，构造了方面词感知BERT（A s p e c t-A w a r e BER T，AABERT），对句子中方面级隐式情感语料进行了预训练编码.AABERT将方面词作为输入句的相邻句进行预测,通过下一句预测任务，能够在预训练过程中有效捕获与方面词相关的上下文信息，最终获得与方面词相关的动态词向量表示.2)本文构造了一种语境感知注意力（Context-AwareAttention，C A T）机制，用于关注深层情感特征中与方面词相关的重要信息.对于由DBGRU编码器得到的深层特征向量，CAT机制在一般注意力机制的权重

10、参数中引入了深层语境信息，并添加了一个学习参数来明确每一个隐藏特征向量和深层语境信息对注意力权重大小的影响，有效地捕捉了深度上下文中与方面词相关的语义信息和句法信息。1DCAB模型本文提出的DCAB模型的结构框架如图1所示，主要组成部分如下：1)词嵌人层：将输人文本通过AABERT模型进行预训练，生成与方面词相关的动态词向量2)DBGRU词向量编码层：将AABERT词向量输入到DBGRU编码器中，提取包含上下文信息的深层特征向量,其中高层的隐藏特征包含上下文中的语义信息，低层的隐藏特征包含上下文中的句法信息.3)CAT机制层：将DBGRU编码器输出的深层特征向量作为输人，使用CAT机制更加准确

11、地关注上下文中与方面词相关的隐藏特征信息.4)输出层:对CAT机制层输出的特征向量使用Softmax分类器进行不同情感类别概率的计算.1.1词嵌入层BERT模型主要由输人嵌入、双向Transformer编码器15和无监督任务三部分构成，其主要原理是通过额外添加的输出层结合语境进行语义微调，能够联合所有层级中的上下文单词训练双向语义表示16.其中：输入嵌入负责对输入句子进行标记处理；Transformer编码器是BERT的核心部分，由输入、自注意力和前馈神经网络组成，负责捕捉上下文中各个词之间的特征信息；无监督任务负责对Transformer编码器输出的隐藏向量进行预训练.而自注意力部分是Tra

12、nsformer中最重要的模块，它能够将文本中的每个输入单词依次与其他单词进行建模，从而直接捕获隐藏层状态之间的依赖关系【17.随后将得到的隐藏向量再传递到前馈神经网络部分，进行求和、归一化与前向反馈等流程后,最终得到输出词向量。方面级隐式情感分析任务的目的是预测句子中给定方面所表达的情感，然而传统的BERT模型无论是输人嵌人、Transformer编码器还是无监督任务部分中都没有能够感知方面词的结构设计，这导致其在预训练过程中可能会丢失与方面词相关的上下文信息.为了解决这个问题,本文考虑从BERT的内部结构进行改进，使其获得方面词感知能力.但在实际情形中发现Transformer编码器和无监

13、督任务部分的结构设计紧凑、逻辑严谨、修改难度较大，如果添加的参数过多很可能会导致模型的复杂度大幅增加，出现过拟合现象，反而会降低原有的优秀建模能力；而输入嵌人部分结构则较为灵活，由于直接与输南京信息工统大学学报（自然科学版),2 0 2 3,15(5):551-56 0Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(5):551-560553OutputLayerAttentionLayerSoftmax.Context-Aware Attentio

14、n4-GRUDBGRURUCRULayerCRUCRUGRU个GRUCRUGRUCRUCRUCRUGRUGRUCRUCRUGRUGRUGRUCRUGRUGRUGRUCRUCRUGRUCRUGRUGRUCRUCRUGRUTransformersTransformersWordEmbeddingsLayerQuick人句子接触，添加方面词信息更加方便，且在修改的过程中不会影响到BERT原有的建模能力.因此为了使BERT在拥有方面词感知能力的同时保持其优秀的语言建模功能，本文通过修改输人嵌人部分，将BERT调整为能够感知上下文中与方面词相关信息的 AABERT.AABERT的改进主要分为三个步骤：首

15、先,对于输人句子s=w1,w2，,w,，每次输人结束时的标点符号（比如句号）可以认为是一个弱分隔符，同时将给定的方面词插入到标点符号和最后的结束标记（SEP）之间，在标记嵌人（Token Embeddings）过程中对所有输人词汇（包括正常词汇和特殊符号)进行嵌入，就能生成对应的标点符号和方面词的位置标记，即提供了一个给定方面词的感知信号.其次在输入中再采用一个显式分隔符SEP来分隔输人的句子和方面词，进一步加深给定方面词的信号，它在位置嵌入（PositionEmbeddings）中的初始化标TransformersTransformersAspect-Aware Input Embeddin

16、gs个8andTransformersTransformers88hasbuilt图1DCAB模型结构Fig.1 Structure of DCAB model记与句尾的SEP设置相同.最后将方面词的片段嵌入（SegmentEmbeddings）标记与前句的片段嵌人标记分别设置为A、B,即在嵌入过程中将前句与方面词视为两个不同的句子.其输人部分结构如图2所示.改进后,输人句的格式被设置为I=CL S+W+SEP+w a s p e e t+SEP.在预训练过程中,先将输入句嵌人I.输人到Transformer编码器中进行编码,其过程如式(1）所示：Xk,Xaspect=TransEnc(I,)

17、其中，x;为输人句单词的隐藏输出向量，xaspet为方面词的隐藏输出向量.再将得到的隐藏向量送入掩码语言模型（Masked Language Model,MLM）和下一句预测（NextSentencePrediction，NSP）两个无监督任务中来完成词向量的预训练8.MLM会随机对单词遮掩（mask），让模型通过语境学习被遮掩的单词，它很好地利用了语境中的信息，但是不能直观地TransformersTransformers8inviruscontrol(1)杨春霞，等.基于BERT与注意力机制的方面级隐式情感分析模型.554YANG Chunxia,et al.Aspect-based im

18、plicit sentiment analysis model based on BERT and ttention mechanism.aspectInputTokenEmbeddingsSegmentEmbeddingsPositionEmbeddings判断文本对之间的逻辑关系.而 NSP 解决了这个问题，它通过判断后句即方面词是否为前句的下一个句子，挖掘了句子之间的逻辑关系，最终捕获了与方面词相关的词向量表示1ei,e2,e,.1.2深度双向门控循环单元编码层门控循环单元(Gated Recurrent Unit,GRU)4是由长短期记忆网络（Long Short-Term Memor

19、y，LSTM)改进而来的,它能够获取文本语境中的语义信息，并且相比于LSTM拥有更高的信息获取效率。但是GRU只能传递某一时刻中词向量序列的语义信息，忽略了全局文本中的语境所带来的影响，而BiGRU解决了这个问题，它由正反向 GRU最后一个状态向量连接而成，可以提取正反向时间序列中的隐藏状态.DBGRU由多层BiGRU叠加而来，其中每层BiCRU的输出将作为下一层的输入.本文采用由两层BiGRU组成的DBGRU来进一步挖掘方面级隐式情感语料中的深层语义信息.GRU的更新公式如下：zr=g(W,e,+U,hr-1+b,),r,=g(W,e,+U,hr-1+b,),h,=tanh(We,+U(r,

20、Oh-1)+bh),h,=z,Ohr-1+(1-z,)Oh,其中：z,r,分别为t时刻的更新门和重置门的输出向量;为sigmoid激活函数;W,W,W,U,U,U为权重矩阵;b,b,bh为偏置项;e,为t时刻的输入向量;ht,ht-1分别为t时刻和t-1时刻的细胞输出;h,为t时刻细胞的隐藏层输出；为Hardamard乘积运算.BiGRU的计算公式如下：h,=-CRU(h.1,e,),CLS+EAE+EEThepriceEpriceisEEAE图2AABERT输人序列Fig.2AABERT input sequenceh,=CRU(h1,e,),h,=h,h,DBGRU每个单元如下：hi-CR

21、U(hL,h),hT=CRU(h,hr-1),h=hi,h,其中：h-与h-分别是t时刻第n1层CRU与CRU的输出;h与h分别是t-1时刻第n层CRU与CRU的输出;h与h；分别是t时刻第n层GRU与CRU的输出;h为第n层BiGRU的最终输出向量,1.3请语境感知注意力机制在方面级语料中往往存在着不少具有情感倾向的词汇，它们对方面的情感极性有着不小的影响.为了提高情感分析的准确率,以往模型通常会采用一般注意力机制捕捉这些情感特征并分配其较大权重，其注意力权重向量u，计算过程如下：(2)un=tanh(W,h+bh),(3)其中：tanh为激活函数；WheRx为可训练的权重(4)参数矩阵，d

22、为单词嵌人的维度;bh为偏置项.本文在(5)应用一般注意力机制后发现分析效果不太理想，原因可能是：1）本文研究的方面级隐式情感语料与普通的方面级情感语料最大的不同在于句子中没有明显的情感词,这会导致一般注意力机制无法准确地捕获相关词向量;2)DBGRU得到的特征向量为多层,其中含有不同类型的语义和句法信息，而一般注意力权重向量uh仅由一个可训练的参数矩阵Wh控(6)制，错失了有效利用这些深层语境信息的机会.由于200EAE4dollarsEE,downEdownEAE。SEPE.EEPEEE,EpriceEpriceE干E(7)(8)(9)(10)(11)(12)SEPE南京信息工统大学学报（

23、自然科学版),2 0 2 3,15(5)：551-56 0Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(5):551-560注意力机制中最重要的部分是计算权重系数，权重系数越高，此部分信息越重要.因此，为了有效突出方面级隐式情感文本中隐含的重要信息，本文对一般注意力机制进行了改进,将DBGRU中的多层语境信息引人到权重参数中,从而构造了CAT机制.CAT的结构如图3所示.Context-AwareAttention555而导致模型梯度过小的问题由此

24、可以得到新的语境感知注意力权重向量：a,=tanh(W,h+bn).继续对权重向量进行归一化处理后,就可以得到关于特征h，的注意力分数t，再将注意力分数与深层特征矩阵H(H=h,h,h）中的子向量进行加权计算求和,可以得到文本特征向量Shexp(an),=(16)(17)(18)：CTThe图3语境感知注意力网络结构Fig.3 Context-aware attention network structureW,=(1-入)W,+入,CUu,入=g(W,Vh+CU.V.),C=C,.,Ccl-,其中：W，=R d 为语境感知注意力的权重参数矩阵;表示 sigmoid 逻辑函数;入，RxI 为调

25、节W,大小的学习参数;U R(-1)ax,V,=RaxI 和 V。eRx1为可训练的参数矩阵;C=R(l-1)为语境矩阵,I为BDGRU编码器输人的特征向量h,的层数,其中高层的隐藏状态可以提供语境的语义信息，低层的隐藏状态可以提供语境的句法信息.假设特征矩阵第1层为当前输入层，注意力机制在分配权重时,通过将输入层下面第1到第l1层的语境特征,Cl-引人到权重参数矩阵中,使其在感知输人层信息的同时，还能感知到与输人特征相关的深层语义和句法信息，从而更加精准地分配注意力权重到特征向量上。此外,本文还在新的权重参数W,中分配了一个学习参数入w，它的作用是明确量化每个隐藏表示与语境矩阵C对注意力权

26、重预测的贡献.参数入自身也受到原参数矩阵W,和语境矩阵C的影响,这样设计的好处在于不仅能对注意力权重的分配实现更加精准地控制,还能使注意力机制在面对不同上下文时的建模更加灵活.与此同时，本文将学习参数入的值限定为1,1,可以有效预防因W,量级过大：priceis：200dollars1：down(13)(14)(15)=11.4输出层本文将CAT机制输出的特征向量Sh输人到Softmax分类层中,并计算其在不同情感极性中的概率,其计算过程如下：g=Softmax(Ws,+b),其中，W为权重矩阵,b为偏置项,g为模型最终的输出向量.此外，选用了基于L2正则化的交叉熵损失函数作为损失函数，其计算

27、过程如下：l=-ZZg ln(g)+l?l,iEDjEE其中i为数据样本的索引,j为情感类别的索引,D为训练集的容量大小,E为数据集的种类数，g为实际情感极性，g为模型预测的情感极性，入为L,正则化参数，为模型中需要训练的参数，入为交叉嫡正则项.2实验2.1实实验数据集与实验环境本文选取的方面级隐式情感数据集来自SemE-val2014task4数据集18 中的隐式情感语料.其中：Restaurant主题中的隐式数据占比达2 7.47%，被称为餐厅隐式情感表达（Restaurant Implicit SentimentExpression,Rest_ISE）;L a p t o p 主题中的隐

28、式数据占比达30.0 9%，被称为笔记本电脑隐式情感表达(Laptop Implicit Sentiment Expression,Lap_ISE).这些数据说明ABSA数据集中广泛存在隐式情感语料，值得研究.此外，为了保证本文模型能够充分捕捉方面级隐式情感的特征，引人了数据集Yelp和Ama-zon19用于AABERT的预训练.以上数据集都将语料标记为积极、消极和中性三种情感极性.其具体数据(19)(20)杨春霞，等.基于BERT与注意力机制的方面级隐式情感分析模型.556YANG Chunxia,et al.Aspect-based implicit sentiment analysis

29、model based on BERT and ttention mechanism.分布如表1所示.某些神经元的激活值以一定的概率停止工作,在一定程度上可以避免过拟合现象.由对比实验可知，表1数据集中的样本标签分布DCAB模型的Dropout取值为0.1时模型的准确率Table 1 Sample label distribution in datasets较高,其原因在于当Dropout值设置过小时，缓解过数据库积极Rest_ISE-训练集619Rest_ISE-测试集174Rest_ISE793Lap_ISE-训练集305Lap_ISE-测试集93Lap_ISE398Yelp117x104

30、Amazon38104本文的实验环境如表2 所示.表2 实验环境Table 2Experimental environment实验环境操作系统显卡内存开发语言开发平台2.2实实验参数与评价指标模型提取方面级隐式情感特征的能力不仅与自身的设计结构相关，还会受到参数设置的影响，合理的参数能够有效提升模型的实验效果,因此参数调优是实验过程中不可或缺的一个步骤.本文在数据集Rest_ISE上以对实验结果影响较大的可调参数随机失活率(Dropout)与DBGRU隐藏层参数维度为例进行分析，使用控制变量法，在两种参数上分别选取了10 个大小不同的指标进行对比，每个指标进行了10次反复实验并计算准确率的平均

31、值作为结果.本文从对比实验中选取了具有代表性的5个指标,其实验结果如表3所示.表3参数设置对准确率的影响Table 3 Effect of parameter setting on accuracyDropout0.050.10.30.50.8Dropout在模型训练阶段的前向传播过程中,让消极18146227142461883910413104具体信息Microsoft Windows 10(64位)NVIDIA GeForce RTX 306016 GBPython 3.8Pytorch 1.6.0准确率/%DBGRU隐藏维度准确率/%63.143268.526468.2312866.86

32、25662.16512中性2304727726735302总计1 03026712977141748881561045110462.8767.3168.5266.3460.58拟合现象的能力并不强，而当Dropout值设置过大时，又会使激活值失活较多从而丢失部分特征，导致准确率下降.DBGRU的隐藏层参数维度即提取到的特征维度，由对比实验可知，当隐藏层参数维度设置为12 8 时模型效果较好，其原因在于当隐藏层参数维度过小时，模型的特征提取能力较弱，而当维度过大时,可能会出现过拟合现象,并且模型的训练时间大大增加。经过对比实验确定DCAB模型的参数后,在数据集Rest_ISE上对模型进行训练.由

33、于本文模型使用了12 层Transformer，多头自注意力的个数为12，因此AABERT的隐藏层参数维度为7 6 8.当模型参数迭代至最优时需要大约4个Epoch，并且使用了Adam优化器进行优化.模型整体参数如表4所示.表4实验参数Table 4Experimental parameters参数值AABERT_维度768Transformer_层数12DBCRU_维度128Dropout0.1本文选取了准确率（Accuracy,A）和F1值作为模型的评价指标，具体公式如下：TPP=TP+FPTPR=TP+FNTP+TNA=TP+FP+TN+FN2PRF1=P+R2.3对比模型由于目前隐式情

34、感分析研究较少，本文选用了一些常见的显式情感分析模型作为对比模型的补充.对比实验具体模型如下：1)TD-LSTM20:模型将目标信息合并到LSTM中，对句子中的目标及其上下文进行建模。2)IIIDYT1：采用基于深层语境化（ELMo）的嵌人方法，将得到的词向量表示传递到BiLSTM中，参数学习率Batch_sizeEpochs优化器值5E-5164Adam(21)(22)(23)(24)南京信息工经大学学报（自然科学版),2 0 2 3,15(5)：551-56 0Journal of Nanjing University of Information Science&Technology(N

35、atural Science Edition),2023,15(5):551-560再结合注意力机制去提取相关的隐式语义信息.3)RAM21:该模型使用GloVe嵌入,将得到的词向量传递到DBLSTM中编码，再使用注意力机制捕获深层语义特征中的重要信息，最终识别评论句中方面词的情感极性.4)GloVe+BiGRU+Attention(GBA)2 一种融合了BiGRU和注意力机制的模型，能够在love词嵌人过程中保留方面词向量的位置信息并消除其位置嵌人.5)Amobeel13 使用 Transformer 遍码器进行预训练，将得到的词向量传递到BiLSTM与注意力机制相结合的框架中分析隐式语料的

36、情感极性.6)BERT+BiCRU+Attention(BBA)23:该模型将BERT模型作为输人层,BiCRU模型作为隐藏层，再结合注意力机制提取其中的重要隐式情感特征,最后用Softmax作为输出层来进行情感分类.2.4实验结果与分析对比实验的结果如表5所示.由表5可知,在数据集Rest_ISE和Lap_ISE中，本文提出的DCAB模型的准确率和F1值均高于其余基线模型，说明DCAB模型的性能要优于其他基线模型.TD-LSTM仅对目标词及其上下文进行建模,IIIDYT在BiLSTM的基础上加人了注意力机制，在提取上下文隐式情感特征的同时关注了其中与方面词相关的重要信息,因此性能要优于TD-

37、LSTM.RAM在IIIDYT的基础上使用DBLSTM代替BiLSTM作为模型的编码器，它能够提取文本中更深层次的语义特征,所以效果较IIIDYT有所提升.而 GBA使用了BiCRU对词向量进行建模,BiGRU相比BiLSTM参数更少更容易收敛,因此GBA模型的精度在一定程度上要优于IIIDYT模型.另外，Amobee和BBA模型都是基于BERT或Transformer结构的模型，Transformer相比于RNN能直接并行计算序列数据,为不同的头分配不同的任务，从而更好地捕捉上下文中隐藏层状态之间的依赖关系,因此性能较其他仅使用 RNN 结构的模型有了较大提升，进而也说明本文使用AABERT

38、作为预训练模型是合理的.本文提出的DCAB模型在两个数据集上相比性能最优的基线模型BBA准确率分别提升2.6 0 和1.28个百分点；F1值分别提升4.16 和1.58 个百分点.其原因在于DCAB模型改进了提取与方面词相关的上下文信息的方法，即使用AABERT预训练模557表5对比模型分类结果Table 5Comparison of model classification results%Rest_ISE模型PRF1APRF1TD-LSTM54.64 53.71IIIDYT57.87 56.37 58.2256.2355.8155.8756.83RAM60.3555.25GBA58.35

39、59.01 60.89 56.56 64.22 65.15 65.95Amobee62.77 62.74 63.21 62.54 69.59 70.13 71.14BBA66.53 64.29 67.33 65.92 77.37 73.65 78.89DCAB70.36 70.55 71.49 68.52 79.26 76.31 80.47型生成与方面词相关的词向量，AABERT在基础BERT的输人嵌人结构中引入了方面词,通过在标记嵌入、位置嵌人和片段嵌入中设置特殊标记格式从而加强方面词的信号，使模型获得方面词信息的感知能力,并且构造了语境感知注意力机制学习上下文中与方面词相关的深层特征，CA

40、T机制在分配注意力权重时能够感知上下文隐藏状态中的语义信息和句法信息，更加精准地关注与方面词相关的深层信息.综上所述,DCAB模型是有效的,不仅能够在预训练过程中保留与方面词相关的上下文信息，还能准确提取上下文中与方面词相关的深层特征信息.2.5模型分析实验2.5.1不同词向量对模型性能的影响为了验证AABERT预训练模型对文本向量化表示的能力，本文将DCAB中的AABERT词向量模型分别替换为GloVe、EL M o、BER T,并在Rest_ISE数据集上进行对比实验，结果如图4所示.由图4可知：GloVe作为静态词向量模型,针对每个输入单词会生成固定的词向量，忽略了一词多义的情况,因此效

41、果较差;ELMo是一种动态词向量模型,它将输人句传递到BiLSTM中,生成的词向量包含了上下文语义信息,所以其性能要优于 GloVe；BERT使用了双向Transformer语言模型，并结合MLM和NSP任务，从而生成动态词向量，能够有效解决一词多义的问题，因此效果要优于ELMo;AABERT在BERT的基础上对输人嵌人部分进行了改进，在引入方面词的同时加强了其信号，使模型获得了方面词相关信息的感知能力，因此性能要优于BERT.综上，这组实验说明了AABERT模型的优越性。2.5.2不同注意力机制对模型性能的影响为了验证语境感知注意力机制的有效性，本文Lap_ISE52.9237.6848.2

42、460.8057.8160.6673.4375.3676.64A杨春霞，等.基于BERT与注意力机制的方面级隐式情感分析模型558YANG Chunxia,et al.Aspect-based implicit sentiment analysis model based on BERT and attention mechanism.74口Acc/%F1/%7270%68666461.876261.17605856Fig.4Comparative experimental results ofword embedding models移除注意力机制，建立了AD（A A BER T+D BG

43、R U）模型；使用传统的注意力机制代替CAT机制，建立了ADA（A A BER T+D BG R U+A tte n tio n）模型.对比实验结果如图5所示.一一Rest_ISE上的准确率A一Rest_ISE上的F1值8580上75.837571.917065.3365上64.3760AD图5注意力机制对比实验结果Fig.5Comparative experimental results of attention mechanism由图5可知，在两个数据集Rest_ISE和Lap-ISE中,DCAB模型的准确率和F1 值相比 AD 和ADA模型均有所提升，这说明DCAB模型的效果相较于AD和

44、ADA模型要更加优秀.AD模型仅提取词向量中的深层上下文语义特征,效果较差；ADA模1.I will upgrade the ram myself(because with this model you can you can do it)later on.2.If you ask me,for this price it should be included.3.I hope to edit this in the next few hours,I am going to try to install my own copy of Windows 7.4.I charge it at nig

45、ht and skip taking the cord with me because of the good battery life.5.I could not find a phone number anywhere to call an actual live person for tech support andhad to result the their online chat.型在AD模型的基础上还关注了上下文语义特征中71.49的重要隐式情感特征,效果次之;而DCAB模型在68.52AD模型的基础上使用的CAT机制不仅能够提取上66.1566.1163.6462.43GloV

46、eELMo词嵌人模型图4词嵌人模型对比实验结果一日一Lap_ISE上的准确率Lap_ISE上的F1值80.4777.65?73.1874.2171.49A68.5268.5264.85ADA对比模型Table 6 Contrast of aspect-based implicit emotional sentences方面级隐式情感句实际情感DCAB积极积极消极消极中性中性中性中性中性消极下文中的重要隐式情感特征，还能充分挖掘深层特征中所包含的语义信息与句法信息.这组实验结果说明了语境感知注意力机制的优越性.2.5.3实例分析BERTAABERTDCAB表6 方面级隐式情感句对比为了进一步分析

47、DCAB模型捕获的深层隐式情感特征在方面级隐式情感分析中的有效性，本文选取数据集中的几个例句,将本文的DCAB模型与RAM和BBA模型进行实例对比分析,结果如表6 所示.句子中存在的方面词已用下划线标出，其中加粗的单词需要判断隐式情感极性.从表6 中可以看出,第1及第2 句中只存在1个方面词,第4及第5句中存在2 个方面词.由第1和第2 句可知，对情感极性为积极或消极的方面级隐式情感句的判断准确率较低,难度较大,但是本文提出的DCAB模型相比RAM和BBA模型在积极或消极情感句上的性能最优.由第3句可知,3种模型在中性情感句上的判断都比较准确.由第4句可知，RAM和BBA模型准确率较低,本文推

48、测可能是由于存在着显式情感词 good修饰方面词 battery life，影响了方面词 cord隐式情感极性的判断;而DCAB的效果较好,其原因在于CAT机制能够关注与给定方面词相关的上下文特征信息，并忽略其他方面词的信息.综上，本文提出的DCAB模型在方面级隐式情感分析任务上有效提高了深层隐式情感特征提取的准确性.虽然本文模型在总体效果上有一定的提升，但也引人了一些新的问题.由第5句可知，当句子中存在着两个隐式情感的方面词时,DCAB模型会将方面词 online chat的情感极性误判为消极,可能是受到了整个句子消极情感的影响，这是本文模型的局限所在.BBA中性中性中性中性中性中性积极积极

49、中性消极RAM南京信息工经大学学报（自然科学版),2 0 2 3,15(5)：551-56 0Journal of Nanjing University of Information Science&Technology(Natural Science Edition),2023,15(5):551-5603结束语为解决现有模型可能会在预训练过程中丢失方面词信息和提取深层特征信息不准确的问题，本文提出DCAB模型.首先通过AABERT生成与方面词相关的词向量,再通过DBGRU进行编码,接着使用CAT机制感知深层隐藏特征中的语义信息和句法信息，提取上下文中与给定方面词相关的深层特征信息.方面级隐

50、式情感分析的对比实验结果表明，DCAB模型性能优于基线模型.本文没有考虑到更大范围语境的影响，下一步将研究句子层面的信息是如何影响隐式情感的.参考文献References1李胜旺，杨艺，许云峰，等.文本方面级情感分类方法综述J.河北科技大学学报,2 0 2 0,41（6）：518-52 7LI Shengwang,YANG Yi,XU Yunfeng,et al.A survey oftext aspect-based sentiment classification J.Journal ofHebei University of Science and Technology,2020,41(

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 BERT 注意力机制方面级隐式情感分析模型

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。