分销赏收藏举报申诉 / 8

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于知识增强的方面级情感分析方法.pdf

基于知识增强的方面级情感分析方法.pdf

上传人：自信****多点

文档编号：2357658

上传时间：2024-05-28

格式：PDF

页数：8

大小：1.54MB

《基于知识增强的方面级情感分析方法.pdf》由会员分享，可在线阅读，更多相关《基于知识增强的方面级情感分析方法.pdf（8页珍藏版）》请在咨信网上搜索。

1、计算机与现代化JISUANJI YU XIANDAIHUA2023年第10期总第338期收稿日期：2022-12-03；修回日期：2023-01-21基金项目：国家自然科学基金资助项目（61876031）；辽宁省自然科学基金一般项目（20180550921）作者简介：李诗月（1998），女，河北保定人，硕士研究生，研究方向：情感分析，E-mail:；孟佳娜（1972），女，辽宁大连人，教授，硕士生导师，博士，研究方向：机器学习和文本挖掘，E-mail:；于玉海（1980），男，辽宁大连人，副教授，硕士生导师，博士，研究方向：情感分析和深度学习，E-mail:。文章编号：1006-2475（20

2、23）10-0001-080引言情感分析是自然语言处理（Natural LanguageProcessing，NLP）领域比较活跃的一个研究方向1，根据研究粒度不同，可细划分成：文档级、句子级和方面级情感分析。方面级情感分析（Aspect Based Sentiment Analysis，ABSA）属于细粒度的情感分析，细粒度的情感分析更具有针对性1。以评论“这个餐馆装修很大气，但是消费太高了！”为例，对于餐馆的“装修”方面，其情感倾向是正向的，而对餐馆的“消费”方面则是负向的。通过该例子可以看到，方面级情感分析具有粒度更细、决策更准、标准统一等特点，能够保留用户针对不同方面的情感信息，其在社

3、交、电子商务等领域发挥着至关重要的作用2。目前方面级情感分析的研究出现了很多基于深度学习的方法，循环神经网络在序列问题中具有优秀的学习能力，Tang等人3提出了基于目标依赖的长短期记忆神经网络和基于目标关联的长短期记忆神经网络，可以学习目标词语跟上下文的相互关系；注意力机制能够准确区分不同方面的关联程度，Wang等人4最先提出带有方向嵌入的、基于注意的LSTM方法，它为每个关键词都分配了一个注意力，让模型自主重视句子中的较重要部分。虽然，基于注意的神经网络模型在一些数据集取得了不错的效果，但由于没有考虑句子中不同方面词的句法依赖关系，导致权重分配错误，进而对方面词情感进行了错误的预测。基于知识

4、增强的方面级情感分析方法李诗月，孟佳娜，于玉海，李雪莹，许英傲（大连民族大学计算机科学与工程学院，辽宁大连 116600）摘要：方面级情感分析能够准确判断出句子中方面词的情感极性，在社交、电子商务等领域发挥着重要的作用。现有的方法大多通过序列表示或者注意力机制建模上下文和目标词间的关系，忽略了文本的背景知识以及方面词之间的概念链接，导致学习到的语义关系不够充分。针对上述问题，提出一种基于知识增强的方面级情感分析模型（Aspect BasedSentiment Analysis Model Based on Knowledge Enhancement，ABSA-KE）。首先，通过预训练模型BE

5、RT提取特征并得到对应的词向量，并使用解析器获取文本对应的依存关系树，利用BiLSTM和图注意力网络联合建模来学习节点嵌入表示并获得文本向量；其次，使用外部知识库引入不同语境下的方面词知识向量来增强方面级情感分析模型；最后，进行情感分类任务。通过与已有模型对比的实验结果表明，本文所提出的模型在方面级情感分析任务上是有效且合理的。关键词：方面级情感分析；图注意力网络；外部知识库；BERT；依存树中图分类号：TP391文献标志码：ADOI:10.3969/j.issn.1006-2475.2023.10.001Aspect Based Sentiment Analysis Model Based

6、on Knowledge EnhancementLI Shi-yue，MENG Jia-na，YU Yu-hai，LI Xue-ying，XU Ying-ao（School of Computer Science and Engineering，Dalian Minzu University，Dalian 116600，China）Abstract:Aspect based sentiment analysis can accurately determine the emotional polarity of aspect words in sentences，andplays an imp

7、ortant role in social networking，e-commerce and other fields.Most of the existing methods model the relationshipbetween context and target words through sequence representation or attention mechanism，but ignore the background knowledgeof text and the conceptual links between aspect words，resulting i

8、n insufficient semantic relationships learned.To solve the aboveproblems，the Aspect Based Sentiment Analysis Model Based on Knowledge Enhancement（ABSA-KE）is proposed.First，thefeatures are extracted and the corresponding word vector is obtained through the pre-training model BERT，and the dependencytr

9、ee corresponding to the text is obtained using the parser.Then，the joint modeling of BiLSTM and graph attention network isused to learn the node embedded representation and obtain the text vector.Second，the external knowledge base is used to introduce the aspect word knowledge vector in different co

10、ntexts to enhance the aspect level emotion analysis model，and finally theemotion classification task is carried out.Compared with the existing models，the experimental results show that the proposedmodel is effective and reasonable in aspect level emotion analysis tasks.Key words:aspect based sentime

11、nt analysis；graph attention network；external knowledge base；BERT；dependency tree计算机与现代化2023年第10期Devlin等人5设计了具有多层变压器编码器结构的BERT模型，有效解决了LSTM模型的并行计算和深度困难。最近的研究6-8利用图的模型来整合句子的句法结构，比那些不考虑句法关系的模型表现出了更好的性能。使用外部知识库（Knowledge Base，KB）增强神经模型已在一系列NLP应用中显示出优势，Peters等人9提出在输入文本中的显式建模实体跨度，并使用实体链接器从KB中检索相关的实体嵌入，以形成知

12、识增强的实体跨度表示形式。Li等人10提出吸收外部知识的注意力模型，实验表明吸收外部知识可以降低对数据的依赖并提升模型表现。Liu等人11通过融合非结构化知识和结构化知识，提出基于扩充知识图的开放域对话生成模型，并在对话系统中进行灵活的多跳知识图推理。Islam等人12提出了一种2级全局-局部实体嵌入方案，该方案允许有效地联合训练基于KG的方面嵌入和ABSA模型。尽管外部知识库在NLP问题中应用比较广泛，但将其使用在方面级情感分析任务中还是比较少的。在方面级任务中，常识知识通过其结构关系帮助模型理解情感术语和观点目标13，并且可以为模型提供监督信号，提高模型语义解析能力14。对于方面级情感分析

13、问题，目前深度学习方法大多是通过序列表示方法或者注意力机制来建模目标词和上下文间的关系，但由于语言的复杂性，这些模型并未充分考虑方面词与对应意见词存在的背景知识。为了解决上述问题，本文提出基于知识增强的方面级情感分析模型（Aspect Based Sentiment AnalysisModel Based on Knowledge Enhancement，ABSA-KE），通过预训练模型BERT建立较为准确的方面词向量特征表示，然后获取文本对应的依存关系树与BiLSTM学习到的方面词和意见词的上下文信息，以及节点在图中的序列特征，将结合后的特征通过图注意力网络（Graph Attention

14、Networks，GAT）建立最终的向量表示，再根据方面词获得ConceptNet15子图，增强文本特征表示，获取方面词的图特征向量，最后与文本特征进行融合，实现情感分类。主要工作有：1）将GAT应用到方面级情感分析中，沿着依存关系树的句法路径建模依存关系，为不同句法路径分配不同的权重，以此增强节点嵌入。2）使用外部知识库获取方面词的概念表示，增强上下文语义知识，并通过其结构关系帮助模型理解情感术语和观点目标。3）融合来自依存树、图注意力网络和外部知识库的特征进行方面级情感分析任务，在5个基准数据集上进行实验，得到了比较好的结果。1相关工作1.1依存关系分析依存关系分析16又名依存句法分析，目

15、的是给定一段文本，识别文本中词与词之间的相互依存关系，为每个单词（头节点）找到其对应的尾节点，可以更好地帮助理解整个句子的含义，这也是NLP领域中比较关键的技术之一。其表示方式通过有向箭头从核心词指向依存词，而有向图、依存投影树和依存树为依存关系结构常见的表达方式。以“I prefer themorning flight through Denver”这个文本为例，其依存树表达方式如图1所示。图1依存树表示方式1.2图注意力网络图卷积网络17（Graph Convolution Networks，GCN）在文本分析方面已经有了许多探索，图卷积是一种对图形结构数据进行半监督学习的网络结构

16、，是基于直接对图进行操作的卷积神经网络的一种有效变体。Yao等人18构建共词网络和文档关系网络，利用图卷积网络在不使用外部知识和单词表达的情况下取得了较好的结果；Sun等人19利用句法信息和单词依赖关系提出了卷积依赖树模型，该模型在依存树上进行卷积操作获取节点特征和连接边的依赖信息，但信息传播中可能会错误地将句法上不相关的单词与目标方面相关联。结合图卷积与注意力机制，Velickovic等人20提出了图注意力网络，GAT是基于图形结构化数据的新型神经网络。采用注意力机制，可以为不同节点分配不同权重，训练时依赖于成对的相邻节点，而不依赖具体的网络结构，并且可用于有向图。Huang等人21提出基于

17、记忆融合的图注意模型，利用卷积运算和注意力机制分别提取节点的局部信息和为边分配不同权重，得到了较好的准确率和F1值。1.3外部知识库知识库有助于将文本与真实实体、事实知识和常识概念联系起来，尤其是常识知识库提供了丰富的背景概念来源，可以通过提供某一领域的概念来增强文本的语义。Ghosal等人13利用外部知识库来调整一个流行的领域对抗性基线方法，有效地提高了其性能。本文使用的ConceptNet是一个语义网络，也是一个知识图谱，以3元组形式的关系型知识构成。利用句子中蕴含的文本自身的语法知识可以提高情感分析任务的准确度。因此，本文考虑借助外部知识库丰富文本中方面词背景信息，增强评论文本特征表示，

18、提高模型分类能力。2模型介绍2.1基本定义本文提出基于知识增强的方面级情感分析模型（ABSA-KE），该模型的实现建立在依存树的基础上，依存关系树可以形象展现出句子的句法结构，更好理I prefer the morning flight through Denver.nsubjrootdobjdetnmodnmodcase22023年第10期解文本中整个句子的含义，并引入外部知识库对方面词进行概念表示，帮助模型取得更好效果。其大概步骤为：使用BERT模型对评论文本信息进行文本特征提取，使用BiLSTM和图注意力网络分别对上下文信息和依存关系进行建模，同时利用方面词提取 ConceptNet子图

19、，通过图卷积网络对子图进行图特征向量提取，三者集成来获取含深层语义的信息特征表示，经过分类器实现情感判别。该方面级情感分析模型的总体结构如图2所示，主要由以下5个部分组成。1）向量表示层：将预处理后的评论文本送到预训练模型BERT中，获得包含了单词语义的双向编码词嵌入表示，即BERT词嵌入。2）BiLSTM层：将向量表示层获得的方面词和上下文词嵌入输送到BiLSTM网络中，学习单词之间的上下文信息，得到BiLSTM层的高维词嵌入表示。3）图注意力网络层：将高维词嵌入送到 GAT中，并且GAT沿着依存关系树的句法路径建模依存关系，并为不同句法路径分配不同权重，阻止无关词向方面词的信息传播，从而增

20、强节点嵌入，输出该层的向量表示。4）概念编码层：通过方面词提取ConceptNet子图，并对其进行概念化，得到图特征向量。5）情感预测层：将得到的GAT词嵌入通过平均池化操作得到方面词向量与概念编码层的图特征向量进行拼接，再经过Softmax分类器输出不同情感极性的概率分布，实现情感分类。双层GCNSoft-max输入向量表示层BiLSTM层图注意力网络层情感预测层文本数据依存树方面词ConceptNet子图概念编码层w1w2w3w4w5h01GATh02h03h04h05Roothl+11hl+12hl+13hl+14hl+15hjhzzgrp图2ABSA-KE模型结构图2.2方法2.2.1

21、向量表示层目前，比较常见的词向量模型主要有 GloVe 和Word2Vec，但是这些模型在训练过程中不能注意到单词间的前后序列关系，不能解决单词的一词多义问题，不能准确定位到单词的位置信息，而BERT预训练语言模型解决了上述这些问题。BERT模型使得每个词语在训练过程中都能同时利用到自身信息和上下文信息，参与运算的信息较充分，具有极好的表征能力4。本文使用 BERT来提取输入句子的更深层次序列特征，然后将输出的特征向量送到下游方面级情感分析任务中。假设一个包含n个单词的句子，s=（w1，w2，wn），句子s有对应的词嵌入x，记为x=（x1，x2，xn）；它由一个方面句子对（a，s）构成，其中方

22、面词a是s的一个子序列，记为a=（w1，w2，wm），经过BERT预训练模型后，转化成低维、连续的实数向量，得到较为准确的方面词向量特征表示。2.2.2BiLSTM层BiLSTM 网络能够从语料中学习到长期依赖关系22；该网络重复利用了每个输入序列和时间步长，充分全面学习到方面词和意见词的上下文信息以及节点在图中的序列特征，有助于提高模型情感预测效果，前向LSTM在词嵌入 x1，x2，xn上学到的隐藏表示，记为 h01，h02，h0n，后向 LSTM 在词嵌入 x1，x2，xn上学到的隐藏表示，记为 h01，h02，h0n，前后 2 个方向捕捉上下文信息，然后拼接得到高维的表示

23、，记为 h01，h02，h0n，其中子序列方面向量a的隐藏表示为 h0+1，h0+2，h0+m，高效捕获方面词和意见词的上下文。2.2.3图注意力网络层在ABSA-KE模型中，用斯坦福解析器23解析句子，得到对应的依存关系树后，依存关系树被看作为一个有n个节点的图G，图中的边代表单词间的依存关系路径。而依存关系的存储形式是一个对称的nn的邻接矩阵，这里用A表示，行与列的长度与句子的李诗月，等：基于知识增强的方面级情感分析方法3计算机与现代化2023年第10期长度等价，0代表单词之间不存在依存关系，1代表单词间有关联，即存在连接路径。假设图G是一个自循环结构，图注意力网络从邻接矩阵A处获取图结构

24、信息和句法信息，辅助ABSA-KE模型实现情感分类。图注意力网络通过这些路径进行更新和传播信息，不断更新节点的嵌入表示。在这样的操作过程中，GAT只考虑了节点的一阶邻域，以此类推，l个连续的GAT操作即表示信息在l阶邻域内传播。给定一个n个单词的句子s，其中包含从第+1个令牌开始的对应的m个单词方面。为了增强上下文与方面词的相关性，在第l层时，对节点i施加一个位置权重函数，计算公式如式（1）所示，qi表示节点i的位置权重。qi=1-+1-in，1 i +10，+1 i +m1-i-mn，+m i n（1）衡量节点i和节点j之间的重要程度，本文采用注意力系数ali，j，计算方式如式（2）所示：a

25、li，j=exp()LeakyReLU()aTWlahliWlahljk Niexp()LeakyReLU()aTWlahliWlahlk（2）其中，Wla表示单词进行线性变换的共享权矩阵，hli是节点i的特征向量，a a是权重向量，Ni表示节点i的邻居集合。为了使得图注意力的学习过程更加稳定，在设置相同参数条件下，本文对K个不同注意力进行了实验，由此，可以得到第 l+1 层节点 i 的最终隐藏表示，如式（3）所示：hl+1i=ReLU()1Kk=1Kj Nil,ki,jWlkhli（3）其中，l，ki，j代表第k个注意力系数；Wlk代表在第l层第k个注意力的权重矩阵。最后，图注意力网络第l+

26、1层的最终表示，记为：hl+1=hl+11，hl+12，hl+1+1，hl+1+m，hl+1n（4）方面词和上下文词经过 BiLSTM 和 GAT 网络联合编码后，方面向量中包含了丰富的上下文、依存和结构信息；ABSA-KE模型为了保留方面向量中大部分重要的信息，应用一个简单的聚合器，通过平均池化来聚合方面向量上的信息，得到一维向量表示，即为图注意力网络层的最终输出，用H(l+1)表示；池化操作的计算方式如式（5）所示：H(l+1)=f(hl+1a1，hl+1a2，hl+1a+1，hl+1a+m，hl+1an)（5）其中，f（）是聚合方面向量的平均池化函数。2.2.4概念编码层本文从Conce

27、ptNet提取文本中方面词相关子图。ConceptNet图表示为有向标记图G=（V，R），其中V表示概念节点vi V，表示标记边(vi，rij，vj)。rij R是节点vi和vj之间的边的关系类型。从数据集中所有训练文档中提取所有方面词作为种子词，用来将ConceptNet过滤到子图G=（V，R）中，并获得初始概念特征向量zi。由于图卷积网络不能对带有标记边的图进行卷积，因此本文使用2层图卷积网络对子图进行编码。在卷积特征变换过程中确保不同的方面词通过基础概念连接，并相互影响，以创建丰富的方面词的图特征向量。转换过程如公式（6）公式（8）所示：f(zi，l)=(r Rj Nri1ci，rW(l

28、)rzj+W(l)0zi)（6）Z(1)i=f(zi，1)（7）Zi=Z(2)i=f(Z(1)i，2)（8）其中，Nri表示关系r R下概念i的相邻概念，ci，r是一个特定于问题的归一化常数，可以选择ci，r=|Nri或者可以在基于梯度的学习设置中学习；是一个激活函数，如ReLU；而W(l)r、W(l)0是变换的可学习参数。通过图卷积网络获得子图中所有唯一节点j的特征向量Zj。2.2.5情感预测层由上文可知，最后输出的结果是方面向量H(l+1)和方面图向量Z Zj的串联结果hZ，H=H(l+1)Zj，然后将其传递给一个全连接层，并对其使用Softmax函数进行归一化，输出不同情感极性的概率分布

29、P，其表达式如式（9）所示：P=Softmax()WphZ,H+bp（9）其中，hZ，H表示方面向量，Wp、bp表示训练过程中学习到的权重和偏置。模型使用的目标损失函数为最小化交叉熵，其训练的目的是使文本中句子的真实值和预测值之间的误差尽可能地达到最小。在模型搭建过程中，它以反向传播形式对模型进行端到端训练，计算方式如式（10）所示：J()1，2=-(a，s)Dc Cyc(a，s)logyc(a，s)（10）其中，D表示方面句子对（a，s）的集合，C表示3种情感类别的集合，yc（a，s）为（a，s）的真实值，其取值为1或0；特别地，一个方面句子对（a，s）只能归类于一个情感类别yc（a，s）=

30、1意味着（a，s）的情感类别属于c。yc（a，s）代表着模型对（a，s）进行预测，目标函数中的1和2分别是对应于BiLSTM和GAT的可训练参数。3实验结果及分析3.1数据集本文在 5 个基准数据集上进行实验，一个是来自Dong等人24发表的Twitter数据集，由Twitter帖子组成；其他 4 个数据集为国际语义测评任务的公开数据集（Restaurant1425，Restaurant1526，Restaurant1627，Laptop1425），由 Laptop 和 Restaurant 这 2个领域的评论构成。每个数据集都分为训练集、验证集和测试集。数据集中的方面词信息以及方面词对应

31、的情感倾向都已经标注；其中，情感倾向类别主要包括积极（Positive）、中立（Neutral）和消极（Negative）这 3 大类。表 1 展示了数据集的统计情况，其中剔除了具有冲突情感极性或者没有明确指出方面词的数据。42023年第10期表1数据集统计表DatasetRestaurant14Laptop14Restaurant15Restaurant16TwitterPositivetrain216497691216571561test728341326611173Neutraltrain637455361013127test1961693444346Negativetrain80785

32、12567481560test196128182204173Total472829201764336569403.2参数设置实验在Pytorch环境下进行，并采用Adam优化器。其中 BERT 词向量维度为 768；模型学习率为 2e-5；BiLSTM隐藏层维度为300；批处理大小为32；dropout为0.5。使用预训练模型BERT对输入文本进行向量表示，并且选用包含了注意力机制的图注意力网络。3.3评价标准实验中使用的评价指标是准确率（Accuracy）和F1值。准确率是文本分类任务中最常用、最基础的指标，是指在所有样本中被预测正确的数量与所有样本数目的比值。F1 值是召回率（Recall

33、）和精确率（Precision）这2种指标的调和平均。各指标计算方式如式（11）式（14）所示：Accuracy=TP+TNTP+TN+FP+FN（11）Precision=TPTP+FP（12）Recall=TPTP+FN（13）F1=2 Precision RecallPrecision+Recall（14）3.4实验结果3.4.1对比实验设置本文选用具有代表性的13个方面级情感分析模型与本文提出的模型进行对比，对比模型的具体描述如下：1）SVM 模型28：基于统计学习的模型，利用WordNet等情感词典，用SVM分类器进行情感判别。2）LSTM模型3：是最基本的神经网络模型，利用LSTM

34、获取上下文的隐藏表示，然后直接通过Softmax函数进行情感预测。3）TD-LSTM 模型3：在 LSTM 模型的基础上进行改进，使用2个LSTM网络对方面词的前向和后向信息并行建模，然后拼接2个方向的隐藏输出，得到的输出结果送到情感预测层进行情感判别。4）IAN 模型29：利用 LSTM 建模目标词和句子上下文信息，借助2个注意力，交互检测整个上下文和目标描述中的重要单词，将两者输出进行结合，实现情感倾向性判别。5）RAM模型30：利用BiLSTM学习句子上下文的序列特征，得到记忆矩阵；使用GRU网络和注意力机制构建循环注意力模型，得到不同注意力层的结果后送入情感分类层，输出情感所属类别。6

35、）AOA 模型31：利用双重注意力机制（Attention-over-Attention）联合建模上下文和方面词，关注两者间的相互信息，并对信息的重要程度进行区分，最后对情感极性进行判别。7）ASGCN模型32：利用语法信息和单词依赖关系，使用图卷积神经网络和LSTM框架、注意力机制集成来研究面向方面的情感分类。8）CDT模型19：在依赖树上使用图卷积网络捕获连接边的依赖信息，缩小方面词和意见词之间的距离，实现情感类型判断。9）BiGCN模型33：一种结合层次句法和词汇图的新型网络结构，使用一个全局词汇图来编码语料库级别的单词共现信息；并在句法图和词汇图上建立了一个概念层次结

36、构，用于区分各种类型的依赖关系或词汇词对。10）RepWalk34：通过在语法图上进行随机复制游走，来获得对方面词情感预测影响最大的上下文词。11）MEMGCN-BERT35：一种图卷积神经记忆网络模型（MemGCN）。通过记忆网络存储文本表示与辅助信息，并使用注意力机制融合句法信息与其他辅助信息。12）ASGCN-AOA-DG36：一种结合图卷积网络GCN和注意-过度注意AOA神经网络的方面级情感分类模型（ASGCN-AOA）。13）CF-CAN37：一种利用组件聚焦策略和多头共注意力机制的模型，解决了包含多词的方面平均池化操作带来的问题。3.4.2对比实验结果将模型在5个不同数据集上分别进

37、行5次实验，表2展示的数据均为5次试验后的平均取值，表中为ABSA-KE模型与对比模型在5个数据集上的结果。由表2可以得到以下信息：1）除CF-CAN模型外，本文的模型在所有数据集上的 F1 值都达到了最好的效果，尤其在 Restaurant14、Restaurant15和Twitter数据集上的准确率也是最优的。2）ASGCN和CDT模型均采用300维的GloVe词嵌入，本文的模型使用了BERT作为预训练模型，准确率最大提升了4.93个百分点。这说明BERT预训练模型相较于其他静态词嵌入，具有一定的先进性，能够帮助方面级情感分析模型取得更好的实验效果。3）与 MEMGCN-BERT、ASGC

38、N-AOA-DG 模型相比，本文模型在几乎所有数据集上都取得了比较好的结果，其原因是GAT比GCN多了注意力机制，注意力机制能够给不同信息赋予不同权重，阻止了无关词向方面词的信息传播。这说明在方面级情感分析研究中，包含GAT的模型能够根据目标词计算上下文词的权重分布，有效识别上下文词对目标词的影响。4）与基于多头共注意力机制的模型CF-CAN相比，本文模型在绝大多数数据集上都取得了较优的结果。分析认为本文提出使用外部知识库为模型进行知识增强，丰富了文本的背景概念以及方面词之间的概念链接，帮助学习更多的语义知识，从而提升了模型性能。李诗月，等：基于知识增强的方面级情感分析方法5计算机与现代化20

39、23年第10期3.4.3GAT层数对准确率和F1值的影响图3和图4分别展示了GAT层数对准确率和F1值的影响，其横坐标表示GAT的层数，取值为15，纵坐标分别为准确率和F1值。由图3和图4可知，在5个数据集上，随着GAT层数的增加，准确率和F1值的走向都是先上升后下降，当层数等于2时，准确率和F1值均达到最高；当层数超过2且逐渐增大到5时，准确率及F1值都直线下降，说明层数越多，模型涉及的参数量会越大，导致训练起来更加困难。因此，实验设置GAT的层数为2。图3GAT层数对准确率的影响图4GAT层数对F1值的影响3.4.4消融实验为了验证ABSA-KE模型的有效性，本文进行了消融实验研究，实验结

40、果如图5和图6所示；其中，各个模型的解释说明如下：1）ABSA-KE w/o BiLSTM：去除模型中的双向长短期记忆网络。2）ABSA-KE w/o GAT：去除模型中的图注意力网络。3）ABSA-KE w/o Attention：去除模型图注意力网络中的注意力机制，类似于直接通过GCN和BiLSTM联合建模来进行情感判断。4）ABSA-KE w/o ConceptNet：去除模型中外部知识库。图5不同模型的准确率结果对比图6不同模型的F1值结果对比由图 5 与图 6 可知，BiLSTM、GAT、Attention 和Conceptnet都能辅助模型进行情感分类，去掉任何一个组成部分，模型的

41、性能都会下降，说明这些在模型中的应用都是合理的。并且，图注意力网络对模型性能影响最大，说明图注意力网络可以帮助模型处理句法结构信息，比单纯使用注意机制或图卷积网络更能捕获语义信息。其次，ConceptNet对模型的影响比较小，分析是由于子图之间是不相连的，可能导致2个不同类别的方面词的词向量表示相近，从而导致模型情感分类错误。但是总体来看去除ConceptNet后，模型性能有所下降，说明ConceptNet可以为模型提供一些有用的额外知识。这些组成部分对模型的重要程度，由高到低顺序为GAT、BiLSTM、Attention和ConceptNet。表2对比实验结果模型SVMLSTMTD-LSTM

42、IANRAMAOAASGCNCDTRepWalkBiGCNMEMGCN-BERTASGCN-AOA-DGCF-CANABSA-KERestaurant14准确/%80.1677.3278.3278.8080.2380.8780.9281.7581.7281.9785.1882.5784.4885.69F1/%N/A66.1868.2470.5970.2170.1872.0272.1973.8673.4877.3273.4577.4878.74Laptop14准确/%70.4969.5970.4771.4773.1974.1675.5576.5176.2074.5978.6875.2479.44

43、78.28F1/%N/A65.5366.4766.6168.2669.6471.0572.0672.3271.8473.9370.2975.3774.54Restaurant15准确/%70.4277.3778.2378.5478.8578.1778.4777.60N/A81.1679.4380.31-81.88F1/%N/A55.1757.2552.6261.9757.0261.8957.93N/A64.7962.3563.60-65.86Restaurant16准确/%80.1484.4484.1783.7484.1384.5084.3884.1589.2088.9685.0189.23-

44、89.08F1/%N/A64.9964.8955.2156.0866.2167.4866.5971.2070.8469.0370.58-77.26Twitter准确/%63.4068.8769.8570.5270.0871.1872.1575.2374.2874.1672.9873.4675.0075.23F1/%N/A67.6768.4070.0371.4771.7170.4074.0872.4173.3572.0871.3373.0174.12707580859012345准确率/%GAT层数Restaurant14Laptop14Restaurant15Restaurant16Twitt

45、er606570758012345F1值/%GAT层数Restaurant14Laptop14Restaurant15Restaurant16Twitter60657075808590Restaurant14Laptop14Restaurant16Twitter准确率/%ABSAKEw/oBiLSTMABSAKEw/oGATRestaurant15 ABSAKEw/oAttentionABSAKEw/oConceptABSAKE556065707580Restaurant14Laptop14Restaurant16TwitterF1值/%ABSAKEw/oBiLSTMABSAKEw/oGATR

46、estaurant15 ABSAKEw/oAttentionABSAKEw/oConceptNetABSAKE62023年第10期 3.4.5案例研究1）ConceptNet子图。为了进一步研究外部知识库的作用，对Restaurant14数据集中的方面词“Bread”的子图进行可视化，并截取部分子图进行呈现，菱形框为方面词，椭圆形为关系类型，矩形为与方面词有关联的词，如图7所示。可以看到，根据方面词“Bread”，可以从庞大的ConceptNet中获取到与之相关的关联词，这些关联词为模型解析方面词的情感极性补充了一些额外知识，增强了方面词与上下文的语义表示，使模型更好地学习文本特征，进而提高模

47、型性能。图7方面词“Bread”的部分子图2）图注意网络层。为了更好地证明图注意网络层的作用，对去掉GAT的模型与ABSA-KE模型自身进行了案例研究，选用了数据集中一些评论文本，案例均来自数据集Laptop14，用粗体标记方面词，用下划线标记表示决定分类结果的关键字，用黑实线连接单词表示依存树上的边，如表 3所示。ABSA-KE 和 w/o GAT 分别表示完整模型和去掉图注意力网络层的模型。案例均标注出方面词和关键词之间的边。可以看出，在3个案例中，ABSA-KE 模型均分类正确，但去掉 GAT 后结果发生错误。这3个案例的方面词和关键词在序列上距离较远，但在依存树上却十分接近。由此可知，

48、依存树不仅可以捕获编码过程中缺失的语法信息，而且能够缩短关键词和方面词的距离，加强两者的联系。图注意力网络是用来处理图结构数据的，建立在依存树的基础上发挥其作用，而依存树能够更好地帮助模型进行情感判别，进而说明图注意力网络对提升方面级情感分析模型性能是有效的。表3图注意网络层案例研究SentenceThe machine is very slow too.The speed is incredible and I am more than stisfied.working with mac is so much easier，so many coolfeature.ABSA-KEw/oGAT4

49、结束语本文提出了一种基于知识增强的方面级情感分析模型ABSA-KE，使用预训练模型BERT，有效地挖掘出方面词和情感词之间的关系，获取每个单词包含的情感信息和语义信息；BiLSTM能够从语料中学习到长期依赖关系，有效编码上下文信息和依存信息；图注意力网络沿着依存关系树的句法路径建模依存关系，为不同连接边分配不同权重，阻止了无关词向方面词的信息传播；ConceptNet提供外部知识，丰富上下文表示。在多个数据集上进行了实验验证，结果表明，ABSA-KE模型在方面级情感分析任务上取得了不错的性能。未来考虑针对跨领域方面级情感分析问题，使用外部知识库丰富不同领域数据的语义知识，从而帮助标注数据量少的

50、新领域进行方面级情感分析任务。参考文献：1 张忠林，李林川，朱向其，等.ON-LSTM和自注意力机制的方面情感分析 J.小型微型计算机系统，2020，41（9）:1839-1844.2ROSENTHAL S，FARRA N，NAKOV P.SemEval-2017task 4:Sentiment analysis in TwitterC/Proceedings ofthe 11th International Workshop on Semantic Evaluation（SemEval-2017）.2017:502-518.3 TANG D Y，QIN B，FENG X C，et al.Ef

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于知识增强方面情感分析方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。