情感增强的对话文本情绪识别模型_王雨 (1).pdf
《情感增强的对话文本情绪识别模型_王雨 (1).pdf》由会员分享,可在线阅读,更多相关《情感增强的对话文本情绪识别模型_王雨 (1).pdf(7页珍藏版)》请在咨信网上搜索。
1、2023 03 10计算机应用,Journal of Computer Applications2023,43(3):706-712ISSN 10019081CODEN JYIIDUhttp:/情感增强的对话文本情绪识别模型王雨1*,袁玉波1,2,过弋1,2,3,张嘉杰1(1.华东理工大学 信息科学与工程学院,上海 200237;2.上海大数据与互联网受众工程技术研究中心,上海 200072;3.大数据流通与交易技术国家工程实验室(上海数据交易所),上海 200436)(通信作者电子邮箱)摘要:针对现有的许多研究忽略了说话人的情绪和情感的相关性的问题,提出一种情感增强的图网络对话文本情绪识别模
2、型SBGN。首先,将主题和对话意图融入文本,并微调预训练语言模型RoBERTa以提取重构的文本特征;其次,给出情绪分析的对称学习结构,将重构特征分别输入图神经网络(GNN)情绪分析模型和双向长短时记忆(Bi-LSTM)情感分类模型;最后,融合情绪分析和情感分类模型,将情感分类的损失函数作为惩罚以构建新的损失函数,并通过学习调节得到最优的惩罚因子。在公开数据集DailyDialog上的实验结果表明,相较于DialogueGCN模型与目前最先进的DAG-ERC模型,SBGN模型的微平均F1分别提高16.62与14.81个百分点。可见,SBGN模型能有效提高对话系统情绪分析的性能。关键词:对话情绪识
3、别;情感分类;主题诱导;图神经网络;双向长短时记忆中图分类号:TP391.1 文献标志码:ASentiment boosting model for emotion recognition in conversation textWANG Yu1*,YUAN Yubo1,2,GUO Yi1,2,3,ZHANG Jiajie1(1.School of Computer Science and Engineering,East China University of Science and Technology,Shanghai 200237,China;2.Shanghai Engineerin
4、g Research Center of Big Data and Internet Audience,Shanghai 200072,China;3.National Engineering Laboratory for Big Data Distribution and Exchange Technologies(Shanghai Data Exchange),Shanghai 200436,China)Abstract:To address the problems that many existing studies ignore the correlation between int
5、erlocutors emotions and sentiments,a sentiment boosting model for emotion recognition in conversation text was proposed,namely Sentiment Boosting Graph Neural network(SBGN).Firstly,themes and dialogue intent were integrated into the text,and the reconstructed text features were extracted by fine-tun
6、ing the pre-trained language model.Secondly,a symmetric learning structure for emotion analysis was given,with the reconstructed features fed into a Graph Neural Network(GNN)emotion analysis model and a Bi-directional Long Short-Term Memory(Bi-LSTM)sentiment classification model.Finally,by fusing em
7、otion analysis and sentiment classification models,a new loss function was constructed with sentiment classification loss function as a penalty,and the optimal penalty factor was adjusted and obtained by learning.Experimental results on public dataset DailyDialog show that SBGN model improves 16.62
8、percentage points compared with Dialogue Graph Convolutional Network(DialogueGCN)model,and improves 14.81 percentage points compared with the state-of-art model Directed Acyclic Graph-Emotion Recognition from Conversation(DAG-ERC)in micro-average F1.It can be seen that SBGN model can effectively imp
9、rove the performance of emotion analysis in dialogue system.Key words:Emotion Recognition in Conversations(ERC);sentiment classification;theme induction;Graph Neural Network(GNN);Bi-directional Long Short-Term Memory(Bi-LSTM)0 引言 近年来,随着人工智能和社交媒体大数据的快速发展,情绪(emotion)分析已经在社交舆情分析、用户画像以及推荐系统等多个领域广泛应用。情感(
10、sentiment)是人类固有的一种基本的内在状态,在人类交流中帮助传达和理解实际信息,因此情感理解对于情绪分析十分重要。在社交媒体大数据开发应用领域的网络对话文本中,说话人的情绪识别(Emotion Recognition in Conversation,ERC)作为自然语言处理(Natural Language Processing,NLP)的新课题越来越受重视,因为它具有从Twitter、微博、微信等平台上大量公开可用的交互式数据中挖掘舆情的能力。此外,对话情绪识别在医疗保健系统、智能教育、视觉问答等方面具有应用潜力。近几年,电商智能客服、闲聊机器人等对话系统的应用越来越广泛,但是它们往
11、往缺乏带有情感的交流,不能很好地识别用户在对话中的情绪和情感,因此有必要研究对话中蕴含的情感信息。对话情绪识别本质上是分类任务,旨在对一段对话中的文章编号:1001-9081(2023)03-0706-07DOI:10.11772/j.issn.1001-9081.2022010044收稿日期:20220114;修回日期:20220511;录用日期:20220512。基金项目:上海市工程技术中心项目(18DZ2252300)。作者简介:王雨(1998),女,山东泰安人,硕士研究生,主要研究方向:对话情绪识别;袁玉波(1976),男,云南宣威人,副教授,博士,主要研究方向:机器学习;过弋(197
12、5),男,江苏无锡人,教授,博士,CCF会员,主要研究方向:文本挖掘;张嘉杰(1999),男,河南焦作人,硕士研究生,主要研究方向:图神经网络。第 3 期王雨等:情感增强的对话文本情绪识别模型话语进行情绪分类。与传统的文本分类任务不同,对话文本存在信息的交互以及说话人情感的影响,说话人的情绪变化不仅受自己情绪状态的影响,还受到对方说话人的情绪状态的影响,说话人之间的依赖和自我依赖之间总是存在重要的相互作用。因此需要综合考虑对话上下文、说话人、说话人的个性、意图、对彼此的态度等,分析这些因素可以得到丰富的会话信息。情感和情绪都是人类主观的感受,因此它们的理解是相似的,并且经常互换使用。之前的相关
13、研究大多将其视为两个独立的问题,情感分类多为情感正负极性的判断,而情绪识别多为更细粒度的情绪识别。文献 1-2 表明情感和情绪密切相关,大多数情绪状态都有明显的积极或消极的区别。如“愤怒”“恐惧”“悲伤”等,属于消极的情绪,而“高兴”和“惊讶”反映了积极的情绪。因此话语的情感知识(或情绪)可以帮助对其相邻话语分类,例如关于愤怒情绪的信息可以帮助预测负面情感,反之亦然。本文的主要工作如下:1)将对话主题信息和行为信息融入对话文本,通过微调预训练语言模型RoBERTa3提取重构的句子特征。2)通过图神经网络(Graph Neural Network,GNN)建模对话上下文,并引入情感分类辅助情绪识
14、别任务,将情感分类损失作为惩罚项设计了新的损失函数,动态调节权值。3)在DailyDialog公开数据集4上进行大量实验,验证了本文方法的有效性。1 相关工作 早期的情绪识别工作主要依赖于支持向量机(Support Vector Machine,SVM)5、规则匹配等。随着深度学习的发展,目前的情绪识别工作主要依赖于神经网络,如卷积神经网络(Convolutional Neural Network,CNN)6、循环神经网络(Recurrent Neural Network,RNN)7等。由于社交媒体平台上开源会话数据集的增加,ERC引起了越来越多的研究兴趣。Hazarika 等8提 出 了 会
15、 话 记 忆 网 络(Conversational Memory Network,CMN)为二元会话的参与者模拟人类交互,并利用说话人相关的记忆进行情绪识别。Hazarika等9扩展CMN,提出另一种用于模拟人类交互的记忆网络,称为交互式会话记忆网络(Interactive Conversational Memory Network,ICON),将所有历史话语包含在对话参与者的上下文窗口内,作为整体对话记忆。Majumder 等10提出了一个基于RNN 的基准模型,使用三个门循环单元(Gated Recurrent Unit,GRU)跟踪单个说话人在对话中的状态、情绪状态和全局语境。另一方面,
16、作为语境信息的一种考虑方式,Shen等11利用增强的记忆模块存储更长的历史上下文,并利用对话感知的自我注意以捕获有用的内部说话人依赖关系。此外,融入外部知识以及情感知识也是目前研究者探索的方向。Zhong 等12通过多层自注意力机制理解上下文,同时,通过上下文感知的情感图注意机制将外部常识利用起来。Bhat等13通过在对话中添加情感词、主题词汇来为句子添加基于上下文的情感特征,通过微调预训练语言模型RoBERTa获得了不错的结果。除了使用 RNN 等序列结构处理对话中的话语序列,还有许多研究者通过图卷积网络(Graph Convolutional Network,GCN)结 构 建 模 对 话
17、。Ghosal 等14提 出 DialogueGCN(Dialogue Graph Convolutional Network)模型,利用 GCN 模拟对话中的交互,并考虑未来的窗口话语。Ishiwatari等15针对DialogueGCN 没有考虑顺序信息的问题,在图网络中加入关系位置编码以捕获说话人的依赖性和话语的顺序。彭韬等16将文本的句法依存关系引入模型,通过 GCN 提取句法结构信息,并与文本情感分析模型相结合。Shen 等17提出用有向无环图(Directed Acyclic Graph,DAG)对话语进行建图,结合话语顺序结构设计了 DAG-ERC(Directed Acycli
18、c Graph-Emotion Recognition in Conversation)模型。也有研究使用情感和其他任务的联合学习方法,利用多个任务之间的相关性提升分类性能。Qin 等18提出深度协同 交 互 关 系 网 络(Deep Co-interactive Relation Network,DCR-Net),引入协同交互关系层建模对话行为识别(Dialog Act Recognition,DAR)和对话情感分类任务之间的交互。基于上述相关研究,考虑到对话文本通常较短,存在表达能力有限等问题,而且对话主题和意图有助于建模说话人之间的影响,本文在话语特征提取阶段融入对话主题和意图信息从而提
19、取更丰富的话语特征表示,然后基于 GNN 建模对话结构和说话人信息,避免 RNN 模型存在的长距离依赖问题。另一方面,本文针对对话情感和情绪存在一定关联的特点,通过基于双向长短时记忆(Bi-directional Long Short-Term Memory,Bi-LSTM)模型的情感分类任务辅助情绪识别任务,从而提高模型情绪识别性能。2 任务定义 2.1问题定义对话情绪识别的问题定义如下:假设在一段对话中有 M 个说话人,用符号表示为P=p1,p2,pM,有 N 个句子的对话U=u1,u2,uN,其中:第i个说话人的话语ui=wi1,wi2,wini,ni为第i个句子中词的数量。对话情绪识别
20、的问题表示如下:F*=argminF HF(U)-y(1)即在给定的模型空间H中,求得一个最优的识别模型F*,在已知情绪标签的数据集合U上,使模型的识别结果和已知标签的差异极小。2.2情感对对话情绪识别的影响分析下面分析说明情感和情绪之间的内在关系以及对话结构对它们的影响。表 1 是一段由 A、B 两个人参与的对话示例。A 表现出“惊讶”的情绪,情感倾向是积极的。而随着对话轮次进行,A的情绪逐渐变为“中性”“生气”,相应的情感倾向也变为消极,而 B随着 A的情绪变化也发生了变化,并且情感倾向的变化相似。这说明对话中说话人的情感和情绪之间存在一定的关联性,一个话语的情感(或情绪)经常与其他语境话
21、语相互依赖,即情感(或情绪)可以对相邻话语进行分类。在对话中特别是两人对话中,说话人之间表达的情感是动态变化的并且会相互影响,通常体现在说话人的自我影响和说话人之间的影响。自我影响或情感惯性是指说话人在谈话中对自己的情感影响。参与者对话由于自身的情绪惯性,很可能会坚持自己的情绪状态。而说话人之间的影响指对方在说话人身上产生的情感影响。这种影响与这样一个事实密切相关,即在对话过程中,说话人倾向于模仿他们面对的人来建立融洽的关系。707第 43 卷计算机应用情感的表达方式、话语的意义也会随对话的主题变化而变化。通常,围绕特定主题的对话存在不同的语言表达方式,不仅影响话语的意义,还影响特定的情感因素
22、的表达。对话行为或者对话意图指在一段对话中说话人说的某句话的动机。对话意图的不同使说话人在对话中表达的情感也会不同,并且两者也存在一定关联。通过识别说话人的意图能帮助检测话语中隐含的情感。此外,对话通常包含许多较短的文本,表达的信息可能有限。所以本文融合对话主题和意图信息以丰富句子的语义特征。对话情绪识别的难点在于不同说话人之间的情感相互影响,并且依赖上下文信息。本文通过分析发现对话中说话人的情绪变化和情感倾向变化趋势相似,存在一定关联;对于同一个说话人,其情感倾向起伏不会很大。基于此,本文基于 GNN 并考虑说话人信息来建模对话结构,探索通过粗粒度的情感分类任务来辅助细粒度的情绪识别性能,并
23、融入主题和意图信息增强文本特征。3 情感增强的对话情绪识别模型 本 文 提 出 的 SBGN(Sentiment Boosting Graph Neural network)模型如式(2)所示:F*=argminF HF(U,s,a)-y(2)即在模型中,融入了主题(s)和意图(a)数据,通过对话情感分类结果优化提升情绪识别的结果。SBGN模型定义为情感增强的对话情绪识别模型,技术架构如图1所示。SBGN模型主要包括三个部分:1)主题特征增强的话语编码。说话人级别的上下文编码器将对话主题和行为信息与原始话语拼接,通过微调预训练模型RoBERTa作为自编码器得到情感增强的话语特征。2)情绪与情感
24、对称学习。在情绪识别模型中,通过堆叠L层的图网络编码对话上下文和说话人信息得到输出向量,拼接L层的隐层向量以及原始特征,然后通过前馈神经网络(Feed-Forward Neural network,FFN),最后经过 Softmax 层得到话语属于每一类情绪标签的概率。在情感分类模型中,首先将增强特征输给 Bi-LSTM 模型,之后应用线性变换,并通过 Softmax层得到情感标签结果。两个任务共享底层特征,分别经过不同的模型结构进一步编码得到不同任务下的话语表征,最后进行联合优化,在形式上形成“对称”的两部分。3)情感与情绪的融合优化。SBGN模型通过调节损失调节因子平衡情感和情绪识别任务。
25、3.1话语特征重构考虑到 RoBERTa 强大的特征提取能力,本文通过微调RoBERTa提取话语级的句子特征,在后续模型训练中冻结其参数。本文将对话主题和意图作为数据增强映射到话语级别进行特征重构。结合DailyDialog数据集标注信息,本文选择的对话主题包括 日常生活,学校生活,文化和教育,态度和情感,关系,旅游,健康,工作,政策/政治,经济 10个类别,对 话 意 图 包 括通 知(Inform),疑 问(Questions),建 议(Directives),接受/拒绝(Commissive)四个方面。具体的,对话语ui,拼接其对应的主题数据ti和意图数据ai得到ui=tiaiui=ti
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 情感增强的对话文本情绪识别模型_王雨 1 情感 增强 对话 文本 情绪 识别 模型 王雨
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。