基于电力领域知识图谱的智慧客服系统研究.pdf
《基于电力领域知识图谱的智慧客服系统研究.pdf》由会员分享,可在线阅读,更多相关《基于电力领域知识图谱的智慧客服系统研究.pdf(8页珍藏版)》请在咨信网上搜索。
1、信息技术XINXIJISHU2023年第9期基于电力领域知识图谱的智慧客服系统研究沈潇军,杨红岩,蔡晴,郑星航(国网浙江省电力有限公司信息通信分公司,杭州310 0 16)摘要:针对现有知识图谱电力客服系统存在应用数据相对封闭、数据管理低效、图谱表示单一、规则表示困难及抽样本稀少等问题,设计了一个基于电力领域知识图谱的智慧客服系统。该系统由在线客服、信息解析、知识匹配、意图识别、业务处理及交互等模块组成,利用领域知识图谱技术构建电力客服领域知识库,运用结构化方式呈现电力客服中概念、实体、事件之间的关系,并融合自然语言技术和深度学习算法实现系统智能问答,最后通过系统测试验证系统的有效性,为智慧电
2、力客服系统设计与实现提供参考。关键词:知识图谱;客服系统;领域知识图谱;智能问答中图分类号:TP181D0I:10.13274/ki.hdzj.2023.09.014文献标识码:A文章编号:10 0 9-2 552(2 0 2 3)0 9-0 0 8 3-0 8Research on intelligent customer service system based on power domain knowledge graphSHEN Xiao-jun,YANG Hong-yan,CAI Qing,ZHENG Xing-hang(State Grid Zhejiang Electric Po
3、wer Company Information&Telecommunication Branch,Hangzhou310016,China)Abstract:Based on the problems existing in the existing knowledge graph power customer service system,such as relatively closed application data,low efficiency of data management,single graph representation,and difficult rule repr
4、esentation and few samples,an intelligent customer service system based on knowledgegraph in power field is designed.The system consists of online customer service,information analysis,knowledge matching,intention recognition,business process and interaction,and other modules,the do-main specific kn
5、owledge graph technology is used to build the domain knowledge base of power customerservice,presents the relationship among concepts,entities and events in power customer service in a struc-tured way,and integrates natural language technology and deep learning algorithm to realize system intelli-ge
6、nt question answering.Finally,the effectiveness of the system is verified by system test,which provides areference for the design and implementation of smart power customer service system.Key words:knowledge graph;customer service system;domain knowledge graph;intelligent Q&A0引 言传统客服系统,一般侧重点都是服务,通过提
7、高对服务对象的满意度提升公司声誉1-3。但是基金项目:国网浙江省电力有限公司科技项目(52 11XT210003)作者简介:沈潇军(197 5),男,硕士,工程师,研究方向为电力信息智能化。这种客服系统在智能化水平、效率和准确性等方面均存在不足,需要引入人工智能技术来改善现状4-10。现阶段电力客服系统大都采用与其他行业客服相类似的主流技术路线,利用知识图谱、自然语言处理和自动语音识别等技术来提升客服系统的整体性能1-16 。文献17 构建了融合领域特征知识图谱的电力智能问答系统,提升了系一8 3 一基于电力领域知识图谱的智慧客服系统研究统识别准确率,降低了响应延迟;文献18 提出一种基于知识
8、图谱的电力智能客服系统,实现客服知识库整理效率的提升,降低了人工成本;文献19提出一种交互式电力智能应答系统,增强了数据智能化训练和智能交互能力;文献2 0 提出一种包含推理引擎、数据本体和客户本体的三级图谱架构,提升了系统整体服务满意度和识别准确性。但上述电力客服系统应用数据相对封闭,互联网化运营理念未得到凸显,认知推理能力较弱,需进一步加强。近些年来因领域知识图谱具有丰富的语义关系、巨大的数据规模和友好的结构逐渐被相关学者关注。在此背景下,引人领域知识图谱技术,提出基于领域知识图谱的在线电力智慧客服系信息解析内容分词信息检索实体匹配信息筛选逻辑判断文本纠错在线客服文本数据查询客户提问(Ou
9、ery)如图1所示,智慧客服系统主要由在线客服、信息解析、领域知识图谱、意图识别、业务处理及交互等模块组成,其中在线客服模块主要是将客户提问的问题运用自动化语音识别技术转化为能够进一步处理的文本数据;信息解析模块主要对文本数据的内容进行解析,包含内容分词、信息检索、实体匹配、信息筛选、逻辑判断和文本纠错等;领域知识图谱模块主要是将解析的信息通过深度学习算法匹配领域图谱中的相关内容,从而得到与客户问题相关联的概念和实体;意图识别模块的作用是对客户咨询的业务进行辨识,包括业务咨询、故障维修、业务包装和投诉建议等类别;业务处理模块主要是为识别出的业务类别导人相应一8 4一一沈潇军等统,进一步提升中心
10、运营效能、坐席工作效率、服务质量和智慧化水平。1智慧客服系统架构知识图谱主要有自顶向下与自底向上两种构建方式,其中自底向上的方式是以非结构化数据为驱动,运用相应的技术进行知识抽取从而形成知识图谱;自顶向下的方式是以结构化数据或已形成的知识库为基础,来获取知识本体的结构信息。一般而言,通用的知识图谱的数据相对封闭,规则和数据模式相对简单,需要进一步提升数据和知识库的利用率。本文采用自顶向下与自底向上相结合的方式构建电力客服领域知识图谱,系统架构如图1所示。领域知识图谱意图识别业务咨询对象-关系型数据库业务报装(PostgreSQL)亚务处理领域知识图谱图数据库(Ne04i)半/非结构化结构化数据
11、解析数据解析电力客服电力客服文本数据结构化数据图1基于电力领域知识图谱的智慧客服系统架构图的客服话术,从而引导客户进行多轮对话最终完成相应业务的办理。2基于领域知识图谱的电力智慧客服系统2.1电力客服领域知识图谱构建电力客服领域知识图谱的整体结构如图2 所示,主要由知识表示、抽取、融合、推理和储存5个模块构成。知识表示模块主要的作用是将电力客服相关知识进行转化,形成计算机能够计算和储存的结构化知识;知识抽取模块主要是将电力客服非结构化、半结构化和结构化数据中的知识要素进行有效提取;知识融合模块能够将实体、关系、属性和对象之间的歧义进行消除,并对新知识进行补充、对旧知识进行更新;客服知识推理模块
12、交互故障报修投诉建议信息服务派发工单业务办理其他记录经验案例库基于电力领域知识图谱的智慧客服系统研究的主要作用是挖掘现有知识缺失事实或者隐含的存模块的作用是设计高效的储存模式来有效管理知识,进一步扩展和丰富电力客服知识库;知识储电力客服数据。(实体1,关系,实体2)表示电力客服知识表示电力客服知识抽取电力客服领域电力客服知识图谱知识融合电力客服知识推理电力客服知识储存图2 电力客服领域知识图谱构建框架2.1.1知识表示为了将电力客服知识进行直观表示,本文选用三元组来作为知识表示形式,其由两个语义关联的电力客服实体与实体关系构成,具体形式为(实体,属性,属性值)和(实体1,关系,实体2)。概念主
13、要为电力客服对象类,例如营业网点等;知识图谱当中最为基本的元素为实体,例如萧山区确认输入户号户号输入身份证号家庭故障电表检查一沈潇军等(实体属性,属性值)表示结构化数据抽取半结构化数据抽取非结构化数据抽取实体对齐属性对齐属性值冲突消除基于规则描述逻辑数据划分查询优化分布式查询等;关系是指不同实体之间的关联,例如位于、属于和包含等;属性是指对象可能具备的参数和特征,例如营业网点代码、营业网点电话等;属性值为对象特定属性所对应的值,例如营业厅所处区域的邮政编码等。电力客服知识表示示例如图3所示。微信选择渠道查费缴费查停电原因辖区信息地市信息省份信息充换电站线下渠道辖区故障说明地址图3电力客服知识表
14、示示例图营业网点联系电话详细地址网点类型营业时间电费代收点自主营业厅充电站电力缴费厅一8 5一基于电力领域知识图谱的智慧客服系统研究2.1.2知识抽取从非结构化、半结构化和结构化数据当中抽取相关知识是知识抽取的主要任务,但对于不同结构数据所选用的知识提抽取方法不同。一般采用R2RML语言和直接映射的方式来抽取结构化数据(通常指关系数据库),其中直接映射将数据库中的表通过编写规则的方式转化为RDF(资源描述框架);R2RML语言是运用D2RQ工具将RDB(关系数据库)转换为RDF。针对半结构化数据,通常选用基于有监督的包装器来进行知识抽取,由于该类型数据重复性较高,故对数据进行适当的标注能够使机
15、器学习形成特定的规则,进而对具有某种关系或同类型数据的数据进行知识抽取。非结构化数据知识抽取主要包含属性抽取、关系抽取和实体抽取,其中实体抽取主要由实体一沈潇军等识别和链接组成,运用自然语言技术对文本中的实体进行识别,实体可能存在多个候选项,故在该过程中需要进行消歧操作,最终将识别的候选实体链接至知识库中。将实体之间的关系从文本中抽取出来就是所谓的关系抽取,可以选用基于弱监督或监督学习和基于模板等方法来实现。属性知识抽取主要是对实体的属性进行抽取,其抽取方法与关系抽取相似。由于结构化数据和半结构化数据知识提取相对简单,在此就不再赘述。非结构化数据知识抽取如图4所示,首先采用远程监督的方法将数据
16、库的数据进行自动标注,其次利用离群点检测方法将错误标注的数据进行清除,最后选用基于监督学习的神经网络算法对完成标注的数据进行训练,并测试未标注的数据,抽取得到未标注数据中所包含的实体及其之间存在的关系。百科文本电力客服领域知识图谱数据自动标注关系标签错误标注去除句向量过滤离群点输出层1解码层注意力真实标签解码层解码层注意力模糊聚类解码层BI-LSTMBI-LSTMBI-LSTMBI-LSTM(候选离群点)嵌入层实体及实体之间的关系at2at.3F1F232.a2.2h1h2eat.4F3F4a2,4a2.3h3h4e4错误标注数据去除关系标签输入层1标注数据(a)基于远程监督数据标注流程2.1
17、.3知识融合知识融合是将同一实体在不同知识库中的知一8 6 一(b)基于监督学习的神经网络知识抽取图4非结构数据知识抽取示意图识进行多层面融合,包括实体对齐、EntityResolu-tion、本体对齐、Record Linkage和本体匹配等。知基于电力领域知识图谱的智慧客服系统研究一沈潇军等一识融合的本质是将同一实体或概念的多源描述信息融合在一起。知识融合的流程如图5所示,开始导入融合实体ID和名称融合结果结束输出图5知识融合流程图由图5可知,知识融合主要由导人实体信息、爬取多源信息、实体消歧、属性对齐、发现属性真值及融合结果输出组成,其中利用多特征命名来消除实体歧义,基于词典(中文分词)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 电力 领域 知识 图谱 智慧 客服 系统 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。