知识图谱嵌入模型中的损失函数研究综述_申秋慧.pdf
《知识图谱嵌入模型中的损失函数研究综述_申秋慧.pdf》由会员分享,可在线阅读,更多相关《知识图谱嵌入模型中的损失函数研究综述_申秋慧.pdf(10页珍藏版)》请在咨信网上搜索。
1、h t t p:/ww w.j s j k x.c o mD O I:1 0.1 1 8 9 6/j s j k x.2 1 1 2 0 0 1 7 5到稿日期:2 0 2 1-1 2-1 5 返修日期:2 0 2 2-0 9-0 5基金项目:国家自然科学基金(6 1 8 0 6 2 2 1)T h i sw o r kw a ss u p p o r t e db yt h eN a t i o n a lN a t u r a lS c i e n c eF o u n d a t i o no fC h i n a(6 1 8 0 6 2 2 1).通信作者:张宏军(j s n j z
2、h j_l g d x 1 6 3.c o m)知识图谱嵌入模型中的损失函数研究综述申秋慧1张宏军2徐有为1王 航1程 恺21陆军工程大学研究生院 南京2 1 0 0 0 72陆军工程大学指挥控制工程学院 南京2 1 0 0 0 0(m a p l e_d a n c i n g z k n u.e d u.c n)摘 要 表达方式丰富直观的知识图谱得到了大量学者的关注。在知识图谱嵌入方面已积累了大量研究,其成果在电商、金融、医药、交通、智能问答等领域发挥了重要的作用。其中,损失函数在知识图谱嵌入模型的训练阶段起到了非常关键的作用。在现有知识图谱嵌入研究的基础上,根据基础损失函数把模型中使用的
3、损失函数梳理为合页损失、逻辑回归损失、交叉熵损失、对数似然损失、负采样损失和均方误差损失六大类,并逐类详细分析了损失函数的原型公式、物理含义和其在知识图谱嵌入模型中的扩展、演变及应用。在此基础上,对静态和动态两大知识图谱场景中各种损失函数的使用情况、效率和收敛性进行了综合分析评价;根据分析结果,结合知识图谱的发展应用趋势和损失函数现状,对损失函数的未来研究方向进行了探讨。关键词:知识图谱;损失函数;嵌入模型;知识表示学习中图法分类号 T P 3 1 1 C o m p r e h e n s i v eS u r v e yo fL o s sF u n c t i o n s i nK n
4、o w l e d g eG r a p hE m b e d d i n gM o d e l sS HE NQ i u h u i1,Z HANG H o n g j u n2,X U Y o u w e i1,WAN G H a n g1a n dCHE N GK a i21S c h o o l o fG r a d u a t e,A r m yE n g i n e e r i n gU n i v e r s i t yo fP L A,N a n j i n g2 1 0 0 0 7,C h i n a2C o l l e g eo fC o mm a n da n dC o
5、n t r o lE n g i n e e r i n g,A r m yE n g i n e e r i n gU n i v e r s i t yo fP L A,N a n j i n g2 1 0 0 0 0,C h i n a A b s t r a c t D u et oi t sr i c ha n di n t u i t i v ee x p r e s s i v i t y,k n o w l e d g eg r a p hh a sr e c e i v e dm u c ha t t e n t i o no fm a n ys c h o l a r s.
6、Al o to fw o r k sh a v eb e e na c c u m u l a t e di nk n o w l e d g eg r a p he m b e d d i n g.T h er e s u l t so ft h ew o r k sh a v ep l a y e da ni m p o r t a n tr o l ei ns o m ef i e l d s,s u c ha se-c o mm e r c e,f i n a n c e,m e d i c i n e,t r a n s p o r t a t i o na n d i n t e
7、l l i g e n tQ&A.I n t h ek n o w l e d g eg r a p he m b e d d i n gm o d e l,t h el o s s f u n c t i o np l a y s ak e yr o l e i n i t s t r a i n i n gs t a g e.B a s e do n t h e e x i s t i n gr e s e a r c ho f k n o w l e d g eg r a p he m b e d d i n g s,t h i sp a p e r c l a s-s i f i e
8、st h e l o s s f u n c t i o n su s e d i nt h em o d e l i n t os i xc a t e g o r i e s:h i n g e l o s s,l o g i s t i c l o s s,c r o s se n t r o p y l o s s,l o g l i k e l i h o o d l o s s,n e g a-t i v es a m p l i n g l o s sa n dm e a ns q u a r e e r r o r l o s s.T h ep r o t o t y p e
9、f o r m u l aa n dp h y s i c a lm e a n i n go f l o s s f u n c t i o n s a n d t h e i r e x p a n s i o n,e v o l u t i o na n da p p l i c a t i o n i nk n o w l e d g eg r a p he m b e d d i n gm o d e l s a r e a n a l y z e d i nd e t a i l o n eb yo n e.B a s e do n t h ea b o v e,t h eu s
10、a g e,e f f i c i e n c ya n dc o n v e r g e n c e o f v a r i o u s l o s s f u n c t i o n s i n t h e s t a t i c a n dd y n a m i ck n o w l e d g eg r a p hs c e n a r i o s a r e c o m p r e h e n s i v e l ya n a-l y z e da n de v a l u a t e d.A c c o r d i n gt ot h ea n a l y s i sr e s u
11、 l t s,c o m b i n e dw i t ht h ed e v e l o p m e n ta n da p p l i c a t i o nt r e n do fk n o w l e d g eg r a p ha n dt h ec u r r e n t s i t u a t i o no f l o s s f u n c t i o n s,t h e f u t u r ew o r k so f l o s s f u n c t i o n sa r ed i s c u s s e d.K e y w o r d s K n o w l e d g
12、eg r a p h,L o s s f u n c t i o n,E m b e d d i n gm o d e l,K n o w l e d g er e p r e s e n t a t i o n l e a r n i n g 1 引言知识图谱嵌入(K n o w l e d g eG r a p hE m b e d d i n g,K G E)可以对大型知识图谱进行高效可扩展的操作,有利于改进链接预测1-2、图谱补全3和实体解析4等下游任务的结果。KG E模型从知识图谱中学习实体、关系及结构。具体地说,嵌入的目标是根据关联性将连接头实体和尾实体的三元组(头实体、关系、尾实
13、体)按关系类型排序。用实体和关系嵌入之间的各种交互作用计算三元组排名。这些交互作用通常反映在特定于模型的评分函数中。近年来有许多研究提出了很多不同的嵌入模型,但这些工作主要集中在新的评分函数的设计上,而对表示学习过程的核心部分损失函数却没有给予太多的关注,但是训练过程中的损失函数会显著影响K G E模型的 行 为。例 如,文 献 5 的 研 究 发 现,模 型H o l E6和C o m p l E x7的评分函数相同,但运行结果不同;文献8 对出现这种现象的原因进行了研究,结论是H o l E使用了基于间隔的排名损失,而C o m p l E x使用的是对数似然损失,这表明损失函数对于深入理
14、解,甚至改进不同K G E模型的性能非常重要。基于此,开展了本项研究,主要完成了如下工作。(1)对K G E模型中的损失函数进行了分类:研究了现有6 4种单个KG E模型(包括传统的静态K G E模型和近期的动态K G E模型),对其进行了深入的分析,把模型中使用的损失函数概括为六大类。(2)评价了K G E模型不同场景下的损失函数:根据模型假设,先把知识图谱分为静态和动态两大类,又把静态模型分为距离、几何、语义匹配、神经网络和附加信息5类,逐个类别地分析其使用的损失函数,并在效率、收敛性和适用性方面进行了分析评价。(3)展望了K G E中损失函数的未来研究方向:基于综合分析结果和当前损失函数
15、存在的问题,从匹配、迁移、复合及负样本4个方面对未来损失函数的研究进行了全面的展望。第2节概述了K G E模型、评分函数、损失函数及表示学习过程;第3节对K G E中的损失函数进行了总结分类,并对每一类进行了详细的研究分析;第4节对损失函数进行了综合分析与评价;第5节描述了目前K G E模型中损失函数存在的问题,讨论了未来可能的损失函数设计模式及研究方向;最后进行全文总结。2 问题定义知识图谱是为了结构化地表示知识,通常用多关系有向图表示,图中的节点表示实体,边表示实体之间的关系。一般将知识图谱定义为G=E,R,T,其中E是实体集合,R是关系集合,TERE是三元组集合,三元组(h,r,t)T表
16、示G中所有存在的事实三元组,h是头实体,t是尾实体,h和t都属于实体集合E,rR是h和t之间的有向关系。一个三元组(h,r,t)成立,就表示知识图谱中存在该事实三元组。知识图谱嵌入也叫知识表示学习(K n o w l e d g eR e p r e s e n-t a t i o nL e a r n i n g,K R L),指的是把知识图谱中的实体通过编码模型表示成空间向量。若c(*)表示编码模型中的投影函数,e表示实体,则c(e)=e,即实体e经过投影变换成一个向量e。如果模型中区分了头尾实体,那么头实体h和尾实体t的嵌入向量分别记为h和t。很多时候为了学习到实体与实体之间的复杂语义信
17、息,也把关系r用到编码模型中,用r表示r的嵌入向量。知识表示学习过程如图1所示。图1 知识表示学习过程F i g.1 P r o c e s so fk n o w l e d g er e p r e s e n t a t i o n l e a r n i n g 设计阶段考虑模型的表征空间(R e p r e s e n t a t i o nS p a c e)、评分函数(S c o r eF u n c t i o n)、编码模型(E n c o d i n gM o d e l s)和是否包含附加信息(A u x i l i a r yI n f o r m a t i o n)
18、,训练阶段是输入样本使用损失函数(L o s sF u n c t i o n)训练模型,求解模型参数,最后在通用数据集上执行训练好的模型,对模型进行评测。为了度量三元组的可信性,更准确地学习到知识图谱的结构特征,完成知识图谱中的语义信息表示,就需要设计一个评分函数。评分函数用f(*)表示,输入正例三元组,评分函数可以计算得到一个数值,用f(h,r,t)表示。同时,用f(h,r,t)表示输入负例三元组的结果。这里正例三元组就是集合T中的三元组,也叫正样本,是G中真实存在的;负例三元组集合用T-表示,也叫负样本,通常定义为T-=(h,r,t)|h Eh h(h,r,t)T(h,r,t)|t Et
19、 t(h,r,t)T。希望能通过分数的不同,预测某个样本中的三元组是真实存在的还是不存在的,也就是希望通过评分函数能够得到三元组属于某个类别的得分值。如果预测错了,就需要使用损失函数把错误信息反馈给模型。损失函数是在模型的训练阶段描述预测值和真实值之间差距的函数,用L表示。损失函数也叫代价函数(C o s tF u n c-t i o n),通过损失函数迭代、优化模型的分类效果,L的值越大表示分类效果越差,L的值越小表示分类效果越好,对模型来说最好的是损失函数值为零。同时,模型中的一些参数值也是通过训练过程求得的。图2给出了K G E模型中评分函数与损失函数的关系。图2 评分函数与损失函数的关
20、系F i g.2 R e l a t i o n s h i pb e t w e e ns c o r i n gf u n c t i o na n d l o s s f u n c t i o n在样本和评分函数相同的情况下,不同的损失函数表现是不一样的,损失函数对模型的行为和训练效率会产生显著影响。接下来对单个知识图谱嵌入模型中的损失函数进行详细分析。3 损失函数分类根据基础数学公式,KG E模型中常用的损失函数主要包括六大类,分别是合页损失、逻辑回归损失、交叉熵损失、对数似然损失、负采样损失和均方误差损失。损失函数分类体系051C o m p u t e rS c i e n c
21、e计算机科学V o l.5 0,N o.4,A p r.2 0 2 3及各模型归属情况如图3所示。下面分别从基础数学表达式和在KG E中的应用扩展两个方面对损失函数进行介绍。图3 损失函数分类与各模型归属情况F i g.3 C l a s s i f i c a t i o no f l o s s f u n c t i o na n da t t r i b u t i o no f e a c hm o d e l3.1 合页损失合页损失(H i n g eL o s s)又叫铰链损失,适合于解决二分类问题,是机器学习中常用的损失函数之一。数学表达式为:L(y)=m a x(0,1-yy
22、)(1)其中,y是标签,取值为-1或1;yR是预测值。当yy1时,损失为1-yy,也就是y(-1,1),分类不确定;当yy1时,损失为0,也就是y1或y-1,是确定的分类结果。但在实际的应用中,很多时候y的取值并不是-1或1,而是更接近于一个概率,值域是0,1;或者模型训练的是两个样本之间的相似关系,而非样本的整体分类,所以合页损失就有了如下的一个变种:L(y,y)=m a x(0,m-y+y)(2)其中,y是正样本得分;y 是负样本得分;m是一个数值,表示最大间隔,正负样本得分之差最多到m就可以了。KG E中 基 于 间 隔 的 排 名 损 失(M a r g i n-b a s e d R
23、 a n k i n gL o s s)就是在合页损失的基础上扩展的。比如在模型UM9,S E1 0,TA T E C1 1和D i s t M u l t1 2中,损失函数为:L=(h,r,t)T(h,r,t)T-m a x(0,1-f(h,r,t)+f(h,r,t)(3)其中,f(h,r,t)是正样本得分,f(h,r,t)是负样本得分,正负样本得分之差为1。但在模型的实际训练中,间隔设置为1并不总能得到一个好的结果,因此需要调整间隔以获得更好的结 果,在 模 型T r a n s F1 3,T r a n s R1 4,H o l E6,T K R L1 5,D K R L1 6,I K
24、R L1 7和H y T E1 8中就把间隔设置为了一个可变的参数,具体公式为:L=(h,r,t)T(h,r,t)T-m a x(0,-f(h,r,t)+f(h,r,t)(4)在训练时不断调整的值,以达到模型最好的分类效果。值得一提的是,目前KG E的研究中用到的基于间隔的排名 损 失 的 模 型 还 有 很 多,如T r a n s E1,T r a n s D1 9,T r a n S p a r s e2 0,I T r a n s F2 1,M a n i f o l d E2 2,KG 2 E2 3,S T r a n s E2 4,P T r a n s E2 5,T r a n
25、s M2 6,T o r u s E2 7和T T r a n s E2 8,但其与式(4)的写法略有不同,如式(5)所示:L=(h,r,t)T(h,r,t)T-f(h,r,t)+f(h,r,t)+(5)其中,x+表示m a x(x,0),也就是说式(4)与式(5)只是写法上不同,实质是一样的,都是通过一个好的间隔参数将正样本和负样本的得分差异最大化。另 外,在 模 型T r a n s H2,T r a n s A2 9,T r a n s A t3 0和N TN3 1中,为了保证正确分类的分值越大越好,错误分类的分值越小越好,在损失函数中添加了正则化项;同时,还为各自模型的具体目标及下游任
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 图谱 嵌入 模型 中的 损失 函数 研究 综述 申秋慧
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。