问答系统研究综述.pdf
《问答系统研究综述.pdf》由会员分享,可在线阅读,更多相关《问答系统研究综述.pdf(18页珍藏版)》请在咨信网上搜索。
1、问答系统研究综述闫悦1,郭晓然2,王铁君2,饶强1,王铠杰11(西北民族大学中国民族信息技术研究院,兰州730030)2(西北民族大学数学与计算机科学学院,兰州730124)通信作者:王铁君,E-mail:摘要:问答系统是人工智能和自然语言处理领域中具有广泛发展前景的研究方向之一.早期的问答系统限定以自然语言形式进行提问和回答,近年来,随着多模态知识图谱、多模态预训练模型的发展,支持文字、图片、音频、视频等多种模态间信息查询的广义问答系统逐渐成为新的研究热点,其以多媒体方式展示结果,更加直观、全面.本文根据问答系统任务对象的变化,将问答系统划分为 3 种类型:专用问答系统、通用问答系统和多模态
2、问答系统.分析了这 3 种类型的问答系统发展过程中所面临的问题,着重总结每个阶段所采用的关键技术与方法,同时对问答系统在工业上的应用进行了举例说明,并对未来研究方向进行了展望.关键词:问答系统;问题分析;信息检索;答案生成;智能问答引用格式:闫悦,郭晓然,王铁君,饶强,王铠杰.问答系统研究综述.计算机系统应用,2023,32(8):118.http:/www.c-s- on Question Answering System ResearchYANYue1,GUOXiao-Ran2,WANGTie-Jun2,RAOQiang1,WANGKai-Jie11(ChinaNationalInform
3、ationTechnologyResearchInstitute,NorthwestMinzuUniversity,Lanzhou730030,China)2(SchoolofMathematicsandComputerScience,NorthwestMinzuUniversity,Lanzhou730124,China)Abstract:Thequestionanswering(Q&A)systemisoneofthepromisingresearchdirectionsinthefieldofartificialintelligenceandnaturallanguageprocessi
4、ng.EarlyQ&Asystemscanonlyaskandanswerintheformofnaturallanguage.Inrecentyears,withthedevelopmentofmultimodalknowledgegraphsandmultimodalpre-trainingmodels,generalizedQ&Asystemssupportinginformationqueriesofmultiplemodessuchastext,image,audio,andvideohavegraduallybecomeanewresearchhotspot,andtheirdis
5、playofresultsinamultimediamannerismoreintuitiveandcomprehensive.ThisstudyclassifiesQ&Asystemsintothreetypesaccordingtotheirchangingtaskobjects:dedicatedQ&Asystems,generalQ&Asystems,andmultimodalQ&Asystems.TheproblemsfacedinthedevelopmentofthesethreetypesofQ&Asystemsareanalyzed,andthekeytechnologiesa
6、ndmethodsusedineachstagearehighlightedandsummarized.Inaddition,theindustrialapplicationsofQ&Asystemsareexemplified,andfutureresearchdirectionsareprospected.Key words:questionanswering(Q&A)system;questionanalysis;informationretrieval;answerextraction;intelligentquestionanswering1引言问答系统是信息检索领域长期以来的研究重
7、点,通常使用自然语言形式的句子进行提问,结合上下文语境为用户返回精准、可靠的答案,改善用户的搜索计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(8):118doi:10.15888/ki.csa.009208http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:国家自然科学基金(62166035);甘肃省自然科学基金(21JR7RA163);中央高校基本科研业务费(31920210090)收稿时间:2023-01-10;修改时间:2023-
8、03-08;采用时间:2023-03-23;csa 在线出版时间:2023-06-09CNKI 网络首发时间:2023-06-12SpecialIssue专论综述1体验.广义的问答系统不再仅局限于自然语言形式的问题和答案,也支持用户输入图片、视频、音频等多媒体信息进行查询,以多媒体形式展示答案,例如:微软小冰1所提供的图片评论功能是对用户发出的图片进行回答;阿里小蜜机器人2在电商直播时担任虚拟主播和智能辅播,可提供文字、图片、视频等多模态的商品展示和回复.随着人工智能和深度学习的发展,面对复杂问题时,期望能够模仿人类运用不同模态的信息,形成一个完整的思维链,因此对多模态知识图谱、多模态预训练模
9、型3和多模态问答系统等诸多方面提出了新挑战.1.1 问答系统的定义早期的问答系统主要利用信息检索技术在对应知识库中找到合适的信息4,属于狭义的问答系统,被定义为一个利用计算机等自动化机器回答自然语言问题的系统5,即问题和答案只有自然语言一种模态.广义问答系统被重新定义6,7,允许用户输入任意模态信息,通过提取用户输入内容中的关键信息,给出问题所对应的准确答案.例如,用户可以提问“燕子的特征是什么?”,也可以输入一张燕子图片,提问“这个动物的特征是什么?”,系统都应该返回一个精准的答案.1.2 问答系统的处理框架狭义的问答系统处理框架主要包括问题分析、信息检索、答案抽取 3 个部分.添加其他模态
10、信息后,问答系统的框架发生变化,问题分析阶段需对文本、图像、音视频信息进行特征提取,之后将多种模态信息进行融合,目的是将多个特征映射到同一个空间中,最后根据融合的信息进行答案生成,框架如图 1 所示.答案抽取文本图像音视频对象识别特征提取目标检测场景分类问题分析信息检索信息融合文本和图像信息文本和音视频信息文本模态多模态实体识别关系抽取问句分类文档检索模板匹配语义解析段落划分模板匹配信息抽取统计模型深度学习答案生成注意力机制解码器分类器知识库检索图 1问答系统的处理框架 1.3 问答系统的发展脉络问答系统概念的提出可追溯到 20 世纪 50 年代图灵测试的提出,发展到如今的多模态问答系统,前后
11、经历了 8 个阶段,每个阶段所处理的数据格式和形式不同,具体应用也有所不同,如表 1 所示.目前有许多研究人员针对问答系统的不同方面进行了综述,陈子睿等人8针对开放领域知识图谱问答方法进行了总结;冯钧等人9对问答系统中的复杂问题进行了总结;姚元杰等人10对问答系统中运用的深度学习方法进行了总结.经过技术的不断发展,本文根据任务对象将问答系统 8 个阶段划分为专用问答系统、通用问答系统和多模态问答系统 3 种类型.接下来,围绕不同类型问答系统所涉及的关键理论技术进行介绍.2专用问答系统文中将任务对象为限定领域、结构化文本数据的问答系统统称为专用问答系统.这一类问答系统是对问答系统这一概念的初提出
12、与初实践,由于当时的网络不是很发达,受数据集内容与数量的限制,留下的有代表性的问答系统多限定在某一领域.计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第8期2专论综述SpecialIssue表 1问答系统发展脉络类型发展时期任务对象相关应用专用问答系统图灵测试(20世纪50年代)测定机器是否具有人工智能的方法AI时期(20世纪60、70年代)限定领域、结构化数据Baseball系统Lunar系统计算语言学阶段(20世纪80年代)限定领域、结构化数据UnixConsultant(UC)通用问答系统基于大规模文档集的问答系统(20世纪90年代)开放领域、电子文档聊天机器人
13、ALICE问答系统评测专项基于问题答案对的问答系统(21世纪00年代)开放领域、问题答案对百度的AnyQ腾讯知文结构化FAQ问答引擎基于知识图谱的问答系统(21世纪10年代)开放领域、结构化数据GoogleKnowledgeGraphAmazon知识图谱基于大规模语言模型的问答系统(21世纪20年代)开放领域、非结构化数据ChatGPT多模态问答系统多模态问答系统(21世纪20年代)文本、图像、视频、音频阿里小蜜机器人微软小冰灵医小智 2.1 图灵测试图灵测试最早来源于 1950 年图灵发表的一篇名为“ComputingMachineryandIntelligence”11的论文中.图灵专注于
14、研究计算机可否像人一样进行交谈,提出了测定机器是否具有人工智能的一套方法图灵测试,它是人工智能最初的概念,甚至早于“人工智能”这个词本身.图灵测试采用“问”与“答”的模式,即观察者通过控制打字机和测试对象通话,观察者不断提出各种问题,从而辨别回答者是人还是机器.围绕图灵测试展开的研究历程如图 2 所示.图灵测试所使用的“问”与“答”的测试方法,是问答系统最早的研究理论.2.2 AI 时期问答系统的雏形最早出现在 20 世纪 60 年代,主要研究内容是如何使用自然语言检索结构化数据库.这一时期有两个比较著名的系统 Baseball12和 Lunar13.Baseball 系统是最早以“未来的人机
15、交互将以自然语言进行交流的方式”为目标构建的系统,用于回答用户通过自然语言提出的关于棒球联赛问题.Lunar 是在 NASA载人航天器中心的支持下开发,使月球地质学家无需学习编程语言和数据库的相关指令,直接使用自然语言就能访问检索 NASA 数据库.Lunar 系统示意图如图 3 所示,主要由 3 个部分组成:第 1 部分用于将自然英语按照语法生成机器可理解的句法树;第 2 部分的语义解释组件将句法表示进行转换,对句子进行意图理解.数据库检索和推理组件用于根据句子含义对数据库进行计算和检索;第 3 部分确定查询的答案并根据结果对数据库进行更改.1936 年 哲学家阿尔弗雷德艾耶尔在语言真理与逻
16、辑中提出有意识的人类及无意识的机器之间的区别.1950 年 图灵发表了一篇划时代的论文,提出图灵测试.1966 年 麻省理工学院的教授约瑟夫维森鲍姆发明了一个人机对话程序,名叫伊莱扎(ELIZA),可以像真人一样与人交流几十分钟.2014 年 雷丁大学在伦敦进行了一场图灵比赛.一台名叫尤金古斯特曼的聊天机器人,成为有史以来首台通过图灵测试的计算机.2015 年 Science杂志封面刊登了一篇重磅研究:人工智能终于能像人类一样学习,并通过了图灵测试.图 2图灵测试研究历程以上两个系统都需要依赖人工撰写的规则模板,完成从自然语言问题到结构化数据库查询语句的转换.这些早期系统大多针对特定领域,处理
17、的数据规模不大且为结构化数据.这一时期还出现了一些可以进行对话的问答系统,比如 ELIZA(心理咨询)14、SHRDLU(积木游戏)15、GUS(旅行信息咨询)16.随着人们在探索问答系统中对句法和语义问题的理解不断加深,问答系统的发展在 20 世纪 80 年代进入了计算语言学时期.2.3 计算语言学时期这一时期的问答系统更加关注于解决事实类型的2023年第32卷第8期http:/www.c-s-计 算 机 系 统 应 用SpecialIssue专论综述3问题,任务对象为限定领域和结构化文本数据,代表系统为 UC 系统17.UC 提供一个智能、自然的语言界面,让用户用英语与系统交流来了解 Un
18、ix 操作系统.研究者们将其称为“智能帮助设施”,具体指建立一个系统模拟人类顾问的实际功能.它具备了分析用户的语言、确定用户操作的目标、给出解决用户需求的规划、决定需要与用户沟通的内容、以英语生成最终的对话内容以及根据用户对 Unix 系统的熟悉程度进行建模等功能.UC的框架由大量组件组成,组件之间大多以串行的方式调用,功能如图 4 所示.这一时期问答系统的处理流程已具备雏形,首先分析用户的问题,了解用户的意图,然后获取有关用户问题主题的知识,最后制定合理的回答并将答案返回给用户.通用语法和解析器规则驱动的语义解释组件数据库检索和推理组件数据库语言理解组件第 1 部分第 2 部分第 3 部分图
19、 3Lunar 系统组成部分UC分析用户的语言确定用户操作的目标给出解决用户需求的规划决定需要与用户沟通的内容以英语生成最终的对话内容根据用户对 Unix 系统的熟悉程度进行建模图 4UC 的功能3通用问答系统经历了上一阶段的专用问答系统后,之后的研究对象大多为开放领域且在这一阶段的研究内容现在还在工业界或者学术界流通使用,所以本文将基于大规模文档集的问答系统、基于问题答案对的问答系统、基于知识图谱的问答系统和基于大规模语言模型的问答系统归类为通用问答系统,其特点为信息量大且不再限定信息领域.3.1 基于大规模文档集的问答系统20 世纪 90 年代,问答系统的发展进入了基于大规模文档集的问答系
20、统时期.这一时期互联网快速发展,产生了大量的电子文档,数据的格式不再是固定的结构化数据,问答系统的流程为从用户的自然语言问句中获取主题词,利用主题词在网络文档中搜索相关的文档,如图 5 所示.问句分类主题提取文本库网页文档检索段落划分候选答案抽取答案排序答案验证问题答案图 5基于大规模文档集的问答系统处理流程1995 年 Wallace 开发设计了第 1 个聊天机器人ALICE18.ALICE 的知识库由 AIML(artificialintelligencemarkuplanguage)语言编写的文件组成,每个 AIML 文件代表一个领域的可能话题.ALICE 的推理机制是将AIML 知识库
21、以树的结构形式加载到内存中形成内存知识树.当用户输入要查询的句子时,ALICE 系统在这棵内存知识树中检索与用户输入语句最匹配的模式,如果匹配到则对答复模板进行进一步处理后回复给用户.这一时期问答系统研究的基本问题是问题分析、信息检索和答案抽取.下面将针对这 3 个问题对基于大规模文档集的问答系统的相关研究进行综述.3.1.1问题分析问题分析主要是对问句进行分析,理解用户问题,为信息检索做准备,通常将问句分类和主题提取用于分析问题.(1)问句分类.问句分类是在给定问句的情况下,将用户问题分类到已规定的或自定义的分类结构中一个或几个类.这一时期对问句分类的主要方法分为基于规则的分类方法和机器学习
22、的方法,最初 Lehnert 等人19将问句分为了 13 个概念类,但这样的分类方式在事实问题上不适用,为解决这一问题,Li 等人20利用计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第8期4专论综述SpecialIssue一种分类的机器学习方法,将问题分为 6 个大类,同时在这 6 个大类下又细分 50 个小类,该方法较好满足了人们的需求.2002 年,Magnini 等人21利用规则的分类方法,在 DIOGENE 系统中用一组手动定义的分类规则,对问句进行分类,可以正确对问句进行处理.近年来问句分类主要是基于深度学习的方法,利用 CNN 模型、LSTM 模型、BE
23、RT 模型进行,Xiao 等人22利用CNN 模型对中国法律问题进行分类,该方法在粗粒度分类和细粒度分类上都取得了不错的效果.杨建飞23利用 BERT 模型对军事装备问题进行分类,张永亮24利用 TextCNN 模型对关于苹果病虫害的问题进行分类,这些方法较好地完成了对应任务.(2)主题提取.主题提取的结果将用于信息检索中获得与查询问题相关的文档,主题词的选取会影响到信息检索的效果,所以一般会选取问句的中心词和中心词的约束作为主题.大多方法是基于 TF-IDF 模型及停用词过滤的方法,Mihalcea 等人25参考 PageRank 算法26提出了一种将文本作为图的无监督排序算法TextRan
24、k 算法,用于关键词抽取和对文档进行简明摘要.El-Beltagy 等人27提出 KP-Miner 算法,该算法首先利用标点符号和停用词将文档切分,将切分出的词序列作为候选词,然后通过候选词的频度以及设定的规则对候选词进行过滤,计算总体权重,最后根据权重值进行排名,来提取关键词.以上两种主题提取的算法应用较广.3.1.2信息检索信息检索是根据所提取的主题剔除掉文档集中的无关文档,减小信息搜索的范围,以提高搜索的效率和精度.信息检索的任务一般分为文档检索和段落划分,检索出含有正确答案的文档或者段落越少,提取出正确答案的可能性就越大.(1)文档检索.文档检索是在所选数据库中查找出与用户问题相关的文
25、档.常用的检索模型有布尔模型、向量空间模型、概率模型、语言模型、机器学习排序算法等.在问题分析的主题提取中提到过,通常会选用问句的中心词和中心词的约束作为检索的内容,但会遇到对长问句选取的关键词较多,对短问句选取的关键词较少的问题,这种情况会对检索产生困难.Moldovan 等人28针对这个问题在查询过程中用迭代式调整技术对关键词进行调整,若返回的文档过多,说明关键词太少、查询限制宽松则需加上一些限制;若返回文档较少,说明若关键词太多、查询限制太严格就去掉一些限制.(2)段落划分.段落划分是在文档检索的基础上再一次减少相关文档的数量.Tellex 等人29在研究中发现布尔查询模式在问答任务中表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 问答 系统 研究 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。