可信人工智能系统的质量属性与实现:三级研究.pdf
《可信人工智能系统的质量属性与实现:三级研究.pdf》由会员分享,可在线阅读,更多相关《可信人工智能系统的质量属性与实现:三级研究.pdf(25页珍藏版)》请在咨信网上搜索。
1、可信人工智能系统的质量属性与实现:三级研究*李功源1,2,刘博涵1,2,杨雨豪1,2,邵栋1,21(南京大学软件学院,江苏南京210023)2(计算机软件新技术国家重点实验室(南京大学),江苏南京210023)通信作者:刘博涵,E-mail:摘要:人工智能系统以一种前所未有的方式,被广泛地用于解决现实世界的各种挑战,其已然成为推动人类社会发展的核心驱动力.随着人工智能系统在各行各业的迅速普及,人们对人工智能系统的可信性愈发感到担忧,其主要原因在于,传统软件系统的可信性已不足以完全描述人工智能系统的可信性.对于人工智能系统的可信性的研究,具有迫切需要.目前已有大量相关研究,且各有侧重,但缺乏一个
2、整体性、系统性的认识.研究是一项以现有二级研究为研究对象的三级研究,旨在揭示人工智能系统的可信性相关的质量属性和实践的研究现状,建立一个更加全面的可信人工智能系统质量属性框架.收集、整理和分析 2022 年 3 月前发表的 34 项二级研究,识别 21 种与可信性相关的质量属性及可信性的度量方法和保障实践.研究发现,现有研究主要关注在安全性和隐私性上,对于其他质量属性缺乏广泛且深入的研究.对于需要跨学科协作的两个研究方向,需要在未来的研究中引起重视,一方面是人工智能系统本质上还是一个软件系统,其作为一个软件系统的可信值得人工智能和软件工程专家合作研究;另一方面,人工智能是人类对于机器拟人化的探
3、索,如何从系统层面保障机器在社会环境下的可信,如怎样满足人本主义,值得人工智能和社会科学专家合作研究.关键词:人工智能系统;可信;质量属性;实践中图法分类号:TP18中文引用格式:李功源,刘博涵,杨雨豪,邵栋.可信人工智能系统的质量属性与实现:三级研究.软件学报,2023,34(9):39413965.http:/ Attributes and Practices of Trustworthy Artificial Intelligence Systems:A Tertiary StudyLIGong-Yuan1,2,LIUBo-Han1,2,YANGYu-Hao1,2,SHAODong1,2
4、1(SoftwareInstitute,NanjingUniversity,Nanjing210023,China)2(StateKeyLaboratoryforNovelSoftwareTechnology(NanjingUniversity),Nanjing210023,China)Abstract:Artificialintelligencesystemsarewidelyusedtosolvevariouschallengesintherealworldinanunprecedentedway,andtheyhavebecomethecoredrivingforceforthedeve
5、lopmentofhumansociety.Withtherapidpopularizationofartificialintelligencesystemsinallwalksoflife,thetrustworthinessofartificialintelligencesystemsisbecomingmoreandmoreworrying.Themainreasonisthatthetrustworthinessoftraditionalsoftwaresystemsisnotenoughtofullydescribethatofartificialintelligencesystem
6、s.Therefore,researchonthe trustworthiness of artificial intelligence systems is urgently needed.At present,there have been a large number of relevant studies,whichfocusondifferentaspects.However,thesestudieslackaholisticandsystematicunderstanding.Thisstudyisatertiarystudywith*基金项目:国家自然科学基金(62072227,
7、62202219);国家重点研发计划(2019YFE0105500);江苏省重点研发计划(BE2021002-2);南京大学计算机软件新技术国家重点实验室创新项目(ZZKT2022A25);海外开放课题(KFKT2022A09)本文由“AI 软件系统工程化技术与规范”专题特约编辑张贺教授、夏鑫博士、蒋振鸣副教授、祝立明教授和李宣东教授推荐.收稿时间:2022-09-04;修改时间:2022-10-13;采用时间:2022-12-14;jos 在线出版时间:2023-01-13CNKI 网络首发时间:2023-07-05软件学报ISSN1000-9825,CODENRUXUEWE-mail:Jo
8、urnal of Software,2023,34(9):39413965doi:10.13328/ki.jos.006875http:/中国科学院软件研究所版权所有.Tel:+86-10-62562563the existing secondary study as the research object.It aims to reveal the research status of quality attributes and practices related to thetrustworthiness of artificial intelligence systems and es
9、tablish a more comprehensive quality attribute framework for trustworthy artificialintelligencesystems.Thisstudycollects,sortsout,andanalyzes34secondarystudiespublisheduntilMarch2022.Inaddition,itidentifies21qualityattributesrelatedtotrustworthiness,aswellasmeasurementmethodsandassurancepracticesoft
10、rustworthiness.Thestudyfindsthat existing research mainly focuses on security and privacy,and extensive and in-depth research on other quality attributes is fewer.Furthermore,tworesearchdirectionsrequiringinterdisciplinarycollaborationneedmoreattentioninfutureresearch.Ontheonehand,theartificial inte
11、lligence system is essentially a software system,and its trustworthiness as a software system is worthy of collaborativeresearchbyartificialintelligenceandsoftwareengineeringexperts.Ontheotherhand,artificialintelligencebelongstohumansexplorationofmachineanthropomorphism,andresearchonhowtoensurethetr
12、ustworthinessofmachinesinthesocialenvironmentfromthesystemlevel,suchashowtosatisfyhumanism,isworthyofcollaborativeresearchbyartificialintelligenceandsocialscienceexperts.Key words:artificialintelligencesystem;trustworthy;qualityattribute;practice在过去的 10 年间,计算机处理能力的提高、数据集的扩大和算法准确性的提升推动了人工智能(artificia
13、lintelligence,AI)技术的进步1.随着越来越多的 AI 技术从实验室走向产业界,基于 AI 技术构建的软件系统也被广泛应用于医疗、工业、教育等各领域2.AI 系统在这些应用领域中展现出新颖且出色的性能,其适用的范围和场景都在以革命性的方式迅速扩大.AI 系统提供的许多创新功能,如自动驾驶,是前所未见的;AI 系统利用的大量数据是过去不曾被使用的.然而,新兴的事物总易遭受质疑,强大的能力需要受到更严格的约束.AI 所体现出的优秀特质也导致了社会对于 AI 系统可信性的广泛讨论,这些讨论涉及人工智能系统的隐私性、公平性、安全性等多个方面.AI 系统基于大量数据建立影响社会的规则和行为
14、,如果在数据中存在偏见,则 AI 系统会存在公平性的问题.例如,美国法院基于 AI 预测再犯概率的系统被证实对黑人存在偏见3;极端光照条件会影响视觉识别系统,进而影响自动驾驶系统的安全4;对人脸识别系统的恶意攻击可能会导致用于训练的个人图像的泄漏5.类似问题正在“人本主义的人工智能(human-centeredAI,HCAI)”“人工智能伦理(AIethics)”“可信人工智能(trustworthyartificialintelligence)”等主题下被广泛热议68.为了有效解决 AI 系统在实际应用中存在的问题,学术界、产业界以及政府组织都在密切关注 AI 系统的可信性,构造可信的 AI
15、 系统应作为其取得更加广泛应用的前提.近年来,可信 AI 领域涌现了大量标准、指南等规范性文件.国际标准化组织(InternationalOrganizationforStandardization,ISO)的技术报告 ISOTR240289分析了影响AI 系统可信性的因素并从公平性、透明性、问责性和可控性等方面讨论了提高 AI 系统可信性的方法.欧盟提出了可信 AI 伦理指南(ethicsguidelinesfortrustworthyAI)10,建议通过尊重人类自治,伤害预防,公平性,可解释性等 4 项原则监管 AI 系统,并提出了可信 AI 评估指南(assessmentlistfort
16、rustworthyartificialintelligence,ALTAI)11用于帮助企业或其他组织评估 AI 系统的开发、部署、采购和使用是否符合可信 AI 伦理指南的相关原则.中国信息通信研究院和京东探索研究院于 2021 年发布的可信人工智能白皮书12从落实 AI 治理共识的角度出发,围绕可靠可控、透明可释、隐私保护以及明确责任等方面,将各项要求引入 AI 系统研发的全流程.可信 AI 同样引起了学术界的广泛关注.可信是一个抽象的概念,要理解并进一步实现可信,需要从具体的与可信相关的质量属性入手.自 2017 年以来,涌现了大量关于可信 AI 系统质量属性及实践的二级研究(secon
17、darystudy).二级研究是指评价与特定研究问题相关的所有一级研究(primarystudy)的研究,目的是综合与特定研究问题相关的证据;其中一级研究是指调查特定研究问题的经验研究(empiricalstudy)13.但是这些二级研究都有着一定的局限性,它们讨论了可信 AI 系统的一个或多个质量属性,但覆盖范围不够全面.例如,文献 14 仅在欧盟的4 项原则下10讨论了可信 AI 系统的质量属性,缺少对质量属性的辨析以及对相关实践的讨论.文献 15 仅关注安全性和鲁棒性两个可信 AI 系统的质量属性及相关实践,缺乏对可信性全面的讨论.文献 16 仅讨论了公平性、隐私性、可解释性、可问责性和
18、可接受性 5 项要求及其相关的保障实践,缺乏对更多质量属性的研究,同时,也未讨论这些质量属性的度量评估方法.更多的二级研究,如文献 1719 仅聚焦于单个质量属性.为了对 AI 的可信建立一个更加系统且全面的认识,本文开展了一项三级研究(tertiarystudy)来收集并分析现有与可信 AI 相关的二级研究,具体从可信 AI 系统的二级研究现状、质量属性、评估度量方法、保障改进实践等 4 个方面开展了研究.三级研究是将二级研究的输出作为输入的综述性研究20,21.当一个研究主题上的二级研3942软件学报2023 年第 34 卷第 9 期究足够多时,三级研究可以覆盖更广泛的证据并从更高的抽象层
19、次开展研究,为研究者建立更系统性地理解和定位相关的二级研究提供帮助,弥补单项二级研究对问题认识不全面及弱化的单项研究中可能引入的偏见22,23.本文检索、挑选和分析了 34 项相关的二级研究1419,2451,具体而言,主要贡献包括:(1)本文揭示了可信 AI系统的质量属性及相关实践的二级研究的研究现状.(2)总结了现有二级研究中讨论的质量属性,按照可信 AI 的基本原则、质量属性及子属性的层次结构建立了可信人工智能系统的质量属性框架.(3)梳理了现有的可信性评估度量方法.(4)梳理了现有的可信性保障改进实践.本文第 1 节阐明本三级研究的研究问题及所采用的研究方法.第 2 节至第 5 节对本
20、研究的 4 个研究问题分别进行回答.第 6 节基于研究结果进行讨论.第 7 节讨论本文的效度威胁.第 8 节对本文进行总结.1 研究方法本研究开展的是以二级研究为研究对象的三级研究.二级研究通常指以一级研究为对象开展的研究,包括采用系统性文献综述(systematicliteraturereview,SLR)、映射研究(mappingstudy,MS)、一般综述(review)等方法的综述性研究13.Kitchenham 等人20,21将三级研究定义为“使用一个学科内的二级研究的输出作为输入的研究”.本研究的开展遵循 Kitchenham 等人关于软件工程领域系统性文献综述的指南13.目前,该
21、指南13描述的系统性文献综述方法被广泛应用于软件工程领域的二级研究和三级研究中,是一种较映射研究和一般综述更加系统且严谨的研究方法.两名硕士研究生和他们的两名导师作为研究人员参与了这项研究.本节主要阐述研究过程中所采用的研究方法.首先提出本三级研究的研究问题(第 1.1 节),其次描述文献的检索和筛选过程(第 1.2 节),最后描述本研究的数据抽取与分析过程(第 1.3 节).1.1 研究问题为了分析可信 AI 领域内的相关二级研究的研究现状,对可信 AI 的质量属性与相关实践建立系统性的理解,本文提出了以下 4 个研究问题(researchquestions,RQs).RQ1:现有可信人工智
22、能系统相关二级研究的研究现状如何?RQ2:现有二级研究中讨论了哪些与人工智能系统的可信性相关的质量属性?RQ3:现有二级研究中讨论了哪些人工智能系统的可信性(即各质量属性)的评估度量方法?RQ4:现有二级研究中讨论了哪些人工智能系统的可信性(即各质量属性)的保障改进实践?其中,RQ1 旨在对可信 AI 相关的二级研究的发表趋势,发表渠道以及研究范畴等建立系统的理解.RQ2 旨在调研当前可信 AI 相关的二级研究中讨论的质量属性间的差异、联系及层次关系,从而建立一个全面的 AI 系统可信性的质量属性框架.RQ3 和 RQ4 分别旨在对 AI 系统的可信性(即各质量属性)的评估度量方法和保障改进实
23、践建立较为全面的认识,识别出研究的热点和空白,进而挖掘出未来可能的研究方向.1.2 相关文献收集本研究对现有二级研究文献的收集过程如后文图 1 所示,包含手动检索、自动检索、文献筛选和滚雪球检索等 4 个步骤.为了尽可能降低文献检索过程中遗漏相关文献的风险,本文采用了基于准黄金标准(quasigoldenstandard,QGS)的检索策略52,具体的文献检索过程包括手动检索、自动检索以及滚雪球检索 3 个步骤,其中滚雪球检索过程中包含了对文献的筛选.文献的筛选由两名硕士研究生分别独立完成,他们之间的任何差异都会和导师进行讨论,所有被纳入的文献都由导师进行最终确认.本研究最终纳入了 34 篇相
24、关文献.需要说明的是,文献收集过程中没有对文献属于二级研究或三级研究加以限制,最终所有识别到的文献均为二级研究,即目前还没有一篇已发表的关于可信 AI 的三级研究.以下将展开介绍文献收集过程的各具体步骤.1.2.1手动检索手动检索基于领域内综述类文献的顶级期刊 ACMComputingSurveys 进行.手动检索的主要目的是为后续的自动检索设计更加全面且准确的检索字符串提供基础.同时,使本研究的所有参与者对研究问题和研究范畴建立清晰且一致的理解,并进一步确立文献选择标准.我们逐一浏览了出版时间在 2018 年至 2022 年 3 月之间的文献并进行筛选,共收集到了 6 篇关于可信 AI 质量
25、属性的二级研究.李功源等:可信人工智能系统的质量属性与实现:三级研究3943步骤 1:手动检索步骤 2:自动检索步骤 3:文献筛选确定筛选标准提供字符串定义依据全包含于筛选标准步骤 4:滚雪球检索最终文献集合6 篇ACMComputingSurveysIEEE XploreACM DigitalLibraryScienceDirectScopus(截至 2022 年 3 月)6 篇634 篇634 篇30 篇30 篇34 篇根据被引信息根据引用信息根据作者信息(20182022)图1相关文献收集过程1.2.2自动检索在确定自动检索的字符串时,主要参考了手动检索得到的 6 篇文献中的关键词.首先
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 可信 人工智能 系统 质量 属性 实现 三级 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。