人工智能系统可信性度量评估研究综述.pdf
《人工智能系统可信性度量评估研究综述.pdf》由会员分享,可在线阅读,更多相关《人工智能系统可信性度量评估研究综述.pdf(19页珍藏版)》请在咨信网上搜索。
1、人工智能系统可信性度量评估研究综述*刘晗1,2,李凯旋1,2,陈仪香1,21(华东师范大学软件工程学院,上海200062)2(上海市高可信计算重点实验室(华东师范大学),上海200062)通信作者:陈仪香,E-mail:摘要:近年来,人工智能技术突飞猛进,人工智能系统已经渗透到人们生活中,成为人们生活中不可或缺的一部分.然而,人工智能系统需要数据训练模型,数据扰动会对其结果造成影响.并且随着人工智能系统业务多样化,规模复杂化,人工智能系统的可信性愈发受到人们的关注.首先,在梳理不同组织和学者提出的人工智能系统可信属性基础上,提出人工智能系统的 9 个可信属性;接着,从数据可信性、模型可信性和结
2、果可信性分别介绍现有的人工智能系统数据、模型、结果可信性度量方法,设计人工智能系统可信证据收集方法.其次,总结当前人工智能系统的可信度量评估理论与方法.然后,结合基于属性的软件可信评估方法与区块链技术,建立一个人工智能系统可信度量评估框架,包括可信属性分解及可信证据获取方法、联邦式可信度量模型与以及基于区块链的人工智能系统可信度量评估架构.最后,讨论人工智能系统可信度量技术面临的机遇和挑战.关键词:人工智能系统;可信性;度量评估中图法分类号:TP18中文引用格式:刘晗,李凯旋,陈仪香.人工智能系统可信性度量评估研究综述.软件学报,2023,34(8):37743792.http:/ on Tr
3、ustworthiness Measurement for Artificial Intelligence SystemsLIUHan1,2,LIKai-Xuan1,2,CHENYi-Xiang1,21(SoftwareEngineeringInstitute,EastChinaNormalUniversity,Shanghai200062,China)2(ShanghaiKeyLaboratoryofTrustworthyComputing(EastChinaNormalUniversity),Shanghai200062,China)Abstract:In recent years,art
4、ificial intelligence(AI)has rapidly developed.AI systems have penetrated peoples lives and become anindispensablepart.However,thesesystemsrequirealargeamountofdatatotrainmodels,anddatadisturbanceswillaffecttheirresults.Furthermore,as the business becomes diversified,and the scale gets complex,the tr
5、ustworthiness of AI systems has attracted wideattention.Firstly,based on the trustworthiness attributes proposed by different organizations and scholars,this study introduces ninetrustworthiness attributes of AI systems.Next,in terms of the data,model,and result trustworthiness,the study discusses m
6、ethods formeasuring the data,model,and result trustworthiness of existing AI systems and designs an evidence collection method of AItrustworthiness.Then,it summarizes the trustworthiness measurement theory and methods of AI systems.In addition,combined withattribute-based software trustworthiness me
7、asurement methods and blockchain technologies,the study establishes a trustworthinessmeasurement framework for AI systems,which includes methods of trustworthiness attribute decomposition and evidence acquisition,thefederation trustworthiness measurement model,and the blockchain-based trustworthines
8、s measurement structure of AI systems.Finally,itdescribestheopportunitiesandchallengesoftrustworthinessmeasurementtechnologiesforAIsystems.Key words:artificialintelligencesystem;trustworthiness;measurement*基金项目:华东师范大学-华为可信创新实验室项目(15902-412312-19214/013);上海市可信工业互联网软件协同创新中心项目本文由“智能系统的分析和验证”专题特约编辑明仲教授、
9、张立军教授和秦胜潮教授推荐.收稿时间:2021-09-03;修改时间:2021-10-14;采用时间:2022-01-10;jos 在线出版时间:2022-01-28CNKI 网络首发时间:2023-01-19软件学报ISSN1000-9825,CODENRUXUEWE-mail:Journal of Software,2023,34(8):37743792doi:10.13328/ki.jos.006592http:/中国科学院软件研究所版权所有.Tel:+86-10-62562563人工智能自 1956 年诞生以来,经历了从繁荣到衰退再到繁荣的螺旋式发展过程,出现了 3 次发展高潮1.第3
10、 次高潮起源于辛顿(Hinton)在 2006 年提出的深度学习概念2,2016 年围棋机器人 AlphaGo3以该模型为核心的算法战胜了人类顶级棋手引发广泛关注,极大地推动了人工智能的研究与应用高潮.近年来,欧美日等国持续加大对人工智能基础理论和应用的重点投入,以保持其在人工智能技术方面的领先地位.我国政府在 2017 年发布了新一代人工智能发展规划,将人工智能正式列入国家发展战略4,学术界和产业界也掀起了人工智能研发热潮,李国杰院士和陆汝钤院士等多位人工智能科学家在多个场合呼吁重视人工智能的发展态势5,华为、百度、腾讯、科大讯飞等人工智能领域企业也在不断增强其人工智能方面的研发力量,人工智
11、能在图像识别、数据挖掘、自然语言处理、推荐算法、信息检索、语言识别和自动驾驶等领域均得到了不同程度的应用.然而,随着人工智能不断融入我们的日常生活,人工智能系统的表现还不尽如人意.例如,近年来,许多学者发现,在图像识别领域,人工智能模型对训练数据非常敏感,当训练数据受到扰动时可能输出不恰当的结果,这种对抗性扰动已经成为人工智能模型,尤其是神经网络模型的梦魇:对抗攻击68.而且,在自动驾驶领域也有研究发现,除了人为的对抗攻击,极端光照条件也会影响视觉系统识别,从而影响自动驾驶9.另一方面,如果训练数据被偏见性地标注,相应机器学习模型的输出结果往往也会具有一定偏见性10.复旦大学管理学院企业管理系
12、孙金云教授研究团队 2021 年发表的“2020 打车软件出行状态调研报告”表明,打车软件通过“差异化的偏差信息”提高了平台自身的收益11.这些数据一旦被滥用于机器学习算法,不仅可能导致偏见性的结果,还可能导致隐私泄露问题的出现.这类事件频繁出现,越来越多的专家和学者开始关注人工智能系统的可信性1,5,12.系统的“可信性”是基于传统的“安全”“可靠”等概念产生的,简单来说是指一个系统在实现给定目标时,其行为及其结果符合人们的期望13.刘克等人认为软件系统“可信性”是人类心中对客观对象各属性较为整体的反映14.在政府机构和有关学者的引导下,学术界和产业界都愈发关注人工智能系统可信性15,构造可
13、信人工智能已经成为现代人工智能发展和应用的重要趋势和必然选择.然而,构造可信人工智能需要人们对人工智能系统的可信性有着清晰的认知,因而如何综合评估判断人工智能系统的可信性已经成为可信人工智能研究中的一个重要问题.因为人工智能系统可信性由其多维属性反映,并且人工智能系统的可信性问题需要从其训练数据可信性、学习模型可信性和预测结果可信性 3 个方面来考虑,所以对人工智能系统可信性的综合评估较为困难.本文从人工智能的可信属性入手,总结梳理人工智能应有的可信属性;接着讨论了数据、模型和结果可信性的度量方法,为度量人工智能系统可信性提供证据基础.在此基础上,本文讨论了现有的人工智能可信度量模型.然后,本
14、文提出了一个基于可信属性的人工智能系统可信度量框架,期待推动人工智能可信度量的研究与发展.本文将从以下几个方面讨论人工智能系统可信评估的研究现状和面临的挑战.(1)人工智能系统的可信属性可信性是人类心中对客观对象各属性较为整体的反映,传统软件的可信属性通常包含可靠性、安全性、可用性、正确性等诸多属性14,人工智能系统作为软件系统的一种,其可信属性包括部分传统软件的可信属性.但是,人工智能系统本身的特性又导致其具有普通软件所不具有的其他属性,例如描述对抗数据干扰能力的鲁棒性,没有偏见的公平性等.因此,如何准确描述这些属性对人工智能系统的可信评估有着重要作用.(2)人工智能系统数据、模型和结果可信
15、性与人工智能系统度量模型人工智能系统的可信性依赖于大量可靠的数据支撑、恰当的模型选择和符合预期输出结果,即其可信性依赖于其训练数据可信性、学习模型可信性和预测结果可信性.数据可信性是训练出可信模型的基础,模型可信性又是得到符合人们心理预期结果的基础,三者相辅相成,相互依赖,共同影响着人工智能系统的可信性.为了实现对人工智能系统可信性的度量,需要从数据、模型和结果 3 方面的度量结果收集可信证据.此外,现有对人工智能系统度量的工作也为人工智能系统可信性度量模型建立打下了坚实的基础.(3)基于可信属性的人工智能系统可信度量评估体系传统软件可信评估理论经过数十年的发展,已经被证明在传统软硬件系统开发
16、中是确保系统可信必不可少的技术.例如列车控制系统和航空飞行系统开发国际标准中均要求将该方法贯穿于整个系统的开发周期以获得较高的可信等级认证16.尤其是基于可信属性的软件可信度量评估,现在已经有了较为成熟的研究成果,并被用于各刘晗等:人工智能系统可信性度量评估研究综述3775种安全攸关软件的可信性度量中17.然而,由于目前人工智能系统本身特有的性质,使得不能直接将软件可信评估理论简单地移植到人工智能系统,而是要针对人工智能系统本身的可信性进一步研究可信度量评估理论与技术.本文结合人工智能系统可信性现状和软件可信评估理论提出了一个人工智能系统可信度量评估框架,具体包括可信属性分解及可信证据获取方法
17、、联邦式可信度量模型与基于区块链的人工智能系统可信度量评估架构.该框架还将保障数据可信性常用的区块链技术融入可信度量全过程,从而可以保障整个度量过程的不可篡改性.1 研究现状和动机 1.1 人工智能现状1950 年,计算机科学之父图灵在论文计算机器与智能中描述了智能的概念,并提出机器智能的测试方法,即“图灵测试”18.随后在 1956 年的达特茅斯会议上,美国 10 位学者正式提出了人工智能概念,达特茅斯会议也成为第 1 次人工智能研讨会,1956 年被称为“人工智能元年”19.人工智能的发展自其诞生以来经历了 3 次高潮.2006 年辛顿提出的深度学习算法的概念2,不仅掀起了深度学习研究与应
18、用的热潮,而且促进了人工智能第 3 次高潮的兴起.人工智能发展的潮起潮落引领着人工智能不断健康地发展,也使得人工智能技术健康地服务人类.现在,人工智能技术在各个领域已经取得了丰硕的研究成果,图像识别20、自然语言处理21、计算机视觉22、自动驾驶23、推荐系统24等技术中处处可见其身影.1.2 可信人工智能发展战略规划如何保障人工智能的健康发展已经成为当前社会和国家关注的主要问题之一,许多政府和学者都倡导科学发展人工智能.2016 年 9 月,英国下议院提出应对机器人发展带来的伦理、法律和道德问题25.2018 年 3 月,欧洲政治战略中心提出要解决人工智能在发展过程中出现的偏见问题,研究人工
19、智能的道德准则26.2018 年4 月,欧盟确立人工智能的伦理和法律框架27.2018 年 12 月,欧盟委员会的人工智能高级专家组(high-levelexpertgrouponartificialintelligence,AIHLEG)发布了可信人工智能伦理指南草案,该指南提出了一个可信人工智能框架,总计 10 项可信人工智能要求和 12 项实现人工智能的技术和非技术方法28.2016 年 10 月,美国国家科学技术委员会(NSTC)探讨了人工智能潜在的公共问题29,30.2017 年年初,美国国家科学基金会、国防部高级研究项目局(DARPA)启动可解释人工智能计划,发展可解释、可信的人工
20、智能技术31.2018 年 4 月,美国国防部发表国防部人工智能战略,旨在促进美国人工智能安全32.2018 年 9 月 DARPA 启动了 20 亿美元的 AINext 战略,明确发展第 3 代人工智能基础理论和技术,重点内容包括鲁棒、对抗、高效知识推理,以及更强能力的人工智能理论和技术33.2018 年 6 月,新加坡成立人工智能伦理委员会,以帮助政府制定伦理标准34.同一时间,印度政府发布人工智能国家战略,其中重点涉及了道德隐私方面的问题35.我国政府从 2015 年开始就大力推进人工智能技术发展36,2016 年发展人工智能技术被列入“十三五”发展规划37.2017 年国务院和工信部提
21、出新一代人工智能发展规划4,38,强调人工智能健康发展,2018 年国家标准化管理委员会发布的人工智能标准化白皮书中提到关注人工智能的安全、伦理和隐私问题39.1.3 软件可信性研究现状1.3.1软件可信性概念随着科技的不断发展,计算机在人类社会的普及程度越来越高,无论是经济、军事还是社会生活中的方方面面,人们都越来越离不开软件,对软件的功能需求也在不断增加.随着软件系统日益复杂化,开发规模不断扩大,或多或少都存在的软件缺陷使得人们越来越难以控制软件质量.各种各样的软件事故不断给用户带来严重的损失,软件经常不按人们期望的方式工作17,40,使得人们逐渐失去对软件的信任,可信性的概念应运而生14
22、.“可信性”是在软件传统的“可靠”“安全”等概念的基础上发展而来的.1972 年,Anderson 提出可信系统的概念41,这是人们对计算机系统可信性的首次探索.但是此时人们大多关注硬件的可信性,直到美国国防部制定可信计算机标准时才提到软件可信性的概念42.Laprie 指出可信性与可靠性是两个不同的概念,前者比后者要复杂得多43.3776软件学报2023 年第 34 卷第 8 期美国科学与技术委员会 NSTC 则认为即使在系统在危险情况下,即系统本身存在错误,环境存在危险或者系统遭到其他人的致命攻击,设计者、实现者和使用者都能保障系统的大部分功能,使其不会失效,则该系统是高可信的44.美国国
23、家研究委员会 NRC 认为一个系统即使在运行环境出现问题、操作人员失误操作、系统受到外界的致命攻击或者系统的设计和实现存在 Bug 的情况下,也能够按照原来设定的预期运行,得到预期的结果,那么该系统是可信的45.德国奥尔登堡研究生院的研究发现可信性应该包括正确性、安全性、服务质量、保密性和隐私性46.在我国国家自然科学基金委“可信软件基础研究”重大研究计划中,何积丰等人14认为可信性是人类心中对客观对象各属性较为整体的反映,提出了可信软件(trustworthysoftware)是指软件系统的动态行为及其结果总是符合人们预期,并在受到干扰时不会失效,并能提供连续服务的软件,这里的“干扰”包括操
24、作错误、环境影响和外部攻击等.陈火旺院士则认为高可信性质包括可靠性、防危性、安全性、可生存性、容错性和实时性47.1.3.2软件可信性发展计划软件可信性保证对整个软件产业,特别对安全攸关软件研发的影响日益加深.各国政府、研究机构以及各大公司都对软件可信性研究提出了相应的研究计划.美国自然科学基金会从 2005 年开始便在可信计算研究领域投入约数亿美元48,政府的“网络与信息技术研究发展计划”中重点强调“可信软件”相关领域49;欧洲于 2006 年 1 月启动了名为“开放式可信计算(opentrustedcomputing)”的研究计划,旨在开发开源可信计算软件,已有 23 个研究机构参加50;
25、欧盟于 1997 年 12 月通过的“第五框架计划”51和 2002 年 11 月通过的“第六框架计划”52都把高可信软件作为软件技术发展的重点.构造可信软件已成为现代软件技术发展和应用的重要趋势和必然选择.我国国家中长期科学和技术发展规划纲要(20062020 年)中将可信计算机的研究作为发展重点53;2007 年,“863”计划开展“高可信软件生产工具及集成环境”重点项目54;国家自然科学基金委于 2007 年提出开展“可信软件基础研究”重大研究计划14,并将“软件的可信性度量与评估”列为 4 个重要核心问题之首.1.3.3软件可信性度量评估软件可信度量评估有助于软件可信性保障,因而其研究
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 系统 可信性 度量 评估 研究 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。