2024年先进人工智能安全国际科学报告.pdf
《2024年先进人工智能安全国际科学报告.pdf》由会员分享,可在线阅读,更多相关《2024年先进人工智能安全国际科学报告.pdf(131页珍藏版)》请在咨信网上搜索。
1、先进人工智能安全先进人工智能安全国际科国际科学报告学报告中期报告2024年5月贡献者椅子椅子Yoshua Bengio教授,蒙特利尔大学/Mila-魁北克人工智能研究所专家咨询小组专家咨询小组Prof.Bronwyn Fox,联邦科学与工业研究组织(CSIRO)(澳大利亚)andr Carlos Ponce de Leon Ferreira deCarvalho,圣保罗大学数学和计算机科学研究所(巴西)Dr.Mona Nemer,加拿大首席科学顾问(加拿大)Raquel Pezoa Riv era,Federico Santa 3月 a技术大学(智利)曾毅博士,曾毅博士,中国科学院空间研究所(
2、中国)Juha heikkil,连接DG(欧洲联盟)Guillaume Avrin,企业总局(法国)Antonio kr ger,德国人工智能研究中心(德国)教授教授Balaraman Ravindran,印度理工学院,马德拉斯(印度)Prof.Hammam Riza,KORIKA(印度尼西亚)Dr.Ciar n Seoighe,爱尔兰科学基金会(爱尔兰)Dr.Ziv Ka tzir,以色列创新局(以色列)Dr.Andrea Monti,基耶蒂-佩斯卡拉大学(意大利)Dr.Hiroaki Kitano,日本索尼集团Mary Kerema,信息通信技术和数字经济部(肯尼亚)何塞何塞拉蒙拉蒙洛佩斯
3、洛佩斯波蒂略博士,波蒂略博士,元素Q(墨西哥)Prof.Haroon Sheikh,荷兰政府政策科学委员会(荷兰)Dr.Gill Jolly,商业、创新和就业部(新西兰)Dr.Olubunmi Ajala,ninnovation and DigitalEconomy(尼日利亚)Dominic Ligot,CirroLytix(菲律宾)教授教授Kyoung Mu Lee,首尔国立大学电气与计算机工程系(大韩民国)Ahmet Halit hadip,土耳其工业和技术部(土耳其共和国)Crystal Rugege,人工智能和创新政策国家中心(卢旺达)Dr.Fahed Albalawi,沙特数据和人工
4、智能管理局(沙特阿拉伯王国)Denise Wong,信息通信媒体发展管理局(IMDA)数据创新和保护小组(新加坡)dr.Nuria Oliver,ELLIS Alicante(西班牙)Dr.Christian Busch,瑞士联邦经济事务、教育和研究部Oleksii Molchanovskyi,乌克兰人工智能发展专家委员会(乌克兰)Marwan Alserkal,内阁事务部,总理办公室(阿拉伯联合酋长国)Saif M.Khan,美国.商务部(美国)Dame Angela McLean,英国政府首席科学顾问Amandeep Gill,联合国技术特使(联合国)写作小组写作小组Daniel Priv
5、itera(首席作家),基拉中心Tamay Besiroglu,A时代IRishi Bommasani,斯坦福大学马萨诸塞州Stephen Casper,Ins技术研究所Yejin Choi,华盛顿大学/A12卡内基梅隆大学Hoda Heidari,Mila-魁北克人工智能研究所HodaHeidari,Leila Khalatbari,香港科技大学科学协调员科学协调员Sren Mindermann,Mila-Quebec AI Institu te高级顾问高级顾问Bayo Adekanmbi,尼日利亚数据科学Paul Christiano,在美国人工智能安全研究所担任高级顾问之前David D
6、alrymple,研究+先进发明机构(ARIA)俄勒冈州立大学Thomas G.Dietterich,Edward Felten,普林斯顿大学香港科技大学Pascale Fung在担任Meta职位之前曾担任高级顾问Pierre-Olivier Gourinchas,International MonetaryFund(IMF)Nick Jennings CB FREng FRS,拉夫堡大学Andreas Krause,苏黎世联邦理工学院Percy Liang,伯南布哥联邦大学斯坦福大学Teresa Ludermir,Vidushi Marda,REAL MLHelen Margetts OBE
7、 FBA,牛津大学/艾伦图灵研究所秘书处秘书处Shayne Longpre,麻省理工学院Vasilios Mavroudis,伊利诺伊大学香槟分校Mantas Mazeika,艾伦图灵研究所Kwan Yee Ng,Concordia AIChinasa T.Okolo,博士,博士,布鲁金斯学会Deborah Raji,MozillaTheodora Skeadas,人文情报弗洛里安弗洛里安特拉梅尔,特拉梅尔,苏黎世联邦理工学院John A.McDermid OBE FREng,约克大学普林斯顿大学Arvind Narayanan,AlondraNelson,KAIST计算学院高级研究学院Ali
8、ceOh,Gopal Ramchurn,英国RAI/UKRI TASHub/南安普敦大学Stuart Russell,加利福尼亚大学,伯克利斯坦福大学Marietje Schaake,Dawn Song,加州大学伯克利分校Alv aro Soto,智利天主教大学Lee Tiedrich,杜克大学ga lvaroquaux,国家数字科学与技术研究所(Inria)姚明,姚明,清华大学跨学科信息科学研究所张亚张亚勤,勤,清华大学由AI安全研究所主办的英国政府秘书处英国政府秘书处Benjamin Prudhomme,-魁北克AI Institut e致谢致谢秘书处感谢以下英国组织的有益支持,评论和反馈
9、:Ada Lovelace研究所,Alan Turing研究所,长期复原力中心,人工智能治理中心和英国人工智能安全研究所。还要特别感谢丹亨德里克斯、迪伦哈德菲尔德梅内尔和帕梅拉萨缪尔森。International Scientific Report on the Safety of Advanced AI:Interim Report5前言前言7执行摘要执行摘要91导言导言152的的能力能力182.1通用AI如何获得其能力?182.2当前的通用AI系统能够实现192.2.1能力按方式202.2.2能力和限制技能212.3最近的趋势能力及其驱动因素222.3.1最近的趋势在计算,数据和算法222
10、.3.2最近的趋势能力252.4能力进步在未来292.4.1,如果资源继续快速扩展,这是否会导致快速发展?302.4.2将迅速扩大资源规模?302.4.3算法的进步会带来快速的进步?323方法评估和理解通用人工智能系统方法评估和理解通用人工智能系统343.1通用AI评估用于评估模型功能和影响。343.2模型性能分析方法353.2.1案例研究353.2.2基准353.2.3红色团队和对抗性攻击363.2.4审计373.3模型透明度、解释和解释383.4挑战与研究通用AI系统394风险风险414.1恶意使用风险414.1.1伤害个人通过虚假内容414.1.2虚假信息和操纵舆论424.1.3网络犯罪
11、444.1.4双重用途科学风险454.2故障风险474.2.1风险来自产品功能问题474.2.2偏见和代表性不足的风险494.2.3失控514.3系统性风险544.3.1劳动力市场风险544.3.2全球AI鸿沟574.3.3市场集中风险和单点故障58International Scientific Report on the Safety of Advanced AI:Interim Report64.3.4危害环境594.3.5隐私风险604.3.6版权侵权614.4交叉风险因素634.4.1交叉技术风险因素634.4.2跨领域的社会风险因素665的的技术方法来减轻风险技术方法来减轻风险68
12、5.1风险管理与安全工程685.1.1风险评估695.1.2风险管理705.2培训更多值得信赖的模型725.2.1使通用AI系统与开发人员的意图保持一致725.2.2减少幻觉的谎言745.2.3提高对故障的鲁棒性745.2.4消除危险能力755.2.5分析和编辑内部工作的模型755.3监测和干预765.3.1检测通用AI生成的内容765.3.2检测异常和攻击775.3.3解释模型动作775.3.4将保障措施纳入AI系统775.4技术方法公平和表示在通用人工智能系统785.4.1减轻偏见和歧视的工作贯穿于通用人工智能的开发和部署阶段795.4.2通用人工智能系统的公平性是实现的?805.4.3挑
13、战实现公平的通用AI系统815.5隐私方法的通用AI系统816结论结论83主席关于中期报告的说明主席关于中期报告的说明84不同观点不同观点86词汇表词汇表87参考文献参考文献917关于高级AI安全性的国际科学报告:中期报告前言这份报告是人工智能安全之旅的开始这份报告是人工智能安全之旅的开始,我很荣幸主持发布首届高级人工智能安全国际科学报告。我很自豪地发布这份中期报告,这是自2023年11月布莱奇利公园人工智能安全峰会委托这项工作以来的六个月里,许多专家付出了巨大努力的结果。我们知道先进的人工智能正在迅速发展,而且这些先进的人工智能系统如何影响我们未来的生活和工作方式存在很大的不确定性。人工智能
14、有巨大的潜力让我们的生活变得更好,但它也带来了伤害的风险。这就是为什么要进行彻底的分析现有的科学文献和专家意见至关重要。我们知道的越多,我们就越有能力塑造我们的集体命运。我们的使命很明确:推动对高级人工智能安全性的共享、基于科学的、最新的理解,并随着时间的推移继续发展这种理解。该报告正确地强调了专家之间存在共识的领域,以及对高级人工智能的能力和风险的分歧,特别是那些预计在未来开发的。为了有效地履行我们的使命,我们的目标是解决知识分子诚实的专家社区之间的分歧。通过剖析这些差异,我们为明智的决策铺平了道路,并刺激了有助于消除迷雾和减轻风险所需的研究。我感谢我们的国际专家咨询小组的宝贵意见,这些意见
15、最初确定了报告的范围,后来又对整个草案提供了反馈。他们的不同观点和认真审查扩大并加强了这份临时报告。同样值得认可的是我敬业的作家和高级顾问团队。他们在过去几个月的承诺创造了一个超出我预期的临时产品。我还要感谢英国政府启动这一进程并提供出色的运营支持。对我来说,同样重要的是,英国政府同意撰写这份报告的科学家应该拥有完全的独立性。这份中期报告只是旅程的开始。毫无疑问,这份报告在第一次尝试中未能捕捉到的观点和证据。在这样的科学过程中,反馈是宝贵的。我们将纳入更多的证据和科学的观点,因为我们对最终版本的工作。Yoshua Bengio教授教授蒙特利尔大学/Mila-魁北克人工智能研究所和主席8关于高级
16、AI安全性的国际科学报告:中期报告AI安全是一个共同的全球问题安全是一个共同的全球问题我很高兴向您介绍有关高级AI安全性的第一份国际科学报告的临时更新,这是2023年11月在布莱奇利公园举行的开创性AI安全峰会的重要成果。这份具有里程碑意义的报告代表了全球前所未有的努力,以建立对人工智能快速发展所带来的机遇和风险的共同的,基于科学的理解,并证明了“布莱奇利效应”-召集才华横溢的头脑来应对人类最大的挑战之一。我们认为,要实现人工智能造福人类的巨大潜力,需要积极努力,以确保安全、负责任地开发和部署这些强大的技术。没有一个国家能够独自应对这一挑战。这就是为什么我如此热衷于将一群世界领先的专家聚集在一
17、起,贡献他们的知识和观点。我要特别感谢Yoshua Bengio教授作为主席在巧妙地指导这一复杂的国际努力方面发挥的领导作用。至关重要的是,该报告还揭示了我们当前知识中的重大差距以及迫切需要进一步研究和讨论的关键不确定性和辩论。我真诚地希望,这份报告及其背后的合作进程能够成为缩小关键知识差距所需的研究和政策努力的催化剂,并为未来具有挑战性的政策选择提供宝贵的投入。我们还有很多东西要学,但这份报告标志着一个重要的开始。英国期待继续与国际伙伴合作,促进负责任的、以人为本的人工智能发展方法-利用这些强大的工具来改善生活和生计,同时警惕地防范下行风险和伤害。我们可以共同努力,建设一个全人类都能从人工智
18、能的奇迹中受益的未来。,Rt Hon Michelle Donelan议员,议员,科学,创新和技术部国务卿向前迈出的关键一步,呼吁向前迈出的关键一步,呼吁AI安全采取行动安全采取行动人工智能的快速发展将以深刻和不可预见的方式重塑我们的世界。从革命性的医疗保健和运输到自动化复杂任务和解锁科学突破,人工智能的积极影响潜力是不可否认的。然而,除了这些显著的可能性之外,还存在着重大的挑战,需要采取前瞻性的方法。关注的范围从嵌入算法中的意外偏见到自治系统超过人类控制。这些潜在风险凸显了迫切需要进行全球对话,以确保人工智能的安全和负责任的发展。在这种情况下,国际人工智能安全报告将为全球合作提供重要的基础。
19、该报告汇集了来自30个国家、欧盟和联合国的专家的知识,提供了对人工智能安全性的全面分析。通过关注对通用人工智能能力和风险的早期科学理解,并评估评估和缓解这些风险的技术方法,该报告将引发多方利益相关者之间的持续对话和合作。我希望基于这份报告,来自30个国家、欧盟和联合国的专家继续进行平衡的讨论,实现可接受的、适合发达国家和发展中国家具体情况的人工智能风险缓解,从而创造一个创新和负责任的人工智能和谐共存的未来。Lee jong-ho,大韩民国MSIT部长9关于高级AI安全性的国际科学报告:中期报告执行摘要关于本报告这是第一份“关于高级ai安全性的国际科学报告”的临时出版物。由75位人工智能(AI)
20、专家组成的多元化小组为本报告做出了贡献,其中包括由30个国家,欧盟(EU)和联合国(UN)提名的国际专家咨询小组。在本报告主席的领导下,撰写本报告的独立专家集体对其内容拥有完全的酌处权。在人工智能发展取得前所未有的进展之际,这份第一份出版物将其重点限制在近年来发展特别迅速的一种人工智能上:通用人工智能,即可以执行各种任务的人工智能。在快速发展的过程中,通用人工智能的研究目前正处于科学发现的时代,尚未成为科学定论。世界各地的人们只有在风险得到适当管理的情况下,才能安全地享受通用人工智能的许多潜在好处。本报告着重于识别这些风险,并评估评估和减轻这些风险的技术方法。它的目的不是全面评估通用人工智能的
21、所有可能的社会影响,包括其许多潜在的好处。这份中期报告有史以来第一次汇集了30个国家、欧盟和联合国提名的专家以及其他世界领先的专家,为通用人工智能安全的讨论和决策提供了一个共享的科学、循证基础。我们仍然在围绕通用人工智能能力、风险和风险缓解的几个问题上存在分歧,无论是次要的还是主要的。但我们认为这个项目对于提高我们对这项技术及其潜在风险的集体理解,以及更接近达成共识和有效的风险缓解至关重要,以确保人们能够安全地体验通用人工智能的潜在好处。赌注很高。我们期待着继续这一努力。执行摘要的要点如果管理得当,通用人工智能可以用于促进公共利益,可能会带来更好的福祉,更多的繁荣和新的科学发现。然而,通用人工
22、智能出现故障或被恶意使用也可能造成伤害,例如,在高风险环境中做出有偏见的决定,或者通过诈骗、虚假媒体或侵犯隐私。随着通用人工智能能力的不断发展,可能会出现诸如大规模劳动力市场影响,人工智能黑客攻击或生物攻击以及社会失去对通用人工智能的控制等风险,尽管研究人员对这些情况的可能性存在争议。对这些风险的不同看法往往源于对社会将采取的限制措施、这些措施的有效性以及通用人工智能能力的推进速度的不同期望。通用人工智能能力的未来进展速度存在相当大的不确定性。一些专家认为,到目前为止,进展最有可能放缓,而另一些专家则认为,极快的进展是可能的或可能的。开发人员可以采用各种技术方法来评估和降低通用人工智能的风险,
23、监管机构也可以要求,但它们都有局限性。例如,用于解释为什么通用AI模型产生任何给定输出的当前技术受到严重限制。International Scientific Report on the Safety of Advanced AI:Interim Report10通用人工智能技术的未来是不确定的,即使在不久的将来,也可能出现各种各样的轨迹,包括非常积极和非常消极的结果。但关于AI的未来,没有什么是不可避免的。社会和政府的决定将决定人工智能的未来。这份临时报告旨在促进对这些决定的建设性讨论。这份报告综合了对通用人工智能的科学理解-人工智能可以执行各种各样的任务-重点是理解和管理其风险。使用人工智
24、能的系统的能力一直在迅速发展。这凸显了人工智能为商业、研究、政府和私人生活创造的许多机会。它还提高了人们对与先进人工智能相关的当前危害和未来潜在风险的认识。关于高级人工智能安全的国际科学报告的目的是朝着对人工智能风险以及如何减轻风险的国际共识迈出一步。该报告的第一份临时出版物将其重点限制在一种能力发展特别迅速的人工智能上:通用人工智能,即可以执行各种任务的人工智能。在快速发展的过程中,通用人工智能的研究目前正处于科学发现的时代,尚未成为科学定论。该报告概述了当前对通用人工智能及其风险的科学理解。这包括确定科学共识的领域以及存在不同观点或开放研究问题的领域。世界各地的人们只有在风险得到适当管理的
25、情况下,才能安全地享受通用人工智能的潜在好处。本报告的重点是识别通用人工智能的风险,并评估评估和缓解这些风险的技术方法,包括使用通用人工智能来缓解风险。它的目的不是全面评估通用人工智能的所有可能的社会影响,包括它可能提供的好处。根据许多指标,通用AI能力近年来增长迅速,并且在如何预测未来进展方面没有达成共识,使得各种场景出现可能根据许多指标,通用AI能力正在迅速发展。五年前,领先的通用人工智能语言模型很少能产生连贯的文本段落。今天,一些通用的人工智能模型可以在广泛的主题上进行多轮对话,编写简短的计算机程序,或者从描述中生成视频。然而,通用人工智能的能力很难可靠地估计和精确定义。通用人工智能的发
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 先进 人工智能 安全 国际 科学 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。