健康医疗人工智能指数报告.pdf
《健康医疗人工智能指数报告.pdf》由会员分享,可在线阅读,更多相关《健康医疗人工智能指数报告.pdf(51页珍藏版)》请在咨信网上搜索。
1、1专家指导委员会主席:詹启敏院士 董尔丹院士成员:邓志鸿 北京大学段会龙 浙江大学付 君 哈尔滨医科大学蒋 云 北京大学信息技术高等研究院(浙江)金 海 华中科技大学孔桂兰 北京大学匡 铭 中山大学李 姣 北京协和医学院马 婷 鹏城实验室施秉银 西安交通大学汤步洲 哈尔滨工业大学(深圳)王海波 中山大学王耀刚 天津医科大学王志锋 北京大学詹思延 北京大学张路霞 北京大学赵歌喃 爱思唯尔赵明辉 北京大学执笔委员会杜 建 北京大学健康医疗大数据国家研究院吴静依 北京大学信息技术高等研究院(浙江)赵 璐 爱思唯尔Baas,Jeroen 爱思唯尔(数据科学家)Schalkwijk,Jan-Maarte
2、n Van 爱思唯尔(数据科学家)白永梅 北京大学健康医疗大数据国家研究院协调委员会王 迈、崔 娜 北京大学健康医疗大数据国家研究院李鹏飞 北京大学信息技术高等研究院(浙江)张丹丹、王 巍 爱思唯尔引言01第一章 界定与分类031.数据集界定 .032.研究领域分类 .04第二章 科学研究概览061.数据与指标 .061.1.数据来源 .061.2.分析指标 .062.分析结果 .082.1.主要国家 .082.2.研究机构 .082.3.科研合作 .102.4.研究主题分布 .112.5.高科学影响力论文 .142.6.全球 Health AI 细分领域分析 .142.7.中国 Health
3、 AI 细分领域分析 .15第三章 科学技术交叉201.数据与指标 .201.1.数据来源 .201.2.学术界与产业界的知识流动指标 .202.分析结果 .202.1.学术界与产业界的知识流动总体状况 .202.2.对 Health AI 技术产生影响的基础性研究 .212.3.Health AI 细分领域科学-技术交叉 .23第四章 科学社会交互241.数据与指标 .241.1.数据来源 .241.2.科学社会交互指标 .242.分析结果 .252.1.多媒介提及指数较高的话题 .252.2.社交媒体传播指数较高的话题 .25目录第五章 人类-机器协同(AI 临床试验)291.引言 .29
4、2.数据与指标 .312.1.数据来源 .312.2.分析指标 .313.分析结果 .323.1.临床试验数量 .323.2.发起机构分布 .323.3.临床试验分期 .343.4.研究类型分布 .343.5.干预措施类型 .343.6.目标人群(疾病谱).353.7.样本量分布 .363.8.招募状态分布 .373.9.临床试验结果报道 .37第六章 主要结论391.前沿科学技术与医学的深度融合是健康医疗人工智能发展的基础,未来将在公共卫生和临床诊疗中发挥更大作用。.392.中国已成为健康医疗人工智能科学研究与临床试验的最主要贡献者之一,但在学术影响力和技术转化方面仍有待提升。.393.健康
5、医疗人工智能技术谱的核心是机器学习(含深度学习)和医疗机器人,疾病谱以慢病和神经系统疾病为主,传染病、罕见病等与医疗 AI 的深度结合仍有空间。.404.与科学共同体的热点研究主题相比,健康医疗人工智能研发与应用的伦理学问题成为社会媒体关注的焦点。.405.健康医疗人工智能全球临床研究仍处于早期阶段,中国以大学/医院为发起主体,侧重疾病智能诊断,企业参与仍有待加强。.416.建议将循证范式引入健康医疗人工智能安全性和有效性评价,以促进其落地应用。.41目录01 引言人口老龄化、社会环境因素变化、慢性病疾病负担加重、新发突发传染病等对我国人民健康带来了巨大挑战。健康医疗人工智能(Health A
6、rtificial Intelligence,Health AI)的核心是利用人工智能等前沿科学技术赋能医疗健康,构建最优化的大健康生态体系,提供优质、高效、经济的新型医疗服务,为解决我国医疗供需矛盾、推动医学发展提供有效的手段。2019 年 4 月 26 日,英国医学杂志(The BMJ)在线发表北京大学健康医疗大数据国家研究院詹启敏院士等学者题为“Can AI fulfil its medical promise?(健康医疗人工智能的应许之地?)”的观点文章。1该文肯定了人工智能(AI)技术在健康医疗领域颇具潜力的应用场景,例如医学影像和病理学诊断,以及作为辅助手段用于常见疾病一般状况的医
7、疗决策。然而,由于 AI算法的内在运行逻辑难以探究、被研究者称为“黑匣子”,而这“会给使用 AI 系统的医生带来迟疑和困惑”。作者提出,AI 系统的有效性和安全性必须得到科学的评估,并建议运用流行病学及医学研究的思路来验证基于 AI 的预测模型。此外,人文关怀是医学中至关重要、并且无法被任何技术系统替代的关键内容。最后,作者将健康医疗领域“划归”为 AI 的“应许之地”,但同时也表示,为充分发挥其潜质,“医生、科研人员和 AI 科学家应当紧密合作;基于可靠的方法、遵循伦理的准则,力争在医疗实践中应用、评估和改进 AI 技术”。自 2017 年以来,斯坦福大学联合麻省理工学院、哈佛大学等机构,每
8、年发布 AI 指数报告(AI Index Report),从学术、产业、政策等多个角度介绍全球 AI的最新进展,至今已连续 3 年发布报告2。2018 年,信息分析公司爱思唯尔发布人工智能:知识的创造、转移与应用报告,对 AI 领域进行了全面定义,勾勒出该领1 https:/ https:/hai.stanford.edu/research/ai-index-201902 3 https:/ https:/nam.edu/artificial-intelligence-special-publication/5 https:/www.oecd.org/health/trustworthy-ar
9、tificial-intelligence-in-health.pdf6 He,J.,Baxter,S.L.,Xu,J.,Xu,J.,Zhou,X.,&Zhang,K.(2019).The practical implementation of artificial intelligence technologies in medicine.Nature Medicine,25(1),3036.7 https:/www.wish.org.qa/wp-content/uploads/2018/11/IMPJ6078-WISH-2018-Data-Science-181015.pdf域在全球范围内
10、的研究趋势,同时聚焦 AI 在中国、欧洲和美国的发展态势3。2019 年 12 月,美国国家医学院发表医疗人工智能:希望、炒作、浮夸承诺、危险综述报告,汇总现有 AI 知识和技术应用,包括成功案例和失败教训,为医疗健康领域的人工智能研发、应用和维护,提供了指导建议和实践指南4。2020 年 4 月,经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)发布值得信赖的医疗人工智能报告,讨论了人工智能在医疗保健领域的前景和风险,以及政策制定者在不确定的环境下需要解决的关键政策问题5。人工智能在健康医疗领域的研究与
11、应用主要集中于4 个方面6:一是疾病诊断,例如电子病历(EMR)/电子健康档案(EHR)和专家知识整合,基于 AI 的常见病诊断和评估;二是疾病治疗,例如通过将 EHR 和临床指南整合,基于 AI 治疗常见病、基于药物基因组学指导临床用药等;三是人群健康管理,例如建立以患者为中心的信息系统,开展健康生活方式监测与干预,疾病早期检测与发现,健康知识教育等;四是管理与监管,例如医疗服务质量评估、药物不良反应监测等。与金融、电信等行业相比,AI 在健康医疗领域发展相对滞后且未充分落地,研究和应用还有很大空间7。但目前尚未见从客观数据角度系统分析健康医疗人工智能研究与开发状况的报告。北京大学健康医疗大
12、数据国家研究院致力于促进和引领人工智能在健康医疗领域的研究和应用,并研发一个科研发展复合指数以供该领域国内科研机构参考。指数(Index),即反映某个领域发展状况的多维、综合指标,为该领域的相关决策提供依据。本报告将从科学研究概览、科学技术交叉、科学社会交互、人类机器协同四个方面,以已发表的科学出版物和已注册的临床试验为基础数据,回顾分析健康医疗人工智能领域最近 5年(2015-2019)的全球科学研究和临床试验的规模、结构和发展趋势,并分析中国的表现,以期为国内健康医疗人工智能领域的战略规划、研发布局和临床应用管理提供参考。04 -Supervised Machine Learning L0
13、1.224.050.375.530.500-Support Vector Machine L01.224.050.375.530.500.500-Unsupervised Machine Learning L01.224.050.375.530.750-Natural Language Processing L01.224.050.375.580-Neural Networks,Computer L01.224.050.375.605-Deep Learning L01.224.050.375.605.500-Robotics L01.224.050.375.630由于上述 8 个一级下位术语
14、之间存在交叉,经咨询医学信息学和医疗人工智能领域专家意见,按如下规则对其进行重组分类:将 Computer Heuristics 和 Fuzzy Logic 合并,在算法层面,都是先验知识的形式化表示。Expert Systems 单独列出,是应用层面的信息系统。Neural networks,computer 归并到 Machine Learning 下面。处理后,共计 6 个大类:2.研究领域分类由于本报告的数据集以科学出版物为主,且聚焦健康医疗领域,因此我们考虑仍采用医学主题词表这一术语体系对健康医疗人工智能研究领域进行分类。在总数据集中,14,820 篇被 MEDLINE 收录,含自动
15、标注的 MeSH 术语;剩余 10,897 篇科学出版物并未被MEDLINE 收录,未标注 MeSH 主题词;对于这部分科学出版物,采用文本挖掘工具Medical Text Indexer(MTI)将标题和摘要文本自动映射并标注 MeSH 主题词;利用 python 3.7 通过爬虫将文件列表中的摘要抓取并储存,随后分配一个识别编号,用于后续 MeSH 主题词映射的追踪与分析。对上述数据进行清洗,数据符合输入要求后输入 MTI 系统。在得到 MTI 结果后,利用 python 程序通过识别编号将主题词与文献之间建立映射。对于已有 PMID 的文献(n=14,820),我们利用PubMed 获取
16、数据进行分析。本报告重点关注两个方面的分类:(1)健康医疗人工智能技术领域的分类;(2)健康医疗人工智能涉及的疾病分类,考虑采用世界卫生组织(WHO)ICD-10 分类标准,并与疾病负担数据进行映射。在 MeSH 树 状 结 构 表 中,人 工 智 能(Artificial Intelligence)位于信息科学(Information Science)大类中,具体层级结构为:Information Science L-Information Science L01-Computing Methodologies L01.224-Algorithms L01.224.050-Artificia
17、l Intelligence L01.224.050.375“Artificial Intelligence”这一术语的 MeSH 树状结构编码为 L01.224.050.375,其一级下位术语有 8 个,包括:计算机启发式决策、专家系统、模糊逻辑、知识组织系统、机器学习、自然语言处理、计算机神经网络和机器人。这些一级下位术语的所有下位术语包括:Artificial Intelligence L01.224.050.375-Computer Heuristics L01.224.050.375.095-Expert Systems L01.224.050.375.190-Fuzzy Logic
18、 L01.224.050.375.250-Knowledge Bases L01.224.050.375.480-Biological Ontologies L01.224.050.375.480.500-Gene Ontology L01.224.050.375.480.500.500-Machine Learning L01.224.050.375.530-Deep Learning L01.224.050.375.530.25005 注意以上6个大类并非完全相互独立,也存在交叉,例如机器学习的下位术语深度学习,往往被用于自然语言处理;但基本能反映健康医疗人工智能涉及的主要技术领域。类别类
19、别名称MeSH 术语与编码1决策规则-Computer Heuristics L01.224.050.375.095-Fuzzy Logic L01.224.050.375.2502专家系统-Expert Systems L01.224.050.375.1903知识库-Knowledge Bases L01.224.050.375.480-Biological Ontologies L01.224.050.375.480.500-Gene Ontology L01.224.050.375.480.500.5004机器学习-Machine Learning L01.224.050.375.530
20、-Deep Learning L01.224.050.375.530.250-Supervised Machine Learning L01.224.050.375.530.500-Support Vector Machine L01.224.050.375.530.500.500-Unsupervised Machine Learning L01.224.050.375.530.750-Neural Networks,Computer L01.224.050.375.605-Deep Learning L01.224.050.375.605.5005自然语言处理-Natural Langua
21、ge Processing L01.224.050.375.5806机器人-Robotics L01.224.050.375.630表 1-1 健康医疗人工智能技术领域分类06 第二章科学研究概览1.数据与指标1.1.数据来源采用由北京大学健康医疗大数据国家研究院和爱思唯尔双方融合后的数据集,该数据集含有 25,717 篇与 Health AI 主题有关的科学出版物,基于爱思唯尔的Scopus 和 Scival 平台进行统计分析。1.2.分析指标(1)科研产出及影响力指标发文量(Scholarly Output):发文量统计了被评估主体发表的包含期刊论文、会议文集、综述文章、发表丛书的所有文章
22、的数量,代表了被评估主体在某一个固定时间段内的科研产出。归一化引文影响力(Field-weighted Citation Impact,FWCI):FWCI 是指被评估主体发表文章所收到的总被引次数相比于与其同类型发表文章(相同发表年份、相同发表类型和相同学科领域)所收到的平均被引次数的比值。FWCI 在一定程度上反映了被评估主体发表文章的学术影响力。相比于总被引次数,FWCI 能够更好的规避不同规模的发表量、不同学科被引特征、不同发表年份带来的被引数量差异。如果 FWCI 为 1 意味着被评估主体的文章被引次数正好等于整个 Scopus数据库同类型文章的平均水平。本次分析的文章被引用次数统计
23、截至 2020 年 9 月 18 日。其中,归属国家/地区定义为:只要在一篇文章的所有作者中,其隶属研究机构从属于某一国家/地区,则该文章会被归为该国家/地区的一篇文章。一篇国际合作型文章会由于署有多个国家/地区的隶属机构而同时属于多个国家/地区。(2)机构科研产出及影响力指标机构科研产出及影响力的评价指标包括:发文量、FWCI 和被引次数。被引次数(Citation)是指在某一个固定时间段内被评估主体所发表文章的所有被引用次数,在一定程度上反映了被评估主体发表文章的学术影响力。但同时也需考虑到,发表时间较近的文章相比于年份较久的文章,会由于积累时间较少而导致总被引次数较少。本次分析的文章的所
24、有被引次数统计截至 2020年 9 月 18 日。(3)科研合作指标学 术 科 研 合 作 文 章 分 为 三 类:国 际 合 作(International Collaboration)、国内合作(National Collaboration)和 机 构 内 合 作(Institutional Collaboration),其中:国际合作文章:是指文章的发表作者为多位作者,且至少有两位作者的署名机构来源于不同的国家/地区,表明该类文章源于国际合作的成果。国内合作文章:是指文章的发表作者为多位作者,且作者中没有隶属于国外研究机构,但至少有两位作者隶属于国内不同的研究机构,表明该类文章源于国内合
25、作的成果。机构内合作文章:是指文章的发表作者为多位作者,且所有作者全部隶属于国内同一机构,表明该类文章源于机构内合作的成果。无合作文章:是指文章发表作者为一人。该类别文章作为对照组进行展示。(4)产学合作指标产学合作(Academic-Corporate Collaboration):该指标考察了学术机构和企业的合作程度。产学合作文章源于产学合作的成果,是指文章的发表作者为多位,其中至少有一位作者的隶属单位属于学术机构,且至少有一位作者的隶属单位属于产业界。07 (5)研究主题分析研究主题(Topic)8:研究主题是指一群具有共同研究兴趣的文章所研究内容的共同焦点。在 Scopus 数据库中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 健康 医疗 人工智能 指数 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。