基于BERT模型的医疗安全事件智能分类研究与实践.pdf
《基于BERT模型的医疗安全事件智能分类研究与实践.pdf》由会员分享,可在线阅读,更多相关《基于BERT模型的医疗安全事件智能分类研究与实践.pdf(7页珍藏版)》请在咨信网上搜索。
1、基于 模 型 的 医 疗 安 全 事 件 智 能 分 类研究与实践赵从朴袁达朱溥珏周炯陈政彭华(中国医学科学院北京协和医院北京 )摘要目的 意义 改进医疗安全事件分类评估模式,提升工作效率和时效性。方法 过程 选取既往医疗安全事件数据进行预处理,利用 模型进行训练、测试、迭代优化,构建医疗安全事件智能分类预测模型。结果 结论 利用该模型对 年 月临床科室上报的 例医疗安全事件进行分类,值达 。将 模型应用于医疗安全事件分类评估辅助,可提升工作效率和时效性,有助于及时干预医疗安全风险隐患。关键词医疗安全事件;深度学习;智能分类 中图分类号 文献标识码 ,;修回日期 作者简介赵从朴,中级职称,发表
2、论文 篇;通信作者:彭华,研究员。基金项目北京协和医学院中央高校基本科研业务费项目(项目编号:)。引言世界卫生组织将医疗安全事件定义为:并非由疾病并发症所致,而是由医疗管理有关行为造成的伤害。美国对医疗安全事件的定义是:由医疗导致的伤害,与疾病的自然转归相反,延长了患者住院时间,导致患者残疾或二者皆有 。在国内,医疗安全事件是指在临床诊疗活动和医疗机构运行过程中,任何可能影响患者诊疗结果、增加患者痛苦和负担并可能引发医疗纠纷或医疗事故,以及影响医疗工作正常运行和医务人员人身安全的因素和事件 。医疗安全事件分类评估是建立安全预警体系、营造安全文化的重要手段。关于医疗不良事件,国内外并没有统一的分
3、类医学信息学杂志 年第 卷第 期 ,或分级标准。美国退役军人医疗机构采用严重程度评估得分矩阵系统,将医疗不良事件分为 级 。中国医院协会根据严重程度将医疗不良事件分为 级 。上海交通大学医学院附属第九人民医院魏斌等 基于“有无过错事实、是否造成后果”提出 分类法,也将医疗不良事件划分为 级。从中国医学科学院北京协和医院医务处安全办的工作经验来看,分类法更具备可解释性和可操作性。因此,本研究基于 分类法进行。结合实际工作情况,将医疗安全事件分为两类:医疗不良事件、患源性安全隐患事件。其中,医疗不良事件根据严重程度分为 个等级,患源性安全隐患事件是指“拒绝做必要检查化验”“高龄患者无家属陪护”“有
4、暴力倾向或心理障碍”等存在安全隐患的事件。由于当前医疗安全事件分类评估工作主要依靠人工逐条标注完成,存在工作效率较低、时效性较差等问题,影响干预医疗安全风险隐患并采取措施的及时性。随着人工智能技术的不断发展和普及,在医疗安全事件分类评估领域,基于深度学习的文本分类算法被广泛应用。双向编码器表征(,)模型是谷歌团队于 年提出的一种语言表示模型,能够获取结合上下文语境的动态词向量,在自然语言处理领域取得了良好效果 。到目前为止,是文本分类任务中最准确的语言模型之一 ,在多类别大规模训练集下更能体现其分类的优越性 。国内外研究现状积极应对医疗安全(不良)事件是医院提高自我纠错能力、持续改进医院医疗质
5、量管理的重要途径,是纠纷隐患提前介入干预的关键环节 。在美国,几乎所有医院都有医疗差错和不良事件的内部报告系统,同时还有大量医院加入了外部报告系统 。中国医疗安全(不良)事件报告系统起步较晚。等 利用 模型和领域特定语料库对中医临床记录进行分类研究;郑承宇等 提出一种用于多标签医疗文本分类的深层神经网络模型,整体 值达到 ;等 利用 模型从乳腺癌医疗文书抽取实体概念及其属性。除了类 模型,医疗安全事件文本分类还可以使用基于统计的模型方法实现。罗玮 对收集到的 条患者投诉文本进行人工标注,运用多种重采样方法平衡患者投诉文本数据,实现了从患者投诉文本中自动识别安全事件相关要素的模型;唐仕肖等 采用
6、德尔菲法和名义群体技术,研究分析医院护理不良事件管理的应用效果,发现可明显降低不良事件发生率,同时提高护理质量和患者护理满意度;朱未等 应用 模型,从组织影响、不安全监督、不安全行为的前提和不安全行为个方面分析医疗器械不良事件的影响因素。然而,这些基于文本统计规律进行分类的方法由于未结合大规模语言模型的语言知识上下文信息,普遍难以超越类 模型的方法,因此本研究未对基于统计的分类方法进行实验对比。技术方案 数据现状和预处理医疗不良事件分类任务具有 个特点:事件情况多样、样本数据有限、数据中类别不均衡现象较严重。中国医学科学院北京协和医院 年积累的医疗不良事件数据总量有 条,但是早期的探索实验发现
7、其中超过 的数据都是患源性安全隐患事件。由于医院 年才开始以 分类法指导分类,此前数据分类标准不统一,原有的分类标签失去价值不能直接使用。因此在本研究中,将 年之前的数据作为无标签数据使用。年收集的数据中有 条以 分类法进行了人工标注,作为高质量的人工标注数据,是本研究的基础。从业务中收集的医疗文本中存在医生和患者的个人信息,直接使用可能会造成医患个人隐私泄漏,且姓名、地址等信息对任务本身无意义,但可能对模型的分类造成错误引导,因此需要进行数据预处理,从而保护医患个人隐私、提升分析效率。本研究通过规则方法结合实体抽取工具,将患者与医务人员的个人信息进行识别和省略。模型结构设计选择 模型作为医疗
8、安全事件智能分类的主医学信息学杂志 年第 卷第 期 ,要训练方法,主要是因为其可以基于大规模无标注的文本数据进行预训练,通过微调来适应不同的任务和领域,还可以同时进行文本分类、命名实体识别、关系抽取等多个任务。相比之下,其他模型要从头开始训练,需要更多的数据和计算资源。而且 模型在处理文本时能够很好地捕捉上下文信息,在处理长文本方面具有优势。在医疗安全事件文本分类中,往往需要对整个文本进行分析,模型能够很好地满足这一需求。基于 通用领域预训练模型,在大规模医疗语料上做增量迁移训练,得到医疗领域的预训练模型,然后采用微调的方式,得到分类模型,进而完成医疗安全事件分类。模型训练过程 模型用于文本分
9、类主要包括两个步骤,见图 。第 步:无监督自学习。在已有大规模语料训练得到的 模型基础上,使用医院多年积累的大规模医疗数据对其进行领域内预训练,训练数据包括医学百科、医学文献、临床指南和电子病历等高质量的文本。图 模型训练过程第 步:有标签监督学习。根据事件分类任务对模型进行微调,在有标签的数据集中进行有监督训练,输出文本特征向量。通过微调过程改变模型中的权重,使模型在该数据集上学得更好,提高分类效果。在分类任务输入中,在文本序列首位加入一个特殊标记 作为分类表征。将预处理后的安全事件文本输入该模型,文本经过词嵌入层将文本中的字向量化,其中包含字的嵌入向量、句子的嵌入向量以及位置的嵌入向量。例
10、如“者”为句子第 个字的输入表征,其由字嵌入 者、句子嵌入和位置嵌入 相加得到,见图 。图 输入向量示意 模型将输入序列的嵌入向量输入到一个全连接层中,然后将输出向量传递给 分类器,经过 函数计算得到分类标签(患源性安全隐患事件、级事件、级事件、级事件、级事件)的概率,选取概率最大值所对应的标签即为模型分类结果。数据扩充 步骤为了缓解数据类别间数量不均衡的问题,需要利用早于 年的无标签数据进行定向数据扩充。第 步:为了增加医疗不良事件数据、减少患源性安全隐患事件数据占比,使用 医学信息学杂志 年第 卷第 期 ,年带有专家标注标签的 条数据,分为“患源性 有分级”两个标签,训练一个简单的 模型二
11、分类器,对早于 年的 条数据进行分类,挑选出可能是以分级数据作为标注扩充的备用数据。第 步:对挑选出的待标注数据进行人工标注,核验后充实到有标签数据中。第 步的二分类模型分类准确率约为 。使用该模型对无标签数据进行预测,挑选出 条待标注数据。标注方案设计及试标注为了简化标注工作、提高标注效率,设计拆分标注方案,即根据 分类法,将对医疗不良事件的分级判断转化为对事件“有过错 无过错 患源性安全隐患”和“造成结果 未造成结果 患源性安全隐患”两个判断,从而帮助标注人员更直接地对事件进行判断,提高了标注准确率,降低了标注难度。试标注完成的 条数据反馈到医院医务处安全办进行结果审查。两次分别标注后组合
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BERT 模型 医疗 安全 事件 智能 分类 研究 实践
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。