基于深度学习与自然语言处理的手术室智慧化管理创新研究.pdf
《基于深度学习与自然语言处理的手术室智慧化管理创新研究.pdf》由会员分享,可在线阅读,更多相关《基于深度学习与自然语言处理的手术室智慧化管理创新研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、12 China Digital Medicine.2023,Vol.18,No.8基于深度学习与自然语言处理的手术室智慧化管理创新研究唐灵逸 郑涛 邵维君【摘要】在医院手术室日常管理中,医护人员需要根据手术过程和结果选择合适的国际疾病分类(ICD)编码,但具体操作时可能存在错选、乱选等问题。本研究基于自然语言处理与深度学习技术,构建 BERT 模型、长短期记忆网络模型等,自动纠正手术名称的 ICD 编码错误并进行 ICD 编码预测;在此基础上,使用围手术期相关医疗文本数据,基于深度神经网络模型预测手术过程中与术后可能的风险,并提供处理建议,实现手术室的精益化、智慧化运营管理。【关键词】国际疾
2、病分类编码;深度学习;自然语言处理;手术室管理Doi:10.3969/j.issn.1673-7571.2023.08.003【中图分类号】R197.3;R612 Research on intelligent management innovation of operating room based on deep learning and natural language processingTANG Lingyi,ZHENG Tao,SHAO Weijun.Information Center,Renji Hospital,Shanghai Jiaotong University Sch
3、ool of Medicine,Shanghai 200127,ChinaCorresponding author:SHAO Weijun,Email:【Abstract】In the daily management of hospital operating rooms,medical staff need to select the appropriate international classification of diseases(ICD)code in accordance with the surgical procedure and results.Howerer speci
4、fic operations may encounter problems such as incorrect or arbitrary selection of ICD codes.In this study,BERT model and LSTM(long short-term memory)network model were constructed to automatically correct the ICD coding of surgical names and to predict ICD codes based on natural language processing(
5、NLP)and deep learning(DL)technologies.On this basis,by employing preoperative and intraoperative related medical text data with deep neural network(DNN)models,this study predicts possible risks during and after surgery and provides treatment suggestions to achieve lean and intelligent operation mana
6、gement within the operating room.【Keywords】International classification of diseases code;Deep learning;Natural language processing;Operating room management作者单位:200127 上海,上海交通大学医学院附属仁济医院信息中心通信作者:邵维君,Email:随着医疗行业的发展,越来越多的医院引入人工智能技术以提高精益化管理效率。手术室作为医院的重要部门之一,其管理质量直接影响疾病的治疗效果、医院的服务水平和声誉。在手术报告编写过程中,医护人员需
7、要根据手术过程和结果选择合适的国际疾病分 类(international classification of diseases,ICD)编码。然而,由于手术报告的复杂性和医护人员的工作强度、工作压力,在选择编码的过程中可能会有错选、乱选等问题。而编码的一位数字之差可能会导致疾病诊断、手术名称的巨大差别,专题策划人工智能在医药领域的应用Special Planning中国数字医学2023 第 18 卷 第 8 期 13轻则浪费手术室资源,重则影响患者的治疗方案,甚至可能危及患者生命。为解决上述问题,本研究结合自然语言处理(natural language processing,NLP)与深度学习
8、(deep learning,DL)技术,对 ICD 编码进行纠错、预测,并在此基础上预警手术风险,进一步推动手术室的智慧化、精益化管理。1 NLP与DL在ICD编码领域的应用NLP 与 DL 技术结合在医疗领域产生了许多突破性的成果。例如,基于 DL 的 NLP 模型Transformers 模型(双向编码器表示 BERT、GPT-4 等)显著提升了各种医疗文本分析任务的性能;Rasmy 等1在 包 含 28 490 650 名 患 者 的 结 构 化 电 子 健 康 档 案(electronic health record,EHR)数据集上,基于 BERT 在超大语料库上预训练生成了预训练
9、的模型;Zeberga等2使 用 Word2vec 和 BERT、Bi-LSTM 模型,分析并检测社交媒体中的抑郁症和焦虑症迹象。NLP 与 DL 技术可以有效处理英文医疗文本数据,越来越多地被应用在基于电子病历信息自动生成ICD编码等任务。Michalopoulos等3 基于 BigBird,结合图卷积网络(graph convolutional network,GCN)构建了 ICDBigBird 模型,提高了在ICD编码任务中的性能,可处理规模更大的文档。Dong 等4 使用 DL 与 NLP 技术分析处理临床文本,转化为标准的 ICD 编码。Chen 等 5构建了基于监督学习的深度神经
10、网络自动 ICD-10 编码和训练系统,利用 DL 模型从临床文本中自动提取相关信息,并将其转化 为 ICD-10 编 码。Falissard 等6引入了深度神经序列模型,通过与NLP 技术结合,实现从自然语言文本中自动识别和翻译 ICD-10 医学实体。Ching 等7探索了 DL 和NLP 技术在 ICD 编码和手术预警中的应用前景。张述睿等8基于 DL 构建图结构,优化 ICD 编码的庞大标签空间中的多标签分类情况。李强等9基于 NLP 及知识库构建技术设计诊断漏写检查系统,找出可能漏写的疾病,提高了住院病案首页的填写质量。本研究则创新性地引入NLP 和 DL 模型解决中文环境中手术数据
11、 ICD 编码的错选、乱选及ICD 编码预测问题,进而尝试预警并处理手术风险。2 手术室智慧管理的方案设计本研究引入 NLP 和 DL 模型,利用病历文本资料,对 ICD 编码进行纠错及预测。采用 NLP 技术对资料进行预处理,包括数据清洗、标注、分词、向量化等,将非结构化、半结构化的文本资料转化为结构化数据;然后使用 DL 模型对预处理后的数据进行训练。模型基于大量的历史数据学习疾病诊断、手术名称及其他相关字段与 ICD 编码之间的关系,然后根据这种关系对 ICD 编码进行纠错,并预测可能的 ICD 编码。在此基础上,对围手术期各阶段的数据进行循环分析,预测潜在的手术风险,使医护人员能够更好
12、地了解患者的情况和需求,提供更安全的手术环境和更优质的医疗服务,实现对手术室各项业务的精确分析与管理。手术室智慧管理系统功能模块见图 1。图 1 系统功能模块2.1 ICD编码纠错为解决 ICD 编码错选、乱选的问题,本研究首先使用 NLP 技术对历史病历中大量非结构化文本数据进行分析,利用 BERT(bidirectional encoder representation from transformers)模型10对病历文本进行词向量表示,将文本数据转换为数值型数据,并对医疗领域的语料库进行微调。数据结构见表 1。语料库来源于本院积累的结构化手术记录数据集,以及基于百度百科和维基百科的文本
13、数据。然后使用支持向量机(support vector machine,SVM)算法进行 ICD 编码的精确匹配。2.1.1 系统程序设计 本研究选用scikit-learn 库 的 SVC 函 数,划 分训练集和测试集,创建 SVM 模型,使用线性核函数,正则化参数 C 设为 1,激活概率估计,在训练集上专题策划人工智能在医药领域的应用Special Planning14 China Digital Medicine.2023,Vol.18,No.8训练 SVM 模型,在测试集上进行预测,输出分类报告,展示模型性能。程序流程见图 2。2.1.2 模型训练与评估 首先,加载数据,并对 ICD
14、编码进行标签编码,以便能够输入到模型中;然后,使用 BERT 模型将病历文本转换为特征向量,通过并发处理加快速度;使用训练集的特征向量和对应的 ICD 编码训练 SVM 模型,并在测试集上进行预测;最后,输出分类报告,以评估模型的性能。分类报告中频数最高的 10 个 ICD 编码输出结果见表 2。表格中的每一行代表一个手术和 ICD 编码的匹配结果以及对应编码的性能指标。“手术名称”是手术的名称,“ICD-9-CM 编码”是与该手术名称匹配的 ICD-9-CM编码。精确度、召回率和 F1 值等是评估模型性能的指标11。精确度、召回率、F1 值均 0.8。说明模型较好地实现了手术名称和 ICD1
15、0编码的精确匹配,性能良好。本研究将 NLP 和 DL 技术应用于 ICD 编码的精确匹配,成功解决了历史数据中ICD编码错选、乱选问题,为手术室的精益化、智慧化运营管理奠定了坚实的基础。2.2 ICD编码预测手术数据是医疗数据的重要组成部分,其中 ICD 编码可以反映手术类型、手术并发症等信息,有助于监测手术安全、预警手术风险等。本研究采用 NLP 和 DL 技术对不同科室的手术数据自动进行ICD 编码预测,在医护人员选择ICD 编码时能自动推荐提醒该科室高频出现的 ICD 编码。2.2.1 系统程序设计 本研究基于DL 和 NLP 技术对手术数据进行特征提取和分类,配合循环神经 网 络(R
16、NN)、长 短 期 记 忆网络(LSTM)和卷积神经网络(CNN)等模型12进行训练,并学习历史手术名称与 ICD 编码的关系,从而根据手术数据自动预测ICD 编码。流程见图 3。2.2.2 数据获取与预处理 本研究采用外科手术数据作为实验数据,每条记录包括患者信息、科室信息、手术名称、手术日期、手术医生、诊断结果、检查检验结果等。每条记录还有一个或多个对应的 ICD编码,表示该手术的类型、指征、并发症等信息。第一步使用 Python的正则表达式库(re)对原始数据进行清洗;第二步数据预处理,首先对选取的数据进行人工标注并交叉验证,然后使用 CountVectorizer方法进行分词,最后使用
17、 Tokenizer方法进行数据向量化;第三步划分训练集和测试集,设置测试集的比例为 20%,随机种子为 42,以确保字段名称数据类型数据长度描述手术科室字符串30表示手术的科室名称手术时长整型3表示手术的时长,单位为分钟手术病种字符串30表示手术的病种类型疾病诊断字符串200表示患者的疾病诊断结果手术名称字符串100表示进行的手术名称手术风险等级字符串20表示手术的风险等级患者年龄整型3表示患者的年龄患者性别字符串2表示患者的性别患者身体状况字符串20表示患者的身体状况表 1 数据结构图 2 ICD 编码纠错流程加载病历文本数据专题策划人工智能在医药领域的应用Special Planning
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 自然语言 处理 手术室 智慧 管理 创新 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。