FCM数据细胞亚群分类和标注的自动化研究.pdf
《FCM数据细胞亚群分类和标注的自动化研究.pdf》由会员分享,可在线阅读,更多相关《FCM数据细胞亚群分类和标注的自动化研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、论 著第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024作者简介:摆文丽(1997.7-),女,甘肃白银人,硕士研究生,主要从事卫生统计学和流式细胞术的研究通讯作者:王奎(1967.3-),男,重庆人,博士,副教授,主要从事卫生统计学、生物信息学以及流式细胞术的研究FCM 数据细胞亚群分类和标注的自动化研究摆文丽1袁农卫霞2袁李智伟3袁雷 伟1袁郭玉娟1袁张向辉1袁芮东升1袁王 奎1渊1.石河子大学医学院预防医学系袁新疆 石河子832000曰2.石河子大学医学院第一附属医院血液风湿科袁新疆 石河子
2、832000曰3.新疆维吾尔自治区人民医院临床检验中心袁新疆 乌鲁木齐830001冤摘要院目的研究自动化分析方法用于流式细胞术数据分析尧解决细胞亚群自动分类和标注问题的价值袁以期为疾病诊断提供参考遥方法收集2021年急性白血病骨髓流式检测数据528例袁通过补偿尧转换以及去粘连完成流式细胞术原始数据预处理袁对预处理后的数据使用无监督聚类方法进行聚类分析袁利用生成的细胞亚群的中心位置袁即宏细胞的分布规律来训练有监督分类模型袁将亚群进一步分类袁最后通过人工识别与标注袁将细胞亚群标注为已知的细胞类型遥结果无监督聚类方法与有监督分类方法共同用于流式细胞术数据分析能够实现细胞亚群的自动分类与标注袁且准确度
3、达到或基本达到手工分析水平遥结论该研究提出的流式细胞术数据自动分类和标注方法袁解决了目前流式细胞自动化分析存在的细胞聚类方法和病人分类方法之间不相关问题袁为全程自动化提供了解决方案曰且提供的临床诊断中所需的中间结果袁可用于疾病诊断的质量控制遥关键词院流式细胞术曰聚类分析曰亚群分类曰亚群标注曰自动化分析中图分类号院R319文献标识码院ADOI院10.3969/j.issn.1006-1959.2024.06.013文章编号院1006-1959渊2024冤06-0078-06Automatic Classification and Labeling of Cell Subsets in FCM D
4、ataBAI Wen-li1,NONG Wei-xia2,LI Zhi-wei3,LEI Wei1,GUO Yu-juan1,ZHANG Xiang-hui1,RUI Dong-sheng1,WANG Kui1(1.Department of Preventive Medicine,Shihezi University School of Medicine,Shihezi 832000,Xinjiang,China;2.Department of Hematology and Rheumatology,the First Affiliated Hospital of Shihezi Unive
5、rsity School of Medicine,Shihezi 832000,Xinjiang,China;3.Clinical Laboratory Center,Xinjiang Uygur Autonomous Region Peoples Hospital,Urumqi 830001,Xinjiang,China)Abstract:ObjectiveTo study the value of automatic analysis method for flow cytometry data analysis and solving the problem of automaticcl
6、assification and labeling of cell subsets,so as to provide reference for disease diagnosis.Methods The data of bone marrow flow cytometry from 528cases of acute leukemia in 2021 were collected,and the original flow cytometry data were preprocessed by compensation,conversion and deadhesion.The prepro
7、cessed data were analyzed by unsupervised clustering method,and the supervised classification model was trained by using the centrallocation of the generated cell subsets,namely the distribution rule of macro cells,to further classify the subsets.Finally,the cell subsets were labeledas known cell ty
8、pes by manual recognition and labeling.Results Unsupervised clustering method and supervised classification method could be usedin flow cytometry data analysis,which can realize automatic classification and labeling of cell subsets,and the accuracy can reach or almost reach thelevel of manual analys
9、is.Conclusion The method of automatic classification and labeling of flow cytometry data proposed in this study bridge the gapbetween cell clustering and patient classification existing in current flow cytometry automation,and provid a solution for the whole process automation.The intermediate resul
10、ts required for clinical diagnosis can be used for quality control of disease diagnosis.Key words:Flow cytometry;Cluster analysis;Subpopulation classification;Subpopulation registration;Automatic analysis流式细胞术(flow cytometry,FCM)是一种能够精确、快速地对生物细胞或微粒的理化特性和生物学特性进行定量分析的技术1。随着精准医疗和基因生物学的发展,FCM 已经成为恶性血液病诊
11、断的重要依据2。FCM 数据在人工分析中最关键和最耗时的步骤是识别数据中的同质细胞群,这个过程为“设门”3。数据传统的分析方法是通过不同参数组合进行人工设门,随着检测参数成倍增加,产生了多组合、高维度的流式数据,而 FCM 数据分析成为FCM 中最具挑战性和最耗时的诊断步骤4-7。自动设门是基于细胞群荧光强度分布的数学建模,可以使用有监督和无监督的方法来执行,用于解决人工设窑论著窑78论 著第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024门所面临的问题。目前常见的自动化分析方法包括FlowMea
12、ns8、SPADE9、Citrus10、FlowSOM11以 及PCA12等,其中最常用的是 FlowMeans,其是一种无监督聚类方法,通过合并多个聚类以获得最终细胞亚群13,14,但只能将 FCM 数据中相似的细胞聚成亚群15,16,不能实现亚群的标注,因此需要工作人员去一一识别,存在一定局限性。基于此,本研究旨在分析 FlowSOM 与有监督分类模型17(混合正态分布模型)联合应用于 FCM 数据自动化分析中的效果,现报道如下。1资料与方法1.1 数据来源 数据来源于实验室 2021 年 1 月-12 月同一面板急性白血病骨髓检测数据,共 528例,包括 412 例正常人、68 例 AM
13、L、9 例 T-ALL 以及39例 B-AL。本研究经当地政府伦理委员会批准。1.2 数据分析 FCM 数据细胞亚群的自动分类和自动标注可以分成 4 个阶段进行:淤预处理:通过读取数据、补偿和转换、去粘连完成 FCM 数据预处理;于细胞聚类:使用 FlowSOM 方法对预处理的数据进行细胞聚类,聚类的结果以宏细胞的方式可视化;盂亚群分类:利用混合正态分布模型,训练有监督分类模型对细胞亚群进行分类;榆亚群标准:对盂得到的有限个数的细胞亚群类进行识别和标注建立多对多映射,完成细胞亚群的标注。1.2.1 数据预处理 通过补偿、转换和去粘连完成FCM 数据的预处理。淤首先应用补偿矩阵对数据进行补偿,补
14、偿矩阵采用流式 fcs 格式数据自带的补偿矩阵,通过读取荧光抗体名称与提取荧光通道的数据矩阵,对荧光抗体做补偿5;于接着对 FCM 数据做转换,对前向散射光 FSC 进行线性变换(除以100 k),侧向散射光 SSC 进行 Log10对数转换,对抗体做双指数变换;盂最后使用百分位法在 FSC-A 和FSC-H 平面对数据做去粘连处理,具体步骤如下:首先选取 FSC-H 大于 0.5 且 FSC-A 小于 2 的细胞子集,计算其在全体细胞中的占比;当子集占比小于等于 0.75 时,使用子集计算变量 FSC-A 与 FSC-H的百分位点 P5和 P75,否则计算 P5和 P90;以两个对子为端点做
15、基准线段,将连线垂直上移和下移 0.225单位做两条平行线;两条平行线之外的点即为粘连细胞;FSC-H 小于 0.2 的点对应于细胞碎片,其余的为进入后续分析的细胞,包括正常细胞和凋亡细胞。上述切割点的选择用试错法确定。1.2.2 细胞聚类 细胞聚类采用无监督分析方法,在操作中不需要任何标签,任何预定义的类作为引用。聚类算法识别同一聚类中的事件,将相似的细胞保留在同一个集群中,不同的细胞保留在不同的集群中。FlowSOM 具有节点网格,每个节点代表多维空间中的点17。自组织映射(the self-organizing map,SOM)将数据中的单元格分配给最近的节点,该节点以及周围的节点向新单
16、元格更新,以此类推,节点被分配到数据空间中的高密度区域,节点网格中相近的节点比较远的节点更相似18。因此,所有的单元格将会分配到距离他们最近的节点,从而将 FCM 数据中相同的细胞聚类在一起形成细胞亚群。为便于观察聚类结果,FlowSOM 聚类结果以亚群中心点展示,下文中把亚群中心点称为宏细胞。聚类的目标是将 FCM 数据分为若干个类群,并保证类群内的样本尽可能密集,不同类群之间尽可能离散。FlowSOM将 FCM 数据中相似的节点聚在一起形成无标签的细胞亚群,以宏细胞的形式展示。当比较 5伊5、10伊10和 15伊15 网格时,发现节点数量越多对应的纯度越高,但是聚类结果很混乱;根据经验,前
17、 4 管使用12伊12 网格,第 5 管使用 10伊10 网格,因此前 4 管的每管有 144 个宏细胞,第 5 管有 100 个宏细胞。1.2.3 亚群分类 聚类分析后得到细胞聚类结果,但由于 FlowSOM 是无监督学习方法,不同抗体组合的样本得到的亚群构成不一致,导致亚群次序混乱缺乏统一标签,需要对细胞亚群进行分类19。把标本分为训练集和测试集,训练基于混合正态分布的有监督分类模型对所有的宏细胞进行分类,也就是对细胞亚群进行统一分类,混合正态分布模型的类别数设置为 20。有监督的混合正态分布模型对 FlowSOM生成的宏细胞结果进行分类。具体步骤如下:为了避免数据过少导致训练集分类结果代
18、表性差,选择60%70%的数据作为训练集,30%40%作为验证集,因此从 AML、T-ALL、B-ALL 数据中分别随机挑选 41、9、39 例数据作为训练集;正常人数据有412例,如果随机选择 60%的数据作为训练集,这样使得训练集中正常人数据远远多于患者数据,正常人细胞亚群特征覆盖异常细胞亚群,造成分类不准79论 著第 37 卷第 6 期医学信息Vol.37 No.62024 年 3 月Journal of Medical InformationMar.2024确,因此选择 100 例正常数据作为训练集。训练集170 例数据,共 97 920 个宏细胞;测试集 358 例数据,共 206
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FCM 数据 细胞 分类 标注 自动化 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。