基于mRNA组学构建弥漫大B细胞淋巴瘤预后模型.pdf
《基于mRNA组学构建弥漫大B细胞淋巴瘤预后模型.pdf》由会员分享,可在线阅读,更多相关《基于mRNA组学构建弥漫大B细胞淋巴瘤预后模型.pdf(7页珍藏版)》请在咨信网上搜索。
1、 基金项目:徐州市科技计划重点研发项目(KC21207)通信作者,E-mail:13952269920lhh 基于 mRNA 组学构建弥漫大 B 细胞淋巴瘤预后模型王玉波,马东慎,骆丹,范美婷,刘慧(徐州医科大学附属医院病理科,江苏 徐州 221002)摘要:目目的的 根据 mRNA 组学数据筛选弥漫大 B 细胞淋巴瘤(DLBCL)预后相关基因并建立预后模型。方方法法 从 TCGA 数据库下载 NCICCR-DLBCL 数据集中 234 例 DLBCL 患者 mRNA 组学数据和预后数据作为训练集,从 GEO 数据库下载 GSE87371 数据集中 223 例 DLBCL 患者相应数据作为验证
2、集,通过 Cox 回归分析、Kaplan-Meier 分析和 LASSO 分析建立预后模型,结合生存曲线和 ROC 曲线验证模型的准确性。采用免疫组化法验证117 例 DLBCL 组织中 CD70 蛋白的表达及其与预后的关系。结结果果 构建包含 14 个独立预后预测 mRNA(ANO3、ZNF93、RAD9B、PROC、ZSCAN20、RBBP9、SLC18B1、CXorf21、MUC12、CYP2U1、VSIG4、CCDC178、CD70、GHRH)的预后模型。高风险组生存时间显著短于低风险组(P0.000 1),ROC 1 年、3 年和 5 年生存率曲线下面积分别为0.92、0.90 和
3、0.91。CD70 阳性组与阴性组的 Kaplan-Meier 生存曲线差异有统计学意义(P=0.009 4),阳性组生存时间较短。结结论论 成功建立了基于 mRNA 表达的 DLBCL 预后预测模型,为 mRNA 转录组学在 DLBCL 预后预测中的实际应用提供了可行性方案,并在临床样本中证实 CD70 高表达与 DLBCL 预后密切相关,可作为临床预后评价的指标之一。关键词:mRNA;CD70;弥漫大 B 细胞淋巴瘤;TCGA 数据库;预后模型;生存分析中图分类号:R733.4 文献标志码:A 文章编号:2096-3882(2024)03-0195-07DOI:10.3969/j.issn
4、.2096-3882.2024.03.008Establishment of a prognostic model for diffuse large B-cell lymphoma based on mRNA omicsWANG Yubo,MA Dongshen,LUO Dan,FAN Meiting,LIU Hui(Department of Pathology,the Affiliated Hospital of Xuzhou Medical University,Xuzhou,Jiangsu 221002,China)Abstract:Objective To screen the p
5、rognosis-related genes for diffuse large B-cell lymphoma(DLBCL)based on mRNA omics data and establish a prognostic model.MethodsThe mRNA-omics data and prognostic data of 234 DLBCL patients in the NCICCR-DLBCL dataset were downloaded from the TCGA database as a training set,while the corresponding d
6、ata of 223 DLBCL patients in GSE87371 dataset were downloaded from GEO database as a validation set.A prognostic model was established through Cox regression analysis,Kaplan-Meier analysis and LASSO analysis,and its accuracy was validated by Kaplan-Meier survival curve and ROC curve.Finally,the expr
7、ession of CD70 protein was detected in 117 DLBCL tissues by immunohistochemistry.Results The prognostic model was established,which contained 14 significantly independent mRNA marker(ANO3,ZNF93,RAD9B,PROC,ZSCAN20,RBBP9,SLC18B1,CXorf21,MUC12,CYP2U1,VSIG4,CCDC178,CD70,and GHRH).The high risk group sho
8、wed remarkably shorter median survival time than the low risk group(P60 岁118(50.4)107(48.0)性别 男139(59.4)116(52.0)女95(40.6)107(48.0)分期 40(17.1)29(13.0)69(29.5)42(18.8)62(26.5)35(15.7)59(25.2)117(52.5)未知4(1.7)0(0)国际预后指数 高风险23(9.8)50(22.4)高-中风险44(18.8)54(24.2)中-低风险45(19.2)45(20.2)低风险81(34.6)74(33.2)未知4
9、1(17.5)0(0)生存状态 存活136(58.1)53(23.8)死亡98(41.9)168(75.3)691徐州医科大学学报 J Xuzhou Med Univ 2024,44(3)续表 1临床特征训练集(n=234)验证集(n=223)未知0(0)2(0.9)1 年生存时间 1 年186(79.5)195(87.5)1 年39(16.7)3(1.3)未知9(3.8)25(11.2)3 年生存时间 3 年141(60.2)111(49.8)3 年68(29.1)66(29.6)未知25(10.7)46(20.6)5 年生存时间 5 年118(50.4)16(7.2)5 年79(33.8)
10、154(69.0)未知37(15.8)53(23.8)1.2 研究对象 收集 20192021 年徐州医科大学附属医院确诊的 117 例 DLBCL 患者作为研究对象。所有 DLBCL 均依据 WHO(2008)诊断标准和 2016年修订标准11 确诊,并应用 Hans 法则进行分型。由 2 位经验丰富的病理医师进行 H-E 染色、免疫组化阅片。1.3 分析方法采用 R 软件进行预后模型分析。从训练集的 mRNA 转录组测序结果中获得基因表达量的 FPKM 值,采用 Z-score 标准化后,根据每个基因中位表达量将病例分为该基因高表达和低表达组,分别进行单基因 Cox 回归分析和单基因 Ka
11、plan-Meier(K-M)生存分析,筛选出 2 种分析方法中 P0.05 的 mRNA。采用 LASSO 回归分析进一步缩小目标基因范围。采用多因素 Cox 回归构建风险比例模型。采用 survminer 程序包的 surv_cutpoint 函数寻找最佳风险分数的临界值,根据此临界值将训练集所有样本分为高风险组和低风险组。采用 K-M 曲线及时间依赖性受试者工作特征曲线(ROC)下面积(AUC)对预测模型进行评估。最后,采用来源于 GEO 数据库的基因表达芯片数据进行验证,根据建好的模型计算各病例的风险系数,采用 K-M 和 AUC 评估模型预测效果。1.4 免疫组化 收集 117 例
12、DLBCL 患者病理蜡块并制作组织芯片,切片后行 H-E 染色及免疫组化双染色。一抗包括 CD20、PAX-5、CD10、BCL-6、BCL-2、MUM1、C-MYC、CD3、CD5、Ki-67 等,购自北京中杉金桥公司,CD70 鼠抗人单克隆抗体购自美国 Proteintech 公司,克隆号 67749-1-lg。结果判定:CD70 阳性定位于细胞膜,将所有病例分为阴性(-)组和阳性(+)组。1.5 随访 以门诊或电话方式进行随访,所有患者随访 172 个月,随访内容包括患者生活质量、一般情况、近期复查情况等。总生存期指自病理确诊至因任何原因死亡的时间。1.6 统计学分析 采用 SPSS 2
13、7.0 软件进行统计学分析,DLBCL 中 CD70 表达与临床病理特征的关系行 Pearson 2检验,若理论频数 T5 且 T1,采用2检验的连续校正公式,若理论频数 T1,采用2检验的 Fisher 精确概率法。生存分析采用 Kaplan-Meier 分析。以双侧 P0.05 为差异有统计学意义。2 结 果2.1 DLBCL 预后模型的建立从训练集中获得17 776 个 mRNA 的表达信息,从中筛选出单基因Cox 回归分析 P0.05、单基因 K-M 生存分析 P0.05 且与预后潜在相关的 mRNA 共 1 183 个。其中 1 107 个为验证集和训练集共有,用于后续分析。对上述
14、1 107 个 mRNA 进行 LASSO 回归以进一步压缩参数。为了得到简洁的模型,采用最小化平均交叉验证误差 值的 1 个标准误差内的最大值(lambda.1se)作为最佳 值,共筛选出 44 个 mRNA791徐州医科大学学报 J Xuzhou Med Univ 2024,44(3)纳入后续分析。进一步采用多因素 Cox 回归构建预后预测模型。14 个基因是独立预后预测因子(P1,表明这 8 个基因可能是影 响 DLBCL 患 者 预 后 的 危 险 因 素;ANO3、ZNF93、RAD9B、PROC、ZSCAN20、RBBP9的 HR1,表明这 6 个基因可能是影响 DLBCL 患者预
15、后的保护因素。2.2预后风险模型及生存分析见图 1。根据构建好的模型计算各样本的风险分数,采用 surv_cut-point 函数确定训练集最佳风险分数临界值为 0.14,并根据此临界值将训练集分为高风险组和低风险组(图 1A),K-M 分析发现高风险组生存时间短于低风险组(P0.000 1,图 1B)。A.训练集中患者的风险评分,垂直虚线左侧点代表低风险患者,右侧点代表高风险患者,垂直虚线为低风险患者和高风险患者风险评分临界值;B.训练集 mRNA 预测模型中患者的 Kaplan-Meier 生存曲线图;C.训练集 mRNA 预测模型中风险得分预测患者 1 年、3 年和 5 年生存率的 RO
16、C 曲线:D.验证集高低风险组 Kaplan-Meier 曲线;E.验证集时间依赖 ROC 曲线图 1 训练集及验证集 DLBCL 患者生存分析 高风险组和低风险组 1 年生存率分别为59.4%和 94.7%,3 年生存率分别为 32.7%和81.2%,5 年生存率分别为 19.8%和 73.7%。ROC曲线分析结果显示,模型预测患者 1 年生存率的 891徐州医科大学学报 J Xuzhou Med Univ 2024,44(3)AUC 值为 0.92,3 年生存率的 AUC 值为 0.90,5 年生存率的 AUC 值为 0.91(图 1C)。采用验证集进行验证,根据模型计算风险分数并确定最佳
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 mRNA 构建 弥漫 细胞 淋巴瘤 预后 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。