基于糖酵解相关基因GFUS对三阴性乳腺癌疗效预测模型构建与验证.pdf
《基于糖酵解相关基因GFUS对三阴性乳腺癌疗效预测模型构建与验证.pdf》由会员分享,可在线阅读,更多相关《基于糖酵解相关基因GFUS对三阴性乳腺癌疗效预测模型构建与验证.pdf(8页珍藏版)》请在咨信网上搜索。
1、临床信息学第 37 卷第 1 期医学信息Vol.37 No.12024 年 1 月Journal of Medical InformationJan.2024基金项目:蚌埠医学院自然科学重点项目(编号:2021byzd095)作者简介:章海斌(1991.4-),女,安徽蚌埠人,硕士研究生,住院医师,主要从事实体肿瘤的内科治疗研究基于糖酵解相关基因 GFUS 对三阴性乳腺癌疗效预测模型构建与验证章海斌1袁王 练2渊蚌埠医学院第一附属医院肿瘤内科1袁中医科2袁安徽 蚌埠233000冤摘要院目的基于生物信息数据库信息探讨糖酵解相关基因GDP-L-岩藻糖合酶渊GFUS冤对三阴性乳腺癌渊TNBC冤预后情
2、况的预测价值遥方法从癌症基因组图谱渊TCGA冤数据库获取TNBC基因表达信息袁应用生物信息学方法分析GFUS在TNBC中的差异表达及预后差异袁筛选与GFUS共表达基因建立预测TNBC预后模型并验证遥结果从TCGA数据库下载160例TNBC组织和113例正常组织的基因转录组数据袁验证了GFUS在TNBC中的高表达与不良预后相关遥基于GFUS共表达基因袁通过COX回归分析得到3个与TNBC预后相关基因袁以此构建模型遥根据预后模型将外部数据集训练样本分为高风险组渊45例冤和低风险组渊62例冤遥 Kaplan-Meier生存分析显示袁高风险组总生存情况低于低风险组袁差异有统计学意义约0.05冤遥结论基
3、于糖酵解相关基因GFUS建立的模型可有效预测TNBC预后情况袁并为个体化治疗提供新思路遥关键词院三阴性乳腺癌曰GDP-L-岩藻糖合酶曰预后模型中图分类号院R737.9文献标识码院ADOI院10.3969/j.issn.1006-1959.2024.01.004文章编号院1006-1959渊2024冤01-0022-08Construction and Validation of a Prediction Model for the Efficacy of Triple-negative Breast CancerBased on the Glycolysis-related Gene GFUS
4、ZHANG Hai-bin1,WANG Lian2(Department of Medical Oncology1,Department of Traditional Chinese Medicine2,the First Affiliated Hospitalof Bengbu Medical College,Bengbu 233000,Anhui,China)Abstract:Objective To explore the predictive value of glycolysis-related gene GDP-L-amylose synthase(GFUS)on the prog
5、nostic profile of triple-negative breast cancer(TNBC)based on bioinformatics database information.Methods The gene expression information of TNBC was obtained fromthe Cancer Genome Atlas(TCGA)database.The differential expression and prognostic differences of GFUS in TNBC were analyzed by bioinformat
6、icsmethods.The co-expressed genes with GFUS were screened to establish a prognostic model for TNBC and verified.Results The gene transcriptomedata of 160 TNBC tissues and 113 normal tissues were downloaded from the TCGA database,which verified that the high expression of GFUS inTNBC was associated w
7、ith poor prognosis.Based on GFUS co-expressed genes,three genes related to TNBC prognosis were obtained by COXregression analysis to construct the model.According to the prognostic model,the external data set training samples were divided into high-risk group(45 cases)and low-risk group(62 cases).Ka
8、plan-Meier survival analysis showed that the total survival of the high-risk group was lower than that ofthe low-risk group,and the difference was statistically significant(0.05).Conclusion The model based on the glycolysis-related gene GFUS caneffectively predict the prognosis of TNBC and provide n
9、ew ideas for individualized treatment.Key words:Triple-negative breast cancer;GDP-L-amylose synthase;Prognostic model三阴性乳腺癌(triple-negative breast cancer,TNBC)是一类特殊类型的乳腺癌,由于其缺乏雌激素和孕激素受体以及人表皮生长因子受体 2(Her-2)的表达,表现出不同组织学类型,基因组和免疫特征,因而被单列为一类疾病1。流行病学资料显示2,TNBC 的发生率占所有乳腺癌的 15%20%,好发于绝经前 40 岁以下的年轻女性。TNBC 具
10、有高侵袭的特性,术后复发率高,约 25%,且术后复发时间仅为1940 个月,远低于非 TNBC 患者的 3567 个月。远处转移发生率约 46%,多累及脑及其他内脏器官,转移后的中位生存时间为 13.3 个月。因此其 5 年死亡率远高于其他类型乳腺癌,达 40%。复发后 TNBC患者发生 3 个月内概率高达 75%3。基于 TNBC 的异质性与难治性,建立有效的预后生物标志物对TNBC 患者准确预后和合理治疗策略至关重要。越来越多的证据表明,有氧糖酵解是癌细胞的重要代谢过程。不管是否有充足的氧气,肿瘤细胞主要利用糖酵解来产生能量,并且具有较高的糖酵解率。这种有氧糖酵解表型被称为 Warburg
11、 效应4。Warburg 效应已在不同类型的实体肿瘤中得到证实,包括乳腺癌5。因此,靶向糖酵解过程可能成为 TNBC 的潜在窑临床信息学窑22临床信息学第 37 卷第 1 期医学信息Vol.37 No.12024 年 1 月Journal of Medical InformationJan.2024治疗靶点。GFUS 又称组织特异性移植抗原 P35B,是一种 NADP(H)结合蛋白,催化 GDP-D-甘露糖代谢中的两步外聚酶和还原酶反应,将 GDP-4-酮-6-D-脱氧甘露糖转化为 GDP-L-岩藻糖,在糖基化过程中起着关键作用6。GFUS 表达的增加可以同时诱导核心岩藻糖蛋白和岩藻糖蛋白的升
12、高。这种异常的岩藻糖基化在结直肠癌、肝癌、肺癌、黑色素瘤、食管癌等肿瘤中都普遍存在,其调控肿瘤细胞的增殖、侵袭和迁移、血管生成、转移、免疫逃逸等方面发挥作用7-9。研究发现10,GFUS 的高表达在乳腺癌的发生发展中起重要作用,可作为乳腺癌的独立分子标志物。因此,本研究通过应用多种生物信息学方法,实现 GFUS 共表达基因鉴定,构建了 TNBC 的预后模型,以期对指导 TNBC 个体化治疗提供新思路。1材料与方法1.1 资料来源 从 TCGA(The Cancer Genome Atlas,TCGA)数据库(https:/portal.gdc.cancer.gov/)获取160 例 TNBC
13、肿瘤样本与 113 例癌旁正常组织样本的基因转录组数据及临床数据。1.2 方法1.2.1 GFUS 在 TNBC 中的表达差异及的功能分析使用 R 软件 v4.0.3 进行统计分析,对 GFUS 表达水平在癌与癌旁进行差异分析,约0.05 被认为差异有统计学意义。使用 c2.cp.kegg.v2022.1.Hs.symbols.gmt集合,采用基因富集分析(gene set enrichment anal原ysis,GSEA)分析 GFUS 高表达组和低表达组之间主要富集在的信号通路和表现的相应生物学功能。1.2.2 差异基因的筛选及共表达基因鉴定使用limma R 包对肿瘤和正常组织之间的
14、DEG 进行鉴定(FDR约0.05 and|log2FC|跃1),得到在 TNBC 中差异表达的基因。通过皮尔森相关性分析选择得到共表达基因(阈值相关性系数在 0.4 及 约0.05)。1.2.3 基因筛选与模型构建 对差异共表达基因的表达量以及生存数据进行单变量 Cox 比例风险回归分析,利用 R 包 survival coxph function,选择约0.05作为阈值得到预后显著基因。通过 Lasso 压缩估计构建模型:使用 R 软件包 glmnet 进行 lasso cox 回归分析,首先分析每个自变量的变化轨迹,随着 lamb原da 的逐渐增大而逐渐增加自变量系数趋于 0 的个数,后
15、使用 5-fold 交叉验证进行模型构建,分析每个 lambda 下的置信区间,最终当 lambda=0.042 357 2时模型达到最优,最终模型公式如下:RiskScore4=0.5609*expGFUS+0.2356*expATP6V0B-0.1159*expGPLD1+0.1661*expMFSD31.2.4 预后模型验证 采用外部验证来评估该模型的预测价值,外部验证集和训练集具有相同的模型和系数。同样,每个样本的风险得分由样本的表达水平计算的而来。使用 R 软件包 timeROC 对 RiskScore进行预后分类的生存分析及受试者工作特征(receiver operating ch
16、aracteristic,ROC)分析,分别分析 3、5 年的预后预测分类效率。1.3 统计学分析 R 软件(R 版本:4.0.3)进行所有数据统计分析。Wilcoxon 检验用于连续变量分析,2检验用于分类数据分析。Kaplan-Meier 分析和Log-rank 检验用于生存差异计算。分析结果均以约0.05 为差异有统计学意义。2结果2.1 基于 TCGA 数据分析 GFUS 在 TNBC 中的表达差异 从 TCGA 数据库中获得的 mRNA 水平显示,癌旁正常组织中的 GFUS 水平低于癌组织(约0.05),见图 1。2.2 GFUS 在 TNBC 中的高表达与较差预后相关 与GFUS
17、低表达患者相比,GUFS 高表达患者具有更差的总生存率(overall survival,OS)(约0.05),见图2A。同样,高表达 GFUS 的 TNBC 患者具有更差的无进展生存期(progress free survival,PFS)、无病生存期(disease free survival,DFS)及疾病特异性生存期(disease free survival,DSS)(约0.05),见图 2B图2D。2.3 GFUS 高低表达组的功能分析 运用 GSEA 分析GFUS 高表达组和低表达组的基因主要富集的信号通路和生物学功能见图 3A3F。结果表明,高表达组 主 要 富 集 在 REN
18、IN_ANGIOTENSIN_SYSTEM、图1 GFUS在TNBC中的癌与癌旁表达差异23临床信息学第 37 卷第 1 期医学信息Vol.37 No.12024 年 1 月Journal of Medical InformationJan.2024GLUTATHIONE_METABOLISM、OXIDATIVE_PHOSPHORYLATION 等通路;低表达组主要富集在SMALL_CELL_LUNG_CANCER、WNT_SIGNALING_PATHWAY、TGF_BETA_SIGNALING_PATHWAY 等通路。2.4 疾病差异表达基因鉴定 为了进一步探索三阴性乳腺癌中差异表达的基因,
19、使用 limma R 包对肿瘤和正常组织之间的 DEG 进行鉴定(FDR约0.05 and|log2FC|跃1),得到 3050 个基因,其中在肿瘤组织中上调基因共有 1099 个,下调基因有 1951 个,差异表达基因的火山图见图 4A,上下调前 100 个基因的表达热图间图 4B。注:A:OS 差异;B:PFS 差异;C:DFS 差异;D:DSS 差异图2 GFUS高低表达组生存指标差异ABCD图3基因集富集分析渊GSEA冤结果ABC24临床信息学第 37 卷第 1 期医学信息Vol.37 No.12024 年 1 月Journal of Medical InformationJan.20
20、24图3基因集富集分析渊GSEA冤结果渊续冤ABC2.5 GFUS 共表达基因鉴定 为了进一步鉴定 GFUS共表达基因,通过皮尔森相关性分析选择阈值相关性系数在 0.4 及约0.05,共得到 340 个共表达基因,其中正相关基因有 308 个,负相关基因有 32 个,相关性散点图见 5A,相关性基因的表达热图见 5B。2.6 模型构建 最终得到 77 个差异共表达基因图6A,对这 77 个基因的表达量以及生存数据进行单变量 Cox 比例风险回归模型。利用 R 包 survivalcoxph function,选择约0.05 作为阈值,最终得到了36 个预后显著的基因。应用 Lasso Leas
21、t absoluteshrinkage and selection operator,Tibshirani(1996)方法进行压缩估计并构建模型,该算法可以进一步缩小基因范围,同时保证较高准确率。使用 R 软件包glmnet 进行 lasso cox 回归分析,首先对每一个自变量的变化轨迹进行分析,自变量系数趋于 0 的个数随着 lambda 的逐渐增大而增多,接着使用 5-fold 交叉验证构建模型,以分析每个 lambda 下的置信区间。图 6B、图 6C 可以看出当 lambda=0.042 357 2 时模型达到最优,最终模型公式如下:RiskScore4=0.5609*expGFUS
22、+0.2356*expATP6V0B-0.1159*expGPLD1+0.1661*expMFSD3依据样本的表达水平分别计算了每个样本的风险得分,并绘制出样本的 RiskScore 分布。如图 7A所示,风险得分高的样本 OS 显著低于得分较低的,这提示了高的 RiskScore 样本预后更差。4 个不同的signature 基因随着风险值的增加表达情况发生变化,鉴定了 GPLD1 的高表达和低风险相关,为保护因素;鉴定了 GFUS、ATP6V0B、MFSD3 的高表达和高风险相关,为危险因素。根据 RiskScore 中值将样本划分高低风险组,并绘制 KM 曲线,如图 7B 所示,从中可以
23、看出两组差异及其显著 Log-rank=0.004 59,=3.476(95%:1.4698.229),其中 80个注:A:火山图;B:热图图4差异表达火山图和热图AB25临床信息学第 37 卷第 1 期医学信息Vol.37 No.12024 年 1 月Journal of Medical InformationJan.2024样本被划分为高风险组,80 个样本为低风险组;进一步使用 R 软件包 timeROC 对 CubScore 进行预后分类的 ROC 分析,分别分析了 1、3、5 年的预后预测分类效率,如图 7C 所示,从中可以看出模型具有很高的 AUC 线下面积,在 0.687 以上。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 酵解 相关 基因 GFUS 阴性 乳腺癌 疗效 预测 模型 构建 验证
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。