基于生物信息学筛选和分析小儿溃疡性结肠炎的潜在生物标志物.pdf
《基于生物信息学筛选和分析小儿溃疡性结肠炎的潜在生物标志物.pdf》由会员分享,可在线阅读,更多相关《基于生物信息学筛选和分析小儿溃疡性结肠炎的潜在生物标志物.pdf(8页珍藏版)》请在咨信网上搜索。
1、医学新知 2024 年 2 月第 34 卷第 2 期 New Medicine,Feb.2024,Vol.34,N 论著一次研究DOI:10.12173/j.issn.1004-5511.202302036基金项目:桂林市技术应用与推广计划项目(202012E15593)通信作者:黄文娟,副教授,副主任医师,Email:基于生物信息学筛选和分析小儿溃疡性结肠炎的潜在生物标志物邹秋凤,邹佳英,李丽娟,方小玲,黄文娟中国人民解放军联勤保障部队第九二四医院新生儿科(广西桂林 541000)【摘要】目的 利用生物信息学筛选和分析小儿溃疡性结肠炎(ulcerative colitis,UC)的潜在基因生
2、物标志物。方法 从基因表达数据库 GEO 中下载炎症性肠病数据集GSE126124 的表达谱数据。使用 GEO2R 获取基因数据集中小儿 UC 组织与相应正常组织的差异表达基因(differentially expressed genes,DEGs)。DAVID、STRING 数据库对 DEGs进行生物学功能、通路富集分析和蛋白质-蛋白质相互作用分析。Cytoscape 基于蛋白质-蛋白质相互作用网络鉴定关键基因,KEGG 分析关键基因的通路富集情况。结果 获得了 153 个 DEGs,包括 92 个高表达基因和 61 个低表达基因。高表达 DEGs 显著富集的生物学功能和通路有外部刺激反应、
3、金黄色葡萄球菌感染和 IL-17 信号通路等。低表达的 DEGs 显著富集的生物学功能和通路有转运、膜的成分和代谢通路等。此外,10 个DEGs 可作为关键基因,包括 Cxcl1、Cxcl2、Cxcl10、Cxcr2、Il1rn、Fcgr3a、Cxcr1、S100a12、Ido1 和 Ccl24。关键基因显著富集的通路有趋化因子、病毒蛋白与细胞因子及受体的作用、幽门螺杆菌感染上皮细胞、IL-17 和 TNF 信号通路。结论 本研究发现了小儿 UC 的 153 个 DEGs,其中 10 个关键基因有可能在小儿 UC 的发生发展中起重要作用。【关键词】小儿;溃疡性结肠炎;基因;生物信息学;生物标志
4、物Bioinformatics-based screening and analysis of potential biomarkers in pediatric ulcerative colitisZOU Qiufeng,ZOU Jiaying,LI Lijuan,FANG Xiaoling,HUANG WenjuanDepartment of Neonatology,The 924st Hospital of Peoples Liberation Army,Guilin 541000,Guangxi Province,ChinaCorresponding author:HUANG Wenj
5、uan,Email:【Abstract】Objective Bioinformatics analysis was performed to screen and identify the underlying gene biomarkers in pediatric ulcerative colitis(UC)patients.Methods GSE126124 dataset,the mRNA expression profile of inflammatory bowel disease,was downloaded from the gene expression omnibus(GE
6、O)database.GEO2R was utilized to obtain differentially expressed genes(DEGs)between pediatric ulcerative colitis tissues and corresponding normal tissues in the dataset.Functional and pathway enrichment analysis and protein-protein interaction analysis of DEGs were conducted using the DAVID and STRI
7、NG database.The Cytoscape software was used to analyze protein-protein interaction network 医学新知 2024 年 2 月第 34 卷第 2 期 New Medicine,Feb.2024,Vol.34,N and hub genes.At last,the KEGG analyzed the biology and pathway enrichment of hub genes.Results A total of 153 DEGs were obtained,including 92 up-regul
8、ated and 61 down-regulated genes.Functional and pathway enrichment analysis showed that up-regulated DEGs were significantly enriched in the external stimulus,staphylococcus aureus infection and IL-17 signaling pathway.Functional and pathway enrichment analysis showed that down-regulated DEGs were s
9、ignificantly enriched in the transport,membrane composition and metabolic pathway.Furthermore,10 DEGs were considered hub genes,including Cxcl1,Cxcl2,Cxcl10,Cxcr2,Il1rn,Fcgr3a,Cxcr1,S100a12,Ido1 and Ccl24.Pathway enrichment analysis showed that hub genes were significantly enriched in the chemokines
10、,the interaction between viral proteins and cytokines and receptors,epithelial cells infected by Helicobacter pylori,IL-17 and TNF.Conclusion This research found 153 DEGs,in which 10 hub genes may play an important role in the occurrence and development of pediatric UC.【Keywords】Pediatric;Ulcerative
11、 colitis;Gene;Bioinformatics;Biomarkers溃疡性结肠炎(ulcerative colitis,UC)是一种病因复杂的慢性非特异性肠道炎性疾病,主要累及结肠和直肠1。根据既往流行病学研究报道,UC 的发病率为 132/10 万人年2。约 20%的 UC患者确诊时 18 岁,小儿 UC 的诊断年龄中位数为 1014 岁3。与成人 UC 相比,小儿 UC 的特点是结肠受累更广泛,疾病更具侵略性4。60%80%的患儿表现为大范围溃疡,10 年的手术切除率高达 30%40%5-6。近年来,病因不明的小儿 UC 发病率呈快速上升趋势7。肠道炎症和黏膜损伤是 UC 的主要
12、形式。正常情况下,黏液层、肠道上皮和肠道免疫系统共同构成肠道物理屏障,避免了肠道细菌和抗原不适当的免疫激活8。在 UC 状态下,炎症和免疫细胞富集在肠道黏膜,肠道通透性发生了变化。基于微阵列和高通量 PCR 技术,UC 和正常组织的 mRNA 表达谱被确定。目前,全基因组关联研究已确定了UC 的 23 个易感基因9,然而,小儿 UC 相关的生物信息学研究有限。本研究基于基因表达综合数据库(Gene Expression Omnibus,GEO),采用生物信息学技术探讨小儿 UC 相关差异表达基因(differentially expressed genes,DEGs)的生物学功能,为小儿UC的
13、机制研究和诊治提供科学依据。1 资料和方法1.1 微阵列数据的预处理从 GEO 数 据 库(http:/www.ncbi.nlm.nih.gov/geo)下载 UC 数据集 GSE126124 的基因表达谱(Affymetrix GPL6244平台,Affymetrix Human Gene 1.0 ST Array)。根据平台注释信息文件,将数据集的所有探针 ID 转换为相应的基因符号。GSE126124数据集包含两组样本,其中 18 个样本来自儿童 UC活检组织,作为实验组;19 个样本来自非炎症性肠病儿童的肠道活检组织,作为对照组。1.2 DEGs获取和筛选实 验组和对照组之间的初步 D
14、EGs 均通过GEO2R(http:/www.ncbi.nlm.nih.gov/geo/geo2r)分 析 获得。GEO2R 是 GEO 内置的网络工具,通过比较样本的转录组数据来获取不同样本间的初步 DEGs。对初步 DEGs 进行筛选,对于未匹配到基因和匹配多个基因的探针 ID 予以删除。对于重复基因,本研究只保留平均表达倍数最高的基因。最后,筛选矫正后 P值 0.05 和基因表达 Log 倍数变化(Log fold change,LogFC)绝对值 1 的 DEGs,其中 LogFC 1 的DEGs视为高表达基因,LogFC-1视为低表达基因。1.3 DEGs的GO和KEGG富集度分析注
15、释、可视化和综合发现数据库(Database for Annotation,Visualization and Integrated Discovery,DAVID)(http:/david.ncifcrf.gov)为 输 入 的 蛋 白质和基因列表提供了一个全面的生物学信息在线分析工具。京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)是一个分析基因功能和相关通路的数据库。GO 数据库(Gene Ontology,GO)是一个公认的生物信息学工具,为注释基因的生物学过程而开发。为了在生物功能水平上分析 DEGs,本研究使用 D
16、AVID 在线数据库进行基因功能和通路富集分析,P 0.05 表示差异具有统计学意义。SangerBox(http:/ 2024 年 2 月第 34 卷第 2 期 New Medicine,Feb.2024,Vol.34,N Tool)用来可视化 GO 和 KEGG 富集结果。1.4 蛋白质互作网络的构建和关键子网络的选择STRING 数据库(Search Tool for the Retrieval of Interacting Genes/Proteins,STRING)(http:/string-db.org)用来构建 DEGs 的蛋白质-蛋白质相互作用(protein-protein
17、interaction,PPI)网络,平均分 0.4 作为关联的临界值。使用 Cytoscape 3.9.1 软件可视化蛋白关联网络。此外,Cytoscape的插件 MCODE 2.0.0 可根据拓扑结构选择集群特定网络,并定位相互作用密集的区域19。使用默认参数如下:Node score cut-off=0.2,K-Core=2,MAX depth=100,degree cut-off=2。选 取 MCODE分数最高的子网进行关键基因分析。1.5 关键基因的选择和分析Cytoscape 的插件 Cytohubba 用于分析子网模块中的关键基因。运用 Cytohubba 中 MCC 算法筛选出
18、分数排名前 10 的基因作为关键基因,并使用 KEGG 分析关键基因的富集通路。2 结果2.1 差异表达基因对 GSE126124 数据集中 18 例 UC 样本和 19例对照组样本数据进行差异分析,确定了 153个矫正后 P 值 0.05 并且 LogFC 绝对值 1 的DEGs,包括 92 个高表达 DEGs 和 61 个低表达DEGs。基因表达火山图见图 1-A。2.2 GO富集分析和KEGG通路分析生物过程(biological process,BP)功能富集显示,DEGs 主要富集在对外界刺激的反应、转运、局域化、免疫系统过程和化合物反应方面(图 1-B)。细胞成分(cell com
19、ponent,CC)分析显示,DEGs 主要富集在细胞外区域、细胞间隙和囊泡方面(图 1-B)。KEGG 通路分析显示,DEGs 主要富集在病毒蛋白与细胞因子及受体的作用、金黄色葡萄球菌感染、百日咳、趋化因子信号通路、补体和凝血级联等方面(图 1-C)。分别对高表达和低表达的 DEGs 进行 GO 功能和 KEGG 通路富集分析。在高表达的 DEGs 中,BP分析显示基因主要富集于外部刺激反应、免疫系统过程和压力反应(图 2-A);CC 分析显示基因主要富集于细胞外域和囊泡(图 2-B);分子功能(molecular function,MF)分析显示基因富集于催化活性、金属离子结合和信号受体结
20、合(图 2-C);KEGG 通路分析显示基因主要富集于金黄色葡萄球菌感染、IL-17 信号通路、病毒蛋白与细胞因子及图1 差异基因的分布和富集分析 Figure 1.The distribution and enrichment analysis of differentially expressed genes注:A.差异基因的火山图;B.差异基因的BP和CC富集分析;C.差异基因的KEGG富集分析。CA-log(P-value)log2(Fold change)log2(Fold change)-log(P-value)-log(P-value)Bvesicleextracellular
21、spaceextracellular region partextracellular regionresponse to chemicalimmune system processestablishment of localizationtransportresponse to external stimulus-log(P-value)医学新知 2024 年 2 月第 34 卷第 2 期 New Medicine,Feb.2024,Vol.34,N 受体的作用、细胞因子-细胞因子受体相互作用、趋化因子信号通路(图 2-D)。另一方面,在低表达 DEGs 中,BP 功能分析显示基因主要富集于
22、转运和局域化(图 3-A);CC 分析显示基因主要富集于膜的成分(图 3-B);MF 分析显示基因主要富集于转运体活性、跨膜转运蛋白活性(图3-C);KEGG 信号通路分析显示基因主要富集于代谢通路、胆汁分泌、药物代谢-细胞色素P450(图3-D)。图3 低表达差异基因的GO和KEGG富集分析Figure 3.GO and KEGG enrichment analysis of low expressed differential genes注:A.低表达差异基因的BP富集分析;B.低表达差异基因的CC富集分析;C.低表达差异基因的MF富集分析;D.低表达差异基因的KEGG富集分析。-log(
23、P-value)log2(Fold change)-log(P-value)-log(P-value)-log(P-value)ABABCD图2 高表达差异基因的GO和KEGG富集分析Figure 2.GO and KEGG enrichment analysis of highly expressed differential genes注:A.高表达差异基因的BP富集分析;B.高表达差异基因的CC富集分析;C.高表达差异基因的MF富集分析;D.高表达差异基因的KEGG富集分析。-log(P-value)-log(P-value)-log(P-value)-log(P-value)log2(
24、Fold change)医学新知 2024 年 2 月第 34 卷第 2 期 New Medicine,Feb.2024,Vol.34,N 图4 差异基因和关键基因的分析Figure 4.Analysis of differentially expressed genes and hub genes注:A.差异基因的蛋白质相互作用网络;B.14个差异基因构成的子网络;C.10个关键基因;D.关键基因的KEGG富集分析。表1 10个关键基因详细信息Table1.The detailed information of 10 hub genes基因缩写基因全名MCC分数校正P值Log FCCxcl1
25、C-X-C基序趋化因子配体15 8881.3610-51.883 714Cxcl2C-X-C基序趋化因子配体25 8867.6210-41.150 942Cxcl10C-X-C基序趋化因子配体105 8841.7310-21.072 653Cxcr2C-X-C基序趋化因子受体25 882 410-41.063 089Il1rn白细胞介素1受体拮抗剂5 7661.0610-41.125 533Fcgr3aFc受体 IIIa5 7606.0110-71.219 084Cxcr1C-X-C基序趋化因子受体15 1602.4910-41.090 256S100a12S100钙结合蛋白A125 0423
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 生物 信息学 筛选 分析 小儿 溃疡性 结肠炎 潜在 标志
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。