整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf
《整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf》由会员分享,可在线阅读,更多相关《整合受体调控基因表达信息构建细胞通信网络_郭书旗.pdf(11页珍藏版)》请在咨信网上搜索。
1、Research Papers研究报告生物化学与生物物理进展Progress in Biochemistry and Biophysics2023,50(3):整合受体调控基因表达信息构建细胞通信网络*郭书旗1)张绍武1)*李岩1)张世华2)*(1)西北工业大学自动化学院,信息融合教育部重点实验室,西安 710072;2)中国科学院数学与系统科学研究院,北京 100190)摘要 目的构建细胞通信网络有助于揭示细胞间协同工作机制、生物学过程和疾病发病机理。目前基于配体-受体相互作用构建细胞通信网络的方法大多只考虑配体和受体的表达信息,忽略了受体对其调控基因的信号传递影响,导致构建的细胞通信网络可
2、靠性较低。鉴于此,本文提出IRRG算法,旨在构建更为准确的细胞通信网络,并挖掘具有生物学意义的细胞通信模式。方法本文提出了一种整合受体调控基因表达信息构建细胞通信网络的方法(命名为IRRG)。该方法通过随机游走方式计算受体对下游基因的影响得分,进而与配体-受体共表达量结合构建细胞通信网络。结果使用IRRG构建了小鼠滤泡间表皮(IFE)细胞通信网络并分析了配体-受体对的生物学意义,验证了IRRG计算受体影响得分的稳定性和细胞通信网络构建的可靠性。此外,使用IRRG构建了透明细胞肾细胞癌(ccRCC)的细胞通信网络,挖掘并分析其肿瘤微环境细胞通信模式。结论IRRG可以构建富有生物学意义并且可靠的细
3、胞通信网络,帮助人们从细胞通信的角度更深入地了解多种生物过程。IRRG算法代码可从GitHub获取:https:/ 细胞通信,配体-受体,基因共表达,基因调控网络,随机游走中图分类号 R318.04DOI:10.16476/j.pibb.2022.0099对于多细胞生物来说,细胞通信(也被称为细胞间相互作用)是必不可少的。细胞通过交流和合作形成动态的通信网络,在许多生物过程中发挥着至关重要的作用。例如,驱动细胞分化和器官发育、维持组织器官内稳态、疾病中的免疫相互作用等1-3。细胞通信所涉及的信号传递,通常受蛋白质相互作用影响。由于RNA测序(RNA-seq)数据易获取和分析,且基因表达水平是蛋
4、白质丰度的主要决定因素4,目前细胞通信的研究主要是以转录组学为基础。随着单细胞RNA测序技术(scRNA-seq)技术的发展,海量单细胞测序数据正在迅速积累。这些数据有助于揭示生物组织中潜在的细胞异质性,并为细胞通信研究提供了重要的数据来源。利用单细胞测序数据,从配体-受体(L-R)相互作用角度出发能够有效构建和分析细胞通信网络。目前,已有一些基于配体-受体互作用构建细胞通信网络的研究。Kumar等5通过识别和比较不同肿瘤之间的配体-受体互作用差异,研究了T细胞亚群之间的细胞通信,及与免疫过程关系;Xiong等6根据肝细胞中高表达的配体-受体对,构建了肝细胞配体-受体通信网络,进而研究了患非酒
5、精性脂肪肝炎的患者肝脏微环境中的细胞间串扰。基于配体-受体互作用研究细胞通信的一项主要工作,就是推断配体-受体的互作用强度。目前已经提出了一些策略用于推断配体-受体的互作用强度,例如:使用阈值判断配体和受体是否有效表达7;识别具有差异表达的配体和受体,找到“活跃”的配体-受体对8;通过配体和受体各自表达量的乘积,计算一个连续值推断配体-受体互作用强度9。这些方法较为简单易行,但存在如下潜在局限:基因表达阈值不好选择,配体或受体的表达量过高会导致乘积结果不准确。重要的是,这些方法仅使用了配体和受体的表达量,事实上,参与细胞间通信的信号事件不仅包括细胞间的信号,还包括细胞内的信号通路和转录调控10
6、。受体在接收到配体信号后,会对受体下游的相关基因产生影响,进而改变基因调控网络和转录因子活性。鉴于此,本文从细胞通信的生物现象角度出 国家自然科学基金(62173271,61873202,12126605)资助项目。通讯联系人。张绍武 Tel:029-88431308,E-mail:张世华 Tel:010-82541360,E-mail:收稿日期:2022-03-17,接受日期:2022-05-23 624 2023;50(3)生物化学与生物物理进展 Prog.Biochem.Biophys.发,提出一种整合受体调控基因表达信息的细胞通信网络构建方法 IRRG。该方法利用 KEGG11和Rea
7、ctome12数据库建立不同细胞类型中每个受体对应的基因调控网络(即受体基因调控网络),然后采用随机游走算法计算细胞通信中受体对下游基因的影响程度得分,并将此影响得分与配体-受体共表达量结合,推断配体-受体互作用强度。用于有效挖掘细胞间的通信现象,发现与生物过程密切相关的配体-受体对和关键通信模式。1数据集与方法1.1数据集本文所用数据主要包括配体-受体对数据、信号通路数据、单细胞RNA测序数据。从LRdb数据库13选取配体-受体对,构建配体-受体对数据集(包含3 251组配体-受体对)。LRdb数据库中的配体-受 体 对 来 自 于 Reactome12、HPMR14、HPRD15、Unip
8、ort16、Fantom517等多个数据库,这些配体-受体对可靠性较高、注释详细18。为了有效整合受体调控的基因表达信息,通过Pathway Commons19下载KEGG和Reactome信号通路,构建信号通路数据集,该数据集包含34万组基因相互作用的路径。此外,为了探究多个信号通路数据库对IRRG构建细胞通信网络结果的影响(附件文档 S1 第 1 节),本文在整合 KEGG 和Reactome两个通路数据库的基础上,又整合了PID和Panther两个信号通路数据库,其基因互作信息的数量达到38万多条。单细胞RNA测序数据主要包括小鼠滤泡间表皮组织(GSE67602)20和透明细胞肾细胞癌组
9、织(GSE159115)21单细胞测序数据,及各自的默认细胞类型标签。小鼠滤泡间表皮组织细胞数据集包含720个细胞,它们分为IFE-B、IFE-DI、IFE-DII、IFE-KI、IFE-KII 5种细胞类型20,构成小鼠表皮独特的分层结构,其中IFE-B细胞位于表皮最底部,可以增殖分化形成最外层的IFE-K(由IFE-KI和IFE-KII两个亚型细胞组成)角化层细胞。本文使用同源基因转化将小鼠滤泡间表皮细胞的基因与配体-受体数据库以及信号通路数据库中的基因对应。肾透明细胞癌组织样本(SI_22368)和正常组织样本(SI_22369)分别包含 2 779、1 495 个细胞,肾 透 明 细
10、胞 癌 组 织 细 胞 分 为 肿 瘤 细 胞(tumor)、平 滑 肌 细 胞(vascular smooth muscle cell,vSMC)、巨噬细胞(macrophage,Macro)、T 细胞(T cell)、B 细胞(B cell)、内皮细胞(endothelial,Endo)6种细胞类型,正常组织细胞分为上皮细胞(epithelial)、vSMC、Macro、T 细胞、B细胞、Endo 6种细胞类型。1.2受体基因调控网络构建构建受体在各个细胞类型中的基因调控网络是整合受体调控基因表达信息的前提。对于特定细胞类型中的受体,考虑到单细胞数据的稀疏性,本文选择该细胞类型中部分基因作
11、为候选调控基因,用于构建受体基因调控网络。鉴于滤除特定细胞类型大部分细胞中均不表达的基因可以降低算法运行时间,且筛选候选调控基因的比例并非越大越好(大的筛选比例会使有效信息数量减少)。因此,本文按照20%的比例值筛选候选调控基因。然后,利用通路数据集中的基因关系,并根据表S1中的基因互作用简化规则,确定受体和其候选调控基因及候选调控基因间的连接。如果基因间的作用类型属于控制(Control),则基因间通过单向边连接;如果互作用类型属于反应(Reaction)和复合物(Complex),则基因间通过双向边连接。经过上述步骤,可能会得到几个不连通的子网络,仅保留受体基因所在的基因调控子网络,进而构
12、建出受体基因调控网络。1.3IRRG算法IRRG算法主要由如下3部分组成:a.受体影响得分计算;b.特异性配体-受体对筛选;c.细胞通信网络构建(图1)。a.受体影响得分计算使用一种改进的随机游走DwanRank算法22计算受体影响分(Rscore)以计算指定细胞类型中某一个受体R的受体影响得分为例,其迭代公式如下:Rt+1m=(1-dm)fm+dmn=1Nadjmnrtndegn,1 m,n N (1)其中,N表示受体R对应的受体基因调控网络中的基因节点数目;rt+1m表示第t+1次迭代后基因m的影响得分;adjmn表示基因m和基因n的邻接关系,如果基因m指向基因n,则adjmn=1;deg
13、n表示基因n 的入度;dm=degm(degm+3)为一动态阻尼系数,基因节点的入度越大,其阻尼系数亦越大,进而网络中更多的连接信息被纳入计算;r0n表示某类型细胞分为两组后基因n的差异表达值;fm表示将某类型细胞分为两组后基因 m 差异表达的归一化值。郭书旗,等:整合受体调控基因表达信息构建细胞通信网络2023;50(3)625 r0n和fm的计算过程如下:首先根据受体R在各个细胞中是否有效表达(本文设置基因有效表达值为0),将某类型细胞分为受体有效表达细胞和未表达细胞两组,然后分别计算两组细胞中受体基因调控网络的基因平均表达量EI、EII,求取二者的绝对 差 值 计 算r0=r01,r0m
14、,r0N,即r0=|EI EII|。根据r0计算fm,即fm=r0m k=1Nr0k。迭代更新rt+1,直至当rt+1 rt 0.001时,则认为该受体基因调控网络游走已达到稳定状态,并从此基因调控网络中获取受体R的稳定值。重复上述过程,可以计算出指定细胞类型中所有受体的稳定值,即向量R=R1,RL,L 为该细胞类型中有效的受体个数。然后对向量R中的值进行归一化,得到特定细胞类型中L个受体的影响得分。b.特异性配体-受体对筛选鉴于部分配体-受体对在不同的细胞类型之间普遍表达、不能提供关于特定细胞状态间的交流信息,IRRG采用置换检验筛选特异配体-受体对,用于构建特异性细胞通信网络。考虑到配体和
15、受体的基因表达是细胞的通信基础,将配体-受体对的共表达量作为置换检验依据,进而筛选特异性配体-受体对。下面以A、B、C 3种细胞类型为例说明如何筛选特异性配体-受体对,首先随机置换所有细胞类型的标签,此时,3种细胞类型会得到新的基因表达矩阵;然后重新计算任意二类细胞(包含同类细胞)之间配体-受体的共表达量,重复1 000次随机置换得到零分布,如果某配体-受体对的 P0.05,则认为该配体-受体对具有特异性(图1b)。筛选出来的特异性配体-受体对用于构建细胞通信网络。c.细胞通信网络构建考虑到配体-受体的共表达是细胞通信的基础,而受体影响得分代表受体在细胞通信中对下游基因R1R2R3RL-1RL
16、R1 LR1LR2LR3LRH-1LRHCoExpSignificant Permutation test LR1LR3LRH=RscoreLRscoreAL R LRscoreFabp5 Rxra 5.35App Lrp1 2.76BABCTop ranked L-R pairLR1LR3LRH(a)(b)(c)PathwayLRdbscRNA-seq DataRLRLR1R1IterateIterateRLSignificant CoExpLR1LR3LRHR1R3RHCoExpFig.1Schematic diagram of IRRG(a)Calculating the impact
17、scores of receptors with the improved restart random walker algorithm.The green arrows represent the integration of gene expression information.(b)Screening the specific L-R pairs with Permutation test.(c)Building the cellular communication network.626 2023;50(3)生物化学与生物物理进展 Prog.Biochem.Biophys.的影响程
18、度,综合配体-受体共表达量(CoExp)和受体影响得分(Rscore),将二者的乘积用于度量配体-受体的互作用强度(LRscore)。LRscorei=CoExpi Rscorei(2)其中,LRscorei表示指细胞类型A和B之间第i对配体-受体的细胞通信强度;CoExpi为第i对配体-受体中的配体在细胞类型A中的平均表达量与受体在细胞类型 B 中的平均表达量之积的算术平方根;Rscorei表示第i对配体-受体中受体在细胞类型B中的影响得分。将细胞类型A和B之间所有特异配体-受体对的互作用强度相加,其加和值可作为细胞通信网络的边权重(即通信强度),即EdgeA B=i=1ILRscorei
19、(3)基于此,可以计算出所有细胞类型间的通信强度,进而构建出细胞通信网络。2结果与讨论鉴于搭建受体基因调控网络时滤除特定细胞类型中大部分细胞中均不表达的基因,可以降低算法运行时间,但过大的筛选比例可能会使有效信息数量减少,本文首先在小鼠滤泡间表皮组织数据集上通过分别设置10%、20%的基因筛选比例阈值构建受体基因调控网络。然后采用随机游走算法计算受体得分,发现10%基因筛选比例阈值下的受体得分计算时间为56 min左右,20%基因筛选比例阈值下的受体得分计算时间为20 min左右。此外,两种基因筛选比例下的各细胞类型受体得分差异较小(图S1)。因此,本文按照20%的比例值筛选候选调控基因构建受
20、体基因调控网络。为验证IRRG算法构建细胞通信网络性能,我们 首 先 在 小 鼠 滤 泡 间 表 皮 细 胞(mouse interfollicular epidermal cells,IFE)和人类肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)的单细胞测序数据上应用本文的IRRG算法,分别构建小鼠滤泡间表皮细胞通信网络和肾透明细胞癌细胞通信网络,分析细胞通信模式。然后通过下采样策略,评估IRRG算法计算的受体影响得分,能否有效反映受体对调控基因的影响。最后,根据细胞通信网络互作用强度大小,统计排名靠前的配体-受体对所拥有的支持文献数量,对比分析了I
21、RRG与现有其他细胞网络构建方法的性能。2.1小鼠滤泡间表皮细胞和肾透明细胞癌细胞通信网络构建结果2.1.1小鼠滤泡间表皮细胞(IFE)通信网络构建结果IFE在保护皮肤中发挥关键作用,鉴于其特殊的分层结构及单细胞测序数据可以公开获取,采用IRRG算法构建了5种IFE细胞类型间的通信网络(图2a),并通过细胞类型间通信强度和特异性配体-受体对数量(图2b、c),分析5种细胞类型之间的细胞通信模式。从图2a可以看到,IFE-KII参与的细胞通信强度较弱,IFE-B细胞所涉及的细胞通信能力较强,此通信模式可能与这两类细胞的功能有关。IFE-B细胞位于表皮的基底层,是一类增殖细胞,它们可以增殖分化形成
22、上基底层细胞,而IFE-KII细胞是一类最终分化的角质层细胞,它们是防止感染和受伤的重要屏障,该类细胞逐渐被去掉细胞核并从皮肤表面脱落20,23-24,结合IFE-KII释放信号强度远大于接受信号强度的现象,意味着其可能在保护小鼠皮肤中倾向担当“哨兵”角色;IFE-DII具有出色的信号释放和接收能力,暗示其可能担任“桥梁”角色、维持多层细胞间通信信号的正常传递;IFE-KI细胞与其分层结构相对较远的细胞(如IFE-B)有较高的通信强度,说明小鼠滤泡间表皮不同层细胞间存在远距离细胞通信,这些细胞通信现象有助于全面了解小鼠表皮不同层细胞间的协同工作机制。为了帮助发现IFE-B细胞分化形成完整皮肤组
23、织的过程和机理,及IFE-KII细胞防止皮肤组织感染和受伤的屏障功能,进一步分析了表皮基底层细胞 IFE-B 与其上层细胞(即 IFE-DI、IFE-DII、IFE-KI细胞)、角质层细胞IFE-KII细胞与其下层细胞(即IFE-KI、IFE-DII、IFE-DI、IFE-B细胞)间互作用强度较高的配体-受体对(图3)。由于IFE-B与IFE-KII之间的通信强度较低(13.58),图3中没有给出IFE-B与IFE-KII间互作用强度较高的配体-受体对统计结果。从图3可以看出,IFE-B与其上层细胞的通信过程中,普遍存在与受体Errb2相关的配体-受体对,这可能与受体Errb2参与表皮组织的表
24、皮生长因子刺激反应、上皮细胞增殖、细胞生长正向调节、伤口愈合等许多重要生物过程25-27有关,此结果说明小鼠滤泡间表皮细胞通信中受体Errb2发挥其重要的生物学功能。IFE-B与IFE-DII的通信中,与表皮生长因子受体Egfr相关的配体-受体对较多,这可能与受体Egfr参与表皮发育、细郭书旗,等:整合受体调控基因表达信息构建细胞通信网络2023;50(3)627 胞迁移正向调节和细胞分化等过程28-29有关。IFE-B与IFE-DI通信中,与受体Sdc4相关的配体-受体对拥有高互作用强度,这可能与受体Sdc4主要参与细胞迁移和伤口愈合等过程30-31有关。IFE-KII 与其下层细胞的通信过
25、程中,受体Erbb2和配体Btc、Ereg、Tgfa参与了细胞通信,它们均与小鼠表皮组织的生物过程相关32,说明IFE-KII细胞可能在促进下层细胞形成完整表皮的过程中发挥重要功能。IFE-KII与IFE-B通信过程中,受体Rpsa主要参与上皮细胞分化,受体Itga6、Itgb4 在细胞迁移和皮肤形态发生中具有积极作用33-34。IFE-KII 和 IFE-KI 通 信 过 程 中,受 体Il1rap可以产生白介素-1受体辅助蛋白,促进各种白介素的产生,用于激活免疫细胞或影响炎症反应35-36,这为IFE-K细胞作为防止入侵的屏障、发挥皮肤抗炎功能提供了有力证据。以上这些结果表明,本文的 IR
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 整合 受体 调控 基因 表达 信息 构建 细胞 通信 网络 郭书旗
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。