使用cBioCancerGenomicsPortal综合分析癌症基因和临床资料.doc
《使用cBioCancerGenomicsPortal综合分析癌症基因和临床资料.doc》由会员分享,可在线阅读,更多相关《使用cBioCancerGenomicsPortal综合分析癌症基因和临床资料.doc(23页珍藏版)》请在咨信网上搜索。
1、使用cBio Cancer Genomics Portal综合分析癌症基因和临床资料文章目录 cBio Cancer Genomics Portal简介 cBio Cancer Genomics Portal所需设备 cBio Cancer Genomics Portal使用方法 cBio Cancer Genomics Portal结果的查看和解释 OncoPrint Mutual Exclusivity Correlation Plots Mutations Protein Changes Survival Network IGV, Download, Bookmark 多个癌症交叉查询
2、查看癌症研究数据 查看单一癌症的基因组改变:患者视图 通过编程语言访问查询cBioPortalcBio Cancer Genomics Portal提供了研究分析癌症基因数据的可视化工具,cBioPortal可以帮助癌症组织和细胞学研究得到的分子学数据认识和理解遗传、表观遗传、基因表达和蛋白质组学。通过自定义数据的交互界面要以主研究人员探求研究基因改变和临床之间的联系。cBioPortal提供了图形化的结果,使复杂的癌症基因组学资料更易理解和接受,而不需要特殊的生物信息学知识。cBio Cancer Genomics Portal简介大样本癌症基因组计划,如如癌症基因图谱(Cancer Gen
3、ome Atlas, TCGA,http:/cancergenome.nih.gov/)和国际癌症基因组联盟(The International Cancer Genome Consortium, ICGC),得到了大量的有关癌症基因组的资料,但是这些资料对于研究人员来说,如何整合、探索和分析,是一个比较困难的事情,尤其是对于那些电脑水平欠佳的人来说,更是一件头疼的事情。cBio Cancer Genomics Portal(http:/cbioportal.org/)的出现就是为了减少这种难度的。cBioPortal方便了研究人员探求多维癌症基因组数据,它要以可视化分析基因、样本和数据类型。
4、我们可以对癌症研究中的样本的基因改变进行可视化,比较基因改变频率,或者综合分析单一样本中基因组改变。cBioPortal还可以研究生物学途径,生存率等等。cBioPortal整合的基因数据类型包括体细胞突变,DNA拷贝数改变,mRNA和microRNA表达,DNA甲基化,蛋白丰度以及磷蛋白丰度。迄今为止,cBioPortal包含了10已发表的肿瘤研究结果和20多个TCGA的结果。每个肿瘤样本和数据可以从网站上下载。cBioPortal把这些复杂的数据从基因水平上进行了整合和简化,每个样本可以查询特定的生物学特性,如基因突变,纯合子缺失,基因扩增,mRNA和miRNA的增加或减少,蛋白质的增加或
5、减少等。这让研究人员可以查询每个基因和样本的基因改变,验证一些假设。cBioPortal的数据来源和分析选项来源于多个网站,如TCGA data portal (https:/tcga-data.nci.nih.gov/tcga/), the ICGC data portal(http:/dcc.icgc.org/), the Broad Institutes Genome Data Analysis Center (GDAC) Firehose (http:/gdac.broadinstitute.org), the IGV, the University of California, Sa
6、nta Cruz (UCSC) Cancer Genomics Browser (30), IntOGen (31), Regulome Explorer (http:/explorer.cancerregulome.org),以及Oncomine (Reserach Edition) 等。cBioPortal提供的分析选项有癌症基因组数据,基因水平改变的引起的相关生物功能变化,综合分析基因组数据和临床资料,患者数据等。cBioPortal并不直接存储这些原始数据,原始数据来源于其它网站,如TCGA, ICGC, and Gene Expression Omnibus (GEO) (http:
7、/www.ncbi.nlm.nih.gov/geo/)等。cBio Cancer Genomics Portal所需设备 如果想使用cBioPortal,一台可以上网的电脑必不要少,当然现在最好还能翻墙,因为cBioPortal部分地区打不开。另外浏览器必须支持Javascript,这个到是不会有太大问题。但是注意:官方建议使用Google Chrome, Firefox 3.0以上, Safari, Internet Explorer 9.0以上版本。还在用XP?!换了吧,XP最高是Internet Explorer 8.0, Adobe Flash player注意:这个浏览器插件主要是为
8、了可视化分析结果用的,一般浏览器都应该有,如果没有可以在此下载安装 Java Runtime Environment注意:这个主要是为了加载Integrative Genomics Viewer (IGV)用的,可以在此下载安装 Adobe PDF Reader这人就不必说了,都有。可以使用一般的Adober Reader 但是我更建议使用PDFXCview,原因要以参阅升级为Windows 8.1,顺便说说我常用的那些软件。 Vector graphic editor注意:这个东东是为了可视化和编辑从cBioPortal下载的SVG文件的,可以使用Adobe Illustrator (或者I
9、nkscape (http:/inkscape.org/).cBio Cancer Genomics Portal使用方法cBioPortal的癌症基因数据可以通过浏览器浏览和查询,网址为http:/cbioportal.org。我们可以查询一个癌症的研究或者多个症状研究结果,如果是单个癌症样本,还可看到相关的基因组改变。如果想查询一个癌症研究结果,我们可以探索和可视化所选定基因的基因组改变,包括这些基因之间改变之间的相关性,同一基因不同数据之间的关系。我们可以选择25余种癌症的研究结果。当选择基因组资料时,一般默认选择突变和CNAs。如果有相应mRNA和miRNA表达或者相应的蛋白和磷酸化蛋
10、白数据,也可以选择,如果没有这两项就不可选。蛋白和磷酸化蛋白基于反向蛋白芯片浅析浅析(reverse phase protein array, RPPA)实验结果。mRNA和miRNA数据和蛋白和磷酸化蛋白数据,标准分数(Z scores)通过实验值预先计算,我们可以设定或者默认设置(平均数的2倍标准差)。mRNA表达的Z scores由每个样本通过比较mRNA的基因表达和在代表典型基因表达的参考样本中的分布而决定。如果邻近组织的表达数据可用的话,邻近组织的表达数据就是参考样本的数据,反之,可以使用所癌症研究中的有疑问的基因的两倍的所有肿瘤的表达值。当研究所分析的样本,默认情况下是匹配所选择的
11、基因组资料。例如,仅查询突变交时会选择测序的数据。但是,我们可以改变这些选项。我们还通过可以User-Defined Case List或者基于Build Case Set自己自定义一个输入特定的样本。当输入基因进行分析时,我们可以手动输入HUGO基因符号,Entrez Gene ID,以及基因别我或者预设置的基因组。如果变异基因列表可用的话,例如MutSig的基因变异或者GISTIC的CNAs,我们可以从这些基因列表中选择基因,也可以通过这些列表建立基因,或者手动输入基因。一般可以通过4步法来进行查询和研究。1. Select Cancer Study,选择想要研究癌症,可以通过下拉箭头进行
12、选择,如Gliobastoma (TCGA, Nature 2008)。2. Select Genomic Profiles,选择基因组配置。默认设置选择Mutations,Copy Number data. Select one of the profiles below并选择Putative copy-number alterations (RAE, 203 cases)。注意:Mutations和Copy Number data. Select one of the profiles below一般是默认选中的。mRNA Expression data. Select one of th
13、e profiles below是默认不选中的,默认的Z Score倍数可以根据用户自己设定。当微阵列和RNA-Seq数据可用时,优先选中RNA-Seq。3. Select Patient/Case Set,选择患者数可以使用下拉箭头进行选择,也可以使用Build Case Set进行选择。如选择“Tumors with sequence and CNA data (91)注意:如果用户自定义列表,该步须通过下拉列表进行选择,然后才可以输入样本ID,并用空格键进行分隔。4. Enter Gene Set,输入基因集合。可以手动输入或者通过限定的列表进行选择。注意:在Advanced: Onco
14、 Query Language (OQL)中可以可以使用Onco查询语法(Onco Query Language,OQL)限定查询。OQL可以用于单个癌症和多个癌症的查询。一当文工团OQL查询,相应的结果也就限定了我们可以指定4个数据类型,CNAs,突变,mRNA或miRNA表达改变,以及蛋白或磷酸化蛋白丰度改变。CNA和突变一般是不连续设置,而mRNA,miRNA和蛋白丰度是连续性设置。表达值转换成Z Scores,以利于比较和限定变异倍数。Data TypeKey wordCategories and LevelsDefaultCopy Number AlterationsCNAAMP A
15、mplifiedHOMDEL Homozygously DeletedGAIN GainedHETLOSS Heterozygously DeletedAMPand HOMDELMutationsMUTMUTShow mutated casesMUT=X Specific mutations or mutation types.All somatic, non-synonymous mutationsmRNA ExpressionEXPEXPxOver-expression is greater thanxSDs above the mean.The comparison operators=
16、also work.At least 2 standard deviations (SD) from the mean.Protein/ phosphoprotein level (RPPA)PROTPROTxProtein-level over-expression is greater than xSDs above the mean.The comparison operators andalso work.At least 2 standard deviations (SD) from the mean.5. Download Data,下载数据。通过Submit可以查询并导出数据。可
17、以另存为txt文档,这个文档可以用Excel文件打开。cBio Cancer Genomics Portal结果的查看和解释基于查询标准,cBioPortal把每个基因分成有变异和无变异,这种分法可用于分析和可视化结果。以下举例说明。OncoPrintOncoPrint是一个一组肿瘤样本中多个基因的简基因组改变明扼要的图形化结果。行代表基因,列代表样本。不同的符合和颜色编码用于区别基因组的变异,如突变,CNAs(扩增和纯合子缺失),以及基因表达或蛋白丰度的改变。如果把鼠标放置在图形上还要以看到额外的信息,如ID号(每个样本代表一个患者样本或者细胞系),可以与患者的查看页面连接,同样还可以显示氨
18、基酸的改变。默认情况下样本根据变异进行排序。我们可以存储原始样本文件。我们还可以从图形化结果上移除未变异的样本。多个样本的基因变异,OncoPrints可以帮助确认一些趋势,如基因之间的排斥性和共生性。OncoPrints另外还包含一些基因查询信息,这些查询信息可以Sanger Cancer Gene Census上得到,并且和NCBI的Gene数据库相联系。我们以视网膜母细胞瘤的基因CDKN2A(编码编码细胞周期素依赖性激酶抑制剂p16) CDK4(编码细胞周期素依赖性激酶4)和多形性成胶质细胞瘤中的RB1作为样本。1. Select Cancer Study选择Gioblastoma (T
19、CGA, Natrue 2008)2. Select Genomic Profiles选择Mutations,Copy Number data. Select one of the profiles below和Putative copy-number alterations (RAE, 203 cases)3. Select Patient/Case Set选择Tumors with suqencing and CNA data (91)4. Enter Gene Set中输入CDKN2A CDK4 RB1然后Submit,可以得到如下OncoPrint图从这个图上可以看到,65个样本(71
20、%)三个基因有至少有1个变异,其是每个基因的变异情况也在图上进行了标示。CDKN24多数的变异是homozygous deletions,并且有3个突变mutations。CDK4是单纯的amplifications。RB1包含1个homozygous deletions和3个突变mutations。有以下几点需要说明:1. 当设置好查询条件后,提交查询,OncoPrint结果是自动生成的。2. 如果基因过多,超出一个视屏,可以使用上下滚动条进行完形查看3. cBioPortal为了使OncoPrint更国简练,因此显示可能不能满足部分人的需要,但是可以通过Customize选项进行结果显示的
21、细微调节。一般要以有3个选项可以调节,Zoom调节OncoPrint的宽度,Remove Unaltered Cases把未变异的基因去除,Remove Whitespace去除中间空白区域。4. 可以把结果下载为PDF,SVG或Txt格式进行保存。5. 把鼠标放置在变异基因上,可以看到更多的信息。6. 可以通过上方的Modify Query进行查询的调整。Mutual Exclusivity癌症中的生物学进程或者路径常常通过多种不同的基因或者不同的机制进行调节。cBioPortal中的Mutual Exclusivity可以发现既往不知道一些癌症发病机制,这些机制可能在肿瘤形成和癌症的进展中
22、起到重要作用。在Mutual Exclusivity标签中,和特定肿瘤相关的基因倾向于相互排斥,如果存在基因排斥,也就是说这个肿瘤可能只有一种基因问题。相反是基因共生,一种肿瘤如果有多个基因同时存在,那这几个基因可能共生,其都在肿瘤的发生和发展中起到作用,这个肿瘤也很可能并非单一基因问题。如上例中的三个基因的变异可以通过Mutual Exclusivity标签查看统计学数据。从上图要以看到这三个基因之间都存在排他性,其中又以CDK4-RB1的排他性最强,但是没有统计学意义(P0.11),可能是由于样本量较小有关。CDK4-CDKN2A和RB1-CDKN2A之间的排他性有统计学意义(P0.05,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 使用 cBioCancerGenomicsPortal 综合分析 癌症 基因 临床 资料
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。