生物信息学毕业论文.doc
《生物信息学毕业论文.doc》由会员分享,可在线阅读,更多相关《生物信息学毕业论文.doc(41页珍藏版)》请在咨信网上搜索。
生物信息学毕业论文 湖 南 科 技 大 学 毕 业 设 计( 论 文 ) 题目 绵羊MHC ClassⅡ基因的生物信息学分析 作者 周丽萍 学院 生命科学学院 专业 生物科学 学号 0709010125 指导教师 金元昌 二〇一一年 月 日 湖 南 科 技 大 学 毕业设计(论文)任务书 生命科学学院 院 生物工程 系(教研室) 系(教研室)主任: (签名) 2011 年 1 月 18 日 学生姓名: 周丽萍 学号: 07090101025 专业: 生物科学 1 设计(论文)题目及专题: 绵羊 MHC ClassII基因的生物信息学分析 2 学生设计(论文)时间:自2011年 1月18日开始至 2011 年 6 月 10 日止 3 设计(论文)所用资源和参考资料: 3.1所用资源:万维网上的生物数据库;学校所购买的电子期刊;校图书馆;学院实验室网络; 3.2 参考资料:张阳德编著.生物信息学[M]北京: 科学出版社,2004.9.金伯泉.细胞和分子免疫学[M].科学出版社,2006,281-305. 许忠能.生物信息学[M]. 清华大学出版社,2008,1-4. 杨晶,胡刚,王奎,沈世镒.生物计算——生物序列的分析方法与应用[M].科学出版社,2010,105-111. 4 设计(论文)应完成的主要内容: 4.1获取绵羊 MHC ClassII基因核酸与蛋白序列及与其同源的其它物种的序列,进行多序列比对,做出分子进化树,并分析; 4.2对绵羊 MHC ClassII分子的疏水区、跨膜区、功能结构域和生物活性位点分析; 4.3预测绵羊 MHC ClassII分子的二级结构与三级结构。 5 提交设计(论文)形式(设计说明与图纸或论文等)及要求: 5.1严格按照<<湖南科技大学本科生毕业设计(论文)工作规范>>的写作完成毕业论文,完成不少于8000字信息量的论文;格式正确,包括目录、论文中英文题目及摘要、前言、正文、参考文献、致谢词和附录; 5.2 在实验及论文写作过程中,对数据和结果等要求实事求是,并且要在老师的指导下独立完成。 6 发题时间: 2011 年 1 月 17 日 指导教师: (签名) 学 生: (签名) 湖 南 科 技 大 学 毕业设计(论文)指导人评语 [主要对学生毕业设计(论文)的工作态度,研究内容与方法,工作量,文献应用,创新性,实用性,科学性,文本(图纸)规范程度,存在的不足等进行综合评价] 指导人: (签名) 年 月 日 指导人评定成绩: 湖 南 科 技 大 学 毕业设计(论文)评阅人评语 [主要对学生毕业设计(论文)的文本格式、图纸规范程度,工作量,研究内容与方法,实用性与科学性,结论和存在的不足等进行综合评价] 评阅人: (签名) 年 月 日 评阅人评定成绩: 湖 南 科 技 大 学 毕业设计(论文)答辩记录 日期: 学生: 学号: 班级: 题目: 提交毕业设计(论文)答辩委员会下列材料: 1 设计(论文)说明书 共 页 2 设计(论文)图 纸 共 页 3 指导人、评阅人评语 共 页 毕业设计(论文)答辩委员会评语: [主要对学生毕业设计(论文)的研究思路,设计(论文)质量,文本图纸规范程度和对设计(论文)的介绍,回答问题情况等进行综合评价] 答辩委员会主任: (签名) 委员: (签名) (签名) (签名) (签名) 答辩成绩: 总评成绩: 摘 要 从NCBI中获取绵羊主要组织相容性复合体(Major Histocompatibility Complex,MHC)Ⅱ的核苷酸与氨基酸序列,应用生物信息学原理,对绵羊MHCⅡ分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比,做出分子进化树。结果表明,绵羊MHCⅡ分子有一个疏水区和跨膜区;该分子有主要组织相容性复合物蛋白免疫球蛋白信号及N-糖基化位点、蛋白质激酶C磷酸化位点等多个生物活性位点。绵羊MHC classⅡ的氨基酸序列和核苷酸序列与成都麻羊的同源性最高,分别达66%和73%,其次与亚洲水牛和肩蜂牛的同源性也较高,与大黄鱼的同源性最低,分别为25%和51%。 关键词:主要组织相容性复合体Ⅱ类;生物信息学;序列分析 ABSTRACT Extract Ovis aries from NCBI of nucleotides and Major Histocompatibility Complex class II amino acid sequence, application bioinformatics principle, on Ovis aries MHC class II molecules succoth watershed and transmembrane area, the structure and function domain and biological activity sites aspects of biology characteristic was analyzed to predict the secondary structure and level 3 genetic structure, and the Ovis aries and other animals will be more nucleotide sequence of amino acid sequence and contrast, make more sequence phylogenetic tree. Results show that, Ovis aries MHC class II molecules have a dredging watershed and transmembrane area, the molecules are major histocompatibility complex protein immunoglobulin signal and N - glycosylation sites, protein kinase C phosphorylation sites such multiple bioactive loci sites, Ovis aries MHC class II the sequence of amino acids and nucleotide sequences and the Capra hircus is highest homology of 66% and 73%. Secondly Bubalus bubalis and Bos indicus homology of higher, with the lowest, homology of Larimichthys crocea for 25% and 51% respectively. Keywords: Major Histocompatibility Complex class II molecules; Bioinformatics; Sequence analys 湖南科技大学本科生毕业设计(论文) 目 录 第一章 前言 1 1.1 生物信息学简介 1 1.2 MHC的相关简介 1 第二章 材料来源 4 第三章 分析方法 5 3.1 蛋白质序列的获取 5 3.1.1 绵羊MHC ClassⅡ基因的核酸和蛋白质序列的获得 5 3.1.2 同源序列获得 5 3.2 蛋白质的基本性质分析 5 3.2.1 疏水性分析 5 3.2.2 跨膜区分析 5 3.2.3 功能结构域分析 5 3.2.4 生物活性位点分析 5 3.3 蛋白质结构预测 5 3.3.1 蛋白质二级结构的预测 5 3.3.2 蛋白质三级结构预测 5 3.4 绵羊MHC ClassⅡ系统进化树分析 5 第四章 结果与分析 6 4.1 绵羊MHC ClassⅡ基因的核酸和蛋白质序列 6 4.2 绵羊MHC ClassⅡ蛋白质的疏水性和跨膜区分析 7 4.2.1绵羊MHC ClassⅡ蛋白质的疏水性分析 7 4.2.2绵羊MHC ClassⅡ蛋白质的跨膜螺旋区分析 8 4.3 绵羊MHC ClassⅡ蛋白质的功能结构域分析 9 4.4 绵羊MHC ClassⅡ蛋白质生物活性位点分析 11 4.5 绵羊MHC ClassⅡ蛋白质的二级结构预测 12 4.6 绵羊MHC ClassⅡ蛋白质的三级结构预测 14 4.7 同源序列对比和系统发生分析 15 第五章 结论 21 参考文献 22 致谢 23 -ⅰ- 第一章 前 言 1.1 生物信息学简介 生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义[1]。它的研究内容包括生物信息的存储于获取、序列比对、测序与拼接、基因预测、生物进化与系统发育分析、蛋白质结构预测、RNA结构预测、分子设计与药物设计、代谢网络分析、基因芯片、DNA计算等。它还是一门以信息知识为基础的学科,关键资源是知识,关键技术是信息处理。它为揭示人类及重要动植物种类的基因组信息,继而进行生物大分子结构模拟和药物设计,以及天然生物大分子的改造和基于受体结构的药物分子设计提供依据。生物信息学不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质具有重要意义,而且可为人类疾病的诊断和防治开辟全新的途径,并为动植物的物种改良提供了坚实的理论基础。此外通过对影响药物代谢或效应通路、相关基因编码序列的再测序,很可能揭示个体对药物差别的遗传学基础[2]。生物信息学作为生命科学研究所必需的研究工具,在生命科学实践中越来越显示出它的重要作用,特别是在实验设计、结构分析上,离不开生物信息学的指导[3]。而生物数据库、相关软件是生物信息学研究与应用的重要资源。在生物信息学软件中,生物学研究人员用得最多的软件是搜索工具BLAST(Basic Local Alignment Search Tool)[1]。本文则是对绵羊MHC class II基因进行了生物信息学分析,也多次使用了BLAST软件。 1.2 MHC的相关简介 诱导强而迅速排斥反应的抗原称为主要组织相容性抗原或主要移植抗原, 编码这种抗原的基因群称为主要组织相容性复合体(Major Histocompatibility Complex, MHC)。 主要组织相容性复合体是存在于脊椎动物某一染色体上的一群紧密连锁的基因群,编码主要组织相容性抗原,调控细胞间相互识别,并与免疫应答和免疫调节有关,呈高度多态性[4]。 多态性是一个群体的概念,指MHC存在多个基因座位,染色体同一基因座有两种以上的基因型,即可能编码两种以上的产物。MHC的高度多态基因区,这些连锁的免疫应答基因控制着机体对抗原产生免疫应答的能力。MHC高度多态性赋於物种极大的应变能力造就了各式各样对抗原(病原体)入侵反应性和易感性不同的个体.使之能对付多变的环境条件及各种病原体的侵袭。在免疫应答的T-B、T-T、T-APC细胞的相互作用中,T细胞除识别抗原物质外,还必须同时识别与之作用细胞表面的MHC分子,这一现象称为MHC限制性。 不同的物种,不同种属动物都有自身的MHC:如人的MHC通常称HLA基因(hunan leukocyte antigen,HLA)或HLA基因复合体, 称其产物为HLA分子或HLA抗原;称小鼠MHC为H-2;称黑猩猩为ChLA;称狗为DLA;称猪为SLA;称牛为BoLA。 根据主要组织相容性抗原分子结构、分布和功能不同分为Ⅰ、Ⅱ、Ⅲ类分子。 按所含基因的功能不同,一般可将MHC区域分为ClassⅠ区、ClassⅡ区和ClassⅢ区。其编码基因也相应地分成三类。Ⅰ类和Ⅱ类分子是结构相似的细胞膜表面糖蛋白,除作为移植抗原外,还与抗原递呈及某些疾病相关。Ⅲ类分子包括C2、C4、B因子和肿瘤坏死因子等多种可溶性蛋白质。MHCⅠ类分子:所有有核细胞及血小板、网织红细胞。 图1.1 MHCⅡ分子结构图 MHC-Ⅱ类分子是异源二聚体,它的分子的两条链均由MHC-Ⅱ类分子基因编码,由α链和β链以非共价键结合的多肽链构成(如图1.1所示),其中α链分子量为32~34kDa,有两个N—连接寡糖;β链为27~30kDa,有一个N—连接寡糖。两条链在整个结构上彼此相似,由于糖基化作用,α链比β链略大,α链、β链胞膜外区各有两个结构域α1、α2及β1、β2,每个结构域约含90个氨基酸残基。α链和β链均是跨膜蛋白,C端为胞浆区。除α1结构域外,α2、β1和β2每个结构域均含一个二硫键。胞膜外区(跨膜区和胞浆区)按功能进一步分为肽结合区和免疫球蛋白样区。MHC-Ⅱ类分子的两条链均由不同的MHC基因编码,呈多态性。肽结合区MHC-Ⅱ类分子的α1、β1结构域与免疫球蛋白样区结构域无相似性,是类分子结合抗原肽部位和高度多态性所在。每个结构域都是有4条β折叠和1个α螺旋组成,α1和β1结构域的β片层共同形成肽结合沟槽的底部,α1和β1结构域的α螺旋共同形成肽结合沟槽的侧壁。α2和β2结构域属于免疫球蛋白超家族C1型结构,具非多态性,α2和β2结构域是MHC-Ⅱ类分子的非多态部分,也是与CD4分子相互作用的位点。α2和β2结构域C端侧各有一个短的连接区,分别连接α2、β2结构域与跨膜区。跨膜区约含25个氨基酸残基,形成α螺旋将α链和β链固定在细胞膜上。胞浆区很短,有25~30个氨基酸残基,可能与信号转导有关[5]。 在MHCⅡ基因内,第一外显子编码先导顺序或信号顺序,它将新生蛋白带向内质网。每个约由90个氨基酸组成的细胞外区残基各有一个大外显子跨膜区和胞浆区由几个小外显子编码。控制MHC基因转录的许多顺式调节顺序位于编码MHC分子外显子阅读框架的5’端,这些核苷酸顺序是DNA-结合蛋白的分子靶位,这些DNA-结合蛋白事反式转录调节因子。MHC基因转录调节的一般原则与免疫球蛋白基因相似。MHCⅡ类基因启动子序列位于基因编码区5’端上游,转录起始点上游200bp范围内。MHCⅡ类基因进侧基因启动子部分存在多态性,表现为顺式作用元件DQ,DP的多基因家族,是类分子多样性的分子基础,在免疫应答中起关键作用[5]。 本文是对绵羊MHC classⅡ分子进行生物信息学分析,应用生物信息学方法找出绵羊MHC classⅡ的核酸和蛋白质序列,对绵羊MHC classⅡ分子疏水区、跨膜区、结构功能域和生物活性位点等几方面生物学特性进行了分析,预测出该基因的二级结构和三级结构,并将绵羊与其它动物的核苷酸和氨基酸序列进行多序列对比和系统分子进化树分析,对绵羊MHC classⅡ的研究做一下基础性工作。 第二章 材料来源 绵羊MHC classⅡ基因及其同源的其它物种的核酸和氨基酸序列编码(表2.1)。 表2.1 不同物种MHC classⅡ基因的核酸和蛋白质序列 种类 (species) 蛋白质编号 (protein ID) 核酸编号 (nucleotide ID) 绵羊 NP-001116870 NM-001123398 褐家鼠 CAD86939 AJ554216 原鸡 AAR14674 AY357254 小家鼠 NP-034508 NM-010378 非洲爪蟾蜍 NP-001079971 NM-001086502 家猫 ACK99138 EU915361 家马 XP-001493225 XM-001493175 野驴 ABM92287 EF204945 欧洲兔 NP-001164589 NM-001171118 欧洲野兔 ACN39186 FJ225345 大熊猫 XP-002914414 XM-002914368 鹪鹩 AAN87894 AY169005 成都麻羊 AAR97716 AAR97716 亚洲水牛 AAY40169 DQ016629 肩峰牛 CAX17688 FM986339 大猩猩 AAU87999 AY663403 红毛猩猩 ACL00582 EU877227 野猪 ABA42968 DQ159895 大西洋鲱 CAM34665 AM492999 三文鱼 CAD27719 AJ438965 大黄鱼 ABV48907 EF681863 人 NP-002113 NM-002122 家犬 CAH61722 AJ630362 第三章 分析方法 3.1 蛋白质序列的获得 3.1.1 绵羊MHC classⅡ基因的核酸和蛋白质序列的获得 在NCBI数据库上搜索绵羊MHC classⅡ基因的核酸和蛋白质序列。 3.1.2 同源序列获得 利用NCBI上的BLAST程序对比直接获取与绵羊MHC classⅡ基因同源的核酸和蛋白质序列。 3.2 蛋白质的基本性质分析 3.2.1 疏水性分析 用位于Expasyde的Protscale[6](http://www.expasy.org/cgi-bin/protscale.pl) 程序对其进行疏水性分析。 3.2.2 跨膜区分析 联网至(http://www.genome.cbs.dut.dk/services/TMHMM-2.0)使用服务器TMHMM-2.0[7] 或联网至(http://www.ch.embnet.org/software/TMPRED_form.html)进行跨膜区分析。 3.2.3 功能结构域分析 联网至(http://www.ebi.ac.uk/interpro/index.html)用EBI开发的InterProScan[7]进行分析。 3.2.4 生物活性位点分析 利用位于Expasy的Prosite[6](http://www.expasy.org/prosite/)对绵羊MHC classⅡ蛋白质进行活性位点分析。 3.3 蛋白质结构预测 3.3.1 蛋白质二级结构的预测 联网至(http://www. Predictprotein.org/)用PHD[8]对绵羊MHC classⅡ进行分析或联网至PSIPRED[8]的网址(http://bioinf.cs.ucl.ac.uk/psipred)。 3.3.2 蛋白质三级结构的预测 利用位于SWISS-MODEL[5]的Automated Mode服务器返回到邮件的结果,观察蛋白质的三级结构。 3.4 绵羊MHC classⅡ系统进化树分析 联网至(http://www.ebi.ac.uk/clustalw/)[6]对所获得的同源蛋白质序列进行比对分析并构建系统进化树。 第四章 结果与分析 4.1 绵羊MHC classⅡ基因的核酸和蛋白质序列 在NCBI上获取绵羊的蛋白质序列(序列号:NP-001116870): 1 MKKALILRAL ALAAMMSLCG GEDIVADHVG TYGTNVYQTY GASGQFTFEF DGDELFYVDL 61 RKKETVWRLP EFNNITMFEI QSALRNIVMS KRNLDILMKN SNFTPATNDI PEVAVFPKSS 121 VILGIPNTLI CQVDNIFPPV INITWFYNGQ FVAEGVAETT FYPKSDHSFL KFSYLTFVPA 181 SEDFYDCRVE HWGLEEPLVK HWEPKIPTPT SELTETVVCA LGLPMGLMGI VVGTVLILRV 241 RCSGAASRRR RAMSHGLKDG KERKVFISVF AAASGAQDHQ PHAAWCFR 该蛋白质序列由288个氨基酸残基组成。 在NCBI上获取绵羊的核酸序列(序列号:NM-001123398): 1 CATGGGCTGC TCCAACATGA TTTCTCCAGC AGTTCTCTTT AGACCACCTT CCTGGTGAGG 61 CACCACTTGG AACAGCCACT CCTGAGGAAA CCCTTGGAGG AGGAGGAGGA TGAAGAAAGC 121 TCTGATTCTG AGGGCTCTCG CTCTGGCCGC CATGATGAGC CTGTGTGGAG GTGAAGACAT 181 CGTGGCGGAC CACGTGGGCA CTTACGGCAC AAATGTCTAC CAGACGTACG GCGCCTCTGG 241 CCAGTTCACG TTTGAATTTG ATGGAGACGA GCTCTTCTAC GTGGACCTGA GGAAAAAAGA 301 GACTGTCTGG AGGCTGCCCG AGTTTAACAA TATCACCATG TTTGAAATTC AGAGTGCCCT 361 GAGAAACATT GTTATGTCAA AAAGAAATTT GGACATCTTG ATGAAAAATT CCAACTTTAC 421 ACCTGCCACC AATGACATCC CTGAAGTGGC TGTGTTTCCC AAATCCTCCG TGATCCTGGG 481 GATTCCCAAC ACCCTCATCT GTCAGGTGGA CAACATCTTT CCTCCTGTGA TCAACATCAC 541 TTGGTTTTAC AATGGACAGT TTGTTGCAGA AGGTGTCGCT GAGACCACCT TCTACCCCAA 601 GAGTGACCAC TCCTTCCTCA AGTTCAGTTA CCTCACCTTT GTTCCCGCCA GTGAAGACTT 661 CTATGACTGC AGAGTGGAGC ACTGGGGCCT GGAAGAGCCC CTCGTCAAGC ACTGGGAGCC 721 CAAGATTCCA ACCCCTACAT CAGAGCTGAC AGAGACTGTG GTCTGTGCCC TGGGGCTGCC 781 CATGGGCCTC ATGGGCATCG TGGTGGGCAC TGTCCTCATC CTCCGAGTCC GGTGCTCAGG 841 TGCTGCCTCC AGACGTCGAA GGGCCATGAG TCATGGCCTG AAAGATGGGA AGGAGAGGAA 901 AGTCTTCATT TCTGTTTTCG CTGCAGCATC GGGAGCACAG GACCATCAGC CTCATGCTGC 961 CTGGTGTTTC AGGTGATCAG TCTTTACAAG AAAAGAAAGG CATGGTTCAG GCTCCAGTTC 1021 CCCATCTTGA CCTTGACTGA GACGTGCTCC TTGGTCCATT TCATCACAGA GCTCCTTCCA 1081 CGCCCTCCTG CTCTCCCTGC TGGGGCAGAC TTTATGGAGG AATTTTCCTT CGAAGATCAC 1141 TGACCCTCAC GAATTCTCCC AACTTAGTCT TTGATTCATT GCCTACCTGT CACAGAGACC 1201 TGGATTGTTC CACC 该核酸序列由1214个碱基组成。 4.2 绵羊MHC classⅡ蛋白质的疏水性和跨膜区分析 4.2.1 绵羊MHC classⅡ蛋白质的疏水性分析 疏水性是每个氨基酸所固有的特性,即每个氨基酸远离周围水分子,将自己包埋进蛋白质核心的相对趋势。疏水性氨基酸在蛋白质内部,由于其疏水性的相互作用,在保持蛋白质三级结构的形成和稳定中起着重要作用。疏水性预测的方法依赖于疏水性的衡量尺度,每个氨基酸根据其一系列的物理特性(例如溶解性、跨越水-汽相时产生的自由能等),被赋予一个数值以代表其疏水性。组成蛋白质的20种氨基酸各自带有不同极性的侧链基团,氨基酸侧链的疏水性,用从各氨基酸的疏水性减去甘氨酸疏水性之值来表示。具有较高正值的氨基酸具有较强的疏水性;而具有较低负值的氨基酸则具有较强的轻水性[6]。利用位于Expasy的Protscale进行疏水性分析,当Window size设置为9时,当氨基酸残基的疏水性值大于2.34时,为明显的疏水区。 单个氨基酸疏水性值: Ala: 1.800 Arg: -4.500 Asn: -3.500 Asp: -3.500 Cys: 2.500 Gln: -3.500 Glu: -3.500 Gly: -0.400 His: -3.200 Ile: 4.500 Leu: 3.800 Lys: -3.900 Met: 1.900 Phe: 2.800 Pro: -1.600 Ser: -0.800 Thr: -0.700 Trp: -0.900 Tyr: -1.300 Val: 4.200 : -3.500 : -3.500 : -0.490 MIN: -2.244 MAX: 3.122 图4.1 用Protscale对绵羊MHC classⅡ蛋白质进行疏水性分析结果 从上图返回的结果我们得知在第234位氨基酸处有最大值3.122,在第258位氨基酸处有最小值-2.244,在第位231至236位氨基酸的值分别为2.503,2.829,2.941,3.122,2.912,2.601这一区段氨基酸疏水性值大于2.34,所以我们得出结论:该蛋白质序列在位于231~236位残基之间具有明显的疏水性,从而说明该序列有一个疏水区。 4.2.2 绵羊MHC classⅡ蛋白质的跨膜螺旋区分析 膜蛋白是一类结构独特的蛋白质,执行着重要的细胞生物学功能。蛋白质序列含有跨膜区,提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白或离子通道蛋白,所以含有跨膜区蛋白往往和细胞的功能状态密切相关,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用[9]。通常使用单一的预测软件分析的准确性都不太高,综合不同的软件预测结果并结合疏水性图,可获得较好的预测结果。使用两种在线网络工具分析结果分别是: (1)利用TMHMM软件分析结果如下: # Sequence Length: 288 # Sequence Number of predicted TMHs: 1 # Sequence Exp number of AAs in TMHs: 21.83121 # Sequence Exp number, first 60 AAs: 0.52936 # Sequence Total prob of N-in: 0.06765 Sequence TMHMM2.0 outside 1 217 Sequence TMHMM2.0 TMhelix 218 240 Sequence TMHMM2.0 inside 241 288 图4.2 用TMHMM对绵羊MHC classⅡ蛋白质的跨膜区分析结果 根据以上数据和图表显示我们可以得出这样的结论:在位于位于218~240位氨基酸之间存在一个跨膜区。 (2)利用Tmpred软件分析结果如下: possible models considered, only significant TM-segments used -----> STRONGLY prefered model: N-terminus outside 3 strong transmembrane helices, total score : 3329 # from to length score orientation 1 4 25 (22) 742 o-i 2 121 143 (23) 542 i-o 3 217 240 (24) 2045 o-i ------> alternative model 3 strong transmembrane helices, total score : 2867 # from to length score orientation 1 6 24 (19) 899 i-o 2 114 133 (20) 505 o-i 3 216 238 (23) 1463 i-o 图4.3 用Tmpred对绵羊MHC classⅡ蛋白质的跨膜区分析结果 由分析结果和图像显示,可得出这样的结论:绵羊MHC classⅡ蛋白质的跨膜区有两种可能,它有三个明显的跨膜区。一种可能为它的跨膜区一个位于 4~25 位氨基酸之间,一个位于121~143位氨基酸之间,另一个位于217~240位氨基酸之间。另一种可能为它的跨膜区一个位于6~24位氨基酸之间,一个位于114~133位氨基酸之间,另一个位于216~238位氨基酸之间。 总体来看,Tmpred软件预测出三个跨膜区,TMHMM预测出一个跨膜区,显然,对于同一蛋白,两种不同的的方法给出了不同的预测结果,但部分预测结果大致相同。然而在多数情况下,Tmpred的预测结果比实际情况会稍微长一些或偏一些,基于综上考虑,认为该蛋白仅存在一个跨膜区,位于218~240位氨基酸残基之间,这与疏水性的分析也基本吻合。 4.3 绵羊MHC classⅡ蛋白质的功能结构域分析 结构域(StructuralDomain)是生物大分子中具有特异结构和独立功能的区域,特别指蛋白质中这样的区域,是介于二级和三级结构之间的另一种结构层次。所谓结构域是指蛋白质亚基结构中明显分开的紧密球状结构区域,又称为辖区。在球形蛋白中,结构域具有自己特定的四级结构,其功能部依赖于蛋白质分子中的其余部分,但是同一种蛋白质中不同结构域间常可通过不具二级结构的短序列连接起来。蛋白质分子中不同的结构域常由基因的不同外显子所编码。有些球形蛋白的一条肽链,或以共价键相连的两条或多条肽链在空间结构上可以区分为若干个球状的子结构,其中的每一个球状子结构就被称为一个结构域。 图4.4 用InterProScan对绵羊MHC classⅡ蛋白质的功能结构域分析 结合Prosite数据库分析: hits by profiles: [1 hit (by 1 profile) on 1 sequence] Hits by PS50835 IG_LIKE Ig-like domain profile : USERSEQ1 (288 aa) 111 - 191: score = 11.134 PEVAVFP-KSSVILGIPNTLICQVDNiFPPVINITWFYNG-QFVAEGVAETTFYpKSDHS FLKFSYltFVPASEDFYDCRVEH------------ Predicted feature: DISULFID 131 187 By similarity [condition: C-x*-C] hits by patterns: [1 hit (by 1 pattern) on 1 sequence] Hits by PS00290 IG_MHC Immunoglobulins and major histocompatibility complex proteins signa- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 毕业论文
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文