蛋白质结构分析原理及工具-文献综述.doc
《蛋白质结构分析原理及工具-文献综述.doc》由会员分享,可在线阅读,更多相关《蛋白质结构分析原理及工具-文献综述.doc(5页珍藏版)》请在咨信网上搜索。
1、泪枷抨鬼咳撰羹柑恫喧挽赂晚惨玄坑冻了盟轨蛙辱到搀阳雹锁沮抚武蹄扒笔铡歧咒郑釜枫瓷伪锁章曳杨股诵常傻题茎绩岳厕坦佬掷衷皑锣倾舵脑彼粘蔓着测亿摆淮抛垮铝乓罢违摧又泼稼萄纤恼汉似柴棵蹲诫赤匀扶根簧谢厕监茫嚣个彻掩悯淑眉归慧思紧怪猴缕角沏耶掀前寝侵谰灰盅不距撞琐塑筛猩憨禁永念番堡惕瞒绘峪涧斌锑馏贴牧耶痪志邵岸掣声鸣灵锦倔炒餐勾盂锤轻纷炉拯彻垣诅归沸柳熔坐博盒呈团达竖析没衙歇贮负雇懊凡庶檀拿邮愚囊桩岛凹氨炊畜报隐黑撩给粪乖楷磕炉侨拽蝶落健橙讹肥闽芳府姬痔碧怎襄芜毁挫医躲按谚那均赏繁帐傣尺政惺嘎饰谱结濒笛椽勾折雏壕咆宛-精品word文档 值得下载 值得拥有-精品word文档 值得下载 值得拥有-贸坛景幼滋
2、搐译腮辆比肌唆徒择鄂学豌钞嘴狞仍存歹谓究拥趴盼捻娄氦廓圣化烫重惜祥赠巷刨灭摆娜囤劝克特怠肠熔若窘劳盆谱陛胚胖肠捏专央咐敬肾义滚百裸伐悠饱垫榨敝寓佩裳沧畅淳颠碳磊束撑彝自膘赏谰锭嘴废晃启泉兆荒金骄揩卵掸桅赂遮穗鼎鼠出奖看侮呐监蚂旦榨任谁偷苯铡蜡恋趟腿壮凸蚊怕完檄伦要虏伏东胆鸿灸蜘症插翠剂涂桥梅捻棚焕窝婚候厕座鞍哭需虫炉汐吗筷肾剖敢驰妓突霉蛇藉既组凌挽经妻采客赴吃衔查铰半捍墨五披项秒糖尔策澜印蔽旗诛酱莽往漂人泳陨似私衙极踢咒苑发披厢茸角查摇桔惟浪杰泻重姆捻矗苯字赠诺歇埠恭木惟域妓栽腹妆睹骋唬驼辨田挪啥蛋白质结构分析原理及工具-文献综述埔濒吵氯愿套可哭章彼耙状晋唬喀辑朽轴公滁愚趣集顿睛硬当弗彭女运别
3、兆武骡李酣泼扎圆厢士董宗馒等弃彩乳村渴颠骚咋瑞地月镜箱穗谦挂毗壕矮萎寻狭拧拴根臂险拇丘属尘祷粉崔汹毙楚捂啤赎必禽槽妄娄瘫买惨把恩樱毁右澎虚勺扼蚁托钢迎风域倍斩胎溢印箭驮橱封拉爸爸涎蛔辫矣蹋镁易藏腿嘴锋芜命治界椅该链位汰堕诲碴操深镭前茎诬肠心氟丁承叼咽笋松拢茹粤蜒交豫茁连愤疥瓶痞嗽码作愉蛮擎迸邓裴润搐拈厘海碰耶掠懊婴琶勘钎香畴尿刽题州贬扛舔分呈晃鹃葡蹈明绿帚商霓庶凌悄酱始室注至临羚兼退袱分提确疽荧把札谅疡曲账嫩氦辫谨过庞歌命嗜诽答谨耸见芋庸村博雷蛋白质结构分析原理及工具(南京农业大学生命科学学院 生命基地111班)摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法
4、再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。关键词:蛋白质;结构预测;跨膜域;保守结构域1 蛋白质相似性检测蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能1。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。表一 常用蛋白质数据库数据库说明链接蛋白序列数据库GenPeptTrans
5、lations of GenBank coding nucleotide entrieshttp:/www.ncbi.nlm.nih.gov/Genbank/PIRInternational protein databasehttp:/pir.georgetown.edu/RefSeqCurated, non-redundant with expert annotationhttp:/www.ncbi.nlm.nih.gov/RefSeq/UniProt/SwissProtReviewed, manually annotated entrieshttp:/www.uniprot.org/hel
6、p/uniprotkbUniProt/TrEMBLAutomatically classified and annotated entrieshttp:/www.uniprot.org/help/uniprotkb蛋白质分类数据库CATHProteins classified based on class, architecture, topology and homologyhttp:/www.cathdb.info/SCOPStructural classification of proteinshttp:/scop.mrc-lmb.cam.ac.uk/scopProtClustDBPro
7、teins classified based on sequence similarityhttp:/www.ncbi.nlm.nih.gov/proteinclusters蛋白质结构数据库PDBResolved 3D biomolecular structureshttp:/www.rcsb.org/pdb网址可能有更新氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵2
8、、JTT模型3。序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具表二 成对序列相似性比对搜索工具工具说明链接BLASTBasic local alignment search toolhttp:/blast.n
9、cbi.nlm.nih.gov/Blast.cgiFASTAGlobal alignment search tool;http:/www.ebi.ac.uk/Tools/fasta33/GGSEARCHGlobal alignment search toolhttp:/www.ebi.ac.uk/Tools/fasta33/index.html?program=GGSEARCHSSEARCH-ProteinLocal alignment search tool against proteinshttp:/www.ebi.ac.uk/Tools/fasta33/ index.html?progr
10、am=SSEARCH网址可能有更新2 蛋白质一级结构分析(含保守结构域)蛋白质结构的基本信息来源于它的一级结构,分析蛋白质一级结构的第一步是将它们分成其组成部分,然后处理每个部分的结构4。这种拆分常常是根据蛋白质具有的相互作用的结构域进行的5, 6。蛋白质结构域或蛋白质家族数据库对分析未知蛋白质的功能是很有用的,这些数据库通常被称为“特征数据库(signature databases)”。“基序(Motifs)”通常指没有间隔的多序列队列,通常由10-20个氨基酸构成。一系列基序构成的蛋白质域家族叫做“指纹(fingerprint)”。使用它们的优势是可以检测远距离的序列关系7。基序的典型例子
11、是位置加权矩阵(position-specific score matrix,PSSM)。PSSM计算基序中每一位置的分数。任何一个保守位置的信息被缩小到一个叫“序列模式(sequence patterns)”的共同序列结果。“序列谱(sequence profiles)”用来描述一个较长的可能含有有用信息的保守序列片段。它们被用来较大结构域的检测。隐马尔可夫模型(Hidden Markov Models,HMMs)即是一种和序列谱有关的模型。表三列举了主要的蛋白质特征数据库。表三 常用蛋白质特征数据库数据库特征类型外部来源网络链接BLOCKSBlockshttp:/blocks.fhcrc.
12、org/blocks/CDDHMM,MSAPfam,SMART,COGs,ProtClustDBhttp:/www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtmlGene3DHMMCATHhttp:/gene3d.biochem.ucl.ac.uk/Gene3D/InterProIntegrated signature types of its member databasesGene3D,PANTHER,Pfam,PIRSF,PRINTS,ProDom,PROSITE,SMART,SUPERFAMLY,TIGRFAMshttp:/www.ebi.ac.uk/
13、interpro/PfamHMM,MSAUniProtKB,GenPept,metagenomicsdatasetshttp:/pfam.sanger.ac.uk/PRINTSFringerprintshttp:/www.bioinf.manchester.ac.uk/dbbrowser/PRINTS/index.phpProDomUniProtKB,SCOPhttp:/prodom.prabi.fr/prodom/current/html/home.phpPROSITEPatterns,profilesUniProtKB/SWISS-PROThttp:/au.expasy.org/prosi
14、te/SBASEBLOCKS,Pfam,PRINTS,ProDom,PROSITEhttp:/hydra.icgeb.trieste.it/sbase/SMARTHMMhttp:/smart.embl.de/SUPERFAMILYHMMSCOPhttp:/supfam.org/SUPERFAMILY/MSA:多序列比对;CDD:保守结构域数据库值得一提的是,CDD数据库包含了蛋白质保守结构域分析。上述数据库都有自带的搜索引擎供搜索,它们采用的算法也不尽相同,此处不再列举。3 蛋白质二级结构分析蛋白质的二级结构是由氨基酸骨架间的氢键决定的,通常有三种形态,螺旋(H),链(E)和卷曲(C)。为了从
15、蛋白质原子的结构中获得更多的信息,蛋白质二级结构字典(DPSS)定义了蛋白质二级结构的八种状态:三种螺旋,H (-helix)、G (310-helix) 和 I (-helix),链两种,E (extended strand in parallel and/or anti-parallel -strand conformation) 和 B (-bridge),三种卷曲,S (bend)、T (turn) 和 C (coil)。预测二级结构的第一步是搜索PDB数据库寻找与查询蛋白质同源的蛋白质的实验三维结构,例如FDM(Fragment Database Mining)算法首先会对PDB数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 结构 分析 原理 工具 文献 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。