功能位点分析.pptx
《功能位点分析.pptx》由会员分享,可在线阅读,更多相关《功能位点分析.pptx(60页珍藏版)》请在咨信网上搜索。
1、生物信息学生物信息学核酸序列的一般分析核酸序列的一般分析主讲教师:王主讲教师:王 莉莉主要内容:主要内容:一、基因组一、基因组DNA简介简介二、序列格式转化二、序列格式转化三、三、DNA序列分析序列分析四、序列翻译、四、序列翻译、ORF查找查找五、限制性内切酶分析五、限制性内切酶分析六、引物设计六、引物设计七、七、RNA二级结构分析二级结构分析一、基因组一、基因组DNA简介简介 遗传信息存贮在遗传信息存贮在4种字符组成的核酸序列中种字符组成的核酸序列中 “天书天书”用遗传语言书写的人类遗传蓝本用遗传语言书写的人类遗传蓝本包含的信息量巨大包含的信息量巨大更重要的是目前人类对它了解甚少更重要的是目
2、前人类对它了解甚少天书中只有天书中只有4个字符(碱基个字符(碱基A、T、G、C)既没有段落,也没有标点符号既没有段落,也没有标点符号是一个长度为是一个长度为3109的一维序列。的一维序列。科学家对这本天书了解最多的部分就是遗传密码科学家对这本天书了解最多的部分就是遗传密码或者说掌握了或者说掌握了DNA对蛋白质编码的规律对蛋白质编码的规律 关于密码子关于密码子(1)密码子的使用是非随机的)密码子的使用是非随机的 如果密码子的第一、第二位碱基是如果密码子的第一、第二位碱基是A、U,那么第三位将尽可能使用那么第三位将尽可能使用G、C;反之亦然。;反之亦然。如果三位都用如果三位都用G、C,则配对容易,
3、分解难;,则配对容易,分解难;三位都用三位都用A、U,则相反。,则相反。一般地说,高表达的基因,要求翻译速度快,一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分开也快。要求密码子和反密码子配对快、分开也快。(2)密码子的使用有一定的统计规律)密码子的使用有一定的统计规律 对同义密码子的使用存在着偏爱对同义密码子的使用存在着偏爱不同种属偏爱的密码子不同不同种属偏爱的密码子不同人类基因组:人类基因组:密码子第三位取密码子第三位取A、U的情况占的情况占90%而第三位取而第三位取G、C仅占仅占10%密码子的使用偏性与基因功能、蛋白质结构相关密码子的使用偏性与基因功能、蛋白质结构相
4、关(3)密码子中的密码密码子中的密码 三个碱基的位置与所编码的氨基酸性质存在着联系三个碱基的位置与所编码的氨基酸性质存在着联系例如:例如:芳香族氨基酸芳香族氨基酸以以U作为第一位碱基作为第一位碱基中间位置碱基的性质与氨基酸是亲疏水性相关中间位置碱基的性质与氨基酸是亲疏水性相关疏水氨基酸的密码子,其第二位碱基是疏水氨基酸的密码子,其第二位碱基是U亲水氨基酸的密码子,其第二位碱基是亲水氨基酸的密码子,其第二位碱基是A第二位碱基是第二位碱基是G、C的密码子所编码的氨基酸的密码子所编码的氨基酸 亲水性、疏水性居中。亲水性、疏水性居中。人类基因组信息:人类基因组信息:编码区域只占编码区域只占1%-3%对
5、于非编码序列,尚不清楚其含义或功能对于非编码序列,尚不清楚其含义或功能非编码区域对于生命活动具有重要的意义非编码区域对于生命活动具有重要的意义 包括内含子、简单重复序列、移动元件、伪基因包括内含子、简单重复序列、移动元件、伪基因 重复序列重复序列:卫星(卫星(satellite)DNA 小卫星(小卫星(mini-satellite)DNA 微卫星(微卫星(micro-satellite)顺式调控元件顺式调控元件:启动子、增强子、沉默子启动子、增强子、沉默子关于生物复杂性:关于生物复杂性:生物的复杂性不仅仅是基因的数目生物的复杂性不仅仅是基因的数目 人类基因约为人类基因约为30000个个 线虫有
6、线虫有20000个基因个基因230000/220000=210000103000 基因组计划带来的希望:基因组计划带来的希望:实验数据的积累速度在迅速地增加实验数据的积累速度在迅速地增加 计算机科学和技术也在不断地发展计算机科学和技术也在不断地发展 单个基因组分析:单个基因组分析:基因序列基因序列基因功能基因功能基因的表达调控基因的表达调控基因产物基因产物基因多态性基因多态性比较基因组分析:比较基因组分析:物种关系物种关系物种进化物种进化物种起源物种起源二、序列格式转化二、序列格式转化 各各种种软软件件为为了了自自己己的的需需要要,通通常常对对序序列列格格式式有有一一定定的的要要求求,给给我我
7、们们的的使使用用带带来来了了一一定定的的困困难难。格格式式转转换换软软件件可可以以将将不不同同格格式式数数据据转转换换以以方方便便使使用用。很很多多综综合合性性软软件件可可以以进进行行序序列列格格式式转转换换,如如DNAstar,seqverter等。等。常见序列格式:常见序列格式:(1)FASTA格式(又称格式(又称Pearson格式)格式)是是比比较较简简单单而而使使用用最最多多的的序序列列格格式式。序序列列以以号号开开头头,其其后后是是单单行行的的关关于于序序列列的的描描述述信信息息,最后是序列。例子:最后是序列。例子:10KD_VIGUN P18646 vigna unguiculat
8、a 10 kda protein precursor MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS(2)Genbank格式(格式(GenBank flatfile,GBFF)最最广广泛泛地地用用于于表表示示生生物物序序列列的的格格式式之之一一,也也是是DDBJ/EMBL/GenBank交换数据时采用的格式。交换数据时采用的格式。例如:例如:LOCUS AB094638_1 146 bp DNA 13-APR-2006 BASE COUNT 38 a 17 c 43 g 48 t 0 others ORIGIN 1 gt
9、tttaatgt gttgccttgg ttgagtggtg aagctggtta gggtagcgtg taaaacatgg 61 tgggtagatt aatgctttgt gtcaccatgc cgtttggttc gattaatgta atcataagga 121 gagaccataa gttatgaata cgcaga(3)EBML格式格式 与与GBFF格格式式的的主主要要区区别别是是:每每行行左左端端均均有有由由两两个个大大写写字字母母组组成成的的识识别别标标志志,是是GenBank识识别标志的缩写。另外,序列的序号在右侧。别标志的缩写。另外,序列的序号在右侧。(4)GCG格格式式
10、:是是商商业业性性的的GCG软软件件包包的的专专用用格式。格式。最新下载最新下载 http:/ *下载后直接安装即可下载后直接安装即可Seqverter三、三、DNA序列分析序列分析基因序列基因表达调控信息 寻找基因涉及到两个方面的工作寻找基因涉及到两个方面的工作:识别与基因相关的特殊序列信号预测基因的编码区域 结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。1.DNA序列分析步骤序列分析步骤在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DN
11、A与RNA的相互作用。存放这些信息的DNA片段称为功能位点如 启 动 子(Promoter)、基 因 终 止 序 列(Terminator sequence)、剪切位点(Splice site)等。发现重复序列发现重复序列数据库搜索数据库搜索分析功能位点分析功能位点序列组成统计分析序列组成统计分析综合分析综合分析一个基本的一个基本的DNA序列分析方案序列分析方案2.核苷酸关联分析核苷酸关联分析对于一个给定的基因组,最简单的计算就是统计DNA序列中各类核苷酸出现的频率对于随机分布的DNA序列,每种核苷酸的出现是均匀分布的出现频率各为0.25。而真实基因组的核苷酸分布则是非均匀的核苷酸核苷酸 频率
12、频率 A0.3248693727808 C0.1751306272192 G0.1751306272192 T0.3248693727808 酵母基因组核苷酸出现频率酵母基因组核苷酸出现频率在统计过程中,如果同时计算DNA的正反两条链,则根据碱基配对原则,A和T、C和G的出现频率相同。如果仅统计一条链,则虽然A和T、C和G的出现频率不同,但是非常接近。两联核苷酸频率:两联核苷酸频率:不同基因组中两个连续核苷酸出现的频率也是不相同的4种核苷酸可以组合成16种两联核苷酸酵母基因组两联核苷酸频率表酵母基因组两联核苷酸频率表对酵母基因组两对酵母基因组两联核苷酸的统计联核苷酸的统计结果结果其中核苷酸对出
13、其中核苷酸对出现频率最高的达现频率最高的达到到0.119而出现频率最低而出现频率最低的只有的只有0.028三联核苷酸三联核苷酸基因密码子:基因密码子:在进行编码区域识别时,常常需要对三联核苷酸进行统计分析,这实际上是分析密码子的使用偏性。由于密码子的简并性(degeneracy),每个氨基酸至少对应1种密码子,最多有6种对应的密码子。在基因中,同义密码子的使用并不是完全一致的。不同物种、不同生物体的基因密码子使用存在着很大的差异基因密码子的使用与基因编码的蛋白的结构和功能有关,与基因表达的生理功能有着密切的联系 蛋白的三级结构与密码子使用概率有密切的关系通过对密码子的聚类分析,可以很清晰地将具
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 功能 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。