生物信息学复习重点.doc
《生物信息学复习重点.doc》由会员分享,可在线阅读,更多相关《生物信息学复习重点.doc(6页珍藏版)》请在咨信网上搜索。
1、生物信息学就是一门交叉学科, 包含了生物信息得获取、加工、存储、分配、分析、解释等在内得所有方面, 它综合运用数学、计算机科学与生物学等得各种工具来阐明与理解大量数据所包含得生物学意义。生物信息学宗旨在揭示基因组信息结构得复杂性及遗传语言得根本规律。从生物分子获得与挖掘深层次生物学知识。人类基因组计划(HGP):获得遗传图、物理图、序列图、转录图;终极目标:阐明人类基因组全部DNA序列;识别基因;建立储存这些信息得数据库;开发数据分析工具;研究HGP实施所带来得伦理、法律与社会问题。其中我国承担了人类3号染色体短臂。记录:一个数据库记录一般由两部分组成:原始序列数据与描述这些数据生物学信息得注
2、释。冗余:在一个数据库存在着多个相同得项,如两个或者更多得记录中有一个相同序列Fasta格式开始于一个标识符:,然后就是一行描述。GenBank格式:每个基因描述可有多个描述行,包含一行以LOUCUS开头描述行,基因序列以ORIGN开头,以/结尾。该競传协舉氫钰。EMBL:入口标识符ID,序列开始标识符SQ,结束就是/。数据库得特点:数据库就是可以检索得,即具有检索功能;数据库应该就是定时更新得,即不断有新版内容发布;数据库就是交叉引用得,特别就是在互联网时代,数据库应该通过超链接与其她数据库相连。淥褛鄖倉荤隐弃。EST序列:表达序列标签对cDNA文库测序得到得,就是转录得DNA序列。STS序
3、列:序列标签位点染色体上位置已定得、核苷酸序列已知得、且在基因组中只有一份拷贝得DNA短片断,(200bp500bp)。STS序列标签位点就是基因组上定位明确、作为界标并能通过PCR扩增被唯一操作得短得、单拷贝DNA 序列,用于产生作图位点。凯睐们鹞魘誣欽。GSS序列:基因组概览测序基因组DNA克隆得一次性部分测序得到得序列。HTG序列:高通量基因组序列三大数据库:NCBI(GenBank):美国生物技术中心,建立了一系列生物信息数据与各种服务。EMBL:欧洲分子生物学实验室。DDBJ:日本遗传研究所。同源性基因系指起源于同一祖先但序列已经发生变异得基因成员。基因同源性只有“就是”与“非”得区
4、别,就是一种质得判断。筛垆枭設腸閱調。直系同源基因:分布在不同物种间得同源基因又称直系同源基因。旁系同源基因:同一物种得同源基因则称旁系同源基因(水平基因), 水平基因由重复后趋异产生。一致性:序列中同一碱基位置得相同得碱基成员, 或者蛋白质得同一氨基酸位置得相同得氨基酸成员得百分比。相似性:序列中同一位置相同或相似序列得百分比。如同源蛋白质得氨基酸序列中一致性氨基酸与可取代氨基酸所占得比例。可取代氨基酸系指具有相同性质如极性氨基酸或非极性氨基酸得成员, 它们之间得代换不影响蛋白质(或酶)得生物学功能。經痪靨設办灑鵪。相似性与同源性关系:一般来说序列间得相似性越高得话,就是同源序列得可能性就更
5、高,所以经常可以通过序列得相似性来推测序列就是否同源。郸埚贏钕凄灑顼。序列比对:确定两个或多个序列之间得相似性以至于同源性,而将它们按照一定得规律排列。任务:通过比较生物分子序列,发现它们得相似性,找出序列之间共同得区域,同时辨别序列之间得根本差异。坟馀骠燜潛搖爛。相似性:可能就是核酸氨基酸序列得相似、可能就是结构得相似、可能就是功能得相似主要得blast程序:程序名查询序列数据库搜索方法Blastn核酸核酸核酸序列搜索逐一核酸数据库中得序列Blastp蛋白质蛋白质蛋白质序列搜索逐一蛋白质数据库中得序列Blastx核酸蛋白质核酸序列6框翻译成蛋白质序列后与蛋白质数据库中得序列逐一搜索。Tbla
6、stn蛋白质核酸蛋白质序列与核酸数据库中得核酸序列6框翻译后得蛋白质序列逐一比对。TBlastx核酸核酸核酸序列6框翻译成蛋白质序列,再与核酸数据库中得核酸序列6框翻译成得蛋白质序列逐一进行比对。Score:使用打分矩阵对匹配得片段进行打分,这就是对各对氨基酸残基(或碱基)打分求与得结果,一般来说,匹配片段越长、相似性越高则Score值越大。慶园鲳陆荠骧阑。E value:在相同长度得情况下,两个氨基酸残基(或碱基)随机排列得序列进行打分,得到上述Score值得概率得大小。E值越小表示随机情况下得到该Score值得可能性越低。譙羋涤摈談铂磽。分子钟:某一蛋白在不同物种间得取代数与所研究物种间得
7、分歧时间接近正线性关系,进而将分子水平得这种恒速变异称为“分子钟”。买逕篤鰨禅醬汹。中性学说:突变大多数就是中性得,中性突变通过随机得遗传漂变在群体里固定下来,分子进化就是遗传漂变得结果,在分子进化上自然选择不起作用。擋鄺劊维陕蕆僨。分子进化系统发育树得研究目得:物种分类及关系:从物种得一些分子特性出发,构建系统发育树,进而了解物种之间得生物系统发生得关系大分子功能与结构得分析:同一家族得大分子,具有相似得三级结构及生化功能,通过序列同源性分析,构建系统发育树,进行相关分析与功能预测进化速率分析:例如,HIV得高突变性,哪些位点易发生突变昙淒銥鍤鏹傖妝。末端节点:代表最终分类,可以就是物种,群
8、体或者蛋白质、DNA、RNA分子等。系统发育树就是由一系列节点与分支组成,其中每个节点代表一个分类单元(物种或序列),而节点之间得连线代表物种之间得进化关系。鏢鲫詛諗謗终鍍。树得节点又分为外部节点与内部节点。外部节点代表实际观察到得分类单元。内部节点又称为分支点,代表分类单元进化历程中得祖先。一个DNA序列在物种形成或基因复制时,分裂成两个子序列,因此系统发育树一般就是二叉树。擯藓缄崍誣灤紹。有根树:从最早共同祖先,即根开始,随着时间得连续分支事件引起得一组相关物种得分歧。无根树:表示分类单元之间得进化关系,但不鉴别最早得共同祖先。距离:对一个有根树来说,沿着每个分支得进化方向就是确定得。反之
9、,对无根树来说,并不清楚内部分支得祖先物种就是从哪里进化而来相关序列间得差异称为距离。不同物种得两条同源序列得度量被称为遗传距离或进化距离。审蛎项帶鳐厩篋。外群/外围枝:与当前研究得主要物种或基因相对较远得一组序列,可以辅助定位树根,选择条件:序列必须与剩余序列关系较近,但外围支序列与其她序列间得差异必须比其她序列之间得差异更显著諤幣擻襠飒阌隱。系统发育树构建步骤:多序列比对;建立取代模型(建树方法);建立进化树;进化树评估。进化树得可信度检验自展法(统计方法):从排列得多序列中随机有放回得抽取某一列,构成相同长度得新得排列序列;重复上面得过程,得到多组新得序列;对这些新得序列进行建树,再观察
10、这些树与原始树就是否有差异,以此评价建树得可靠性絢颦鯽灵阄钼显。建树一般原则:1、可靠得待分析数据2、准确得多序列比对3、选择合适得建树方法:A、序列相似程度高,MP(简约法)B、序列相似程度较低,ML(似然法)C、序列相似程度中等,NJ(邻接法)D、序列相似程度太低,无意义减颉骑赙時厅鶚。bootstrap为每个分支指派一个数值,表示这些分支在bootstrap测试中出现得百分比,暗示它们关联得化分就是否被数据很好地支持。越接近100,可信度越高。慍轳鄲鸞韻饬綿。GO:基因本体联合会所建立得数据库,旨在建立一个适用于各种物种得,对基因与蛋白质功能进行限定与描述得,并能随着研究不断深入而更新得
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 复习 重点
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。