生物信息学及应用复习题.doc
《生物信息学及应用复习题.doc》由会员分享,可在线阅读,更多相关《生物信息学及应用复习题.doc(6页珍藏版)》请在咨信网上搜索。
《生物信息学及应用》课程复习题 1、 生物信息学的基本定义,阐述它的主要研究目标、研究内容及研究方法。 生物信息学:Bioinformatics is the combination of biology and information technology. It is the branch of science that deals with the computer-based analysis of large biological data sets. 生物信息学研究的最终目的--揭示蕴藏在DNA和蛋白质氨基酸序列中具有普遍性、真实性的生物遗传本质,掌握复杂的生命现象 —— 生命起源、生物进化以及细胞、器官和个体的发生、发育、病变、衰亡的规律和时空联系. 生物信息学的主要研究内容 1. 生物信息的收集、存储、管理与提供; 2. 基因组序列信息的提取和分析; 3. 功能基因组相关信息分析; 4. 生物大分子结构模拟和药物设计; 5. 生物信息分析的技术与方法研究; 6. 应用与发展研究方面 方法: (1)建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库(YEASTS)、美国种质保藏中心(ATCC)、美国专利局数据库(USPO)等; (2)数据库检索:如Blast等; (3)序列分析:序列对位排列、同源比较、进化分析等; (4)统计模型:如隐马尔可夫模型(hidden Markov model, HMM)――基因识别、药物设计;最大似然模型(maximun likelihood model, ML)、 最大简约法(Maximun Parsimony, MP)――分子进化分析等; (5)算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经网络(artificial neural network)等。 2、 生物信息学的发展经历了哪几个阶段,生物信息学的研究在生命科学中的意义。 生物信息学从产生至今经历了两个历史时代: 前基因组时代,也被称为测序基因组时代 后基因组时代,也被称为功能基因组时代 第一个阶段是前基因组时代。这一阶段主要是以各种算法法则的建立、生物数据库的建立以及DNA和蛋白质序列分析为主要工作; 第二阶段是基因组时代。这一阶段以各种基因组计划测序、网络数据库系统的建立和基因寻找为主要工作。 第三阶段是后基因组时代。这一阶段的主要工作是进行大规模基因组分析、蛋白质组分析以及其他各种基因组学研究。 3、 分子生物信息数据库的主要类别,分别举例说明它们的功能。 一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。 二级数据库 对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。 分为四类: a) 基因组数据库; b) 核酸和蛋白质一级结构序列数据库; c)生物大分子(主要是蛋白质)三维空间结构数据库; d)由上述三类数据库和文献资料为基础构建的二次数据库 (Secondary database )。 4、简介下列著名的生物信息数据库:GenBank,Swiss-Prot,PDB,PROSITE,人类基因组数据库 5、简介NCBI;Entrez 集成于哪个数据库平台?主要功能是什么?在应用中可以访问哪些子数据库(请列举5个以上)? Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。 6、解释BLAST及其用途,它分为哪些类型? BLAST 是目前常用的数据库搜索程序,它是 Basic Local Alignment Search Tool 的缩写,意为 “基本局部相似性比对搜索工具”。BLAST(Basic Local Alignment Search Tool)是一个基本的序列比对工具,以从数据库中找到与查询序列相似的序列。 BLAST 算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片断,并作为内核向两端延伸,以找出尽可能长的相似序列片段。 7、 序列的相似性与同源性有什么区别与联系? 如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度问题。这两条序列之间要么是同源的,要么是不同源的。 所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。 同源蛋白质的氨基酸序列具有明显的相似性,这种相似性称为序列同源性。 相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。 相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构与功能有什么联系。 当相似程度高于50%时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。 8、 序列比对原理,在大分子序列分析中,为何局部比对比全局比对更有意义?多序列比对的主要应用。 通过将两个或多个核酸序列或蛋白序列进行比对,显示其中相似的结构域,这是进一步相似性分析的基础。通过比较未知序列与已知序列的一致性或相似性,可以预测未知序列功能。 局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。 此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。 BLAST和FastA等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。 多重序列比对: 用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域等。 用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。 其他应用,如构建profile,打分矩阵等。 9、 假设你得到一段未知基因的DNA序列,从你学习到的生物信息学分析方法和软件,设计一个分析流程来分析该未知基因的功能和家族类别。 基因/蛋白质的功能预测 (1) 一级序列的比较:相似的序列具有相似的功能 同源物的鉴定:不同物种中的直系、旁系同源物的预测 主要工具:BLAST (2) 保守的功能结构域:保守的功能 常用工具:Interpro/Pfam/SMART/PROSITE/ProDom/CDD (3) 三级结构的比较:相似的结构具有相似的功能 Ubiquitin: 泛素,主要负责蛋白质的降解 SUMO:小的类泛素蛋白质,基因转录 &信号通路 催化反应通路的分子机制相似 序列相似性:不显著! 10、试述SWISS-PROT中的数据来源。已获得编码某个基因的DNA序列,请设计和论述(a)怎样得到其蛋白质序列?(b)如何分析该基因编码的蛋白质序列? 数据库由蛋白质序列条目构成, 每个条目包含蛋白质序列、引用文献信息、 分类学信息、注释等, 注释中包括蛋白质的功能、转录后修饰位点、特殊位点 和区域、二级结构、四级结构、与其他序列的相似性、序列残缺与疾病的关系、 序列变异体等信息。 11、 研究蛋白质结构有什么意义?为什么要进行蛋白质结构预测?试述蛋白质三维结构预测的三类方法。 同源建模法(Homology) 同源蛋白质具有相似的结构和功能 根据序列同源性推断目标蛋白的结构 折叠识别/穿线法(Threading) 根据现有的蛋白质折叠类型来推断目标蛋白的折叠方式 从头算预测法(ab initio) 从序列到结构 根据物理模型进行分子动力学模拟 12、 基于核酸和蛋白质序列如何研究生物进化?主要步骤是什么? 蛋白质序列分析主要内容: (1)蛋白质序列的基本性质分析 理化性质分析,疏水性分析,跨膜区分析,信号肽预测,Coil区分析,亚细胞定位 (2)序列数据库搜索 相似性搜索,模体的搜索 (3)结构域定位 (4)多序列比对 序列比对为解决下列问题提供重要信息: - 确定新发现基因的功能; - 确定基因间、蛋白质间乃至物种之间的进化关系; - 预测蛋白质的结构和功能:即可以提供结构域相应的信息,蛋白质功能位点的残基、蛋白质亲水性和疏水性的氨基酸残基,从比对结果中得到更多的同源模建或二级结构预测的模板 (5)空间结构预测 二级结构及三级结构预测,结构预测方法评价 1、构建系统进化树。2、主要步骤如下:A、序列相似性比较。就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;B、序列同源性分析。是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等; C、构建系统进化树。根据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,象PYLIP、MEGA等;D、稳定性检验。为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。通用的方法使用 Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。 13、试述基因芯片的工作原理;基因芯片对于生物分子信息检测的作用和意义? 14、试述计算机辅助药物设计;什么是分子对接,它依据的原理是什么? 计算机辅助药物设计将合理药物设计的思路与方法计算机化,综合和借助多学科的先进技术、方法和成果,为合理药物设计提供了强有力的基本工具和手段。 离开计算机的辅助,合理药物设计是寸步难行的。 分子对接是指受体和配体之间通过能量匹配和空间匹配而相互识别形成分子复合物,并预测复合物结构的操作过程。 分子对接就是配体分子在受体活性部位的定位。 分子对接是研究三维定量构效关系及基于结构的药物设计的一个关键步骤。 分子对接是依据配体与受体作用的“锁-钥原理”,模拟小分子配体与受体生物大分子 相互作用。配体与受体相互作用是分子识别的过程,主要包括静电作用、氢键作用、疏水作用、范德华作用等。通过计算,可以预测两者间的结合模式和亲和力,从而进行药物的虚拟筛选。 15、简述人类基因组计划与生物信息学之间的相互促进关系。 16、生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系? 其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 应用 复习题
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文