生物信息学生物信息学绪省公共课一等奖全国赛课获奖课件.pptx
《生物信息学生物信息学绪省公共课一等奖全国赛课获奖课件.pptx》由会员分享,可在线阅读,更多相关《生物信息学生物信息学绪省公共课一等奖全国赛课获奖课件.pptx(90页珍藏版)》请在咨信网上搜索。
1、HGP最初目标经过国际合作,用时间(19902005)最少投入30亿美元,构建详细人类基因组遗传图和物理图,确定人类DNA全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:HGP终极目标说明人类基因组全部DNA序列;识别基因;建立储存这些信息数据库;开发数据分析工具;研究HGP实施所带来伦理、法律和社会问题。遗传图物理图物理图序列图序列图转录图转录图第1页第二节第二节 生物信息学及其发展历史生物信息学及其发展历史 第12页1、生物信息学概念第13页新生物学研究模式出发点应该是理论。科学家将从理论推测出发,然新生物学研究模式出发点应该是理论。科学家将从理论推测出发,然后再返回到
2、试验中去,追踪或验证这些理论假设。后再返回到试验中去,追踪或验证这些理论假设。生物学家不但必须生物学家不但必须成为计算机学者,而且也要改变他们硕士命现象路径。成为计算机学者,而且也要改变他们硕士命现象路径。W.Gilbert,Towards A Paradigm Shift in Biology,W.Gilbert,Towards A Paradigm Shift in Biology,Nature,Nature,349(1991)99349(1991)99第14页传统生物学:试验科学传统生物学:试验科学当代生物学发展:当代生物学发展:1 1、高通量数据获取日益实现自动化、半工业化、高通量数据
3、获取日益实现自动化、半工业化 从数据库中实现数据挖掘、知识发觉2 2、海量数据、海量数据 难以完全依赖试验伎俩对新数据进行分析,必须借助计算机实现分析和筛选3 3、更复杂层次生物学问题、更复杂层次生物学问题 复杂基因调控网络、代谢网络;细胞间信号转导过程;生物个体全部基因表示改变分析、筛选大量新数据分析、筛选大量新数据生物中复杂网络、复杂过生物中复杂网络、复杂过程、复杂现象程、复杂现象理论生物学理论生物学计算生物学计算生物学第15页 试验永远起着决定作用试验永远起着决定作用 计算计算/理论生物学发展离不开理论生物学发展离不开试验生物学贡献试验生物学贡献 试验生物学日益依赖计算试验生物学日益依赖
4、计算/理理论生物学指导论生物学指导二十一世纪生命科二十一世纪生命科学学理论理论理论理论计算计算计算计算试验试验试验试验数学与物理科学数学与物理科学数学与物理科学数学与物理科学第16页生物信息学(生物信息学(BioinformaticsBioinformatics)这一名词来由这一名词来由 八十年代末期,林华安博士认识到将计算机科学与生物学结合起来主要意义,开始留心要为这一领域构思一个适当名称。起初,考虑到与将要支持他主办一系列生物信息学会议佛罗里达州立大学超型计算机计算研究所关系,他使用是“CompBio”;之后,又将其更改为兼具法国风情“bioinformatique”,看起来似乎有些古怪。
5、所以很快,他便深入把它更改为“bio-informatics(或bio/informatics)”。但因为当初电子邮件系统与今日不一样,该名称中-或/符号经常会引发许多系统问题,于是林博士将其去除,今天我们所看到“bioinformatics”就正式诞生了,林博士也所以赢得了“生物信息学之父”美誉。第17页生物信息学生物信息学HGP生物数据激增生物数据激增(每(每15个月翻一番个月翻一番)生物学家生物学家数学家数学家计算机计算机科学家科学家生物信息学生物信息学(bioinfomatics)诞生诞生第18页三种科学文化融合三种科学文化融合三种科学文化融合三种科学文化融合生物学家生物学家生物学家生
6、物学家(生物学问题生物学问题生物学问题生物学问题)数学物理学家数学物理学家数学物理学家数学物理学家计算机科学家计算机科学家计算机科学家计算机科学家(基础理论问题基础理论问题基础理论问题基础理论问题)工程师工程师工程师工程师(技术应用)(技术应用)(技术应用)(技术应用)第19页 生物信息学(bioinformatics)是80年代未伴随人类基因组计划(Human genomeproject)开启而兴起一门新交叉学科。它包括生物学、数学、计算机科学和工程学,依赖于计算机科学、工程学和应用数学基础,依赖于生物试验和衍生数据大量储存。第20页概念(广义)概念(广义)生物体系和过程中信息生物体系和过程
7、中信息存贮、传递和表示存贮、传递和表示细胞、组织、器官生理、病理细胞、组织、器官生理、病理、药理过程中各种生物信息、药理过程中各种生物信息信息科学信息科学生生命命科科学学中中信信息息科科 学学第21页广义说,生物信息不但包含基因组信息,如基因DNA序列、染色体定位,也包含基因产(蛋白质或RNA)结构和功效及各生物种间进化关系等其它信息资源。生物信息学既涉基因组信息获取、处理、贮存、传递、分析和解释,又包括蛋白质组信息学如蛋白质序列、结构、功效及定位分类、蛋白质连锁图、蛋白质数据库建立、相关分析软件开发和应用等方面,还包括基因与蛋白质关系如蛋白质编码基因识别及算法研究、蛋白质结构、功效预测等,另
8、外,新药研制、生物进化也是生物信息学研究热点。第22页概念(狭义概念(狭义)生物生物分子数据分子数据深层次生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics挖掘获取生物分子信息获取、存贮、分析和利用生物分子信息获取、存贮、分析和利用第23页 因为当前生物信息学发展主要推进力来自分子生物学,生物信息学研究主要集中于核苷酸和氨基酸序列存放、分类、检索和分析等方面,所以当前生物信息学能够狭义地定义为:将计算机科学和数学应用于生物大分子信息获取、加工、存放、分类、检索与分析,以到达了解这些生物大分子信息生物学意义交叉学科。第24页 1995年,在美国人类基因组计划(
9、HGP)第一个五年总结汇报中给出了一个较为完整较为完整生物信息学定义:生信息学是包含生物信息获生信息学是包含生物信息获取、处理、贮存、分发、分析和解取、处理、贮存、分发、分析和解释全部方面一门学科,它综合利用释全部方面一门学科,它综合利用数学、计算机科学和生物学各种工数学、计算机科学和生物学各种工具进行研究,目标在于了解大量生具进行研究,目标在于了解大量生物学意义。物学意义。第25页Bioinformatics生物分子数 据 计算机计 算+第26页2、生物分子信息第27页细胞细胞分子分子存贮、复制、传递和表示存贮、复制、传递和表示遗传信息系统遗传信息系统生物信息载体生物信息载体第28页n生物信
10、息学主要研究两种信息载体生物信息学主要研究两种信息载体nDNA分子分子n蛋白质分子蛋白质分子第29页Protein Machines 第30页From the Cell to Protein Machines 第31页生物分子最少携带着三种信息生物分子最少携带着三种信息n遗传信息遗传信息n与功效相关结构信息与功效相关结构信息n进化信息进化信息第32页(1)遗传信息载体遗传信息载体DNA 遗传信息载体主要是DNA 控制生物体性状基因是一系列DNA片段 生物体生长发育本质就是遗传信息传递和表示 第33页DNA经过自我复制,在生物体繁衍过经过自我复制,在生物体繁衍过程中传递遗传信息程中传递遗传信息
11、基因经过转录和翻译,使遗传信息在生物基因经过转录和翻译,使遗传信息在生物个体中得以表示,并使后代表现出与亲代个体中得以表示,并使后代表现出与亲代相同生物性状。相同生物性状。基因控制着蛋白质合成基因控制着蛋白质合成 DNARNA蛋白蛋白质质转录转录翻译翻译第34页基因DNADNA序列序列DNA前体RNAmRNA多多肽链肽链蛋白质序列对对应应关关系系遗遗传传密密码码第35页(2)蛋白质结构决定其功效蛋白质结构决定其功效n蛋白质蛋白质功效功效取决于蛋白质空间取决于蛋白质空间结构结构 n蛋白质结构决定于蛋白质蛋白质结构决定于蛋白质序列序列(这是当(这是当前基本共认假设),蛋白质结构信息隐前基本共认假设
12、),蛋白质结构信息隐含在蛋白质序列之中。含在蛋白质序列之中。第36页(3)DNA分子和蛋白质分子分子和蛋白质分子都含有进化信息都含有进化信息n 经过比较经过比较相同蛋白质序列相同蛋白质序列,如肌红蛋,如肌红蛋白和血红蛋白,能够发觉因为基因复制白和血红蛋白,能够发觉因为基因复制而产生分子进化证据。而产生分子进化证据。n经过比较来自于不一样种属同源蛋白质,经过比较来自于不一样种属同源蛋白质,即即直系同源蛋白质直系同源蛋白质,能够分析蛋白质甚,能够分析蛋白质甚至种属之间系统发生关系,推测它们共至种属之间系统发生关系,推测它们共同祖先蛋白质。同祖先蛋白质。第37页生生物物分分子子信信息息DNA序列数据
13、序列数据 蛋白质序列数据蛋白质序列数据 生物分子结构数据生物分子结构数据 生物分子功效数据生物分子功效数据 最基本最基本直观直观复杂复杂生物分子数据类型生物分子数据类型第38页 DNA核酸序列核酸序列蛋白质蛋白质氨基酸序列氨基酸序列蛋白质蛋白质结构结构蛋白质蛋白质功效功效最基本最基本生物信息生物信息维持生命活维持生命活动机器动机器第一部第一部遗传密码遗传密码第二部第二部遗传密码?遗传密码?生命体系千姿生命体系千姿百态改变百态改变生物分子数据及其关系生物分子数据及其关系第39页n第一部遗传密码已被破译,但对密码转录过程还不清第一部遗传密码已被破译,但对密码转录过程还不清楚,对大多数楚,对大多数D
14、NA非编码区域功效还知之甚少非编码区域功效还知之甚少n 对于第二部密码,当前则只能用统计学方法进行分析对于第二部密码,当前则只能用统计学方法进行分析n不论是第一部遗传密码,还是第二部遗传密码,都隐不论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量生物分子数据之中。藏在大量生物分子数据之中。生物分子数据是宝藏,生物分子数据是宝藏,生物信息数据库是金矿,生物信息数据库是金矿,等候我们去挖掘和利用。等候我们去挖掘和利用。第40页生物分子信息特征生物分子信息特征n生物分子信息数据量大生物分子信息数据量大 n生物分子信息复杂生物分子信息复杂 n生物分子信息之间存在着亲密联络生物分子信息之间存在着亲密
15、联络第41页3、生物信息学发展历史、生物信息学发展历史生物信息学生物信息学基本思想产生基本思想产生 生物信息学生物信息学 快速发展快速发展二十世纪二十世纪50年代年代二十世纪二十世纪80-90年代年代生物科学和生物科学和技术技术发展发展人类基因组人类基因组计划计划推进推进 第42页n2020世纪世纪5050年代,生物信息学开始孕育年代,生物信息学开始孕育n2020世纪世纪6060年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算 生物学和计算机科学联络起来生物学和计算机科学联络起来n2020世纪世纪7070年代,生物信息学真正开端年代,生物信息学真正开端n2020世纪世纪7070
16、年代到年代到8080年代早期年代早期 ,出现了一系列著,出现了一系列著 名序列比较方法和生物信息分析方法名序列比较方法和生物信息分析方法 n2020世纪世纪8080年代以后,出现一批生物信息服务机年代以后,出现一批生物信息服务机 构和生物信息数据库构和生物信息数据库n2020世纪世纪9090年代后年代后 ,HGPHGP促进生物信息学快速促进生物信息学快速 发展发展第43页第三节第三节生物信息学主要研究内容生物信息学主要研究内容第44页生物信息学主要研究内容生物信息学主要研究内容1、生物分子数据搜集与管理生物分子数据搜集与管理2、数据库搜索及序列比较数据库搜索及序列比较 3、基因组序列分析基因组
17、序列分析 4、基因表示数据分析与处理、基因表示数据分析与处理 5、蛋白质结构预测、蛋白质结构预测 第45页基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJEMBLGenBankSWISS-PROTPDBPIR1、生物分子数据搜集与管理第46页2、数据库搜索及序列比较数据库搜索及序列比较 n搜索同源序列在一定程度上就是经过序列比较搜索同源序列在一定程度上就是经过序列比较寻找相同序列寻找相同序列 n序列比较一个基本操作就是序列比较一个基本操作就是比对比对(Alignment),即将两个序列各个字符(代),即将两个序列各个字符(代表核苷酸或者氨基
18、酸残基)按照对应等同或者表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共置换关系进行对比排列,其结果是两个序列共有排列次序,这是序列相同程度一个定性描述有排列次序,这是序列相同程度一个定性描述n多重序列比对多重序列比对研究是多个序列共性。序列多重研究是多个序列共性。序列多重比对可用来搜索基因组序列功效区域,也可用比对可用来搜索基因组序列功效区域,也可用于研究一组蛋白质之间进化关系。于研究一组蛋白质之间进化关系。第47页发觉同源分子第48页3、基因组序列分析基因组序列分析 n遗传语言分析遗传语言分析天书天书 n基因组结构分析基因组结构分析n基因识别基因识别n基因功
19、效注释基因功效注释n基因调控信息分析基因调控信息分析n基因组比较基因组比较第49页4、基因表示数据分析与处理、基因表示数据分析与处理n基因表示数据分析是当前生物信息学研究热基因表示数据分析是当前生物信息学研究热 点和重点点和重点 n当前对基因表示数据处理主要是进行聚类分当前对基因表示数据处理主要是进行聚类分 析,将表示模式相同基因聚为一类,在此基析,将表示模式相同基因聚为一类,在此基 础上寻找相关基因,分析基因功效础上寻找相关基因,分析基因功效 n所用方法主要有:所用方法主要有:n相关分析方法相关分析方法n模式识别技术中层次式聚类方法模式识别技术中层次式聚类方法n人工智能中自组织映射神经网络人
20、工智能中自组织映射神经网络n主元分析方法主元分析方法 第50页基因芯片基因芯片第51页第52页第53页层次式聚类层次式聚类第54页二二维维电电泳泳图图第55页5、蛋白质结构预测、蛋白质结构预测 n蛋白质生物功效由蛋白质结构所决定蛋白质生物功效由蛋白质结构所决定,蛋白质,蛋白质结构预测成为了解蛋白质功效主要路径结构预测成为了解蛋白质功效主要路径n蛋白质结构预测分为蛋白质结构预测分为:n二级结构预测二级结构预测n空间结构预测空间结构预测 蛋白质折叠蛋白质折叠第56页二级结构预测二级结构预测n在一定程度上二级结构预测能够归结为模式识别问题在一定程度上二级结构预测能够归结为模式识别问题 n在二级结构预
21、测方面主要方法有:在二级结构预测方面主要方法有:n立体化学方法立体化学方法n图论方法图论方法n统计方法统计方法n最邻近决议方法最邻近决议方法n基于规则教授系统方法基于规则教授系统方法n分子动力学方法分子动力学方法n人工神经网络方法人工神经网络方法 n预测准确率超出预测准确率超出70%第一个软件是基于神经网络第一个软件是基于神经网络PHD系统系统第57页空间结构预测空间结构预测n在空间结构预测方面,比较成功理论方在空间结构预测方面,比较成功理论方法是法是同源模型法同源模型法 n该方法依据是:相同序列蛋白质倾向于该方法依据是:相同序列蛋白质倾向于折叠成相同三维空间结构折叠成相同三维空间结构 n利用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 公共课 一等奖 全国 获奖 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。