生物信息学省公共课一等奖全国赛课获奖课件.pptx
《生物信息学省公共课一等奖全国赛课获奖课件.pptx》由会员分享,可在线阅读,更多相关《生物信息学省公共课一等奖全国赛课获奖课件.pptx(118页珍藏版)》请在咨信网上搜索。
生物信息学生物信息学主讲教师主讲教师:高雪峰高雪峰E-mailE-mail:吉林大学生命科学学院吉林大学生命科学学院10/10/1 1第1页课程安排课程安排1、时间:每七天一下午、时间:每七天一下午58节节 教室:第三教学楼第二阶梯教室教室:第三教学楼第二阶梯教室 课时:每七天课时:每七天4课时(总计课时(总计4 4=16课时课时)2、学分:、学分:2学分学分3、成绩考评方式(、成绩考评方式(笔试笔试)4、E-mail: (办公室地址:理三(办公室地址:理三341室)室)10/10/2 2第2页参考文件参考文件1 1、生物信息学概论、生物信息学概论 罗静初罗静初 北京大学北京大学 北京大学出版社北京大学出版社2 2、生物信息学、生物信息学 D.R.Westhead 科学出版社科学出版社3 3、生物信息学、生物信息学基因和蛋白质分析使用指南基因和蛋白质分析使用指南 李衍达李衍达 清华大学清华大学 清华大学出版社清华大学出版社4 4、生物信息学中计算机技术、生物信息学中计算机技术 孙超孙超 中国电力出版社中国电力出版社5 5、生物信息学手册、生物信息学手册 郝柏林郝柏林 中科院物理所中科院物理所 上海科学技术出版社上海科学技术出版社6 6、简明生物信息学、简明生物信息学 钟扬钟扬 复旦大学复旦大学 高等教育出版社高等教育出版社10/10/3 3第3页第一章第一章生物信息学引论生物信息学引论10/10/4 4第4页介绍1引言引言 2生物信息学发展历史生物信息学发展历史 3人类基因组计划和基因组信息学人类基因组计划和基因组信息学 4蛋白质结构与功效关系研究蛋白质结构与功效关系研究5当前生物信息学主要研究内容当前生物信息学主要研究内容 6生物信息学所用方法和技术生物信息学所用方法和技术10/10/5 5第5页 第一节第一节 引言引言生命信息组织、传递、表示物理化学分子生物学遗传学信息技术10/10/6 6第6页1、生物信息学概念HGP生物数据激增(每15个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)诞生10/10/7 7第7页概念(广义)生物体系和过程中信息存贮、传递和表示细胞、组织、器官生理、病理、药理过程中各种生物信息信息科学生命科学中信息科学10/10/8 8第8页概念(狭义)深层次生物学知识分子生物信息学分子生物信息学MolecularBioinformatics挖掘获取生物分子信息获取、存贮、分析和利用生物分子信息获取、存贮、分析和利用生物分子数据10/10/9 9第9页Bioinformatics生物分子数 据 计算机计 算+10/10/1010第10页 高性能计算服务器,图形工作站高性能计算服务器,图形工作站10/10/1111第11页 高端计算集群10/10/1212第12页高度灵活高度灵活可扩展计算集群10/10/1313第13页10/10/1414第14页2、生物分子信息 细胞分子存贮、复制、传递和表示存贮、复制、传递和表示遗传信息系统遗传信息系统生物信息载体生物信息载体10/10/1515第15页生物信息学主要研究两种信息载体生物信息学主要研究两种信息载体DNADNA分子分子分子分子蛋白质分子蛋白质分子蛋白质分子蛋白质分子10/10/1616第16页10/10/1717第17页Protein Machines 10/10/1818第18页From the Cell to Protein Machines 10/10/1919第19页生物分子最少携带着三种信息生物分子最少携带着三种信息遗传信息遗传信息遗传信息遗传信息与功效相关结构信息与功效相关结构信息与功效相关结构信息与功效相关结构信息进化信息进化信息进化信息进化信息10/10/2020第20页(1)遗传信息载体遗传信息载体DNA 遗传信息载体主要是DNA 控制生物体性状基因是一系列DNA片段 生物体生长发育本质就是遗传信息传递和表示 10/10/2121第21页DNA经过自我复制,在生物体繁衍过程中传递遗传信息 基因经过转录和翻译,使遗传信息在生物个体中得以表示,并使后代表现出与亲代相同生物性状。基因控制着蛋白质合成DNARNA蛋白质转录翻译10/10/2222第22页基因DNADNA序列序列DNA前体RNAmRNA多多肽链肽链蛋白质序列对对应应关关系系遗遗传传密密码码10/10/2323第23页(2)蛋白质结构决定其功效蛋白质结构决定其功效蛋白质蛋白质功效功效取决于蛋白质空间取决于蛋白质空间结构结构 蛋白质结构决定于蛋白质蛋白质结构决定于蛋白质序列序列(这是当(这是当前基本共认假设),蛋白质结构信息隐前基本共认假设),蛋白质结构信息隐含在蛋白质序列之中。含在蛋白质序列之中。10/10/2424第24页(3)DNA分子和蛋白质分子分子和蛋白质分子都含有进化信息都含有进化信息经过比较经过比较相同蛋白质序列相同蛋白质序列,如肌红蛋白和,如肌红蛋白和血红蛋白,能够发觉因为基因复制而产生血红蛋白,能够发觉因为基因复制而产生分子进化证据。分子进化证据。经过比较来自于不一样种属同源蛋白质,经过比较来自于不一样种属同源蛋白质,即即直系同源蛋白质直系同源蛋白质,能够分析蛋白质甚至,能够分析蛋白质甚至种属之间系统发生关系,推测它们共同祖种属之间系统发生关系,推测它们共同祖先蛋白质。先蛋白质。10/10/2525第25页生物分子信息DNA序列数据蛋白质序列数据生物分子结构数据生物分子功效数据最基本直观复杂生物分子数据类型生物分子数据类型10/10/2626第26页 DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功效最基本生物信息维持生命活动机器遗传密码生命体系千姿百态改变生物分子数据及其关系生物分子数据及其关系10/10/2727第27页第一部遗传密码已被破译,但对密码转第一部遗传密码已被破译,但对密码转录过程还不清楚,对大多数录过程还不清楚,对大多数DNA非编码非编码区域功效还知之甚少区域功效还知之甚少 对于第二部密码,当前则只能用统计学对于第二部密码,当前则只能用统计学方法进行分析方法进行分析不论是第一部遗传密码,还是第二部遗不论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量生物分子数据之传密码,都隐藏在大量生物分子数据之中。中。生物分子数据是宝藏,生物信息数据库是金矿,等候我们去挖掘和利用。生物分子数据是宝藏,生物信息数据库是金矿,等候我们去挖掘和利用。10/10/2828第28页生物分子信息特征生物分子信息特征生物分子信息数据量大生物分子信息数据量大 生物分子信息复杂生物分子信息复杂 生物分子信息之间存在着亲密联络生物分子信息之间存在着亲密联络10/10/2929第29页3、生物信息学目标和任务、生物信息学目标和任务 搜集和管理生物分子数据搜集和管理生物分子数据搜集和管理生物分子数据搜集和管理生物分子数据数据分析和挖掘数据分析和挖掘数据分析和挖掘数据分析和挖掘开发分析工具和实用软件开发分析工具和实用软件开发分析工具和实用软件开发分析工具和实用软件生物分子序列比较工具生物分子序列比较工具生物分子序列比较工具生物分子序列比较工具基因识别工具基因识别工具基因识别工具基因识别工具生物分子结构预测工具生物分子结构预测工具生物分子结构预测工具生物分子结构预测工具基因表示数据分析工具基因表示数据分析工具基因表示数据分析工具基因表示数据分析工具 10/10/3030第30页 试验数据信息知识搜集表示分析建模刻画特征比较推理应用基因工程蛋白质设计疾病诊疗疾病治疗开发新药生物分子信息处理流程10/10/3131第31页分子生物学三大关键数据库分子生物学三大关键数据库 GenBank核酸序列数据库核酸序列数据库 SWISS-PROT蛋白质序列数据库蛋白质序列数据库 PDB生物大分子结构数据库生物大分子结构数据库 10/10/3232第32页数据源数据源数据源数据源数据量数据量数据量数据量生物信息学任务生物信息学任务生物信息学任务生物信息学任务DNADNA序列序列11.511.5百万条序列百万条序列125.0 125.0 亿个碱基亿个碱基 分离编码与非编分离编码与非编码区域码区域识别内含子与外识别内含子与外显子显子基因产物预测基因产物预测基因功效注释基因功效注释基因调控信息分基因调控信息分析析 蛋白质序列蛋白质序列40.040.0万条序列万条序列(每条序列(每条序列平都有平都有300300氨氨基酸基酸 )序列比较序列比较多重序列比对多重序列比对识别保守序列模识别保守序列模式式进化分析进化分析 大分子结构大分子结构1.5 1.5 万个结构万个结构(每个结构平均(每个结构平均10001000个原子坐标)个原子坐标)二级结构、空间结构预测二级结构、空间结构预测三维结构比对三维结构比对蛋白质几何学度量蛋白质几何学度量表面和形态计算表面和形态计算分子间相互作用分析分子间相互作用分析分子模拟分子模拟 基因组基因组300300个基因组个基因组 标重视复序列标重视复序列基因结构分析基因结构分析系统发生分析系统发生分析基因与疾病连锁基因与疾病连锁分析分析基因组比较基因组比较遗传语言分析遗传语言分析 基因表示基因表示酵母酵母60006000个个基因基因在约在约2020时间时间点表示值点表示值 达模式相关分析达模式相关分析基因表基因表基因调控网络分基因调控网络分析析表示调控信息分表示调控信息分析析 表1.1至初已经得到各类数据及基本数据处理任务10/10/3333第33页生物信息学研究意义生物信息学研究意义认识生物本质认识生物本质了解生物分子信息组织和结构,破译基因组信了解生物分子信息组织和结构,破译基因组信了解生物分子信息组织和结构,破译基因组信了解生物分子信息组织和结构,破译基因组信息,说明生物信息之间关系。息,说明生物信息之间关系。息,说明生物信息之间关系。息,说明生物信息之间关系。改变生物学研究方式改变生物学研究方式 改变传统研究方式,引进当代信息学方法改变传统研究方式,引进当代信息学方法改变传统研究方式,引进当代信息学方法改变传统研究方式,引进当代信息学方法在医学上主要意义在医学上主要意义为疾病诊疗和治疗提供依据为疾病诊疗和治疗提供依据为疾病诊疗和治疗提供依据为疾病诊疗和治疗提供依据为设计新药提供依据为设计新药提供依据为设计新药提供依据为设计新药提供依据生物信息学将是二十一世纪生物学核心10/10/3434第34页主要研究内容主要研究内容n n 破译遗传语言、识别基因破译遗传语言、识别基因破译遗传语言、识别基因破译遗传语言、识别基因n 预测蛋白质结构和功效预测蛋白质结构和功效预测蛋白质结构和功效预测蛋白质结构和功效n 认识生物界信息存贮和传递本质认识生物界信息存贮和传递本质认识生物界信息存贮和传递本质认识生物界信息存贮和传递本质n 研究药品作用机制和开发新药研究药品作用机制和开发新药研究药品作用机制和开发新药研究药品作用机制和开发新药10/10/3535第35页第二节第二节 生物信息学发展历史生物信息学发展历史生物信息学基本思想产生生物信息学快速发展二十世纪50年代二十世纪80-90年代生物科学和技术发展人类基因组计划推进10/10/3636第36页n2020世纪世纪世纪世纪5050年代,生物信息学开始孕育年代,生物信息学开始孕育年代,生物信息学开始孕育年代,生物信息学开始孕育n2020世纪世纪世纪世纪6060年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算 生物学和计算机科学联络起来生物学和计算机科学联络起来生物学和计算机科学联络起来生物学和计算机科学联络起来n2020世纪世纪世纪世纪7070年代,生物信息学真正开端年代,生物信息学真正开端年代,生物信息学真正开端年代,生物信息学真正开端n2020世纪世纪世纪世纪7070年代到年代到年代到年代到8080年代早期年代早期年代早期年代早期 ,出现了一系列著,出现了一系列著,出现了一系列著,出现了一系列著 名序列比较方法和生物信息分析方法名序列比较方法和生物信息分析方法名序列比较方法和生物信息分析方法名序列比较方法和生物信息分析方法 n2020世纪世纪世纪世纪8080年代以后,出现一批生物信息服务机年代以后,出现一批生物信息服务机年代以后,出现一批生物信息服务机年代以后,出现一批生物信息服务机 构和生物信息数据库构和生物信息数据库构和生物信息数据库构和生物信息数据库n2020世纪世纪世纪世纪9090年代后年代后年代后年代后 ,HGPHGP促进生物信息学快速促进生物信息学快速促进生物信息学快速促进生物信息学快速 发展发展发展发展10/10/3737第37页关于生物信息学发展历程中主要大事,关于生物信息学发展历程中主要大事,请参见下面两个网站介绍:请参见下面两个网站介绍:http:/www.ncbi.nlm.nih.gov/Education/BLASTinfo/milestones.html、http:/www.biosino.org/bioinformatics/。10/10/3838第38页生物信息学发展现实生物信息学发展现实状况状况PubMed中与生物信息学相关论文统计90002%10/10/3939第39页第三节第三节 人类基因组计划和基因组信息学人类基因组计划和基因组信息学 1 1、人类基因组计划介绍、人类基因组计划介绍 人类基因组计划准备用时间,人类基因组计划准备用时间,投入投入3030亿美元,完成人类全部亿美元,完成人类全部2424条染色体条染色体31093109脱氧核苷酸对脱氧核苷酸对(bp)(bp)序列测定,主要任务包含作序列测定,主要任务包含作图图(遗传图谱、物理图谱建立及遗传图谱、物理图谱建立及转录图谱绘制转录图谱绘制)、测序和基因识、测序和基因识别。其中还包含模型生物别。其中还包含模型生物(如大如大肠杆菌、酵母、线虫、小鼠等肠杆菌、酵母、线虫、小鼠等)基因组作图和测序,以及信息系基因组作图和测序,以及信息系统建立。作图和测序是基本任务,统建立。作图和测序是基本任务,在此基础上解读和破译生物体生在此基础上解读和破译生物体生老病死以及和疾病相关遗传信息老病死以及和疾病相关遗传信息10/10/4040第40页模式生物酵母大肠杆菌果蝇线虫老鼠10/10/4141第41页曼哈顿原子弹计划曼哈顿原子弹计划(1942-46)阿波罗登月计划阿波罗登月计划(1961-69)人类基因组计划人类基因组计划(1990-)20世纪世纪三大科学计划三大科学计划10/10/4242第42页1961年,美国总统年,美国总统Kennedy提出两个科学计划:提出两个科学计划:登月计划登月计划攻克肿瘤计划攻克肿瘤计划 人类遗传信息复杂性人类遗传信息复杂性人类基因组计划人类基因组计划(HGP,Human Genome Project)目标:整体上破解人类遗传信息奥秘目标:整体上破解人类遗传信息奥秘目标:整体上破解人类遗传信息奥秘目标:整体上破解人类遗传信息奥秘“我们选择登月我们选择登月我们选择登月我们选择登月”(1962(1962年年年年KennedyKennedy在在在在RiceRice大学演讲大学演讲大学演讲大学演讲)为何提出为何提出HGP?10/10/4343第43页 DNA:遗传物质遗传物质(遗传信息载体遗传信息载体)双螺旋结构双螺旋结构 A,C,G,T四种基本字符复杂文本四种基本字符复杂文本 基因基因(Gene):含有遗传效应:含有遗传效应DNA分子片段分子片段DNA、基因、基因组、基因、基因组10/10/4444第44页10/10/4545第45页1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列意义1986.3 杜尔贝科(Dulbecco)在Science撰文“肿瘤研究转折点:人类基因组测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨开启经费约550万美元1989 美国成立“国家人类基因组研究中心”,Watson担任第一任主任1990.10经美国国会同意,人类基因组计划正式开启James WatsonWalter GilbertHGP历史回顾历史回顾10/10/4646第46页尽管比之于人类登月,尽管比之于人类登月,HGP投入资金要投入资金要少得多,但少得多,但HGP对人类生活影响要更为对人类生活影响要更为深远深远。因为伴随这个计划完成,。因为伴随这个计划完成,DNA分分子中编码子中编码遗传信息将对人类存在化学基遗传信息将对人类存在化学基础作出最终回答础作出最终回答。这将不但帮助我们了。这将不但帮助我们了解我们是怎样作为健康人发挥正常功效,解我们是怎样作为健康人发挥正常功效,而且也将在化学水平上解释遗传因子在而且也将在化学水平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危害人类健康疾病中分裂症等一些严重危害人类健康疾病中作用。毕竟作用。毕竟对人类本身更深入了解是人对人类本身更深入了解是人类活动中最主要一个部分。类活动中最主要一个部分。Watson,1990,Science10/10/4747第47页HGP最初目标经过国际合作,用时间(19902005)最少投入30亿美元,构建详细人类基因组遗传图和物理图,确定人类DNA全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:遗传图物理图序列图基因图HGP终极目标说明人类基因组全部DNA序列;识别基因;建立储存这些信息数据库;开发数据分析工具;研究HGP实施所带来伦理、法律和社会问题。10/10/4848第48页1995第一个自由生物体流感嗜血菌(H.inf)全基因组测序完成1996完成人类基因组计划遗传作图开启模型生物基因组计划H.Inf 全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫10/10/4949第49页1997 大肠杆菌(E.coli)全基因组测序完成1998完成人类基因组计划物理作图开始人类基因组大规模测序赛立拉(Celera)企业加入,与公共领域竞争开启水稻基因组计划1999.7第5届国际公共领域人类基因组测序会议,加紧测序速度大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划10/10/5050第50页 Celera企业宣告完结果蝇基因组测序国际公共领域宣告完成第一个植物基因组拟南芥全基因组测序工作.6.26公共领域和Celera企业同时宣告完成人类基因组工作草图.2.15Nature刊文发表国际公共领域结果.2.16Science刊文发表Celera企业及其合作者结果Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥10/10/5151第51页2月15日Nature封面2月16日Science封面10/10/5252第52页At the White House on June 26,Francis Collins(r),Director of the National Human Genome Research Institute,President Clinton,and J.Craig Venter,President of Celara Genomics,lauded the thousands of scientists who contributed to the genome sequence.10/10/5353第53页10/10/5454第54页8月26日人类基因组“中国卷”绘制工作宣告完成。年水稻、小鼠、疟原虫等基因组测序完成204月14日中、美、日、德、法、英等6国科学家宣告人类基因组序列图绘制成功,人类基因组计划全部目标全部实现。2010月人类基因组完成图公布。10/10/5555第55页10/10/5656第56页10/10/5757第57页种类种类种类种类数目数目数目数目备注备注备注备注古细菌古细菌(Archaea)(Archaea)3535真细菌真细菌(Bacteria)(Bacteria)421421其中有测定了其中有测定了2 2个以上菌株个以上菌株真核生物真核生物(Eukaryo)(Eukaryo)4747包含酵母、线虫、果蝇、蚊子、包含酵母、线虫、果蝇、蚊子、拟南芥、人等拟南芥、人等病毒病毒(Virus)(Virus)1,2751,275包含不一样亚类或不一样株系包含不一样亚类或不一样株系类病毒类病毒(Viroid)(Viroid)3939包含不一样亚类或不一样株系包含不一样亚类或不一样株系噬菌体噬菌体(Phage)(Phage)347347包含不一样亚类或不一样株系包含不一样亚类或不一样株系细胞器细胞器(Organelle)(Organelle)1,0971,097包含线粒体和叶绿体包含线粒体和叶绿体质粒质粒(Plasmid)(Plasmid)480480(http:/www.ebi.ac.uk/genomes/,2月)已完成测序已完成测序3,000多个基因组多个基因组10/10/5858第58页1、大协作研究大协作研究:以学科为中心,以问题为中心,多学科合作2、研究计划性和有序性研究计划性和有序性:各方共同参加,制订更科学、更全方面研究计划4、政府与国家作用政府与国家作用:美:领导与推进英:始于1989年2月,贡献为1/3左右法:始于1990年6月,贡献为3左右日:始于1990年,贡献为7左右德:始于1995年,贡献为7左右中:始于1999年9月,贡献为1左右3、商业竞争促进基础研究商业竞争促进基础研究:1998年Celera企业加入HGPHGP研究特色研究特色研究特色研究特色10/10/5959第59页5、可连续性可连续性:太空观察和基因组计划都是科学上出众计划,每一个都是科学太空观察和基因组计划都是科学上出众计划,每一个都是科学上迈出一大步。不过二者之间存在着一个刺眼差异:开支方面上迈出一大步。不过二者之间存在着一个刺眼差异:开支方面有四十倍差异。开支差异是至关主要,因为这意味着可连续性。有四十倍差异。开支差异是至关主要,因为这意味着可连续性。当一个计划足够廉价到成为一条能够无限向未来延伸系列第一当一个计划足够廉价到成为一条能够无限向未来延伸系列第一个时,它是可连续。个时,它是可连续。而当一个计划太昂贵,以至不经过重大政而当一个计划太昂贵,以至不经过重大政治斗争就无法重复时,它就是不可连续。可连续计划带来新计治斗争就无法重复时,它就是不可连续。可连续计划带来新计划开始,不可连续计划则标志着老时代结束划开始,不可连续计划则标志着老时代结束。The Sun,the Genome,and the InternetTools of Scientific RevolutionFreeman Dyson 10/10/6060第60页各学科参加、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学HGP带来科学挑战带来科学挑战HGP:Pandoras Box 10/10/6161第61页 首要科学问题首要科学问题 怎样找到记载在基因组DNA一维结构上控制生命时间、空间调控信息编码方式和调整规律。应用数学、复杂系统理论、信息论、非线性科学催生生物信息学生物信息学、计算生物学、系统生物学计算生物学、系统生物学 DNA芯片技术芯片技术 交叉性技术领域:物理学、微电子信息技术、生化技术、信息技术 结构生物学结构生物学 前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及X射线晶体衍射技术、核磁共振技术10/10/6262第62页人类基因组计划详细任务能够概括人类基因组计划详细任务能够概括为建立四张图谱为建立四张图谱 n遗传图谱遗传图谱n物理图谱物理图谱 n序列图谱序列图谱n转录图谱转录图谱10/10/6363第63页遗传图谱(遗传图谱(遗传图谱(遗传图谱(genetic mapgenetic map)又称连锁图谱)又称连锁图谱)又称连锁图谱)又称连锁图谱(linkage map)(linkage map),它是以含有遗传多态性(在,它是以含有遗传多态性(在,它是以含有遗传多态性(在,它是以含有遗传多态性(在一个遗传位点上含有一个以上等位基因,在群一个遗传位点上含有一个以上等位基因,在群一个遗传位点上含有一个以上等位基因,在群一个遗传位点上含有一个以上等位基因,在群体中出现频率皆高于体中出现频率皆高于体中出现频率皆高于体中出现频率皆高于1%1%)遗传标识为)遗传标识为)遗传标识为)遗传标识为“路标路标路标路标”,以遗传学距离(在减数分裂事件中两个位,以遗传学距离(在减数分裂事件中两个位,以遗传学距离(在减数分裂事件中两个位,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组百分率,点之间进行交换、重组百分率,点之间进行交换、重组百分率,点之间进行交换、重组百分率,1%1%重组率称重组率称重组率称重组率称为为为为1cM1cM)为图距基因组图。遗传图谱建立为基)为图距基因组图。遗传图谱建立为基)为图距基因组图。遗传图谱建立为基)为图距基因组图。遗传图谱建立为基因识别和完成基因定位创造了条件。因识别和完成基因定位创造了条件。因识别和完成基因定位创造了条件。因识别和完成基因定位创造了条件。遗传图谱遗传图谱 10/10/6464第64页n遗遗传传连连锁锁图图:经经过过计计算算连连锁锁遗遗传传标标志志之之间间重重组组频频率率,确确定定它它们们相相对对距距离离,普普通通用用厘厘摩摩(cM,即即每每次减数分裂重组次减数分裂重组频率为频率为1%)表示。表示。10/10/6565第65页物理图谱物理图谱物理图谱(物理图谱(physical map)是指相关组成)是指相关组成基因组全部基因排列和间距信息,它是经基因组全部基因排列和间距信息,它是经过对组成基因组过对组成基因组DNA分子进行测定而绘制。分子进行测定而绘制。绘制物理图谱目标是把相关基因遗传信息绘制物理图谱目标是把相关基因遗传信息及其在每条染色体上相对位置线性而系统及其在每条染色体上相对位置线性而系统地排列出来。地排列出来。10/10/6666第66页n1998 年年完完成成了了含含有有52,000个个序序列列标标签签位位点点(STS),并并覆覆盖人类基因组大部分区域连续克隆系物理图谱。盖人类基因组大部分区域连续克隆系物理图谱。敲碎基因组,分析研究内容所处染色体位置敲碎基因组,分析研究内容所处染色体位置敲碎基因组,分析研究内容所处染色体位置敲碎基因组,分析研究内容所处染色体位置细菌人工染色体细菌人工染色体(80300 kb)酵母人工染色体酵母人工染色体(数百(数百 kb)中心粒中心粒一对紧密一对紧密相邻标志相邻标志一对相邻一对相邻较远标志较远标志染色体图染色体图10/10/6767第67页序列图谱序列图谱伴随遗传图谱和物理图谱完成,测序就成伴随遗传图谱和物理图谱完成,测序就成为重中之重工作。为重中之重工作。DNA序列分析技术是一序列分析技术是一个包含制备个包含制备DNA片段化及碱基分析、片段化及碱基分析、DNA信息翻译多阶段过程。经过测序得到基因信息翻译多阶段过程。经过测序得到基因组序列图谱组序列图谱 10/10/6868第68页大规模基因组测序大规模基因组测序 Megabace 测序仪测序仪3700 测序仪测序仪10/10/6969第69页大规模测序基本策略大规模测序基本策略n逐逐一一克克隆隆法法:对对连连续续克克隆隆系系中中排排定定BAC克克隆隆逐逐一一进进行行亚亚克克隆隆测测序序并并进进行行组组装装(国国际际合合作作测测序序计划)计划)n全全基基因因组组鸟鸟枪枪法法:在在一一定定作作图图信信息息基基础础上上,绕绕过过大大片片段段连连续续克克隆隆系系构构建建而而直直接接将将基基因因组组分分解解成成小小片片段段随随机机测测序序,利利用用超超级级计计算算机机进进行行组组装装(美国(美国Celera企业)企业)10/10/7070第70页利用计算机软件进行序列拼接利用计算机软件进行序列拼接10/10/7171第71页转录图谱转录图谱 转录图谱是在识别基因组所包含蛋白质转录图谱是在识别基因组所包含蛋白质编码序列基础上绘制结合相关基因序列、编码序列基础上绘制结合相关基因序列、位置及表示模式等信息图谱。位置及表示模式等信息图谱。10/10/7272第72页10/10/7373第73页基因识别基因识别 基因识别(基因识别(基因识别(基因识别(gene identificationgene identification)是)是)是)是HGPHGP主主主主要内容之一,其目标是识别全部人类基因。要内容之一,其目标是识别全部人类基因。要内容之一,其目标是识别全部人类基因。要内容之一,其目标是识别全部人类基因。基因识别包含:基因识别包含:基因识别包含:基因识别包含:识别基因组编码区识别基因组编码区识别基因组编码区识别基因组编码区 识别基因结构识别基因结构识别基因结构识别基因结构基因识别当前常采取有二种方法:基因识别当前常采取有二种方法:基因识别当前常采取有二种方法:基因识别当前常采取有二种方法:l l从基因组序列中识别那些转录表示从基因组序列中识别那些转录表示从基因组序列中识别那些转录表示从基因组序列中识别那些转录表示DNADNA片段片段片段片段l l从从从从cDNAcDNA文库中挑取并克隆。文库中挑取并克隆。文库中挑取并克隆。文库中挑取并克隆。10/10/7474第74页人类基因组计划实现对医学事 业影响 对致病基因克隆也是人类基因组计划内容。对致病基因克隆也是人类基因组计划内容。疾病与基因直接或间接相关,经过生物学、疾病与基因直接或间接相关,经过生物学、医学等技术对相关基因进行抑制或调控,医学等技术对相关基因进行抑制或调控,即可到达治疗某一疾病效果。即可到达治疗某一疾病效果。假如掌握了与某种疾病相关基因及突变,假如掌握了与某种疾病相关基因及突变,则能够对该疾病进行预测、诊疗,甚至治则能够对该疾病进行预测、诊疗,甚至治疗。疗。10/10/7575第75页基因变异与疾病基因变异与疾病10/10/7676第76页10/10/7777第77页人类基因组计划实施意义人类基因组计划实施意义 人类基因组计划为我们硕士物信息组织、结构、人类基因组计划为我们硕士物信息组织、结构、人类基因组计划为我们硕士物信息组织、结构、人类基因组计划为我们硕士物信息组织、结构、遗传、表示带来了极大方便,使人类对本身有一遗传、表示带来了极大方便,使人类对本身有一遗传、表示带来了极大方便,使人类对本身有一遗传、表示带来了极大方便,使人类对本身有一个根本了解。个根本了解。个根本了解。个根本了解。人类是最高级、最复杂、最主要生物,假如搞清人类是最高级、最复杂、最主要生物,假如搞清人类是最高级、最复杂、最主要生物,假如搞清人类是最高级、最复杂、最主要生物,假如搞清楚人类基因组,那么再研究其它生物就轻易得多。楚人类基因组,那么再研究其它生物就轻易得多。楚人类基因组,那么再研究其它生物就轻易得多。楚人类基因组,那么再研究其它生物就轻易得多。研究各种模式生物基因组将有利于研究地球生物研究各种模式生物基因组将有利于研究地球生物研究各种模式生物基因组将有利于研究地球生物研究各种模式生物基因组将有利于研究地球生物进化史。进化史。进化史。进化史。10/10/7878第78页5、我国对人类基因组计划贡献、我国对人类基因组计划贡献10/10/7979第79页又一次成功!又一次成功!水稻基因研究水稻基因研究10/10/8080第80页2、人类基因组计划给生物信息学提、人类基因组计划给生物信息学提出挑战出挑战伴随试验数据和可利用信息急剧增加,伴随试验数据和可利用信息急剧增加,伴随试验数据和可利用信息急剧增加,伴随试验数据和可利用信息急剧增加,信息管理和分析信息管理和分析信息管理和分析信息管理和分析成成成成为为为为HGPHGP一项主要工作一项主要工作一项主要工作一项主要工作 发觉生物学规律解读生物遗传密码认识生命本质研究基因组数据之间关系分析现有基因组数据利用数学模型和人工智能技术10/10/8181第81页10/10/8282第82页功效基因组学功效基因组学 HGPHGP完成后,我们将进入完成后,我们将进入完成后,我们将进入完成后,我们将进入“后基因组学后基因组学后基因组学后基因组学”(post-genomics)”(post-genomics)时代时代时代时代基因组学研究重心已开始从揭示生命全部遗传基因组学研究重心已开始从揭示生命全部遗传基因组学研究重心已开始从揭示生命全部遗传基因组学研究重心已开始从揭示生命全部遗传信息转移到在信息转移到在信息转移到在信息转移到在分子整体水平对功效研究分子整体水平对功效研究分子整体水平对功效研究分子整体水平对功效研究上上上上,即即即即功效基因组学(功效基因组学(功效基因组学(功效基因组学(functional genomicsfunctional genomics)功效基因组学任务是功效基因组学任务是功效基因组学任务是功效基因组学任务是进行基因组功效注释(进行基因组功效注释(进行基因组功效注释(进行基因组功效注释(Genome annotationGenome annotation)认识基因与疾病关系认识基因与疾病关系认识基因与疾病关系认识基因与疾病关系掌握基因产物及其在生命活动中作用掌握基因产物及其在生命活动中作用掌握基因产物及其在生命活动中作用掌握基因产物及其在生命活动中作用10/10/8383第83页功效基因组学研究内容功效基因组学研究内容深入识别基因,识别基因转录调控信息,分析深入识别基因,识别基因转录调控信息,分析深入识别基因,识别基因转录调控信息,分析深入识别基因,识别基因转录调控信息,分析遗传语言。遗传语言。遗传语言。遗传语言。注释全部基因产物功效,这是当前基因组功效注释全部基因产物功效,这是当前基因组功效注释全部基因产物功效,这是当前基因组功效注释全部基因产物功效,这是当前基因组功效注释主要层次。注释主要层次。注释主要层次。注释主要层次。研究基因表示调控机制,研究基因在生物体代研究基因表示调控机制,研究基因在生物体代研究基因表示调控机制,研究基因在生物体代研究基因表示调控机制,研究基因在生物体代谢路径中地位,分析基因、基因产物之间相互谢路径中地位,分析基因、基因产物之间相互谢路径中地位,分析基因、基因产物之间相互谢路径中地位,分析基因、基因产物之间相互作用关系,绘制基因调控网络图。作用关系,绘制基因调控网络图。作用关系,绘制基因调控网络图。作用关系,绘制基因调控网络图。比较基因组学研究,在基因组水平对各个生物比较基因组学研究,在基因组水平对各个生物比较基因组学研究,在基因组水平对各个生物比较基因组学研究,在基因组水平对各个生物进行对照比较,能够揭示生命起源和进化、发进行对照比较,能够揭示生命起源和进化、发进行对照比较,能够揭示生命起源和进化、发进行对照比较,能够揭示生命起源和进化、发觉蛋白质功效。觉蛋白质功效。觉蛋白质功效。觉蛋白质功效。10/10/8484第84页人类基因组与其它生物基因组比较人类基因组与其它生物基因组比较10/10/8585第85页例:人与鼠染色体差异例:人与鼠染色体差异10/10/8686第86页生物信息学与新药研制生物信息学与新药研制未来药品研究过程将是基于生物信息知识挖未来药品研究过程将是基于生物信息知识挖未来药品研究过程将是基于生物信息知识挖未来药品研究过程将是基于生物信息知识挖掘过程掘过程掘过程掘过程数据处理和关联分析发觉药品作用对象确定靶目标分子针对靶目标进行合理药品设计10/10/8787第87页生物信息学与疾病检测生物信息学与疾病检测基因组计划产生基因及基因多态性数据基因组计划产生基因及基因多态性数据与临床医学检验结果之间关系需要利用与临床医学检验结果之间关系需要利用生物信息学方法去分析、去揭示生物信息学方法去分析、去揭示依据这么分析结果,科学- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 公共课 一等奖 全国 获奖 课件
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文