概述化学信息学相关概念省公共课一等奖全国赛课获奖课件.pptx
《概述化学信息学相关概念省公共课一等奖全国赛课获奖课件.pptx》由会员分享,可在线阅读,更多相关《概述化学信息学相关概念省公共课一等奖全国赛课获奖课件.pptx(46页珍藏版)》请在咨信网上搜索。
1、化学信息和化学信息学化学信息和化学信息学 自从化学学科出现以来,信息记载、组织与交流对化学学科发展起了主要作用,同时也成为化学学科一个主要组成部分。这是因为化学试验统计资料含有久远时间意义。在化学学科中,化学家依据百年以前统计资料从事科学研究例子并不罕见。另外,化学物质结构统计与检索需要建立独特统计系统。伴随计算机技术发展,化学家必须建立自己信息表示、统计与管理系统,以适应时代要求。第1页化学信息化学信息化学信息可分为两大组成部分:化学物质化学信息化学物质化学信息:利用科学原理和方法经过测量得到化学成份相关信息,如物质物理、化学性质,物质中各成份定性、定量以及结构信息,分子间相互作用信息,化学
2、反应信息等。媒体形式化学信息媒体形式化学信息:化学信息统计形式,如图书、期刊、专刊、专利、数据库以及音像资料等,经过化学信息传输使化学家们共享测量原理、方法及测量结果。化学信息学是近年来发展起来新学科,它产生与发展是基于化学信息量指数般增加,尤其是组合化学及高通量筛选快速发展。化学信息学产生与发展是与药品研究与开发息息相关,但它应用却覆盖化学学科各个领域,如农业化学、分析化学、合成化学、物理化学等。近年来,国际上已出版与化学信息学相关杂志,出现众多化学信息学企业,许多大学纷纷开设化学信息学课程,培养化学信息学人才。第2页1.1 化学信息学起源及历史化学信息学起源及历史1.1.1 信息学起源信息
3、学起源上世纪40年代,以申农(CEShannon)通讯数学理论、维纳(NWeiner)控制论动物和机器中通讯与控制问题问世为标志,信息论诞生了,它是科学发展史上里程碑,其伟大贡献和深远影响是前所未有。1959年,美国宾夕法尼亚大学莫尔电子工程学院首先应用了“信息科学”概念,这一概念既包含了信息理论又包含了信息技术。出现了:以计算机为代表“计算机信息科学”;以文件处理自动化为代表“图书馆信息科学”和以申农通讯信号计量理论为关键“全信息信息科学”。三者共同特征是:仅研究特定领域中一些信息,对其它领域中信息不予充分关注与考虑。上世纪60年代初,以申农信息论为基础信息科学得到了一定发展,新概念和新理论
4、不停涌现。第3页20世纪80年代以来,在申农原有信息论基础上分别在含糊信息、概率与非概率信息、语法信息、语义信息、语用信息等方面做了大量工作。在此基础上,人们提出了广义信息论。1982年美国普林斯顿大学马克卢普(FMchlup)在美国聚集了当初不一样信息研究领域众多学者发起了一个信息多学科交叉研究运动,信息理论研究开始向其它科学领域渗透和扩展,诞生了40各种部门信息学,并发表了继申农、维纳之后又一本经典著作信息研究:学科之间通讯。1994年,德国一批学者又发起了一个新交叉信息科学研究运动,开拓了部门信息学一些新领域。即使,研究范围愈加广泛,不过,并没有做出实质性评论与创新性理论。90年代后期,
5、部门信息学得到了蓬勃发展,除了增加了新组员,而且,关涉到了自然科学和社会科学众多前沿问题。其中较有影响部门学科是:生物信息学,物理信息学,还有经济信息学,人类信息学等等。据统计当前大约已经有50余种部门信息学。第4页1.1.2 化学信息学起源与历史化学信息学起源与历史 20世纪60年代以来,计算机与化学结合形成了计算机化学。经过近40年发展,计算机化学几乎在化学每一分支领域都取得了丰硕结果,计算机已成为化学研究主要工具之一。20世纪80年代以来,Internet飞速发展,逐步成为各种信息资源传递主要载体,包含基于化学信息网站、化学信息数据库、远程化学教学等内容化学信息网络化趋势也日趋形成。化学
6、与internet成为一个非常活跃、进展惊人新兴交叉领域。伴随计算机化学不停发展和化学信息网络化不停普及,一个崭新化学分支学科“化学信息学(Chemoinfiormatics)”应运而生。“化学信息学”首次出现于1987年诺贝尔化学奖取得者J.M.Lehn教授获奖汇报中。JMLehn在研究复杂分子反应过程中发觉分子含有自组织、自识别化学智能反应现象,识别概念包含着信息展示、传递、判别和响应等过程,这就是化学信息学研究开始。第5页化学界教授学者们正试图以新方式和方法建立化学信息周期表。国外一些大学开设了化学信息学课程并确定为硕士研究方向,从事研究、管理和开发化学信息团体、机构和企业也相继出现。美
7、国化学会化学信息分会和图书馆协会在Indiana大学成立了化学信息教学资料交换中心(The Clearinghouse for Chemical Information Instructional Materials(CCIIM)),负责搜集、公布和分发化学信息源。美国化学会还设置了化学信息教育委员会(American Chemical Society Division of Chemical Information Education Committee)。美国、欧洲、澳大利亚很多大学开设了化学信息学类课程。在国内,化学教学指导委员会已将化学信息学列入化学教学基本内容,北京大学化学学院已设置
8、课程并编写了讲义,南京大学、复旦大学及我校等高校也相继开设了该课程。第6页1.2 化学信息学概念及研究内容化学信息学概念及研究内容1.2.1 化学信息学概念化学信息学概念 1987年J.M.Lehn教授首次提出化学信息学概念以后并没有深入深入研究这一概念本质,但我们能够看出,当初化学信息内在含义应为分子间相互作用或相互识别相关信息,而化学信息学应为研究分子间相互作用实质或识别机理一个学科,主要目标是为解释超分子形成过程提供依据。当前化学信息学内容愈加强调了化学文件、化学信息数据库、尤其是Internet中化学资源等内容。第7页 化学信息学还没有统一被广泛接收定义及英文名称。当前最 通 用 为
9、Chemoinformatics及 Chemical informatics。也 有 用Cheminformatics,Chemi informatics。也有些人把Chemical information Science及Molecular Informatics称为化学信息学。与化学信息学相关术语有 chemi-informatics,chemometrics,computational chemistry,chemical informatics,chemical information management/science,和cheminformatics等等。美国印第安那大学(Ind
10、iana University)在国际上最早在化学图书馆科学基础上开设化学信息课程及培养化学信息学硕士,他们把化学信息学定义为:化学信息学包含从利用传统图书馆科学方法组织化学信息到利用当代计算机技术产生、存放、检索及可视化化学信息。第8页定定义义1:Frank Brown于1998年把化学信息学定义为:应用信息技术和信息处理方法已成为药品发觉过程中一个很主要部分,化学信息学实际上是一个信息源混合体。把各种化学数据转化为信息,把信息提升为知识,其主要目标是在药品先导化合物发觉及组织过程变得更有效。这个定义太偏重于药品化学,实际上,化学信息学在其它领域如农业化学也有广泛应用。(“The use o
11、f information technology and management has become a critical part of the drug discovery process.Chemoinformatics is the mixing of those information resources to transform data into information and information into knowledge for the intended purpose of making better decisions faster in the area of d
12、rug lead identification and organization”F.Brown,Annual Reports in Medicinal Chemistry,33,375-384(1998)第9页 定定义义2:M.Hann 和R.Green 认为化学信息学是处理化学老问题一个新名称(“Chemoinformatics-a new name for an old problem”,Current Opinion in Chemical Biology,3,379-383(1999))。定定义义3:Greg Paris在1999年8月ACS会议上提出了一个更普通性定义,他认为:化学
13、信息学是个普通术语,它包含化学信息设计、建立、组织、管理、检索、分析、判别、可视化及使用。(“Chem(o)informatics is a generic term that encompasses the design,creation,organization,management,retrieval,analysis,dissemination,visualization and use of chemical information”G.Paris(August 1999 ACS meeting)。第10页 定定义义4:将计算机技术应用到化学中一门组合技术,利用统计模 型、计 算 和
14、 分 析 科 学 来 了 解 化 学 数 据 主 要 性(“Chemoinformatics is the application of computer technology to chemistry;a combination of techniques and models in statistical,computational,and analytical sciences to understand the significance of chemical data.”)。定定义义5:“化学信息学是近几年发展起来一个新化学分支,它利用计算机和计算机网络技术,对化学信息进行表示、管理
15、、分析、模拟和传输,以实现化学信息提取、转化与共享,揭示化学信息内在实质与内在联络,促进化学学科知识创新。”化学信息学是化学学科分支学科,其研究对象和研究目标均属于化学学科领域。它研究伎俩为计算机技术和计算机网络技术,研究内容则包含怎样利用计算机和计算机网络技术对化学信息进行表示、管理、分析、模拟和传输等。同时,化学信息学目标是为了实现化学信息提取、转化以及化学家之间资源共享,从而为促进化学学科发展与知识创新做出贡献。第11页1.2.2 化学信息学研究内容化学信息学研究内容(1)化学信息组织、管理、检索和使用化学信息组织、管理、检索和使用:化学信息可分为与传媒相关信息(如文件、图书资料、网络信
16、息等)及与物质相关信息(各种试验数据,包含化学反应相关数据,谱学数据,射线晶体学数据,化学与物理性质数据,毒性及生物活性数据,与环境相关数据等)。化学信息形式包含:文字、符号、数字、形貌、图形及表格等。这些化学信息最主要组织、管理形式是形成数据库数据库。最早化学数据库是各种谱学数据库及剑桥晶体结构数据库。当前最完善化学信息系统是MDL系统、Beilstein系统及CA系统。据统计当前化学信息中58%已经组织为各种数据库系统,但其中只有12%能够相互转换,而化学信息经常是需要结合使用,要完成一项化学研究工作需要调用各种相关数据库。第12页 化学信息学主要内容之一是怎样实现化学信息间关联及转化。化
17、学信息管理、检索及使用包含化学信息快速有效检索及推理、判断。主要包括人工智能方法,最主要是化化学学教教授授系系统统。一个教授系统包含化学知识信息处理,化学知识利用系统、知识推理能力及咨询解释能力。20世纪60年代开发化学教授系统DENDRAL系统是最早教授系统。当前已经有各种化学教授系统用于不一样目标,如图谱解析教授系统、反应路线设计教授系统等。(2)分分子子结结构构编编码码、描描述述、三三维维结结构构构构建建:巨大数目分子结构编码及三维结构模型构建及各种形式结构表示,并能快速连接到合成路线,谱学数据,纯化技术等是化学信息学基础工作。第13页(3)化化学学信信息息加加工工、处处理理及及深深化化
18、:化学信息加工处理包含数据预处理,回归分析,主成份分析,偏最小二乘,信号分析,模式识别,神经网络,遗传算法,含糊及随机算法等。它们能够帮助化学家正确分析、评价、利用现有化学信息并从中获取最大量有用结果,实现从数据到信息,从信息到知识转换。计算机模拟技术包含量子化学、分子动力学、蒙特卡罗方法及各种优化技术,近年来已取得重大进展,在药品开发,功效材料研制及生命科学领域都取得许多突破性结果。化学体系包括分子、超分子、超分子聚集体及聚集态等。在不一样尺度及层次化学体系会表现出不一样性质,称尺度效应。过去化学家主要着眼于微观体系,化学工程学家主要关注宏观体系,对于联络宏观与微观介观体系没有受到应有重视,
19、所以相关介观体系信息及多尺度研究也应是化学信息学关注主要问题。第14页(4)计算组合化学计算组合化学:组合化学是当前化学家关注热门领域。它特点是以比较短时间及较少经费为快速合成大量化合物提供大量化学信息。但它面临组合数目过大,所谓组合爆炸,如此巨大数目标组合化学合成仍需要消耗大量人力与物力,万一失败就造成巨大浪费,所以需要经过计算组合化学方法建立虚拟组合化学库,然后在计算机上进行筛选,选择较少数目化合物进行组合化学合成。虚拟库构建要考虑分子相同性及差异性。虚拟库筛选包含基于靶酶结构利用分子对接方法进行筛选,或利用神经网络方法把已成药化合物作为训练集,把虚拟组合化学库作为预测集,把化合物区分为类
20、药分子(Drug Like)及非成药分子(Non Drug compounds)。一个组合化学计算机系统应包含组合合成库设计,高维化学空间差异性质计算及影射,化学反应数据库系统和知识库系统,综合性化学多样性信息及生物试验数据管理系统,分子对接及构效关系研究等。第15页(5)化学体系中信息交换及传递化学体系中信息交换及传递:诺贝尔奖金取得者Lehn在1987年诺贝尔获奖演说中提出信息化学(Semiochemistry)概念。他认为化学信息寓于分子中,在分子间相互作用时读出化学信息,这些化学信息对于化学反应及性能起着调控作用。这方面研究包括分子识别、超分子建筑、分子结构学、晶体工程、分子器件等方面
21、内容。但当前在国外文件中较少有些人把这方面内容纳入化学信息学范围。第16页(6)分分子子物物理理化化学学性性质质预预测测:当前已合成化合物数目已超出5107个,而虚拟组合化学库化合物数目可达亿万个。如此巨大数目标化合物无法全部完成它们物理化学性质试验测定,所以依据化合物结构预测化合物性质有主要意义和价值。利用量子化学及分子力学方法可预测许多主要分子性质,如:键长、键角、二面角、三维结构、药效构象、反应中间体、过渡态、电子性质、电荷分布、偶极矩、离子化势、电子亲和性、质子亲和性、极化、静电势、分子间相互作用、Wood World Hoffman规则、结合能、大分子间结合位点、pKa、分子能量、生
22、成热、焓、活化能、势能面、反应路径、溶剂化能、光谱性质、振动频率、红外及拉曼强度、ESR常数、激活能、消光系数、传输性质、亲脂性、分子体积、分子表面积等等。第17页1.3 化学信息学惯用方法化学信息学惯用方法 最早化学信息学方法和应用都是发表在美国Journal of Chemical Information&Computer Science(Journal of Chemical Information and modeling)杂志上。化学信息学研究最早内容之一是象结构描述符一类化学结构计算机表示。1.3.1 描述符和化学结构数据库获取描述符和化学结构数据库获取 20世纪80年代以前,计算
23、机速度较慢,对化合物结构和子结构搜寻是一个极难问题,因为它们计算量都很大。为了找到在较慢计算机上能够进行化合物结构和子结构搜索非常切实可行方法,化学家们尝试了许多方法方便能够找到一个简练结构表示方法,如结构线性表示等。这种方法将化合物结构图转化成计算机很轻易识别和搜索字符串。数据搜索方法能够过滤掉许多不符合条件化合物,然后在小范围里再依据逐一原子搜索方法就会将搜寻化合物缩小到一定范围。第18页1.3.1.1 线性符号线性符号 结构线性符号在一系列规则下将化学结构连接表转化为含有一定序列字符串。最早线性符号是Wiswesser 线性符号(WLN)。在上世纪60年代中期到80年代,WLN被认为是最
24、好表示化学结构工具。即使WLN很有效压缩了化学结构数据,而且非常适合低性能计算机存放和搜索,不过,它编码让非专业人员极难看懂。以后Weininger又提出了一个新线性符号编码系统SMILES。因为SMILES和自然语言很靠近,所以有机化学家广泛应用该方法建立化学结构数据库。要想成功地表示化学结构,线性符号必须含有唯一性,即线性符号和化学结构之间必须是一一对应关系,WLN和SMILES就含有这么特点。第19页1.3.1.2 规范化规范化 WLN和SMILES都能够经过字符串匹配方法处理结构搜索问题。一个分子2D结构图能够经过数学算法规范化地变成一个实数,这些实数就被称为分子拓扑指数。不过两个不一
25、样分子可能含有相同拓扑指数,所以,拓扑指数只能用于对分子筛选。拓扑指数概念最早是在QSAR和QSPR研究中提出。Wiener在1947年第一个报导了分子拓扑指数。假如分子和拓扑指数之间是一一对应关系,那么结构搜索就能够经过数据比较来完成。不过,子结构搜索依然要经过一个一个原子匹配算法来进行,这么就非常耗时。为了增强化学数据库搜索功效,必须要找到很好结构筛选技术。第20页1.3.1.3 筛选与搜索筛选与搜索 为了防止使用逐一原子匹配,当前大都使用筛选方法。这种方法思绪是先定义一组子结构(官能团),用来过滤掉一些不可能结构。这些预先定义结构叫做搜索关键词。当前这些关键词都被MDL结构数据库系统搜集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概述 化学 信息学 相关 概念 公共课 一等奖 全国 获奖 课件
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。