评分函数在蛋白质-配体结合方面的应用研究进展.pdf
《评分函数在蛋白质-配体结合方面的应用研究进展.pdf》由会员分享,可在线阅读,更多相关《评分函数在蛋白质-配体结合方面的应用研究进展.pdf(10页珍藏版)》请在咨信网上搜索。
1、书书书第 卷第 期计算机应用与软件 年 月 评分函数在蛋白质 配体结合方面的应用研究进展曹雨康江健,刘杰,(武汉纺织大学数学与计算机学院湖北 武汉 )(武汉纺织大学数学与计算机学院非线性科学研究中心湖北 武汉 )收稿日期:。国家自然科学基金面上项目()。曹雨康,硕士生,主研领域:计算生物信息学,机器学习算法。江健,副教授。刘杰,教授。摘要评分函数作为一种计算方法,广泛应用于基于结构的药物设计中,用于评估蛋白质与配体的相互作用,但分类有些混乱。提出一种适当的分类方案及命名约定并讨论这些分类的区别与联系,有助于反映评分函数在预测蛋白质与配体结合情况这一领域的最新进展,并明确进一步的研究方向。简要介
2、绍不同类型的评分函数在蛋白质与配体相互作用中的应用情况,并对当前评分函数所存在的一些问题进行总结,从研究和应用两个方面对评分函数的发展方向进行展望。关键词评分函数蛋白质配体结合机器学习药物设计中图分类号 文献标志码 :,(,)(,),引言蛋白质与配体的相互作用存在于生物体每个细胞的生命活动过程中,是细胞中一系列重要生理活动的基础。许多生物过程中,如遗传物质复制、基因表达调控、信号转导和免疫应答等都涉及蛋白质与配体的结合。研究蛋白质与配体相互作用的方式和程度,将有助于蛋白质功能的分析、疾病致病机理的阐明和新型药物的开发等众多难题的解决。因此,研究蛋白质 配体相互作用已成为生物化学、生物物理学和分
3、子生物学研究中的核心问题之一。为了评估蛋白质与配体的结合,人们开发了各种评分函数。自 世纪 年代初以来,研究和开发评分函数成为了一个非常活跃的领域。据不完全统计,文献中公开报道的评分函数已有上百种之多,虽然发展迅猛,但是却没有形成一个合适的分类方案和命名约定。为了促进评分函数在评估蛋白质与配体这一领 计算机应用与软件 年域的良好发展以及方便初学者对该领域的学习认识,等 根据不同评分函数使用的方法和不同的推导方式,将这一领域目前存在的评分函数划分为四大类:基于物理的评分函数、实证评分函数、统计势评分函数、基于描述符的评分函数。其中:基于物理的评分函数通过计算蛋白质与配体结合时的相互作用力来进行评
4、估;实证评分函数使用多元线性回归来拟合现有数据 ;统计势评分函数可直接使用蛋白质 配体复合物的数据集,无须进一步地训练 ;最后,基于描述符的评分函数是由数据驱动的,除了描述符和机器学习算法之外,其性能很大程度上取决于训练集的好坏,可以处理大量多样化的数据 。同时文献 提出了一套评价药物 靶标亲合性评分函数性能的方法体系 (),用来帮助用户对评分函数进行合理的选择,也为发展评分函数的理论研究提供依据。本文根据这些分类方法和评价体系对目前主流的一些评分函数进行了综述性的介绍,并对评分函数当前存在的一些问题进行了总结,对未来的发展趋势进行了展望。基于物理的评分函数一开始并没有专门为评估蛋白质与配体相
5、互作用而开发的评分函数,然而由于 世纪 年代 和他同事开创性的工作,力场才被逐渐应用到模拟生物大分子中来 。研究人员因此可以利用力场来计算蛋白质与配体之间的相互作用,评分函数的概念也由此而生。由于蛋白质与配体相互作用的性质,研究者们通常利用的是力场中的非共价相互作用,包括范德华力、静电相互作用和氢键。例如 评分函数 和 评分函数 的早期版本都使用了 力场 作为评分引擎,随后这些评分函数考虑了溶剂效应对蛋白质与配体结合的影响从而得到了进一步的发展 ,而且鉴于当今计算机的强大性能,量子力学可能会取代力场在评估蛋白质与配体结合中的作用,虽然这种方法还存在很多技术难题,但在很多研究中都有了突破和进展。
6、后来 等 将这些利用现代力场、量子力学方法和溶剂效应的评分函数统一命名为基于物理的评分函数,这类评分函数大多满足如下形式:()式中:表示蛋白质与配体形成复合物的过程中结合自由能 的变化;表示范德华力;为静电相互作用;表示氢键;则表示去溶剂化能,综合起来衡量蛋白质与配体的相互作用情况。前面提到的 评分函数由 等在 年提出,他们通过计算蛋白质三维结构上各点势函数中的受体依赖项来达到评估的目的,力场在其中发挥了重要的作用。是一套分子对接软件,用于预测柔性配体与已知结构大分子的结合,同样使用力场作为评分引擎,是计算机辅助药物设计的典型例子。等 在 的基础上,引入量子化学计算得出的部分电荷数值,使新的模
7、型与 中的评分函数相比,在对接能力以及评分能力均有提高。等 曾提出过一种评分函数 ,这个函数基于一个包括范德华力、溶剂效应和氢键在内的物理相互作用模型。为了保证函数的可迁移性,他们没有使用蛋白质 配体实验数据进行参数训练,而是在诱饵识别和结合亲和力 预测方面对函数进行了测试,同时他们发现函数产生误差的原因可能是没有考虑结合时的熵损失,这也为改进函数提供了思路。文献 更加关注的是如何计算蛋白质与配体相互作用时的结合亲和力,他们基于半经验量子力学方法()设计了一个评分函数,该函数可以计算蛋白质与配体结合过程中的静电相互作用和溶剂化自由能。这个基于物理的评分函数能够计算出多种蛋白质与配体复合物结合亲
8、和力的变化趋势,除此之外还能区分出天然复合物与诱饵蛋白。等 针对小分子与已知三维结构的大分子结合模式的预测,设计了一个自动化的配体对接程序 (),利用遗传算法()进行蛋白质与配体的结合运算,结合时的蛋白质为部分柔性而配体为完全柔性。因其准确性和可靠性在分子圈内评价很高,国内许多科研单位都已引进该软件。等 则采用了一种将多个评分函数进行组合的技术,并将其应用到药物设计中,并且在命中率、假阳性率和丰富度上均有明显提高,与单个评分函数相比,这种组合技术能提供更准确的结果。与此类似的是 等 提出的将单个评分函数整合到一起用于虚拟筛选的方法,他们使用遗传算法来寻找组合评分函数。第 期曹雨康,等:评分函数
9、在蛋白质 配体结合方面的应用研究进展 实证评分函数 发表的评分函数是公认的第一个实证评分函数,如今在 这个软件中仍然可以用到这个评分函数。实证评分函数的特点在于它通过汇总许多单独的指标来评估蛋白质与配体的结合情况,每个指标都是结合过程中的一个重要因素。例如实证评分函数 便满足如下公式:()式()分为 和 两部分,为奖励分数,为惩罚分数。式中:为氢键奖励分数;为与金属离子的配位键奖励分数;为亲脂性奖励分数;为冻结的旋转键惩罚分数;为配体的内部应变能惩罚分数;为蛋白质与配体之间的空间碰撞惩罚分数;和 分别为可能存在的共价对接和约束惩罚分数。函数由这些不同的分数组合在一起得出最终的评分结果,实证评分
10、函数通常采用多元线性回归或最小二乘法来计算每个影响因素的权重。研究的评分函数 作为实证评分函数的开创性研究,只采用了 种蛋白质 配体复合物作为训练集,在如今看来可能觉得训练集较小,但是在 世纪 年代末发表的实证评分函数使用的训练集复合物数量普遍小于 ,在这种有限的数据集上很难获得鲁棒的评估模型。后来 等 在 、和 的基础上提出了一个新的实证评分函数 ,它的复杂度与 大致相同,区别在于它使用的训练集复合物数量达到了 ,而且比 拥有更多的参数以供调节,因此得到了收敛的回归模型,在蛋白质与配体结合亲和力的预测上表现更好。评分函数经过多年的发展积累了很多蛋白质 配体复合物的结合数据,如 数据库 。该数
11、据库系统地收集了蛋白质数据库中各类蛋白 配体复合物的三维结构以及亲合性实验数据,致力于提供结构信息和物理化学性质之间的联系,可以为各类分子识别的理论研究提供知识基础,在许多大学、研究所和医药公司的努力下,数据库一直在更新与发展。在实证评分函数近几年的研究中,等 提出了一种新的 ()实证评分函数,用于预估蛋白质与小分子之间的结合自由能。函数的权重系数从一个预先训练好的神经网络中推导得出,有较高的精确度。(药物的吸收、分配、代谢、排泄和毒性)药物动力学方法是当代药物设计和药物筛选中十分重要的方法,然而用这么多 性质来评估化合物的药物相似性并不容易。等 提出了一个名为 的评分函数来评估化合物的药物相
12、似性,并使用一些退出市场的药物对其进行了测试。文献 研究的 可能是目前最成熟的实证评分函数之一,其特点在于它将氢键分为中性 中性、中性 带电和带电带电三种类型,这使奖励分数与惩罚分数处理地更加细化。与传统评分函数不同,它没有直接将配体对接至已知三维结构的蛋白质上,而是近似地预测对接对象的构象、方向和空间位置,这种方法的准确度几乎是上一部分提到的自动化的配体对接程序 的两倍。后来王玮 在一次研究中发现,在成功识别蛋白质 配体复合物的晶体结合构象的前提下,对这些复合物的反向对接过程的识别率只有 ,其原因可能是 存在不同蛋白之间的噪声,在后续的研究中,他们发现引入一个以“”为核心的修正项,可将预测准
13、确率提高到 ,并将改进后的评分函数命名为 。统计势评分函数在 年 等发布的设计项目 ()中,统计势评分函数首次被提出,并在接下来的十年左右的时间里迅速普及 。这是根据蛋白质与配体的结合亲和力对已知三维结构的蛋白质 配体复合物进行排序的一种方法。这一类型的评分函数在技术层面可能有所不同,但它们遵循着相同的原则:求出蛋白质与配体之间的统计成对势 :()()式中:为配体的原子数;为蛋白质的原子数。从而达到排序的目的。()是原子对 之间的距离相关势,可以根据玻尔兹曼方程分析导出:()()()()式中:()是原子对 在距离为 时的数值密度;是原子对 在假定原子间相互作用为零的参考状态 计算机应用与软件
14、年下的数值密度;为玻尔兹曼常数;为热力学温度;()为 ()与 的比值。在这一类评分函数中,原子对相互作用的频率可认为是衡量蛋白质 配体结合情况的一个指标。如果原子对相互作用的频率比其在参考状态下的频率高,则说明给定原子对之间存在有利的相互作用,反之则说明存在不利的相互作用。统计势评分函数首次在 项目中被提出后,这一类型的评分函数的研究引起了人们的广泛关注。开发了评分函数 (),其使用蛋白质 配体复合物的结构信息来推导原子对相互作用势能。用计算出的 得分来衡量不同蛋白质 配体复合物的结合亲合力。文献 ,提出了 ,他们在文章中介绍了这个评分函数的开发和验证过程,它可以很好地区分已成功对接的蛋白质配
15、体结构和一些由计算机程序生成的偏差量较大的结构。后来在 版本中,他们对训练集进行了升级,并在 中对其进行了测试,在评分、排序和对接能力上均表现良好。等 使用一种新的迭代方法开发出一个统计势评分函数 ,中蛋白质与配体的成对统计电势来自由蛋白质数据库中的 个蛋白质 配体复合物组成的训练集,他们采用的迭代方法的基本思想是通过迭代提高成对统计电势,直到函数能正确地将训练集中的复合物结构与诱饵结构区分开。与此类似的是 等 开发了一种基于统计势的双迭代评分函数 ,用于评估 与 的相互作用。这个双迭代函数通过迭代更新势函数解决了参考状态的问题,并通过迭代解决了常规方法中依赖诱饵的问题,有助于 结构和 复合物
16、的预测和设计。等 提出了一种基于碳原子的评分函数 ,用于蛋白质模型结构的排序。等 提出的统计势评分函数 重新定义了参考状态,从而使他们能够将成对统计电势与 势()联系起来(势由蛋白质数据库中蛋白质 配体复合物的结构数据生成),通过这一方法他们推导出了 种原子对的相互作用。在此之后,等 基于两个蛋白质 配体复合物训练集,采用迭代法开发了一种基于统计势的卤键评分函数,称为 ,用来预测蛋白质与配体的相互作用。他们将蛋白质 配体复合物的结构信息转换为与原子对距离相关的成对电势,在对接、评分和排序能力上表现中等。对非共价相互作用卤键 有较好的预测效果。等 研究的一种平均力势能评分函数,也属于统计势评分函
17、数,同样用来评估蛋白质与配体的结合。他们介绍了平均力势能评分函数的背景和最新进展,并讨论了可能遇到的挑战与未来进展的方向。王希诚等 研究的一种通过计算原子对间距离来评价结合自由能的统计势评分函数,其构造方法与前面提到的平均力势能函数相似,同时采用基于信息熵的多种群自适应遗传算法,在降低了计算效率的同时,预测精度得到了提高。汪心亭 提出的一个复合的统计势评分函数 ()综合考虑了成键与非成键势能,以及依赖方位取向的相互作用和疏水相互作用,在测试中有较高的成功率。基于描述符的评分函数基于描述符的评分函数的研究开始于 年左右 ,这种方法由于研究中包含大量描述符而得名。其特点是将定量结构 活性关系(,)
18、研究方法 引入到了蛋白质与配体相互作用的评估中。自计算机辅助药物设计实现以来,研究方法便广泛应用于预测化合物的理化性质和生物活性中。这类评分函数通常使用如随机森林、贝叶斯分类器、神经网络和支持向量机在内的机器学习算法来进行变量的选择,近年来得到了蓬勃的发展 ,与实证评分函数类似,它也需要一些已知结构和结合数据的蛋白质 配体复合物的训练集来推导函数模型。但与前面三种评分函数通常为线性函数不同的是,基于描述符的评分函数由于采用了机器学习算法通常为非线性函数 。等 提出的一种基于神经网络的评分函数()便属于基于描述符的评分函数,他们建立的这个模型能够模拟大脑的微观组织,可以快速准确地预测候选配体的对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 评分 函数 蛋白质 结合 方面 应用 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。