嗜热毛壳菌基因组密码子偏好性研究_戴明丹.pdf
《嗜热毛壳菌基因组密码子偏好性研究_戴明丹.pdf》由会员分享,可在线阅读,更多相关《嗜热毛壳菌基因组密码子偏好性研究_戴明丹.pdf(14页珍藏版)》请在咨信网上搜索。
1、Research paper 研究论文 22 March 2023,42(3):745-758 菌物学报 Mycosystema ISSN1672-6472 CN11-5180/Q Doi:10.13346/j.mycosystema.220369 资助项目:国家自然科学基金(31800060);福建省自然科学基金(2019I0009,2020J01177)This work was supported by the National Natural Science Foundation of China(31800060)and the Natural Science Foundation
2、of Fujian Province,China(2019I0009,2020J01177).*Corresponding author.E-mail: Received:2022-09-28;Accepted:2022-10-24 Copyright 2023 Institute of Microbiology,CAS.All rights reserved.| Http:/journals- Tel:+86-10-64807521 菌物学报 745 嗜热毛壳菌基因组密码子偏好性研究 戴明丹,秦丽娜,江贤章*福建师范大学生命科学学院 工业微生物发酵技术国家地方联合工程研究中心,福建 福州 3
3、50000 摘 要:嗜热毛壳菌具有强大的木质纤维素降解能力,将其开发为优异的重组蛋白表达宿主有着广阔的应用前景。蛋白表达宿主的密码子偏好性对重组蛋白的表达水平具有重大影响。为确定嗜热毛壳菌中密码子的使用模式及影响因素,本研究以 6 897 条 CDS 序列为对象,对其进行密码子偏好性分析。结果显示,嗜热毛壳菌中GC3的平均含量为66.2%,高于GC1(59.1%)和GC2(45.6%)的平均含量。Effective number of codon(ENC)分析与中性绘图分析结果显示,自然选择是影响嗜热毛壳菌密码子偏好性的主要因素。相关性分析结果显示,芳香族氨基酸比例与 GC1 含量及蛋白疏水水
4、平呈极显著相关,说明密码子第一位的碱基组成对氨基酸是否具有芳香性影响较大。此外,在嗜热毛壳菌使用频率较高的密码子中,有 24 个以 G/C 末端结尾的密码子,进一步确定了 23 个高表达优越密码子和 1 个高表达最优密码子(CGC)。通过与其他模式真菌的密码子偏好性进行比较发现:与嗜热毛壳菌在密码子使用频率上差异较小的为嗜热毁丝菌、粗糙脉孢霉,有显著差异的为酿酒酵母。本研究为在嗜热毛壳菌中异源表达重组蛋白提供了目标基因密码子优化的理论依据,为嗜热毛壳菌在基因组水平上的应用和研究提供了数据支撑,有助于开发高效嗜热丝状真菌表达系统应用于工业酶制剂的生产。关键词:嗜热毛壳菌;密码子偏好性;相对同义密
5、码子使用度;最优密码子 引用本文 戴明丹,秦丽娜,江贤章,2023.嗜热毛壳菌基因组密码子偏好性研究.菌物学报,42(3):745-758 Dai MD,Qin LN,Jiang XZ,2023.Analysis of codon usage bias in the genome of Chaetomium thermophilum.Mycosystema,42(3):745-758 戴明丹 等/嗜热毛壳菌基因组密码子偏好性研究 研究论文 菌物学报 746 Analysis of codon usage bias in the genome of Chaetomium thermophilum
6、 DAI Mingdan,QIN Lina,JIANG Xianzhang*National Joint Engineering Research Center of Industrial Microbiology and Fermentation Technology,College of Life Sciences,Fujian Normal University,Fuzhou 350000,Fujian,China Abstract:Chaetomium thermophilum has strong lignocellulose degradation ability,having b
7、road application prospects to be developed as an excellent host for recombinant protein expression.The codon bias of the protein expression host significantly impact the expression level of recombinant proteins.In this study,the codon usage pattern of C.thermophilum genome was elucidated by analyzin
8、g 6 897 CDS sequences.The results showed that the average content of GC3 in C.thermophilum was 66.2%,which was higher than the average content of GC1(59.1%)and GC2(45.6%).Effective number of codon(ENC)-plot analysis and neutral analysis demonstrated that natural selection pressure was the main facto
9、r affecting codon usage bias of C.thermophilum.Further analysis showed that the rate of aromatic amino acids was significantly correlated with the GC1 content and protein hydrophobicity,indicating that the base composition of the first codon greatly influenced the aromatization of amino acid.Among t
10、he frequently used codons in C.thermophilum,there were 24 codons ending in the G/C terminus,of which 23 codons are superior for high expression and 1 is optimal for high expression.In comparison with the codon usage bias of other model fungi,it was found that the codon usage bias of C.thermophilum w
11、as close to that of Myceliophthora thermophila and Neurospora crassa,but was significantly different from that of Saccharomyces cerevisiae.This study provided a theoretical basis for the codon optimization of target genes for heterologous expression of recombinant proteins in C.thermophilum,supporti
12、ng the application and research at the genomic level of C.thermophilum.It is helpful to develop an excellent expression system of thermophilic filamentous fungi in application to the production of industrial enzyme preparations.Keywords:Chaetomium thermophilum;codon usage bias;relative synonymous co
13、don usage;optimal codons 嗜热毛壳菌 Chaetomium thermophilum 是一种嗜热真菌,它的生长温度可高至 60 (Lamosa et al.2000),可生产多种耐热型纤维素水解酶,具有成为工业纤维素酶生产菌株的潜力(Heinzelman et al.2009)。与大多数真菌相比,嗜热毛壳菌产生的纤维素酶酶活力高、稳定性强且不易退化(Bock et al.2014)。在本实验室前期研究中发现,与工业应用菌株嗜热毁丝霉菌以及里氏木霉 Qm6a 相比,嗜热毛壳菌中具有优良的酶资源,其胞外蛋白表达量与分泌量相对较高。同时其纤维素酶酶活均高于嗜热毁丝霉菌及Qm6
14、a,具有较强的木质纤维素降解能力(张正盈2021)。而且,嗜热毛壳菌的发酵温度通常高于50,可以有效降低发酵反应器中其他微生物物种的污染。另外,其分泌的酶有很好的耐热性,在多步反应过程中,可以显著增强生物质多糖糖化的效率。目前嗜热毛壳菌的遗传操作体系已成熟(Kellner et al.2016),在嗜热毛壳菌中挖掘优Research paper 22 March 2023,42(3):745-758 Mycosystema ISSN1672-6472 CN11-5180/Q 菌物学报 747 良酶资源或对其进行遗传改造,有希望将其开发为高效蛋白表达宿主,具有良好的工业前景和科学应用价值。密码子
15、(codon),即信使 RNA 链上决定 1 个氨基酸的相邻的 3 个碱基,亦称三联体密码(刘洋等 2021)。在常见的 20 种氨基酸中,除色氨酸(Trp)和蛋氨酸(Met)具有单一密码子外,其余氨基酸均由 26 种同义密码子编码(胡晓艳等2019)。密码子使用偏性(codon usage bias,CUB)是指同义密码子在不受其他压力因素影响时会以相同的概率出现,而受到影响后同义密码子会出现偏性使用的现象。该现象与 DNA 转录和蛋白质翻译相关联,广泛存在于生物中(Hershberg&Petrov 2008)。对于亲缘关系或生存关系密切的物种,也可能使用类似的密码子选择方法(Romero
16、et al.2000)。在蛋白质翻译过程中,密码子使用模式会对基因的表达产生一定的影响(Zhou et al.2016)。同时,密码子的使用控制翻译延伸速率和共翻译蛋白质折叠过程被证明是蛋白质表达水平的重要决定因素。首选密码子可以提高翻译延伸速率,而非最佳密码子会降低翻译延伸速率(Yang et al.2021)。开放阅读框内的高 GC 含量与密码子最优性相关,可增强转录。目前,对于密码子偏性的研究主要集中于一些模式物种中,如真菌酿酒酵母、植物拟南芥等(Sharp et al.1988;Chiapello et al.1998),而对于嗜热丝状真菌的研究较少。与大多数嗜热真菌相比,嗜热毛壳菌具
17、有基因组序列草图,且其基因组已被注释,以便对嗜热毛壳菌进行生物信息学分析(Ter-Hovhannisyan et al.2008)。本研究以嗜热毛壳菌基因组全序列为研究对象,对嗜热毛壳菌的密码子偏好性进行了研究,明确了密码子偏好的影响因素。本研究结果为进一步揭示该物种的分子进化机制提供了依据,有助于将嗜热毛壳菌开发为工业产纤维素酶耐热菌株,为通过密码子优化增强嗜热毛壳菌外源基因表达水平提供了理论依据。1 材料与方法材料与方法 1.1 材料 嗜热毛壳菌 Chaetomium thermophilum var.thermophilum DSM 1495 基因组数据来自 NCBI(美国国家生物信息中
18、心,https:/www.ncbi.nlm.nih.gov/)公共数据库,基因组项目编号为 ADUW01(Amlacher et al.2011;Bock et al.2014)。所用的软件包括:galaxy 生物信息学分析平台(https:/usegalaxy.org/)中的 fasta statistics 统计嗜热毛壳菌 DSM 1 495 基因组、filter sequences by length 筛选 CDS 序列、cusp 分析密码子的 GC含量;使用 Python 3.9 中的 biopython-1.79 模块处理序列;对各个 CDS 密码子的分析使用CodonW 1.4.2
19、 软件;使用 Origin 9.0 完成数据的统计与制图。1.2 方法 1.2.1 基因的选择 在 NCBI 数据库中下载 CDS 序列,为提高密码子偏好性分析的准确性,将序列长度过短以及重复序列剔除(何亚玲等 2022),利用 galaxy的 filter sequences by length 脚本过滤长度小于300 bp(选择长度300 bp)的 CDS(Rosenberg et al.2003),最终收集 6 897 条 CDS 序列以供进一步分析。1.2.2 GC 含量统计 各基因 GC 总含量以及密码子的第 1、2 和3位碱基为G或C的含量比例通过galaxy的cusp脚本进行统计
20、分析,分别记为 GC、GC1、GC2和 GC3。其中对于密码子使用偏好性具有重要影响的为 GC3。1.2.3 中性绘图分析 中性绘图分析可初步分析密码子偏好性的影响因素(李江平等 2019)。本研究对密码子每个位置的 GC 含量进行统计,分别用 GC1、GC2及 GC3 表示密码子第 1、2 和 3 位的 GC 含量。以 GC3 为横坐标,GC12(GC1 和 GC2 的平均值)戴明丹 等/嗜热毛壳菌基因组密码子偏好性研究 研究论文 菌物学报 748 为纵坐标制作散点图,绘制回归曲线。突变对密码子使用偏好的影响程度由回归曲线的斜率表示。如果 GC12 与 GC3 相关性显著,其斜率接近 1,表
21、示密码子 3 个位置的碱基组成相似,说明突变是决定密码子偏好性的重要因素;若相关性不显著,其斜率接近 0,说明密码子第 1、2 位和第 3 位碱基组成存在一定的差异,自然选择对密码子使用偏好有较大影响(Chakraborty et al.2019)。1.2.4 ENC-plot 分析 有效密码子数(effective number of codon,ENC)是指基因中使用的有效密码子的数量,该值反映同义密码子非均衡使用的偏好程度,理论范围为 2160,如果数值接近 20,说明密码子受突变的影响较大,否则就意味着选择对密码子有较大影响(Majeed et al.2020)。其标准曲线公式为 EN
22、C=2+GC3+29/GC32+(1GC3)2(Ikemura 1981)。以 GC3(同义密码子第 3 位 GC 总含量,反映定向突变的强度)为横坐标,ENC 值为纵坐标,绘制了 ENC-plot 二维散点图。标准曲线可以显示出在无选择压力时ENC及GC3之间的相关性,若基因位点落在标准曲线或其附近,则突变是影响密码子使用偏好性的主要因素;若基因位点比标准曲线低,其他因素也会影响密码子偏好性,如自然选择(唐晓芬等 2013)。1.2.5 相关性分析 通过多元统计分析来探索变量和样本之间的关系。使用 Pearson 相关系数法对各参数进行相关性分析(刘兴跃等 2022)。采用双尾检测实验对相关
23、系数的显著性进行分析,并研究样本所有变量之间的相关性,揭示密码子使用规律的主要影响因素(Liu et al.2010)。1.2.6 PR2-plot 分析 奇偶偏好性分析(parity rule 2 plot,PR2-plot)是以 G3/(G3+C3)、A3/(A3+T3)为横纵坐标绘制散点图(Sueoka 1999)。从图中 A、T、G、C 的比例可以推测出碱基突变对密码子偏好性的影响程度。如果偏好性只受到突变的影响,那么A/T和G/C在密码子第3位碱基的使用频率是相同的,即 A=T/G=C,否则可能会受到自然选择及其他因素影响(Sueoka 2001)。1.2.7 相对同义密码子使用分析
24、 使用 CodonW 软件对相对同义密码子使用度(relative synonymous codon usage,RSCU)进行分析。RSCU 的计算方法为某一密码子所使用的频率与该密码子所编码的氨基酸的所有密码子平均使用次数之比(Sharp&Li 1987),是一种有效反映密码子偏好性程度的指标(Shields&Sharp 1987)。若 RSCU1,则表明该密码子为使用较频繁的密码子,若密码子使用无偏好,该密码子的 RSCU=1。1.2.8 高表达密码子的确定 ENC 代表某个基因使用密码子的偏好程度,取值范围 2061,内源基因表达量的相对高低可通过比较 ENC 值确定,通常高表达基因的
25、密码子偏好程度越高,其 ENC 值越低。所以根据 ENC 值大小,前后各选取 10%的基因构建高低偏好性库(吴宪明等 2007)。其中高表达密码子为RSCU0.08(高、低两组相减所得的RSCU值)的密码子。1.2.9 与其他真菌密码子偏好性比较 利用 CodonW 分别计算嗜热毛壳菌及其同属的嗜热毁丝霉菌 Myceliophthora thermophile(Berka et al.2011)、丝状模式真菌粗糙脉孢霉Neurospora crassa OR74A(Galagan et al.2003)和模式真菌酿酒酵母 Saccharomyces cerevisiae(Goffeau et
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嗜热毛壳菌 基因组 密码子 偏好 研究 戴明丹
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。