应用文献轮廓挖掘技术分析黑斑息肉综合征差异表达基因.docx
《应用文献轮廓挖掘技术分析黑斑息肉综合征差异表达基因.docx》由会员分享,可在线阅读,更多相关《应用文献轮廓挖掘技术分析黑斑息肉综合征差异表达基因.docx(11页珍藏版)》请在咨信网上搜索。
1、应用文献轮廓挖掘技术分析黑斑息肉综合征差异表达基因【摘要】 目的探索黑斑息肉综合征(PJS)特异性相关基因。方法根据PJS基因谱表达系列,采用基于文献轮廓的数据挖掘方法,从Medline文献数据库中提取基因的相关文献并分析词的频率,再基于重复发生和共发生的过滤标准提取功能相关的词,最后基于词的发生频率对基因进行功能聚类。结果从PJS患者的特异差异表达基因谱中得到270个已知基因名称的差异表达基因,从聚类结果看,是与“遗传”和“先天缺陷”“肿瘤”“肌肉”“突变”关系密切的基因聚在一起,包括了COL6A2和COL6A3两个基因。结论COL6A2和COL6A3可能是PJS特异性相关基因。【关键词】
2、黑斑息肉综合征 微阵列 数据挖掘 生物信息学Mining Gene Expression Microarray Data of PeutzJeghers Syndrome by Literature ProfilingDai Yichen, Huang Zhongxi, Song Yugang, Xie Junpei, Zeng Weiof Gastroenterology, PLAHospital, Xiamen 361003, China;Hospital, Guangzhou 510515, ChinaAbstract: ObjectiveTo search for the studie
3、s on PeutzJeghers syndrome (PJS)related genes. MethodsPJS microarray gene expression data was mined by literature profiling. The search was based on the analysis of literature profiles generated by extracting the frequencies of certain terms from the abstracts on these different expression genes sto
4、red in the Medline literature database. Terms are then filtered on the basis of both repetitive occurrence and cooccurrence among multiple gene entries. Finally, clustering analysis with Cluster and Treeview program was performed. ResultsCOL6A2 and COL6A3 were the two novel genes related with PJS po
5、lyps. ConclusionCOL6A2 and COL6A3 genes may play an important role in the pathogenesis of PJS polyps.Key words: PeutzJeghers syndrome; microarray; literature profiling;computational biology我们应用文献轮廓挖掘技术分析PJS基因差异表达情况,揭示参与PJS形成的多个基因的功能关系以及发现特异性的相关基因,进而揭示PJS形成的可能机制。1材料和方法11获取差异表达基因把资料完整地入选病例分为大肠腺瘤组、PJS大
6、肠息肉组和正常大肠黏膜对照组。大肠镜检查术中留取的新鲜组织标本液氮冻存备用,按Trizol 一步法提取样品组织总RNA,经质量检测后,将各组的RNA样品等量混合,进行反转录荧光标记,用Cy3dUTP标记大肠腺瘤组和大肠PJS息肉组的cDNA,用Cy5dUTP标记正常大肠黏膜组的cDNA。将已标记的样品cDNA探针与深圳微芯生物公司提供的含有8 064个人类靶基因的基因表达谱芯片进行杂交,经清洗、扫描仪扫描荧光图像、提取杂交信号,经转换后以数据形式输出,对数据进行标准化处理后用生物信息学软件进行生物信息学分析。以芯片中密度值在5108以上的数据点为有效数据,同时把比值2或的数据点作为存在显着性表
7、达差异基因点的筛选标准,筛选各组间差异表达的基因。根据差异表达基因的筛选标准,选取已知基因名称的差异表达基因。大肠PJS息肉特异性表达变化的基因有270个,其中已知基因259个,EST 11个。获取基因的相关摘要通过检索在PUBMED文献中那些在标题中包含基因的官方名称、缩写或别称的条目来获取基因的相关文献。如果检索到的文献不足5篇, 则需进一步扩展到摘要中包含基因名称的条目,甚至用基因家族名称代替基因名称。基因命名的信息从人类基因命名委员会的网站和NCBI的Locuslink的网站上获取。由于相当大量的文献并不遵守官方命名,因此一方面会存在漏检现象,另一方面则出现假阳性。为了避免过高的假阳性
8、,有必要快速浏览搜索结果以便发现并删除不恰当的检索字符串。文字分析选择XML的输出格式后,点击工具条的保存按钮就可以将查询结果保存下来。摘要从输出文件中抽取来,并保存在一个新文件中,并且一篇摘要保存一行。用Montreal公司的Provalis Research软件的Wordstat模块的“文本转换魔术师”对每个文件进行格式转化。再用simstat模块打开并用“内容分析”的统计方法进行分析。输出选择词的类别百分比。数据过滤在分析的文献中发现的每一个特定词都赋予一个发生频率值,这样每一个基因都有好几万条记录。这些词当中大多数要么是普遍存在的,要么是极罕见的,因此对于定义基因特异性词的发生轮廓没有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 文献 轮廓 挖掘 技术 分析 黑斑 息肉 综合征 差异 表达 基因
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。