JACUSA说明书.doc
《JACUSA说明书.doc》由会员分享,可在线阅读,更多相关《JACUSA说明书.doc(6页珍藏版)》请在咨信网上搜索。
1、JACUSA说明书版本1.21. 介绍正确的SNV预测的JAVA构架是一个从比对过的匹配测序样本中检测单核苷酸变异的一步解决方案。可以有效得有力的识别由于人工特异性的NGS数据和使用的比对策略造成的误差。我们实施了不同特性的筛选来减少假阳性的数目。JACUSA采用了一个基于窗口的方法来详细研究带有高度平行过程特性的给定的BAM文件。JACUSA已经强有力的被进行估计和优化来对RNA-DNA和RNA-RNA测序样本进行RNA编辑位点的识别。JACUSA要求一个可操作的Java环境并采用排过序和建立过索引的BAM文件作为输入文件。2. 安装要求JACUSA不需要任何配置,但是需要正确配置的Java
2、环境。我们开发并检测JACUSA都是用Java1.7进行的。如果你遇到任何Java相关的问题,请考虑变为Java1,7.模拟数据的样本下载我们用来开发JACUSA的样本数据。你可以选择不同的配置和物种,后者对数据的大小尺寸有较大的影响,同时也会对检测样本的运行时间产生影响。GDNA和cDNA的比对代表典型的数据设置,是在检测RNA编辑位点中会使用到的,通过将基因组测序片段和转录组测序片段进行比对可以实现。在这个设置中,变异仅仅被估计在cDNAbam文件中。cDNA和cDNA数据比对设置能够被解释为,表示单个苷酸突变或者不同的RNA编辑的等位基因特异性的表达。在这个设置中,成对发生的变体带有不同
3、的碱基频率,被估计到两个cDNA的bam文件中。除此之外,为了使得识别变异更具有挑战性带有成对的相似的碱基评率的SNP 已经被包括在两个bam文件中。这个位点应该不被是被为真正的位点。GDNA数据已经采用art进行模拟,同时cDNA片段已经采用flux进行模拟。片段模拟已经被全部应用到相关的代表性物种的第一个染色体上。样本数据是可用的。每种实现的方法包括:GDNA.bam,cDNA.bam BAM 文件:gDNA.bam和cDNA或者cDNA_1.bam和cDNA_2.bam。snps.txt 仅仅可用于cDNA和cDNA比对。估计的SNP的相匹配参照。在两个bam文件中与SNP匹配有相同目标
4、频率但是影响不同或者样本的评率不同。形成的参数决定了由多少种样本的频率将会从每个BAM文件中的靶向频率衍生出来。后缀cdna-和cdna-2分别对应相关的BAM文件。variant.txt 估计的变异和他们的靶向和样本频率的坐标。可用的样本数据3. 输入3.1比对文件JACUSA需要比对过和整理过的BAM文件。Bam是一个标准化的文件形式来有效的存储比对的结果。检查说明书的3或者4来知道如何用不同的工具来将你的比对文件转换成有效的JACUSA输入BAM文件。下面展示的是SAMtools的命令SAM ! BAM samtools view -Sb mapping.sam mapping.bams
5、ort BAM samtools sort mapping.bam mapping.sortedindex BAM samtools index mapping.sorted.bam它是一个推荐的预处理步骤来移除重复的片段,当进行变体识别的时候。重复的片段的发生大部分是由于PCR的人工操作。它们很有可能包含假的变异并且大部分的数检测要求片段是独立取样的,下面展示的是picardtools的命令java -jar MarkDuplicates.jar I=mapping.sorted.bam O=dedup_mapping.sorted.bam M=duplication.info用额外的命令行
6、选择“-F 1024”调用JACUSA来筛选被复制片段修饰的片段。3.1.1链信息在V1.2中,支持连特异性的双末端片段已经被加到JACUSA中。取决于采用的测序数据库,JACUSA能够用链的方向来建立堆栈。警告:因为v1.2的“-P”模式已经改变了,所以这个形式已经被TopHat的文库类型的参数激活。用命令行参数“-P,build-pileup ”,用户能够从下面的结合中进行选择:FR-FIRSTSTRAND STRANDED library - first strand sequenced,FR-SECONDSTRAND STRANDED library - second strand s
7、equenced, andUNSTRANDED UNSTRANDED library.来定义链信息是否将被用来建立堆栈。为了通过比较GDNA和连特异性的RNA数据来识别RNA编辑位点(单末端或者双末端)可以用:first strand sequenced “-P UNSTRANDED,FR-FIRSTSTRAND”Table 1: Example of BED-like traverse filecontig start end1 1000 11002 10000 10000second strand sequenced “-P UNSTRANDED,FR-SECONDSTRAND”当你的RN
8、A测序数据是非连特异性的时候,用“-P UNSTRANDED,UNSTRANDED”并且参照来自于注释信息中的正确额方向。3.2详细研究BED-like的文件变体检测能够被限制在特异性的基因组区域或者转录组区域。提供一个简化的BED-like文件来限制在这个区域或者位点内进行研究、剩下的BAM文件的区域将不会被考虑在内。在下面的详细文件中,这个研究被限制在重叠群1开始位置1000的100nt的区域内,以及在重叠群2的一致的10000位点上的一个单个核苷酸位点上:HINT:一些独立的位点将会减慢JACUSA的工作进度。如果可以的话,尝试去讲邻近的位点合并到邻近的区域并总JACUSA的输出文件中抓
9、取特异性的位点,可用bedtools交叉实现:合并位点:bedtools merge -d 500 singular_sites.bed contigous_regions.bed运行JACUSAjava -jar JACUSA.jar call-2 -b contigous_regions.bed -rJACUSA.out mapping_1.sorted.bam mapping_2.sorted.bam提取位点bedtools intersect -wa -a JACUSA.out -b singular_sites.bed输出JACUSA将输出写到一个用户定义的文件或者通道。当使用复杂的
10、线程的时候,JACUSA将会创造一个压缩的临时位点,对于每个指派的线程。选择命令行参数和当前的基因组位点被打印到一个命令的提示中。更过的,依赖于给定的命令行参数,JACUSA将会产生一个被识别为潜在的人工失误的位点的文件,当“-s”被提供的时候。当前,JACUSA支持下面的输出模式,通过“-f”进行控制。默认(JACUSA输出)VCF模式默认文件的输出模式是基于额外的JACUSA特异性列的BED。列的实际数目取决于给定的BAM文件的数目。(1,2,3)重叠群+起始位点+终止位点 0个碱基的,潜在的变异位点的基因组坐标。(4)名字 当前的,连续的字符串:“变体”。这个虚拟的区域是用来确保BED6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- JACUSA 说明书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【丰****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【丰****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。