怎么使用trim_galore对NGS数据进行质量过滤

技术怎么使用trim_galore对NGS数据进行质量过滤怎么使用trim_galore对NGS数据进行质量过滤,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题

如何使用trim_galore对NGS数据质量进行过滤,相信很多没有经验的人对此无能为力。为此,本文总结了问题产生的原因和解决方法,希望大家可以通过这篇文章来解决这个问题。

Cutadapt软件可以过滤NGS数据的质量,FastQC软件可以检查NGS数据的质量分布,trim_galore将这两个软件打包在一起,使用起来更加方便。

软件将在以下四个步骤中处理数据

1. 去除reads 3’端的低质量碱基

illumina平台测序数据,通常3’端质量较差。Trim_galore将首先在3’端过滤掉低质量的碱基,本质上是调用cutadapt的质量过滤算法。下图显示了过滤前后的基础质量分布。

怎么使用trim_galore对NGS数据进行质量过滤

可以看出,过滤掉低质量的碱基后,序列的整体质量显著提高。

00-1010在过滤掉低质量的碱基后,trim_galore将调用cutadapt在读取的3’端找到适配器序列并将其移除。通常,我们需要指定相应的适配器序列。如果没有规范,trim_galore会自动找到以下三种类型的适配器。

illumina a : agatcggaagagc

SmallRNA:TGGAATTCTCGG

Nextera:CTGTCTCTTATA默认读取前一百万个序列,通过这一百万个序列判断适配器属于以上三种类型中的哪一种,然后删除。如果不希望软件自动判断,也可以通过-illumina、-nextera、-small _ RNA参数指定对应的适配器类型。

00-1010经过以上两个步骤,有可能剩余的序列长度很短,而这个短序列也将被删除。默认情况下,如果序列长度小于20bp,序列将被丢弃。

2. 去除adapter序列

对于所有输入序列,以上三个步骤肯定会执行。此外,trim_galore还支持一些其他过滤措施,以满足个性化需求。

Hardtrim5参数用于从序列的3’端切割底部,如下所示。

在: cctaagaacaagtacactccacatgcata之前

-hardtrim520: cctaagaacaagtacact序列可以通过hardt rim 5参数截断为固定长度。相应地,还有一个hardtrim3参数,它从序列的5’端开始切割碱基,如下所示。

在: caaatgttatttaagaaatggaaaat之前

-hard trim 3203360 tttttaaaaaaatggaaat软件安装起来也非常方便。首先,需要确保安装了cutadapt和fastqc,并且可执行文件位于PAH环境变量定义的路径中。然后下载trim_galore的源代码包并解压。代码如下

wget https://github.com/FelixKrueger/TrimGalore/archive/0 . 5 . 0 . tar . gz

Tarxzvf0.5.0.tar.gz在软件的安装目录中有一个名为trim_galore的可执行文件。

对于单端测序数据,基本用法如下

trim _ galore-quality 20-aagatcggaggc-length 20-out _ dirinput . FQ对于双端时序数据,基本用法如下

Trim_galore-payed-quality 20-aagatcggagc-a2 agatcggagagc-length 20-out _ dirr1.fq.gzr2.fq.gz,看完上面的内容,你知道怎么用trim _ galore过滤NGS数据的质量吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道,感谢您的阅读!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80650.html

(0)

相关推荐

  • 如何分析python在键值对的数据集合Dict

    技术如何分析python在键值对的数据集合Dict如何分析python在键值对的数据集合Dict,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。dict是

    攻略 2021年12月4日
  • cocos2d-x 代码片段有哪些

    技术cocos2d-x 代码片段有哪些这篇文章将为大家详细讲解有关cocos2d-x 代码片段有哪些,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。cocos2d-x 代码

    攻略 2021年11月11日
  • 怎么用C#开发超级账本Fabric

    技术怎么用C#开发超级账本Fabric本篇内容介绍了“怎么用C#开发超级账本Fabric ”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读

    攻略 2021年11月26日
  • spark硬件推荐配置(spark调优最佳配置)

    技术Spark调优之硬件要求有哪些这篇文章将为大家详细讲解有关Spark调优之硬件要求有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一,存储系统因为因为大多数Spark工作可能需

    攻略 2021年12月16日
  • mysql如何修改字段注释

    技术mysql如何修改字段注释这篇文章主要介绍“mysql如何修改字段注释”,在日常操作中,相信很多人在mysql如何修改字段注释问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”mysql如

    攻略 2021年12月1日
  • php获取文件mime类型的几种常用方法

    技术php获取文件mime类型的几种常用方法 php获取文件mime类型的几种常用方法说明
    这些是在文件上传必备的一些验证函数,文件上传这一块要是不做好安全防护,肯定被人登录后台拿你源码的
    MIME类型

    礼包 2021年12月14日