linux上的并行软件ParaFly怎么用

技术linux上的并行软件ParaFly怎么用这篇文章将为大家详细讲解有关linux上的并行软件ParaFly怎么用,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

本文将详细解释如何在linux上使用并行软件ParaFly。这篇文章的内容质量很高,所以边肖会分享给大家参考。希望你看完这篇文章后有所了解。

很多时候,写信人处理多个文件,每个文件的操作都是一样的。此时,为循环串行处理编写一个可能就足够了。然而,有时串行操作需要很长时间,例如bwa mem比较。如果一个文件一个文件地处理,时间是累积的。

通常,我们在服务器上运行任务,这是多核多线程的。最坏的情况是我们自己的多核多线程笔记本,实际上可以让任务并行运行。

例如,使用htop查看,下面是一台40核服务器,需要时更好地使用空闲核,省时省力:

linux上的并行软件ParaFly怎么用

今天,我想介绍一个非常有用的小工具ParaFly,它可以通过简单的操作在linux上并行化任务。

linux上的并行软件ParaFly怎么用

linux上的并行软件ParaFly怎么用

linux上的并行软件ParaFly怎么用

首先,用anconda3安装ParaFly。

$condainstall-cbiocondaparafly

检查如何使用它:

$ para fly-h # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #需要: # # # # # # # # # # # # # # # # c str : filename,包含要执行的bash样式命令列表。#-CPU int : number _ of _ threads # # optional : #-shuffle :随机打乱命令顺序。# -failed_cmds str :filename捕获失败的命令。default(' failed commands ')#-v : simple进度监控。#-vv :进度监控的详细程度增加。# # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #注:此过程创建一个名为的文件,其扩展名为.completed。这将启用恢复功能,如果重新运行,将只重新处理未成功完成的命令。

linux上的并行软件ParaFly怎么用

可以看到,Required参数只有两个,说明这个工具使用起来非常简单。其实只需要把要操作的命令写在一个文件中,用-c指定这个文件,用-CPU指定并行核心总数(需要同时执行几个命令)。

命令成功执行默认情况下,相应的命令行将输出到带有。文件名中已完成的后缀,未成功执行的命令将输出到FailedCommands文件。

parafly :s impleparallelunixcommandprocessingopenmpparafly providess implementoring for running predefinedlisto funixcommandsin并行使用多小时引导。失败的进程被重新捕获并报告。成功执行的进程被重新捕获。如果进程重新运行,将执行或失败的进程。

一个简单的例子:

Fastq-dump拆分三个SRA文件,这三个命令可以写入fastq_dump.txt文件:

$ catfastq _ dump . txtfastq-dump-split-3SRR 1510125.1 fastq-dump-split-3SRR 1004284.1 fastq-dump-split-3SRR 1004285.1

然后用ParaFly并行化:

$ParaFly-cfastq_dump.txt-CPU3

服务器将分别用三个内核同时运行这三个命令。飞行结果文件:

$ catfastq _ dump . txt.completedfastq-dump-split-3SRR 1004285 . 1 fastq-dump-split-3SRR 1004284 . 1 fastq-dump-split-3SRR 1510125 . 1

总的来说,ParaFly比linux附带的并行更容易学习和使用。可以考虑添加它在linux上做多任务处理,这样会大大缩短数据处理时间。

如何在linux上使用并行软件ParaFly,我希望在这里分享。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/141709.html

(0)

相关推荐

  • mysql服务启动后该怎么操作(怎么用命令开启mysql以及运行结果)

    技术MySQL启动和关闭的方法是什么这篇文章主要介绍“MySQL启动和关闭的方法是什么”,在日常操作中,相信很多人在MySQL启动和关闭的方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家

    攻略 2021年12月23日
  • 如何删除UNDO表空间并处理ORA-01548问题

    技术如何删除UNDO表空间并处理ORA-01548问题这篇文章给大家分享的是有关如何删除UNDO表空间并处理ORA-01548问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。准备工作1.找到

    攻略 2021年11月9日
  • 荸荠怎么煮,赤豆煮荸荠的制作方法是怎样的

    技术荸荠怎么煮,赤豆煮荸荠的制作方法是怎样的制作赤豆煮荸荠的原料有:赤豆100克,荸荠100克,料酒10毫升,姜5克,葱10 克,盐3克,鸡精3克,鸡油30毫升荸荠怎么煮。制作方法:(1 )将赤豆去泥沙,洗净;荸荠去皮,

    生活 2021年10月26日
  • sparkstreaming数据量(使用sparkstreaming的必要性)

    技术如何理解Spark Streaming的数据可靠性和一致性如何理解Spark Streaming的数据可靠性和一致性,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决

    攻略 2021年12月17日
  • springsession和普通session区别(springsession配置sessionname)

    技术spring-session自定义序列化方法是什么本篇内容介绍了“spring-session自定义序列化方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处

    攻略 2021年12月23日
  • 如何实现JavaScript函数式的浅析

    技术如何实现JavaScript函数式的浅析这篇文章给大家介绍如何实现JavaScript函数式的浅析,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。JS函数式浅析0x00 入门的导语(废话)最近两年

    攻略 2021年11月16日