python多线程优化,

  python多线程优化,

  这篇文章主要为大家介绍了大蟒实现盖特克多线程加速示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  

目录
GATK变异分析下面的来自网络未验证

  

GATK 变异分析

  对于大数据样本可能会比较慢,因此可以按照染色体拆分后进行多线程并行计算。

  下面是我写的一个大蟒多线程脚本,仅供参考,拙劣之处敬请指正。

  #!/usr/bin/python3

  导入线程

  导入操作系统

  导入线程

  导入时间

  多线程=[]

  bam_file=a.mkdup.bam

  out_file_prefix=flower

  chr_list=[CHR01 , CHR02 , CHR03 , CHR04 , CHR05 , CHR06 , CHR07 , CHR08 , CHR09 , CHR10 , CHR11 , CHR12 , CHR13]

  对于chr_list:中的儿童健康研究(Child Health Research的缩写)

  threads _ co monder _ name= gatk单元型caller-intervals chr -R/mnt/j/BSA/02-read-align/TIF runner 2。fasta-I bam _ file -ERC GVCF-O out _ file _ prefix - chr 。ERC。g . vcf

  多线程。追加(线程_命令_名称)

  exitFlag=0

  类myThread(线程。螺纹):

  def __init__(self,threadID,name,counter,commander):

  threading.Thread.__init__(self)

  self.threadID=threadID

  self.name=name

  自我。计数器=计数器

  self.comander=comander

  定义运行(自身):

  打印(开始线程:自我名)

  打印时间(自己的名字,自己的计数器,5,自己的命令)

  打印(退出线程:自我名)

  定义打印时间(线程名、延迟、计数器、命令):

  #当计数器:

  如果exitFlag:

  threadName.exit()

  时间.睡眠(延迟)

  打印(命令)

  操作系统(命令)#调用操作系统命令行处理数据

  #计数器-=1

  # 创建新线程

  threadlist=[]

  对于I,线程nu in enumerate(muthreads[0:11]):

  打印(一)

  打印(线程数)

  threadsnew=myThread(1, Thread- str(i),2,threadsnu)

  threadlist.append(threadsnew)

  # 开启新线程

  对于线程列表:中的线程

  threads.start()

  对于线程列表:中的线程

  threads.join()

  打印(运行结束退出主线程)

  

下面的来自网络未验证

  多条染色体的同样本的椎体压缩性骨折文件合并

  # for i in {1.22 } X Y;do echo -I final _ chr $ I . vcf \ ;完成的

  #因为我在{10.19} {1.9 } M X Y;do echo -I final _ chr $ I . vcf \ ;完成的

  模块加载java/1.8.0_91

  GATK=/home/jianmingzeng/biosoft/GATK/GATK-4。0 .3 .0/GATK

  $ GATK GatherVcfs \

  -I final_chr1.vcf \

  -I final_chr2.vcf \

  -I final_chr3.vcf \

  -I final_chr4.vcf \

  -I final_chr5.vcf \

  -I final_chr6.vcf \

  -I final_chr7.vcf \

  -I final_chr8.vcf \

  -I final_chr9.vcf \

  -I final_chr10.vcf \

  -I final_chr11.vcf \

  -I final_chr12.vcf \

  -I final_chr13.vcf \

  -I final_chr14.vcf \

  -I final_chr15.vcf \

  -I final_chr16.vcf \

  -I final_chr17.vcf \

  -I final_chr18.vcf \

  -I final_chr19.vcf \

  -I final_chr20.vcf \

  -I final_chr21.vcf \

  -I final_chr22.vcf \

  -I final_chrX.vcf \

  -I final_chrY.vcf \

  -O merge.vcf

  合并的时候需要注意,vcf文件的顺序跟每个椎体压缩性骨折文件里面头文件顺序是相同的。

  以上就是大蟒实现盖特克多线程加速示例的详细内容,更多关于python GATK多线程加速的资料请关注盛行信息技术软件开发工作室其它相关文章!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: