使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序? 需求 实现

目录

已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?
需求
实现
原顺序:
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?
需求
实现

想要的排序结果:
使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?
需求
实现

实现

使用bioawk,没有的话conda直接安装。

bioawk -c fastx '{print}' old.genome.fa |  
  sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa

https://www.biostars.org/p/494201/