欢迎光临
我们一直在努力

AWK怎么提取所有基因位置信息

这篇文章主要介绍了AWK怎么提取所有基因位置信息的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇AWK怎么提取所有基因位置信息文章都会有所收获,下面我们一起来看看吧。

从基因组注释信息GFF文件中提取所有基因位置信息

gff文件当中存储了基因组当中所有基因的注释信息,如果想得到基因组当中所有基因的位置信息可以利用awk命令批量的提取,命令如下:

$ grep -v '#' Arabidopsis_thaliana.TAIR10.41.gff3|awk -F "[\t=:;]" 'BEGIN{OFS="\t"}$3=="gene"{print $1,$4,$5,$10}' |head
1       3631    5899    AT1G01010
1       6788    9130    AT1G01020
1       11649   13714   AT1G01030
1       23121   31227   AT1G01040
1       31170   33171   AT1G01050
1       33365   37871   AT1G01060
1       38444   41017   AT1G01070
1       44970   47059   AT1G01080
1       47234   49304   AT1G01090
1       49909   51210   AT1G01100

关于“AWK怎么提取所有基因位置信息”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“AWK怎么提取所有基因位置信息”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注云搜网行业资讯频道。

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。