欢迎光临
我们一直在努力

怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量

这篇“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”文章吧。

1.获得基因组的各染色体的长度信息

$ samtools faidx genome.fa
#生成gemome.fa.fai文件第一列为染色体,第二列为对应染色体长度
chr01   44488843        7       44488843        44488844
chr02   38522657        44488858        38522657        38522658
chr03   34302425        83011523        34302425        34302426
chr04   31904921        117313956       31904921        31904922
chr05   31465669        149218885       31465669        31465670
chr06   29481096        180684562       29481096        29481097
chr07   26142479        210165666       26142479        26142480
chr08   23295356        236308153       23295356        23295357
chr09   21309744        259603517       21309744        21309745
chr10   20413421        280913269       20413421        20413422

2.根据染色体的长度产出区域文件:

$ bedtools makewindows -g genome.fa.fai -w 100000 >region.bed
$ head region.bed
chr01   0       100000
chr01   100000  200000
chr01   200000  300000
chr01   300000  400000
chr01   400000  500000

3.输入vcf文件统计不同区域里面变异个数

$ bedtools coverage -a region.bed -b q4.vcf  -counts >result.txt

以上就是关于“怎么用bedtools统计VCF文件中各染色体不同区域中的变异数量”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注云搜网行业资讯频道。

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。