欢迎光临
我们一直在努力

bedtools如何批量提取基因组指定位置序列

小编给大家分享一下bedtools如何批量提取基因组指定位置序列,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

用到软件是bedtools,具体方法如下:

Usage:   bedtools getfasta [OPTIONS] -fi <fasta> -bed <bed/gff/vcf>
Options:
        -fi     Input FASTA file
        -bed    BED/GFF/VCF file of ranges to extract from -fi
        -name   Use the name field for the FASTA header
        -split  given BED12 fmt., extract and concatenate the sequencesfrom the BED "blocks" (e.g., exons)
        -tab    Write output in TAB delimited format.
                - Default is FASTA format.
        -s      Force strandedness. If the feature occupies the antisense,
                strand, the sequence will be reverse complemented.
                - By default, strand information is ignored.
        -fullHeader     Use full fasta header.
                - By default, only the word before the first space or tab is used.

其中-fi 指定基因组fasta文件,-bed 指定要提取序列的位置文件,可以是bed、gff 或 vcf 文件(染色体碱基位置从0开始计数)。

-tab 指定输出格式。

$bedtools getfasta -fi GCA_001651475.1_Ler_Assembly_genomic.fna -bed id.bed
>CM004359.1:0-10
gtttagggtt
>CM004359.1:100-200
ttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggttt
>CM004359.1:1000-1050
TTGTGGgaaaattatttagttgtaGGGATGAAGTCTTTCTTCGTTGTTGT
$bedtools getfasta -fi GCA_001651475.1_Ler_Assembly_genomic.fna -bed id.bed -tab
CM004359.1:0-10 gtttagggtt
CM004359.1:100-200      ttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggtttagggttt
CM004359.1:1000-1050    TTGTGGgaaaattatttagttgtaGGGATGAAGTCTTTCTTCGTTGTTGT

以上是“bedtools如何批量提取基因组指定位置序列”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注云搜网行业资讯频道!

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。