欢迎光临
我们一直在努力

怎么下载TCGA中指定Primary Site的样本数据

这篇文章主要介绍“怎么下载TCGA中指定Primary Site的样本数据”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么下载TCGA中指定Primary Site的样本数据”文章能帮助大家解决问题。

代码:

# 筛选primary_site对应的癌症样本
library(GenomicDataCommons)
resp = cases() %>% filter(~ project.project_id=='TCGA-HNSC' &
                            primary_site =='Larynx') %>%
  GenomicDataCommons::select(c(default_fields(cases()),'samples.sample_type')) %>%
  response_all()
resp %>% count()

case_name <- resp$results$submitter_id
# 之后对下载的samplesDown 进行过滤,获得需要下载的sample_download
download_name = substr(samplesDown,1,12)
sample_download <- samplesDown[download_name %in% case_name]

有了sample_download ,就可以采用TCGAbiolinks进行下载了。

把要下载的数据筛选出来之后重新得到query,添加barcode选项指定下载想要的数据:

query <- GDCquery(project = project,
                  data.category = data_category,
                  data.type = data_type, 
                  workflow.type = workflow_type,
                  barcode = sample_download,
#                  sample.type = sample_type,
                  legacy = legacy)

关于“怎么下载TCGA中指定Primary Site的样本数据”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注云搜网行业资讯频道,小编每天都会为大家更新不同的知识点。

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。