欢迎光临
我们一直在努力

R语言如何在行上取数据子集

本篇内容介绍了“R语言如何在行上取数据子集”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

subset_row.r  提供列表,在行上取数据子集

使用方法:

usage: /share/nas1/huangls/test/TCGA_GEO_immu/scripts/subset_row.r
       [-h] -i input -m idlist -c colname [-o outdir] [-p prefix]
get subset by ID
optional arguments:
  -h, --help            show this help message and exit
  -i input, --input input
                        input data matrix data [required]
  -m idlist, --idlist idlist
                        input idlist [required]
  -c colname, --colname colname
                        match column name in idlist and input [required]
  -o outdir, --outdir outdir
                        output file directory [default cwd]
  -p prefix, --prefix prefix
                        output file name prefix [default demo]

参数说明:

-i 输入要取子集的数据,

ID TCGA-D7-A74A-01A-11R-A32D-31 TCGA-BR-7704-01A-11R-2055-13 TCGA-VQ-A91N-01A-11R-A414-31 TCGA-CD-A4MH-01A-11R-A251-31 TCGA-BR-7715-11A-01R-2055-13 TCGA-EQ-8122-01A-11R-2343-13 TCGA-BR-7704-11A-01R-2055-13 TCGA-VQ-A91Y-01A-11R-A414-31
TSPAN6 5.607434 4.574163 14.39654 27.34667 7.381342 7.094949 4.638539 3.431114
TNMD 0.036605 0 0 0.10144 0.069677 0.013961 0.088328 0
DPM1 47.27602 69.15157 39.07867 54.38476 34.75987 53.74329 17.22876 45.18002
SCYL3 2.480883 1.120544 4.504755 2.020254 2.454489 2.806747 1.956408 2.751801
C1orf112 1.972838 0.657791 4.021506 1.796665 0.86856 2.489893 0.568309 1.631315
FGR 0.640395 5.705655 0.768222 1.897257 5.528251 2.128635 2.707995 2.874438
CFH 1.005737 4.231042 3.06005 2.499263 17.27662 3.249414 12.7978 8.515792
FUCA2 29.32949 35.97601 31.40956 33.73129 21.70492 45.04622 16.3126 17.08673
GCLC 8.669732 7.575979 7.387031 6.207049 4.920366 11.9263 4.398624 6.320377
NFYA 7.260346 8.435074 9.566617 10.99219 6.49941 7.3871 7.003742 6.259676

-m 指定ID列表,-c 指定 ID列表中的列名:

ID log2FC logCPM PValue FDR regulate
FGR 1.15187 3.546373 3.56E-41 2.75E-39 Up
CFH 1.148486 6.292113 2.77E-25 5.74E-24 Up
CD38 1.629447 4.320928 1.23E-28 3.14E-27 Up
HSPB6 3.013333 7.468948 8.24E-38 4.57E-36 Up
PDK4 1.05844 6.536584 1.98E-09 9.88E-09 Up
MEOX1 1.595276 2.077971 2.50E-36 1.21E-34 Up
COPZ2 1.016028 3.043114 1.38E-19 1.85E-18 Up
PRKAR2B 1.529285 4.016024 6.52E-35 2.73E-33 Up
ITGAL 1.595675 5.118729 2.03E-47 3.33E-45 Up

使用举例:

Rscript $scriptdir/subset_row.r -m ../04.deg/S1_vs_S2.edger.DEG.final.tsv -c ID \
  -i ../02.sample_select/TCGA-STAD_gene_expression_TPM.tsv -p deg_gene_exp_tpm

“R语言如何在行上取数据子集”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注云搜网网站,小编将为大家输出更多高质量的实用文章!

赞(0)
【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。