知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > 生信答疑 >

TCGA改版下载STAR-Counts之后如何merge

时间:2022-04-03 05:53来源:未知 作者:乐伟 点击:
TCGA改版下载页面没有PFKM选项,下载STAR-Counts之后如何使用新版merge.pl进行提取
TCGA改版下载页面没有PFKM选项,下载STAR-Counts之后如何使用新版merge.pl进行提取

STAR – Counts添加到Cart之后,可以看到数目,这里TCGA-PRAD显示的Files(553),Cases(497),

进入Cart之后,选择下载两个文件一个压缩包,Metadata文件(用来合并)、Manifest文件(用来无法下载压缩包,用gdc工具下载)、Cart压缩包(也就是每个样本一个文件的压缩包),下载好之后,把压缩包解压。


可以看到一个样本一个文件夹,按照之前我们的操作是moveFiles.pl(把文件合并到一个文件夹)、merge.pl(合并矩阵)两步操作,现在用tcga2022新版的merge.pl(需要请联系进行更新或者付费购买,微信客服:18520221056)

然后进入cmd终端,把merge.pl、解压好的553个文件夹、还有下载好Metadata文件放在一个文件夹里面,在cmd终端进入该工作目录,输入命令perl merge.pl metadata.cart.2022-04-03.json

等待运行,接下来会看到normal count:52 tumor count:501,对比改版前数据还是有一点点变化,之前是52 vs 499,当然在实际操作中,如果已经开始做分析,数据是之前下载的,那么在写作中把自己的数据下载时间写清楚,以免浪费太多时间。

运行之后就得到我们经常用到的symbol.txt,那么改版数据提取工作完成,接下来照着课程学习其他内容。

推荐学习最新的课程《肿瘤单基因文章套路(免疫组化+免疫治疗+药物敏感性)》



加生信自学网群
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
BioWolf二维码生成器
------分隔线----------------------------
GEO芯片数据库挖掘生信视频教程
推荐内容
TCGA数据库挖掘文章套路生信视频教程
中药复方网络药理学文章套路生信视频教程