知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > TCGA >

批量挖掘lncRNA数据合并

时间:2020-09-04 20:02来源:生信自学网 作者:刘鑫 点击:
从官网上下载好了数据后,要对所有的数据进行合并,合并成一个矩阵方便做后续分析。

批量挖掘lncRNA数据合并

        上一篇文章我们已经从官网上下载好了数据,下面我们对其进行数据合并,我们需要把这些数据变成如图一个表格,它的行名是基因的id,列名是样品名。


具体操作:

        1、我们先将之前我们下载的压缩包进行解压,解压后会得到很多的文件夹,每个文件夹中都有一个样品文件的压缩包,接下来我们要做的就是把所有文件夹中的文件压缩包全部提取出来放到一个文件夹中,方便做后续的分析。这就需要用到一个pl脚本,里面提供的对这些文件夹进行处理的代码。


        2、我们在装有perl的电脑上用cmd运行我们的pl脚本。我们就可以把所有文件夹里的文件压缩吧拷贝到一个文件夹中,就是我们的file文件夹,最后在将里面的压缩包全部解压就行了。




       3、 下一步就是整理这些文件,将这些文件样品文件进行合并,我们用到两个文件,一个是整理这些文件的脚本文件吗,另一个就是上一篇我们教大家下载的metadata文件。


        4、通过运行我们的pl文件,我们可以得到mRNAmatrix.txt文件,打开这个文件,里面就是合并后的样品文件,其中有4个正常样品和178个肿瘤样品。有了这个矩阵后,我们就可以做后续的分析。


课程链接:
TCGA数据库批量挖掘lncRNA视频

相关课程:
长非编码RNA芯片数据挖掘视频



加生信自学网群
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
BioWolf二维码生成器
------分隔线----------------------------
GEO芯片数据库挖掘生信视频教程
推荐内容
TCGA数据库挖掘文章套路生信视频教程
中药复方网络药理学文章套路生信视频教程