生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

GO与KEGG富集分析

GO与KEGG富集分析

下面我们给大家讲解关于GO与KEGG的富集分析,这在肿瘤微环境联合免疫细胞浸润分析中占着很重要的一步。
GO富集分析
在进行GO富集分析之前,我们先要知道GO富集分析的目的。GO富集分析就是观察我们的基因在哪些功能上具有富集,这个我们就可以通过GO富集分析实现。在富集之后,我们可以得到一个气泡图和一个圈图以及一个柱状图。
我们先看一下气泡图,它的纵坐标是GO的名称。横坐标的话就是基因的比例,然后圆圈的大小就代表富集在每个GO基因的数目,圆圈越大就说明富集在这个GO上基因的数目越多。圆圈的颜色代表富集的显著性,圆圈越红就说明我们的差异基因在这个GO上富集越显著。从图中我们可以看出,我们这里的差异基因大多数都是富集在免疫相关的功能上。

之后我们再看一下这个圈图,这个圈图的话,这里面的这些圆圈,它代表的是功能,然后其他的圆圈代表的是基因,而这里不同的颜色的线条就代表不同的GO如果这个GO和基因之间有连线就说明这个基因他在这个GO上是具有富集的。这里的颜色代表的是基因的logFC。红色就说明这个基因在高得分组里面是上调的,然后蓝色的话就代表这个基因在高得分组里面是下调的。

下面我们来绘制这两个图形,我们要准备的输入文件是基因的id文件,这在我们之前的文章中已经得到,里面有基因的名称,logFC值和基因的id。然后就是我们做GO富集分析的脚本文件,脚本文件是由我们生信自学网提供编写的,感兴趣的学员可以通过下方的链接购买我们的课程。

将我们的脚本文件拷贝到R中运行,我们可以得到一个GO的结果文件


还有上面提到的三个图形


KEGG富集分析
讲了GO富集分析,下面我们进行KEGG富集分析,KEGG富集分析的目的是就是观察我们的差异基因在哪些通路上具有富集,这就是KEGG富集分析的目的。
富集之后,我们同样可以得到这样的气泡图、柱状图和圈图,我们先看一下气泡图,它的纵坐标是通路的名称。横坐标是基因的比例,然后圆圈的大小就代表富集在每个GO上的基因的数目。然后这个圆圈的颜色就代表富集的显著性。

我们再看一下这个圈图,在这个圈图里面,它的上方的这些点大小是不唯一的。这些点代表的是通路,然后其他的点代表基因的名称,如果基因和这个通路之间有连线,就说明这个基因在这个通路上具有富集。这里的曲线都用不同的颜色展示。这不同的颜色就是代表不同的通路。

下面做KEGG的富集分析,输入文件的话和GO富集分析是相同的,唯一不同的就是脚本文件。运行脚本文件后,我们同样得到了三个图形和KEGG的结果文件。





课程链接:

《TCGA数据库肿瘤微环境视频》

精品课程推荐:
《TCGA肿瘤免疫细胞浸润模式挖掘》
《GEO数据库免疫细胞浸润视频》
《甲基化免疫细胞浸润模式》
《TCGA数据库肿瘤微环境》
《TCGA数据库肿瘤突变负荷》


 
 

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码