知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > GEO >

课程指南系列之GEO数据库挖掘

时间:2019-08-08 15:38来源:生信自学网 作者:乐伟 点击:
对于肿瘤分析当道的今天,非肿瘤分析的科研人员,如何做自己的生信分析呢?GEO数据无疑是一个最佳选择,芯片量大,数据获取简单,分析方法成熟便捷,都是GEO持续火热的理由。
对于肿瘤分析当道的今天,非肿瘤分析的科研人员,如何做自己的生信分析呢?GEO数据无疑是一个最佳选择,芯片量大,数据获取简单,分析方法成熟便捷,都是GEO持续火热的理由。
一、什么是GEO数据库
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。

二、GEO提供的数据类型
Series: 多个样本连接成一个完整的研究数据集,并提供了整个研究的描述,包括对数据的描述,总结分析。目前共有96445个研究。
Platforms: 用户提交给GEO数据中涉及到的芯片/测序平台,目前GEO上包含了18300种平台的数据。
Samples:用户提交给GEO的样本数据,目前平台上共有2439709个样本
DataSets: GEO工作人员根据用户提交的数据整理后得到的数据集,类似于TCGA的level4数据,目前共有4348个。
Profiles:GEO工作人员根据用户提交的数据整理后的数据,倾向于某个基因在不同数据集中的表单情况。
三、GEO与TCGA的区别
GEO主要包含各种芯片数据,也有少部分测序数据,与TCGA的差别在于TCGA只包含人的数据,而GEO是多物种的,GEO上有各种平台的数据,而TCGA只有测序数据,芯片数据的数据量较小,而TCGA的测序数据数据量较大。
四、GEO课程购买导航
接下来,我们来看下如何选择学习“生信自学网”关于GEO分析的课程
1、无任何基础,可以先学习《GEO基础入门课程》

2、希望在零基础的课程上加深分析
可以学习《GEO基础入门课程》《多芯片联合RobustRankAggreg分析》《多芯片联合Batch分析》
这里需要给大家说明一下两个多芯片联合分析的区别:RobustRankAggreg分析是把多个芯片先做差异,再用差异结果做RobustRankAggreg分析;Batch分析,是多个芯片做ID转换之后,Batch成一个矩阵,再用组合的矩阵做差异分析。一般情况下,学习RobustRankAggreg分析,如果自己研究方向芯片比较少,可以考虑多芯片Batch分析。

3、不管是做基础分析,还是多芯片联合分析,都会得到差异基因,得到差异基因之后,我们就大有可为了,可以做GO、KEGG、PPI网络等分析。这里推荐大家得到差异基因之后学习:
《GO富集分析》
《KEGG富集分析》
《蛋白互作网络构建》
这三门课程作完,一个基本的分析套路就得到了,当然现在文献还有做其他一些分析,大家可以根据参考文献做后续一些分析。
当然如果有需要也可以做GSEA富集分析:《GSEA富集分析》

4、当然,不是所有的学员都是分析基因的,这里我们也给大家准备了其他分析的GEO课程
单细胞测序:《单细胞测序数据挖掘》(非常热门的分析)
甲基化:《GEO甲基化分析》
LncRNA:《GEO数据库长非编码RNA芯片分析》
miRNA:《miRNA芯片数据挖掘文章套路》
环状RNA:《环状RNA芯片数据挖掘》
如果是做免疫相关的,还可以学习GEO芯片方面的免疫课程:
《GEO数据库免疫细胞浸润模式》
《甲基化免疫细胞浸润模式》
免疫是当然最热门的课题,如果做GEO免疫分析,选择以上两个课程是非常不错的选择

五、还有其他芯片数据库吗?
答案是肯定的,ArrayExpress数据库,ArrayExpress与Geo数据库类似,里面都存储这大量芯片表达数据,对于数据库挖掘的学员来说,ArrayExpress是一个不可或缺的数据库。生信自学网应学员的要求,录制了ArrayExpress数据库挖掘的视频。视频主要从以下几个方面录制讲解ArrayExpress数据库的挖掘,首先,我们会讲解如何从ArrayExpress数据库下载数据,大家通过网页和R包下载ArrayExpress数据。

信自学网针对三种不同的数据,采用三种不同的方法进行分析。A,对于下载数据已经包含探针矩阵的,我们利用平台文件将探针矩阵转换为基因矩阵。B,对于下载的数据是单个的表达文件,我们先将单个表达文件合并成探针矩阵,然后在转换为基因矩阵。C,对于下载的数据是原始数据的,我们首先用R包将原始数据转换为探针矩阵,然后在转换为基因矩阵。
《ArrayExpress数据库挖掘》
六、拓展分析
PCA :《PCA主成分分析》
WGCNA:《WGCNA分析》
小分子药物:《小分子药物分析》(用得到的上调下调差异基因做药物分析)
编程:《R绘图生信应用》
《perl编程生信应用》
以上就是小编个大家整理的GEO数据库挖掘课程梳理,每个课程链接都有课程简介,和试学视频,如果大家对购买课程还有什么以为,可以联系微信客服:18520221056。购买课程之后,提供资料、答疑、发票,请直接联系微信客服,如果需要加群,加微信时备注“三群”,谢谢。




责任编辑:乐伟
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
马上与乐老师QQ联系 生信自学连
BioWolf二维码生成器
顶一下
(1)
100%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
TCGA肿瘤微环境
推荐内容
单基因发文套路
m6A