生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > SEER >

SEER数据库分析快速发文

前面的短文我们讲解了SEER数据库,官方提供的SEERStat软件的下载与安装,以及TCGA数据库与SEER数据库的区别,有了这些知识,接下来就到了大家最关系的问题,如果利用SEER数据库下载和分析数据,下载的数据可以做哪些分析,现在论文都是怎样一个分析思路?
带着这些问题,给大家讲解下主要的分析方法。
首先看下SEER数据库经常用到的一些字段
SEER数据库字段
当然我们比较关系的字段根据我们的分析是不同的,用的比较集中的包括癌症发生部位,癌症分期、分级、TNM分期,是否多原发,生存时间,生存状态,是否癌症死亡等等。
有了这些字段我们就可以做很多分析,最基本的生存分析,也就是论文最常出现的KM分析;然后是多因素COX分析,相比KM分析,COX有很多优点,KM没有矫正其它因素的影响,如果需要确定到底某个因素是不是影响生存的独立危险因素,就要用到像Cox这种多因素生存分析模型。
KM分析
接下来做的是卡方检验,卡方检验是一种用途很广的计数资料的假设检验方法。
竞争风险模型分析,可以计算多个终点时间,SEER数据库是提供是否死于癌症这个字段,那么死亡就有多个原因,可以分成两类,一类是癌症死亡,一类是其他非当前癌症死亡。
竞争风险模型
多原发癌,这个是现在比较流行的分析,也是SEER数据分析的重头戏,SEER数据库可以提取到多原发的信息。
JoinPoint分析,数据库提供一个软件专门做数据的JoinPoint分析。

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码