QQ登录

只需一步,快速开始

使用微信账号登录

查看: 3382|回复: 1

DNA甲基化差异筛选的软件

  [复制链接]

该用户从未签到

9

主题

20

帖子

67

积分

注册会员

Rank: 2

积分
67
发表于 2017-9-13 21:00:13 | 显示全部楼层 |阅读模式
生信自学课堂

DNA甲基化是最早发现的修饰途径之一,可能存在于所有高等生物中。DNA甲基化 导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,抑制了转录因子与启动区DNA的结合效率,能关闭某些基因的活性,去甲基化则诱导了基因的重新活化和表达。DNA甲基化的主要形式为5-甲基胞嘧啶,N6-甲基腺嘌呤和7-甲基鸟嘌呤。在真核生物中,5-甲基胞嘧啶主要出现在CpG和CpXpG中,原核生物中CCA/TGG和GATC也常被甲基化;没有甲基化的胞嘧啶发生脱氨基作用,就可能被氧化成为U,被DNA修复系统所识别和切除,恢复成C;已经甲基化的胞嘧啶发生脱氨基作用, 它就变为T, 无法被区分。因此, CpG序列极易丢失,甲基化胞嘧啶极易在进化中丢失,所以,高等真核生物中CG序列远远低于其理论值;哺乳类基因组中约存在4万个CG islands,大多位于转录单元的5'区。

近年来随着测序技术的发展,全基因组甲基化测序技术也有了很大的发展(14年之前基本上很少见相关甲基化测序的公司),比较流行的还是WGBS技术,基于WGBS进行全基因组甲基化检测之后进行生物信息分析,一般的分析内容无非是找甲基化位点,甲基化在基因组,染色体,功能元件上的分布,寻找DMS,DMR,DMP,进一步的与基因关联分析相关基因功能。

今天主要来介绍的是两款老少皆宜的筛选甲基化的软件,这两款软件均来自于张岩教授所带领的哈尔滨医科大学计算表观遗传学课题组,张岩教授的课题组从2006年开始就开展研究表观遗传学研究,发表了许许多多的计算表观遗传学相关的算法、软件以及数据库。

首先上一个简单的软件:QDMR: a quantitative method for identification of differentially methylated regions by entropy,这是一个2011年发表在Nucleic Acids Res上的软件

官网:http://fame.edbc.org/qdmr/

软件界面如下:

从图中可以看出操作及其简单,实际上该软件算法的原理是基于香浓信息商改造而来(比较抽象,学算法者自行百度),就是输入一个甲基化的矩阵,这个矩阵每一行表示一个cpg位点,多种一个基因组区域,每一列表示样本在这些cpg位点或区域的甲基化水平

导入数据时可以选择甲基化水平的区间是否是0-1还是0-100,自定义从哪一列开始为甲基化水平数据,哪些列为基因组区域信息,首行是否为标题行等等

点击Import按钮之后没报错的话数据就导入成功了,进一步点击左侧Quantify Difference按钮进行甲基化差异计算,只需点击,傻瓜式操作,点完之后甲基化差异计算就算完事了,此时选择一个阈值来筛选甲基化差异,点击Identify DMRs,阈值可以根据自己的数据适当调整,一般默认即可,此时就得到了差异甲基化区域及非差异甲基化区域



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

该用户从未签到

9

主题

20

帖子

67

积分

注册会员

Rank: 2

积分
67
 楼主| 发表于 2017-9-13 21:01:19 | 显示全部楼层
生信自学课堂
通过数据可视化部分看得出来筛选的差异甲基化区域差异还是很明显的,进一步的咱们可以使用Measure Specificity按钮筛选出那些样本甲基化特异的区域

以上就完成了甲基化差异筛选、特异甲基化区域筛选,最后导出结果即可,傻瓜式超简单。

从上面的步骤中细心的同学可以发现软件中筛选的差异甲基化指的是在多个样本中变化剧烈的甲基化区域,而不是相对于某个样本的甲基化,事实上该软件确实只能筛选在多个样本中变化的甲基化区域,筛选出来的差异甲基化区域可以简单的理解为该甲基化区域在多个样本中甲基化水平不稳的。

另外一个问题如果自己的数据有重复样本该如何是好,如果自己的数据有很多甲基化区域并不确定比如BS-Seq数据结果;那么你就需要作者的另外一款软件SMART

SMART:Systematic identification and annotation of human methylation marks based on bisulfite sequencing methylomes reveals distinct roles of cell type-specific hypomethylation in the regulation of cell identity genes

这是一款2016年发表在 Nucleic Acids Res上的软件包,官网:http://fame.edbc.org/smart/ 安装也超级简单:

pip install SMART-BS-Seq

这款软件是QDMR的改进版,虽然是改进版,其实相当于全新开发,除了都是基于香农信息熵,其他的基本上都改了。

附上工作原理:

从原理图中可以看出DMCs DMRs DM-ROIs都可以做了

安装完SMART之后初步运行下:



命令也是超级友好,超级简单,每个参数都有详细说明,大家自己去琢磨吧。

这款SMART非常适合公司在标准流程中使用,谁用谁知道。

引用文献:

Hongbo Liu et al. Systematic identification and annotation of human methylation marks based on bisulfite sequencing methylomes reveals distinct roles of cell type-specific hypomethylation in the regulation of cell identity genes Nucleic Acids Res: 2016 ,44(1) ,75-94.

Hongbo Liu et al. Systematic identification and annotation of human methylation marks based on bisulfite sequencing methylomes reveals distinct roles of cell type-specific hypomethylation in the regulation of cell identity genes Nucleic Acids Res: 2016 ,44(1) ,75-94.


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

客服热线
18520221056(微信) 周一至周日:09:00 - 22:00
公司官网:http://www.biowolf.cn

速科生物是一家融生信创新、设计、技术开发、服务为核心的生物公司,生信自学网专注于生信培训周边课程开发和代码设计,坚持为客户打造高品质的精品课程和培训服务。

Powered by 生信自学网 © 2016-2019 江西速科生物

QQ|生信自学论坛 ( 赣ICP备19001400号-1 )

GMT+8, 2019-10-15 16:42 , Processed in 0.194039 second(s), 25 queries .

快速回复 返回顶部 返回列表