知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > 生信数据库 >

miRNA命名规则

时间:2017-08-11 20:23来源:原创 作者:森莘 点击:
以动物microRNA为例 一、 确定命名规则之前发现的microRNA,则保留原来名字,如cel-let-7。 二、 在提交新的microRNA到数据库时,按照microRNA family顺序分别编号命名,如数据库中已有mir-41,那
以动物microRNA为例
一、 确定命名规则之前发现的microRNA,则保留原来名字,如cel-let-7。
二、 在提交新的microRNA到数据库时,按照microRNA family顺序分别编号命名,如数据库中已有mir-41,那么之后再新增的就会被命名为mir-42。这一规则是基于microRNA的前体种子序列,在跨物种的microRNA保守性之上的,比如数据库会先后收入两条成熟的microRNA:hsa-miR-41和cbr-miR-42。
三、microRNA的发卡结构状前体(pre-miRNA)写成小写的mir,在miRBase里的ID编号以MI开头,而成熟体简写成miR,在miRBase数据库里的ID编号以MIMAT开头。再根据其物种名称,及被发现的先后顺序加上阿拉伯数字,如cbr-miR-42的前体是cbr-mir-42。
四、高度同源的成熟体microRNA命名时在数字后加上英文小写字母(a,b,c,…),如hsa-miR-12a,hsa-miR-12b等。
五、由不同染色体来源的DNA序列转录加工生成的具有相同成熟体序列的microRNA,则在后面加上阿拉伯数字以示区分,如hsa-miR-19b-1和hsa-miR-19b-2,其前体分别位于第13号染色体和性染色体X。
六、microRNA的前体pre-miRNA其长度大约为70~80nt,其两个臂都可能分别产生microRNA。之前通行的规则是先确定两个不同成熟体的表达水平,表达量较高的microRNA后面不加任何符号,而表达量较低的microRNA后面加上*号,如mmu-miR-7和mmu-miR-7*。然而并不是每次都能精确地确定其不同成熟体的表达量高低,还有组织特异性表达等因素,在这种情况下则以microRNA的成熟体产生于pre-microRNA的5`端臂还是3`端臂来命名,分别加上后缀“-5p”和“-3p”分别命名。如asu-miR-100b-5p和asu-miR-100b-3p,表明这两条microRNA分别从asu-mir-100b前体的5’端臂和3’端臂加工而来的。类似地,在旧有规则的命名中,有时也会以“-s”和“-as”来命名,但现在已经取消了这种命名方式。
七、最初命名时*用来区别表达量高低,在无法确定表达量之前还是用-5p和-3p来区别,甚至更早时候连-5/3p都不用,用-s和-as,好混乱!从miRBase的17版开始,取消了上述带有“*”及“-s”、“-as”规则,代之以前面所述的“-5/3p”命名规则,具体可以见这篇博文。不得不说这真是一个好消息,把“*”这种通配符放到名称里一个不注意处理起来真是欲仙欲死有木有?到了miRBase 19版发布时旧有体系已完全被停止使用。
 
植物microRNA命名与前面所说的动物microRNA命名方式略有不同,大致如下:
①microRNA前体:以“MIR”取代“mir”命名顺序,且其后不跟有短线“-”,如osa-MIR420。
②microRNA成熟体:在“miR”与其后的数字(&字母等)编号之间没有“-”,如ath-miR420。
 
病毒microRNA及其前体命名方式同动物的命名方式一致。
 
最后,用一个图示简单地总结一下microRNA的命名规则。
miRNA命名规则

加生信自学网群
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
BioWolf二维码生成器
------分隔线----------------------------
GEO芯片数据库挖掘生信视频教程
推荐内容
TCGA数据库挖掘文章套路生信视频教程
中药复方网络药理学文章套路生信视频教程