北京基因组所开发长非编码RNA数据库LncBook
克日,由基因组所开发的人类长非编码RNA(long non-coding RNA, lncRNA)数据库LncBook正式上线。该项研究效果以“LncBook: a curated knowledgebase of human long non-coding RNAs”为题在国际学术期刊Nucleic Acids Research在线揭晓。
近年来,有关lncRNA的研究一直是国际热门,研究批注,lncRNA在多种生物历程中施展了主要作用并与疾病的爆发亲近相关,但lncRNA的注释信息及质量仍远远落伍于卵白编码基因。LncBook数据库不但提供了富厚的高质量人类lncRNA数据集,还举行了大规模的多组学数据剖析,以及系统的功效与疾病注释,为功效实验研究及生物信息学剖析提供了大宗可用信息与数据。
基于严酷的审编标准,LncBook整合已有lncRNA数据并判断新的lncRNA,共获得270,044个lncRNA转录本。在此基础上,LncBook在lncRNA表达、甲基化、变异、miRNA-lncRNA相互作用这些多组学层面举行大规模深条理的数据剖析。在表达层面,绘制lncRNA在32或者53种正凡人类组织中的表达图谱,并判断出49,115个高度组织特异(tissue-specific)和819个持家(housekeeping) lncRNA;在甲基化层面,构建lncRNA在9种癌症中正常与癌症状态下的promoter及body区的甲基化图谱;在变异层面,基于dbSNP数据库SNP位点注释lncRNA区域92,725,757个SNP最小等位频率(基于千人基因组数据)、ClinVar与COSMIC疾病关联信息;展望了128,392,451个lncRNA-miRNA的相互作用条目。上述的效果以图或表的形式展示在LncBook数据库中,相关信息均可免费下载;谝陨鲜,LncBook还展望了97,998个潜在的疾病关联lncRNA。别的,在LncRNAWiki的基础上LncBook对1,867个文献报道lncRNA举行了系统的功效与疾病信息注释。
LncBook作为主要的lncRNA资源库,提供了现在为止数据量最为富厚的人类lncRNA数据。作为LncRNAWiki数据库的增补,LncBook具备友好的盘问、浏览与可视化功效。用户可通过ID/symbol、功效、疾病名称等检索lncRNA信息,浏览指定lncRNA的多组学信息,并通过ftp下载所有相关注释信息与剖析效果。别的,LncBook还提供了可用于lncRNA序列比对、分类、编码能力展望等研究的工具,利便在线剖析。
该研究与沙特阿卜杜拉国王科技大学(King Abdullah University of Science & Technology,KAUST)Vladimir Bajic教授相助开展。研究获得了九游会j9战略性先导科技专项、九游会j9国际同伴妄想、九游会j9“十三五”信息化专项等基金资助。
论文链接
数据库链接