打开APP

Nature重磅!科学家绘制出迄今为止全面的人类基因组中非编码DNA图谱 揭示了3万个人类疾病区域的特殊回路!

  1. DNA图谱
  2. EpiMap
  3. GWAS
  4. 基因组
  5. 疾病
  6. 非编码DNA

来源:本站原创 2021-02-23 22:26

2021年2月24日 讯 /生物谷BIOON/ --近日,一篇发表在国际杂志Nature上题为“Regulatory genomic circuitry of human disease loci by integrative epigenomics”的研究报告中,来自麻省理工学院等机构的科学家们通过绘制表观基因组图谱即使了3万个人类疾病区域的回路。20年前

2021年2月24日 讯 /生物谷BIOON/ --近日,一篇发表在国际杂志Nature上题为“Regulatory genomic circuitry of human disease loci by integrative epigenomics”的研究报告中,来自麻省理工学院等机构的科学家们通过绘制表观基因组图谱即使了3万个人类疾病区域的回路。20年前,人类基因组的第一份草案公开发布,该项目的主要惊喜之一就是科学家们发现人类基因组中仅有1.5%是由蛋白质编码基因组组成的。

在过去20年里,科学家们最初认为是垃圾DNA的非编码DNA片段在机体发育和基因调节中都扮演着关键角色,这项研究中,研究人员发布了迄今为止最全面的非编码DNA图谱。该图谱对跨越833种组织和细胞类型进行了表观基因组标记,即能表明不同类型细胞中哪些基因被开启或关闭的修饰,相比之前所涵盖的内容有了显著增加,此外,研究人员还识别出了能控制特定生物程序的调节元件,并揭开了与540种特定性状相关的大约3万个遗传变异的候选作用机制。

研究者Manolis Kellis教授说道,我们所提供的其实是人类基因组的回路,20年后我们不仅有了基因,而且还拥有了非编码的注释、模块、上游调节子、下游靶点、病毒变异以及对这些病毒变异的解释。

图片来源:CC0 Public Domain

表观基因组的控制

叠加在人类基因组(组成遗传代码的核苷酸序列)之上的是表观基因组,表观基因组由化学标记所组成,其能帮助确定不同时间点和不同细胞中会有哪些基因被开启表达,这些标记包括组蛋白修饰、DNA甲基化以及某段DNA的可及性。表观基因组学能直接读取机体细胞所使用的标记,从而记住每一种细胞类型和机体每一种组织中到底什么开启和关闭;其就好像便利贴、荧光笔和下划线一样,表观基因组学能让我们了解每种细胞类型中被标记为重要的细胞,从而了解基因组的实际功能。

而绘制这些表观基因组注释或能帮助揭示遗传控制元件以及不同元件活跃的细胞类型,这些控制元件能被分类为集群或模块,共同作用来控制特定的生物学功能,其中一些元件是增强因子,其能与激活基因表达的蛋白质相结合,而另一些则是抑制因子,能够关闭基因的表达。研究人员新绘制的图谱名为EpiMap (Epigenome Integration across Multiple Annotation Projects),其建立在多个大规模绘图联盟的数据基础之上,并能够结合这些数据,包括了ENCODE(DNA元素百科全书), Roadmap Epigenomics(表观基因组学计划)和Genomics of Gene Regulation(基因调控基因组学计划)。

文章中,研究人员共收集了833个生物样本,其达标了不同类型的组织和细胞类型,每个生物样本的表观基因组标记的子集都略有不同,因此很难完全整合多个联盟的数据;随后研究人员通过合并类似标记和生物样本的现有数据,填补了缺失的数据集,并利用由此产生的跨越833个生物样本中的1万个标记汇编来研究基因调节和人类疾病的发病机制。

研究人员注释了200多万个增强子位点,其仅覆盖了每个生物样本中0.8%的比例,合计占基因组的13%;研究人员根据其活性模式将其归纳为300个模块,并将其控制的生物学过程、调节子和短序列基序联系了起来,同时研究者还预测了基于其协调活性模式下,控制元件和目标基因之间的330万种联系,这代表了迄今为止人类基因组中最全面的回路。

疾病链接

自从2003年人类基因组最终草案完成以来,研究人员已经进行了数千项全基因组关联性研究(GWAS),揭示了能使携带者易患某种形状或疾病的常见遗传突变。这些研究大约产生了12万个突变,但仅有7%的突变位于蛋白编码的基因中,其余的93%的突变位于非编码的DNA区域中。然而,非编码突变体如何发挥作用,研究人员并不清楚,原因有很多;首先,基因突变是成组遗传的,这就使得在每个疾病相关区域的几十个突变中寻找致病突变体变得非常困难,此外,非编码突变体能够远距离作用,有时在数百万个核苷酸以外,这就很难找到其所作用的靶基因,同时其还具有极强的动态性,这样研究人员就很难知道其到底会在哪个组织中发挥作用,而且了解其上游调节机制也是一个未解决的问题。

这项研究中,研究人员就能解决这些问题,并能为超过3万个非编码GWAS编译提供候选的机制见解;研究者发现,与同一特性相关的变异更倾向于在该特性生物学相关的特定组织中富集,比如,与智力相关的基因突变往往会出现在大脑中活跃的非编码区域,而与胆固醇相关的基因突变则会出现在肝脏中的活跃区域中。研究人员还表明,一些性状或疾病会受到多种不同组织类型中增强子活性的影响,比如他们发现,与冠心病相关的遗传突变或在脂肪组织、冠状动脉、肝脏等其它组织中处于活跃的状态。

目前研究者Kellis的实验室正在与其他研究人员合作,在这些全基因组预测的指导下来寻找特定疾病发生的线索;研究人员正在对冠心病患者的心脏组织、阿尔兹海默病患者的小胶质细胞以及肥胖患者的肌肉、脂肪和血液等组织样本进行分析,基于目前的研究结果,这些或许都是能预测疾病的因素。许多其它实验室也都在利用EpiMap数据来进行不同疾病的多项研究;最后研究者Kellis说道,我们希望我们的预测结果能在工业界和学术界得到广泛的引用,从而帮助阐明遗传突变及其发挥作用的机制,并能帮助靶向性疗法瞄准作用靶点,从而加速治疗多种该疾病的药物等疗法的开发。(生物谷Bioon.com)

参考资料:

【1】Boix, C.A., James, B.T., Park, Y.P. et al. Regulatory genomic circuitry of human disease loci by integrative epigenomics. Nature 590, 300–307 (2021).doi:10.1038/s41586-020-03145-z

【2】Epigenomic map reveals circuitry of 30,000 human disease regions

by Massachusetts Institute of Technology

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->