核 酸 研 究,找 艾 博 思!
新闻中心
News center
超级增强子系列二

超级增强子发现


2013年,Richard A. Young实验室基于当时增强子的研究,提出了超级增强子(Super-enhancers, SEs)概念。超级增强子是具有转录活性增强子的一个大簇,富集高密度的关键转录因子(Master tran-scription factors)、辅因子(Cofactor)和增强子表观修饰标记(Histone modification marks),驱动控制细胞身份基因的表达,可以用来解释细胞类型特异的表达模式,在发育生物学、癌症等疾病致病机理研究中显示出巨大的应用潜力。


超级增强子定义


胚胎干细胞细胞多能性状态的维持,受到少数几个关键转录因子的控制,这些关键转录因子包括Oct4、Sox2和Nanog等,它们在其他细胞类型的特异表达可以诱导形成多能干细胞(induced plu-ripotent stem cells, iPSCs)。关键转录因子通过结合位于增强子的结合位点(Binding sites),进一步招募辅因子Mediator、cohesin及RNA聚合酶Ⅱ等蛋白转录复合体组分来调控靶基因的表达、精密调控细胞状态和个体发育的进程。因而对这些因子结合位点的检测,可以高准确地预测增强子的活性状态。利用ChIP-seq方法测定小鼠胚胎干细胞Oct4、Sox2和Nanog的共同结合位点,所得数据集共鉴定出8794个增强子,发现其中231个增强子的Mediator结合密度远远大于其他增强子,主要和控制胚胎干细胞多能性状态的基因相关联,这些增强子被称为超级增强子。超级增强子是指具有转录活性增强子的一个大簇,能驱动控制细胞身份基因的表达。


超级增强子的鉴定


超级增强子的鉴定,依据的是增强子转录活性标记分子结合水平强度的差异,这些分子包括辅因子(如Mediator和cohesin)、组蛋白修饰标记(如H3K27-ac和H3K4me1)、染色质修饰分子(如p300)等。超级增强子的鉴定流程如图上图所示所示,简单来说分为3个步骤。以超级增强子在小鼠胚胎干细胞中的鉴定为例:


第一步,确定活性增强子位点


对小鼠胚胎干细胞的关键转录因子Oct4、Sox2和Nanog结合位点进行ChIP-seq测序分析,基因组中共同的结合位点区域为增强子。


第二步,对所得增强子进行缝合


在基因组范围内,这些单个增强子实体间如在12.5 kb范围内,则合并为单个实体,即缝合增强子(Stitched enhancer)。


第三步,确定超级增强子和普通增强子之间的阈值


缝合增强子和其余的单个增强子按照ChIP-seq所测Med1信号水平的强度排序,绘制获得一张曲线图,该曲线上斜率为1的切线的切点所得的Med1信号值为区分超强增强子和普通增强子之间的阈值,高于该值为超级增强子,其余的则称为普通增强子(Typical enhancer)(图B)。


在数量方面,超级增强子远远少于普通增强子。随后分别用关键转录因子PU.1、MyoD、T-bet和C/EBPα在小鼠的pro-B细胞、肌小管细胞(Myotubes)、帮助T细胞(Helper T cells)和巨噬细胞(Macrophages)鉴定出超级增强子的存在[9]。超级增强子控制并定义了细胞身份,这些元件及其关联基因在所有细胞类型的鉴定有利于人们对细胞发育及疾病发生过程的理解。


然而,大部分细胞类型人们并不知道其对应的关键转录因子,因而Hnisz等进一步分析了增强子的其他分子标记是否能够应用于超级增强子的鉴定,结果显示H3K27ac为最佳选择,并对包括肿瘤等疾病相关的86种人类细胞和组织的超级增强子得到了进一步鉴定。超级增强子的概念及其巨大的应用潜力得到了越来越多的认可和引用,已广泛应用于发育生物学、肿瘤等疾病发生的机理研究。


超级增强子主要结构特征归纳


1.超级增强子多数位于超级增强子结构域(Super-enhancer domains, SDs)



真核生物基因组结构是个高度有序的、层次化的结构,DNA和组蛋白组装成染色质初级结构核小体(Nucleosome),折叠成染色质折叠和功能的基本单元拓扑学关联结构域TADs(Topologically associating domains),进一步形成更加复杂的染色体。在TADs内,cohesin介导各种基因环次级结构的形成,如cohesin关联的增强子−启动子环(cohesin-asso-ciated enhancer-promoter loops)、cohesin关联的CTCF环(cohesin-associated CTCF loops)等,从而调控基因的表达。Dowen等对ESCs高可信度cohesin ChIA-PET数据进行分析,发现大部分超级增强子及其关联基因一般位于基因组中大的CTCF-CTCF环内,其中84%的超级增强子及其关联基因位于这种环内,而与此相反的是,普通增强子位于这种环内的比例只有48%。这种包含超级增强子的环,往往包含两个相互作用的CTCF位点,CTCF位点结合CTCF蛋白后,并共同结合cohesin,称之为超级增强子结构域。超级增强子结构域通常含有一个超级增强子,和SDs内的基因形成转录环,从而限制超级增强子只对SDs内基因的激活,若一旦失去这种约束很可能导致邻近基因不恰当的激活,一个超级增强子的基因错误靶向足以导致肿瘤的发生。


2.超级增强子横跨更大的基因组区域


超级增强子是具有转录活性增强子的一个大簇,在大小方面,超级增强子横跨DNA的长度比普通增强子高一个数量级。和普通增强子相比,超级增强子表现出横跨更大的基因组区域的特征,有的横跨20kb范围甚至更长。


3.超级增强子富集大量转录因子、辅因子及转录活性相关组蛋白修饰标记


超级增强子是高度活跃的,富集了大量转录因子、辅因子及转录活性相关组蛋白修饰标记。和普通增强子相比,这些分子在超级增强子部位的信号水平至少要高一个数量级。造成这种数量级的差异,不仅因为超级增强子和普通增强子之间的大小不同,还因为这些分子位于这些区域的密度存在差异。



4.eRNA在超级增强子处的表达


强子RNA(Enhancer RNA, eRNA)属于非编码RNA(Non-coding RNA, ncRNA),在基因组增强子区域转录合成,对关联基因的转录起到促进作用,是功能活跃增强子全基因组的特征。活跃增强子通过直接招募RNA聚合酶II,进行单向或双向转录合成eRNA。增强子的转录及合成的eRNA有助于增强子行使功能,其转录水平和增强子的活性高度相关。