基因组信息如何指导基因在特定空间和时间表达的机理仍有待进一步深入研究。“结构决定功能”是认识自然规律中的一个共识,动物基因组在细胞核中不是随机分布的,而是排列成具有重要功能意义的高级染色质结构,染色质构象与基因表达调控密切相关,然而目前还有许多物种的染色质构象仍不清楚,且对进化过程中这些染色质结构单元的变化也知之甚少。Hi-C 技术推动了三维基因组学的研究,实现了全基因组范围内染色体片段间相互作用的捕获,十多年的时间,该项技术广泛应用于构建基因转录调控的交互图谱,染色质结构的进化,转录调控研究等领域。
近日,四川农业大学李明洲教授团队、中科院大学人工智能学院张治华研究员团队以及不朽情缘研发合作中心田仕林研究员团队共同利用12种主要脊椎动物的Hi-C数据,绘制了不同物种3D基因组结构的图谱,探索动物进化与三维基因组结构的关系,扩展了人们对基因组结构形成机制的理解,为农业动物重要经济性状的三维基因组学研究提供了参考依据。研究结果以题为Comparative 3D genome architecture in vertebrates发表在国际权威期刊BMC Biology上,首次揭示了染色质构象不同结构单元在进化过程中的保守性及其相关功能。
该研究对来自于12种脊椎动物(图1)的31个成纤维细胞系进行了基于高通量染色质构象捕获 (Hi-C) 数据的比较三维基因组分析,包括两个代表性的哺乳动物谱系:灵长总目 (包括人类、恒河猴、小鼠、大鼠和兔子) 和北方兽类 (包括狗、猫、猪、羊和牛),以及两种非哺乳动物——鸟类 (鸡) 和鱼类 (斑马鱼),揭示了决定跨物种功能基因保守性和转录调控的结构特征。
图1 染色体长度可能影响脊椎动物的染色体结构
该研究首先对12个物种的全基因组染色体内互作模式进行了分析,发现较长的染色体通常具有更高的远距离互作频率、更低的延展性和更紧缩的染色体疆域分布,提示染色体长度影响脊椎动物整体染色质构象的可能。进一步构建了染色体间互作网络图,发现染色体疆域具有强烈的非随机分布特征,且长度相近的染色体间的互作频率更高。此外,研究团队利用染色体间互作网络的两个参数——即聚类系数(Clustering coefficient,反映任意两个位点倾向于聚集的程度)和平均度(Average degree,表示互作网络中与每个位点互作的节点数)来反映染色体间的空间物理接近性。通过物种间两个参数的比较发现,与鸡和斑马鱼相比,哺乳动物染色体间的连通性相对较弱,且这种染色体间连通性与物种的基因组大小显著相关。基于蛋白编码基因的染色体间互作相似性的层次聚类树与12个物种的系统发育树高度一致(图2),提示我们空间上聚集的基因可能具有共调控作用,且这种共调控作用在物种间具有普遍性。
图2 染色体间基因-基因互作的种间比较
在局部的空间互作层面上,研究团队对10个哺乳动物的共线性区域 (约占各物种基因组的30%左右)分析了其染色质活性状态和绝缘性在物种间的相似性,表明进化上更接近的物种,其局部空间环境模式具有更高的相似性。大多数共线性区域在10个哺乳动物中具有一致的染色质状态,近一半的区域具有保守的绝缘性,且这些进化上保守的染色质区室和绝缘状态在不同的组织或细胞类型中也倾向于维持其保守性(图3)。而那些具有物种特异性进化模式的区域可能包含与物种表型多样性相对应的具有不同功能的基因。
图3 不同物种compartment比较
为了进一步探索图谱关联结构域(TAD)在物种间的保守性,该研究团队在20 kb分辨率下用Domaincaller的方法鉴定了12种脊椎动物的TAD,发现基因组较大的哺乳动物具有更多更长的TAD。通过对预测的CTCF基序进行分析,表明基因组上收敛的(Convergent)CTCF基序对脊椎动物三维基因组结构的维持具有重要作用。通过非编码保守性元件CNE在TAD内的富集分析及基于同源基因的TAD保守性得分分析发现,TAD结构对基因调控的限制性影响可能是脊椎动物保守的进化特征(图4)。通过以人的基因组作为参考,进一步鉴定了TAD边界(TAD boundary)的保守性及其在进化过程中的获得和丢失,发现247个在10个哺乳动物中保守存在的TAD边界,以及29个人类特异性获得的TAD边界。位于人类特异性获得的TAD边界内的基因主要与免疫系统有关,例如TBIB1基因,该基因参与白细胞分化和对细菌的反应,作为慢性抗体介导排斥反应的血液和组织生物标志物,在移植中起着关键作用。灵长类获得的TAD边界中,包含了与神经网络活动和突触可塑性调节相关的GRM5基因,该基因是一个治疗精神分裂症认知缺陷的潜在靶基因。
图4 不同物种TAD的比较
转座元件TE(尤其是活跃的SINE)在人、小鼠和果蝇等基因组中都参与了染色质空间结构的形成,在维持和/或重塑基因组结构中具有重要的作用。该研究同样分析了TE对12个哺乳动物三维基因组的影响(图5)。通过TE在TAD内的富集分析发现,SINE在哺乳动物TAD边界富集,而LINE、DNA和LTR在哺乳动物TAD边界缺失。并且,SINE和LINE与染色质区室状态间存在显著的弱相关。为了进一步探讨TE在不同物种的三维基因组结构形成中的潜在作用,研究团队比较了四种主要TE家族分布与TAD内染色质互作频率的关系。结果显示,在哺乳动物中,SINE和DNA转座元件的比例与互作频率呈正相关,而LTR和LINE比例与之呈负相关。相反,在鸡基因组中,DNA转座元件与互作频率呈负相关;而在斑马鱼中,所有的TE家族都显示出与互作频率正相关。对预测的增强子区域中TE家族富集程度比较显示,哺乳动物增强子中SINE富集程度高于非增强子区域,LINE的富集程度则低于非增强子区域,而DNA转座子和LTR未发现一致的规律;非哺乳动物的增强子区域中,同样未检测到TE家族的富集模式。进化上接近的10种哺乳动物,其单拷贝同源基因对应的增强子区域中TE比例具有更高的互作相似性。鉴于本研究中非哺乳动物样本数量有限,TE在非哺乳动物中的分布还需进一步研究。
图5 不同物种中TE富集情况
综上,该研究表明基因组大小和染色体长度与最上层的三维基因组结构单元——染色体疆域的形成有关,而更精细的下层结构特征,包括DNA的局部转录可及性,是通过脊椎动物的进化选择的;TAD的保守性似乎与物种间基因表达的模块化密切相关;在基因组结构的进化过程中,LINE和SINE转座因子可能分别参与异染色质和常染色质的组织。该研究揭示了决定跨物种功能基因保守性和转录调控的三维基因组结构特征,相关发现扩展了我们对基因组结构形成机制的理解,对正在进行的基因组进化研究具有一定的参考价值。
四川农业大学李地艳教授、何梦楠博士后、唐茜子教授、研发与合作中心首席科学家田仕林和四川农业大学张佳满博士生为论文的共同第一作者,四川农业大学的李明洲教授和中科院大学人工智能学院张治华研究员为共同通讯作者。
Copyright@2011-2024 All Rights Reserved 版权所有:不朽情缘 京ICP备15007085号-1