随着三代测序技术的发展,基因组组装已经进入新时代。T2T(Telomere-to-Telomere)基因组更是结合PacBio HiFi以及Hi-C等多种测序技术,完成了高准确性、高连续性和高完整性的基因组组装。在这个T2T基因组频发的时代中,部分动植物已经拥有了T2T级别的参考基因组,但对于昆虫类基因组来说,其进展依然较为缓慢。那么对于较难达成T2T基因组级别的昆虫类物种,我们应该如何开展相关研究?那么今天这篇文章给出了极好的答卷。
西北工业大学/中国科学院昆明动物研究所王文教授团队在国际著名期刊《Nature Communications》上在线发表了题为“Evolutionary patterns and functional effects of 3D chromatin structures in butterflies with extensive genome rearrangements”的研究论文,为我们提供了蝴蝶3D染色质结构研究前沿思路。
研究对象:核型不同的四种蝴蝶(凤蝶科)
测序策略:PacBio HiFi+Hi-C
研究结果:该研究获得了核型不同的四种蝴蝶的染色体水平参考基因组,结合大规模的Hi-C数据,详细研究了昆虫中3D染色质结构的演化模式,伴随着在Compartment、TAD、subTAD和染色质环水平的密集基因组重排。不朽情缘提供了PacBio HiFi建库测序以及所有样本的Hi-C测序服务。
1.基因组构建
使用PacBio HiFi和Hi-C数据组装了四种蝴蝶的染色体级基因组,其中P. bianor基因组30条染色体中的12条无缺口,达到T2T水平,此前报道中并无该类物种的T2T基因组。
该研究注释出这些基因组序列的37-60%的重复序列和每个基因组约15,000个蛋白质编码基因。基于系统发育分析和分歧时间分析,这三个Graphium物种形成一个分支,大约在6.66Mya与P. bianor分化,三个Graphium物种的分化时间从8.1到27.2 Mya不等。这些结果为识别基因组重排事件提供了系统发育背景。
表1 4种蝴蝶基因组组装
2.染色体重排
通过与P. bianor基因组的全基因组比对,分析了Graphium物种中发生的染色体重排事件。结果显示,G. eurypylus和P. bianor之间几乎没有染色体重排,这与它们具有相同染色体数的事实一致。相比之下,三个Graphium物种的基因组共线性分析显示,其中有许多基因组重排。尽管G. sarpedon和G. cloanthus经历了大量的染色体间重排,并且最近分化了(~8.1Mya),但它们只共享一个染色体融合位点。这表明,在这两个物种之间的8.1Myr,大多数染色体间的融合是在物种形成后独立进化的。
图1 四种蝴蝶的基因组进化
3.3D基因组染色质结构
为了研究蝴蝶的3D染色质结构,研究利用大规模Hi-C数据构建了四种蝴蝶的高分辨率的全基因组染色质相互作用图谱,为4个蝴蝶分别生成了177~415 Gb Hi-C数据,并定位到相应的基因组上,分别在Comparements、TAD、subTAD 和loop环的水平上探索3D染色质结构。研究观察到青凤蝶的3D染色质结构长度(TAD为40kb)与之前对双翅目物种的研究(TAD为5kb)显著不同,这可能归因于四种蝴蝶物种的基因组大小较大。
图2 青凤蝶属3D基因组染色质结构
4.基因组重排对3D染色质结构的影响
先前的研究表明Compartment结构在进化过程中是相当保守的。随后,研究通过分析G. sarpedon和G. cloanthus染色体间融合位点两侧基因的区室类型,并将其与G. eurypylus中相应同源基因的区室类型进行比较,研究发现染色体间融合位点附近同源基因的区室类型保守性大致相当于(~90%)同源基因的区室类型在整个基因组中的总体保守水平。这些结果表明,Compartment状态几乎没有受到染色体间重排的影响。研究同时比较了G. sarpedon和G. cloanthus的 TADs、subTADs 和染色体融合位点周围的loop环与G. eurypylus的相应区域。结果发现,G. sarpedon和G. cloanthus的染色体间重排位点(RS)均位于G. eurypylus的端粒或TAD边界,而G. eurypylus没有观察到跨越这些区域的染色质环。这些发现表明,染色体间融合几乎不会破坏祖先染色体预先存在的3D染色质结构。然而,研究观察到在重排基因组中的一些染色体间RS上出现了TAD甚至subTADs。
图3 基因组重排对3D染色质结构的影响
5.TE插入改变3D染色质结构
接下来,研究分别在G. sarpedon和G. cloanthus中鉴定了66个和69个长程(>100 kb)染色体重排,观察到TE介导的三种青凤蝶基因组扩增之间存在显着相关性,与P. bianor相比,TADs和subTADs的平均长度和数量增加,以及TADs和subTADs的平均长度和数量增加。因此,研究从两个方面比较了染色体内重排对3D染色质结构的影响:长程(>100 kb)染色体重排(包括倒置和易位)和TE插入。结果发现,大染色体内RSs周围区室的保守水平与全基因组的平均区室保守水平(~90%)相当,与染色体间重排一致。蝴蝶基因组中存在广泛的 TE 插入,研究探索了由TE插入引起的重排。结果发现,G. eurypylus、G. sarpedon和G. cloanthus中Compartments A内TADs 和subTADs长度变化的比例小于染色体大小的比例,表明它们在A区室中受到更强烈的约束。与此一致,我们观察到A区间连续区域的 3D结构具有更高水平的一致性。相比之下,3种青凤蝶中“A到B”和“B到B”型转变中涉及的TADs和subTADs的长度变化比例均高于染色体大小的比例。一个值得注意的例子是,通过比较P. bianor 的3D染色质结构,研究发现TE插入介导的染色体重排在三种青凤蝶的B区室中形成了一个新的TAD。有趣的是,一个重要的基因,果聚糖果糖转移酶(lft),它调节昆虫翅膀的TOR信号,位于这些转换区室中。因此,区室转变可能导致lft基因在三种青凤蝶中表达更高(RNA-seq数据指示)。该案例表明,TE插入可以诱导区室转换并改变TADs,从而调控基因表达。
图4 TE插入改变3D染色质结构
总的来说,本研究构建了四种凤蝶属的高质量参考基因组,并生成了大规模的Hi-C数据,结合ATAC-seq和RNA-seq多组学数据,揭示了基因组重排引起的3D染色质结构改变进而影响基因表达调控,证明了染色体重排引起的3D染色质结构改变在动物性状进化中起着重要作用。这些发现强调了3D染色质结构在生物体进化中的重要性,为未来的进化遗传学研究探索了新的方向。
参考文献:
[1] Zhou, B., Hu, P., Liu, G. et al. Evolutionary patterns and functional effects of 3D chromatin structures in butterflies with extensive genome rearrangements. Nat Commun 15, 6303 (2024).
Copyright@2011-2024 All Rights Reserved 版权所有:不朽情缘 京ICP备15007085号-1