尊龙凯时

尊龙凯时

Sitemap

两个T2T完美基因组揭示了辣椒进化和辣椒素生物合成的见解

2024年9月29日    编辑:尊龙凯时

发文单位:北京大学现代农业研究院陈为凯助理研究员、科研助理王祥锋、孙杰、王欣蕊与华南农业大学园艺学院朱张生副教授为论文共同第一作者,北京大学现代农业研究院郭立研究员和何航研究员为论文共同通讯作者。北京大学现代农业研究院、 清华-北大生命科学联合中心邓兴旺教授、北京大学现代农业研究院张兴平研究员和李博生研究员参与了该项工作。

发表期刊:Nature CommunicationsIF=16.6)

发表时间:2024年5月20日

研究结果:该研究组装了两个端粒到端粒的无缺口辣椒基因组,这些T2T基因组资源将加速辣椒精准分子育种和辣椒素合成生物学等核心技术发展,促进辣椒食用、观赏、药用价值的开发利用。本研究中,三代长读长、Hi-C、Illumina和ATAC-seq等建库测序服务由尊龙凯时提供。

背景介绍

辣椒(Capsicum spp.)是茄科(Solanaceae)的一员,是一种在全球范围内广泛种植的蔬菜作物,其果实以辣味而闻名,这种辛辣味是由辣椒素引起的。辣椒素通过苯丙烷途径和支链脂肪酸途径生成前体代谢物,最后在辣椒素合成酶(CS)的催化下生成;然而,完整的生物合成途径目前尚未阐明。到目前为止,已公开了至少23个栽培辣椒的基因组序列,而野生辣椒的基因组序列相对稀缺。已发布的辣椒基因组存在大量缺口和组装错误,并且缺少完整的着丝粒和端粒,辣椒功能基因组研究仍然具有挑战性。因此,生成端粒到端粒(T2T)的无缺口基因组序列对于改进辣椒的精确遗传特性以及解析辣椒素和其他天然代谢产物的完整合成通路具有至关重要的意义。

 

文章思路

 

主要结论

1.T2T无缺口辣椒基因组组装

该研究使用了PacBio HiFi、ONT Ultra Long(ONT超长测序)、Illumina paired-end(NGS)和Hi-C等测序技术完成了C. annuumC. rhomboideumT2T无缺口基因组组装。首先基于HiFi和ONT reads单独组装,使用ONT基因组填补了HiFi基因组中的Gap及端粒区域,然后使用Hi-C进行了染色体级别的挂载,并使用Juicebox进行手动矫正。最终得到了两个辣椒的T2T无缺口基因组。C. annuumCaT2T)包含12条染色体,基因组大小为3.1 Gb,contig N50为262.6 Mb; C. rhomboideumCrT2T)包含13条染色体,基因组大小为1.7 Gb ,contig N50为146.0 Mb。

1 两个无缺口T2T辣椒基因组

2.基因组验证和注释

首先,检查了Hi-C染色质互作图,该图显示CaT2T和CrT2T中没有明显的错位。然后,针对基因组分别比对了所有HiFi、ONT和NGS reads,所有三种数据类型的比对率都超过99.96%。除了CrT2T中存在少量高拷贝数卫星重复,其余比对的HiFi或ONT reads显示了整个基因组均匀覆盖。CaT2T和CrT2T的质量值(QV)分别为56.60和77.18,BUSCO分别为98.62%和97.12%,这表明两个基因组具有很高的准确度和完整度。此外,最近发表的C. annuum cv. '59'(以下简称Ca59)的基因组与CaT2T基因组比对,显示出良好的共线性。HiFi和ONT reads的高覆盖率很好地支持了CaT2T的高质量组装。有趣的是,CaT2T和CrT2T的部分区域高覆盖率,与完整的线粒体或叶绿体基因组插入序列相对应;这一结果得到了跨越整个整合位点的ONT超长reads的验证,表明了质体基因组近期在核基因组中进行了整合。

重复注释显示,C. annuumC. rhomboideum基因组中79.5%(2.45 Gb)和74.6%(1.28 Gb)是重复序列。虽然C. rhomboideum中的LTR插入是最近发生的,但在C. annuum中大约在0.1 Mya和3.9 Mya有两次爆发,这与之前关于Ca59的报告一致。两种辣椒基因组的卫星重复序列含量都很低(<0.01%),远低于人类(4.5%)、拟南芥(0.37%)及烟草(1.75%)。通过整合abinitio预测、同源蛋白和转录组数据等证据,在CaT2T和CrT2T中分别预测了34,428和33,512个蛋白编码基因。CaT2T填补的Ca59的Gap区域中共编码614个基因,其中110个是CaT2T中新注释出来的。

3.辣椒的着丝粒广泛受到CRM逆转录转座子的侵入

着丝粒是细胞分裂期间确保染色体分离所必需的功能元件,在拟南芥中主要由Mb级别的串联卫星重复序列组成,而辣椒的着丝粒序列尚未由报道。本文首先通过C. annuumCENH3 ChIP-seq数据确定CaT2T的着丝粒,该数据清楚地划定了CaT2T中12个着丝粒的位置和边界。然后,观察到染色体间的Hi-C相互作用总是与ChIP-seq峰值呈正相关,特别是在CrT2T中。与拟南芥和人类着丝粒不同,辣椒着丝粒缺乏高拷贝的卫星重复序列,取而代之的是被Gypsy-LTR广泛入侵,约占总着丝粒序列的71%,而Gypsy-LTR仅占整个基因组的47.3~49.7%。小麦和棉花中也有类似情况,着丝粒中80%以上是Gypsy-LTR。该研究还发现,着丝粒中的LTR插入爆发比整个基因组中的爆发要晚,这表明最近的着丝粒进化是由LTR入侵造成的。此外,共线性分析显示C. baccatumC. pubescensC. rhomboideum基因组中CRM反转座子富集的区域对应C. annuum中确定的着丝粒位置,这表明CRM是辣椒着丝粒的一种特征元件,可用于预测或识别辣椒着丝粒的位置。该研究还观察到种内和种间着丝粒序列的相似性较低,这表明辣椒着丝粒在种内和种间的迅速分化。这一结果与最近对拟南芥着丝粒的研究结果一致。

C. annuum基因组中着丝粒区域的基因组结构

4.着丝粒和端粒具有转录和表观遗传活性

在蛋白质编码基因以及转录和表观遗传控制方面,着丝粒和端粒是研究较少的的基因组区域。基因组注释显示,CaT2T着丝粒中的60个基因在冷冻反应、DNA拓扑变化和减数分裂染色体分离等功能方面具有重要作用。相比之下,CrT2T着丝粒上编码了94个基因,富含对UV-B的响应、光合作用和昼夜节律调节。有趣的是,在两个辣椒中只有6或7个基因是同源的。着丝粒基因的低同源性反映了物种之间着丝粒的高度差异。该研究还在CaT2T的着丝粒和端粒上发现转座子和蛋白质编码基因的转录活性。

3 C. annuum T2T基因组中的表观基因组和转录特征

5.辣椒素生物合成途径的进化史

辣椒素生物合成的启动机制在植物中的具体机理尚不明确,通过使用两个全基因组测序的辣椒属植物和其他15个被子植物的基因组,包括4个辣味和13个非辣味物种,重新探讨了这个问题。发现辣椒属与酸浆属(Physalis,即姑娘果)的亲缘关系更近,而不是茄属(例如番茄),分别在约17百万年前和约19百万年前分化。辣椒素生物合成仅限于辣椒属作物,C. baccatum在约5百万年前与C. annuumC. chinense分离,后者与不能产生辣椒素的C. rhomboideum在约13.4百万年前分化,这表明辣椒素生物合成途径可能是在约5-13.40万年前起源的。为了了解辣椒属作物中该途径的起源,使用OrthoFinder在17个被子植物中鉴定了与已知辣椒素生物合成基因(CBG)同源的基因。在所有物种中,无论辣味与否,都含有大多数CBG的同源基因,只有最关键的基因CS仅在茄科作物中以串联重复的形式出现。一年生辣椒含有7个串联重复拷贝,而在野生辣椒中仅存在4个拷贝。转录组分析显示CBG基因在辣椒果实中高度表达,而在不辣的植物如番茄、马铃薯、酸浆和野生辣椒CS基因几乎不表达。序列比对显示辣椒的CS基因(CS-1/CS-2)具有保守的编码序列和上下游调控区,而在不辣的辣椒和近缘茄科物种中,CS基因编码区和调控区发生了明显的结构变异,由此导致辣椒素合成能力的差异。

4 辣椒素生物合成基因的进化及其组织特异性

6.染色质可及性调控组织特异性的辣椒素生物合成

辣椒素的生物合成具有高度的组织特异性,仅发生辣椒果实的胎座中。为了理解辣椒素生物合成的组织特异性是如何实现的,本文对C. annuum的果实和叶片进行了多组学分析,包括ATAC-seq、WGBS-seq和RNA-seq。RNA-seq分析显示,CS及其转录调控因子MYB31MYB48在胎座中特异性表达。CS-1在胎座、果肉和种子中均检测到低甲基化的开放染色质区域(OCRs),而CS-2、MYB31MYB48仅在胎座中鉴定到OCRs,这表明CS-2很可能是决定辣椒素胎座特异性合成的主要基因。

如何共调控基因组分散的CBGs以赋予辣椒素合成的时空特异性仍然未知。人们预期CBGs应该有共同的调控元件。为了验证这个假设,提取了ATAC-seq鉴定的胎座特异性的OCRs和CBGs的上游2 kb序列,进行序列基序富集分析。鉴定到在多个CBG基因周围的OCR中发现了MYB等转录因子结合位点,表明转录因子(如MYB31)可能特异识别这些OCR区域内的顺式元件,实现在果实组织中协同调控CBG表达。不辣的C. annuum中,由于2.4 kb的缺失,CS-2OCRs丧失,导致这些品种中缺乏辣椒素。简而言之,多组学数据分析揭示了辣椒中辣椒素生物合成基因组织特异性共表达的可能的表观遗传机制。

 

结论

综上,该研究首次公布了C. annuumC. rhomboideum两个辣椒T2T无缺口基因组。系统发育基因组学和多组学研究揭示了辣椒果实中辣椒属特有的和胎座组织特异性积累的辣椒素的进化机制。新的T2T基因组资源代表了作物基因组研究的一个里程碑,将加快提升辣椒功能基因组学研究和精确改良。

 

参考文献

[1] Chen, W., Wang, X., Sun, J. et al. Two telomere-to-telomere gapless genomes reveal insights into Capsicum evolution and capsaicinoid biosynthesis. Nat Commun 15, 4295 (2024).

 




Copyright@2011-2024 All Rights Reserved    版权所有:尊龙凯时    京ICP备15007085号-1

一对一业务咨询

一对一业务咨询

在线客服

联系方式

联系电话

400-658-1585

企业邮箱

service@novogene.com
返回顶部
Sitemap