大豆是人类摄取蛋白质和油类的主要来源。栽培大豆(Glycine max (L.) Merr.)大约 5,000 年前在中国由其一年生的野生近缘种(Glycine soja Sieb. & Zucc.)驯化而来。在大豆进化过程中,利于精耕细作、高生产力和高质量的基因得到了选择,从而出现了地方品种和随后的改良品种。地方品种和改良品种的传播导致适应范围和生产力的显著增加。
在2022年中央一号文件提出“大力实施大豆和油料产能提升工程”和“集中支持适宜区域、重点品种、经营服务主体”的大背景下,中国农业科学院作物研究所邱丽娟研究员和李英慧研究员团队和尊龙凯时研发与合作中心首席科学家田仕林研究员团队等在国内SCI TOP期刊SCIENCE CHINA Life Sciences上发表题为Genome-wide signatures of geographic expansion and breeding of soybean的文章,通过对2214个大豆样品的基因组序列进行分析,揭示了大豆的地理扩张与育种过程中的进化历史,为未来的大豆育种工作提供了宝贵的遗传资料。
1. 提出了“自华南地区扩展、至华中地区驯化、最后在本地实现育种和扩大种植”的野生大豆进化路线。
2. 野生大豆和人工育种大豆从遗传角度上是相对独立的,在大豆地方品种地理扩张过程中,遗传渐渗主要来自同域野生种群而非异域野生种群。
3. 野生大豆地理扩张和育过程中,GmSPA3c 等花期基因均得到正向选择。
实验材料:来自不同地理区域的 2214 个大豆样品(1674 个新测序大豆和 540 个先前测序的大豆种质,新测序品种平均测序深度6.3X)测序平台:Illumina Hiseq X;(部分数据来自NCBI数据库导入)研究方法:群体变异检测,群体选择分析,连锁不平衡分析,群体遗传结构分析,种群历史动态分析,候选基因功能验证
1.大豆基因组变异图谱
从2214个大豆种质重测序数据中共获得了8,785,134个高置信度双等位SNP,随机抽取了114份材料进行目标测序分型,验证率为98.3%,表明本研究的SNP检测准确率高。在随后的种群遗传解读分析中,作者只筛选了具有弱连锁性的1,721,062个SNP集合进行分析。
图1 大豆群体SNP的检测流程
2.野生和栽培大豆显示出类似的种群分化
大豆主要的遗传分化在G.max及其祖先G.soja之间。93.6%的大豆种质聚集成三个亚群并分布在三个地理区域,其一是中国北方、日本、朝鲜半岛和俄罗斯远东地区;其二是黄河流域中下游的中国中部地区;最后是中国南部区域。分析结果证实了中国南部地区的野生大豆向北扩散的迹象,由此推断出栽培大豆的遗传基因信息从中国中部的地方品种分别流向中国北部地方品种以及中国南部改良品种,这揭示了中国黄河中游可能为大豆的驯化中心。
图2 大豆亚属的分布、遗传多样性和种群结构
在所有三个亚群中均观察到从当地野生种群到地方种群的定向基因流动,在涉及两个同域野生和驯化种群的比较中,fd 值显著高于涉及异域种群的比较。这表明,当大豆地方品种迁移到中国南部和北部地区时,来自当地野生种群的基因渗入可能加速了大豆对当地的适应。作者分析了5%的fd离群值对应的基因组区域,这些区域包含与大豆种子品质、开花时间和生物抗性相关的功能基因。特别是在中国中部和中国南部地区的栽培大豆种群之间在大豆基因组的6号染色体上大约有20 ~ 30 Mb的遗传渗入,并包含一个关键开花基因E1。通过进一步研究前fd离群值对应的基因组区域,发现在三个地理区域中有共同的显著富集的渐渗区域,表明基因组中一些关键的共同位点的变异对大豆的南北传播非常重要。
图3 地方品种fd 值
基于系统发育树、种群结构和种群历史分析,研究提出了野生和栽培大豆的进化路线,包括四个阶段。第一阶段对应于野生大豆从中国南部向中国北部扩张,第二阶段是中国中部驯化过程,第三阶段是地方品种种群从中国中部地区向南北扩展,第四阶段是改良过程。
该研究在野生大豆和地方品种扩张期间共鉴定出2,438 个和 4,877个选择消除基因。研究发现了野生大豆和地方品种在扩张期间受选择的基因的重叠率明显低于预期,说明两者都能够独立适应相似的本地环境。在大豆进化的第三阶段,在大豆地方品种从中国中部扩张至南部和北部的过程中开花时间基因E2被选择,而另一个开花时间基因GmFT2a在中国中部扩张至南部时被选择。进一步的基因分型分析发现了E2基因上的控制早花期的等位基因型Chr10:45310798_T在中国北部的栽培大豆中几乎固定,这说明开花时间基因对于地方品种地理扩张过程中的局部适应至关重要。
在大豆进化的第二阶段驯化过程中,发现了一些早期人类偏好的因果等位基因在地方品种中被强烈选择,如开花时间基因(E4和GmFT5a)、种子开花基因Boom1(B1)、种子硬度基因(GmHs1_1)和种子休眠 G 基因。这符合大豆早期驯化过程中,农民为了追求快速均匀发芽、安全、可食用且不含有害过敏原的大豆种子,导致了大豆种子硬度丧失和种子开花丧失的表型变化的育种偏好规律。
在大豆进化的第四阶段改良过程中,发现了一些响应不同改良方向和适应不同环境的选择基因,如在中国南部地区检测到开花基因E1,在中国南部和北部地区同时检测到开花基因E2,在中国中部地区检测到开花基因GmFT5a。
此外,在该研究中,还另外设计了一种能检测大豆驯化过程中连续定向变化规律的选择分析方法。该方法通过整合三个区域的驯化、扩张和改良的四个阶段的组合来确定等位基因频率的连续的定向增加或减少规律。通过该方法在中国南部,中部和北部检测出200个基因表现出等位基因频率的连续动态变化。其中一些开花时间基因(GmFT2b、GmFT4/E10 和 GmGBP1)显示等位基因频率连续增加,也在野生大豆从中国南部地区向中部地区扩展和中部地区驯化过程中都表现出选择。通过该方法还找到了一些其他的候选基因,如GmFT2b和GmFT4被育种者在中国中部地区改良中使用,GmGBP1和GmFT2b分别在中国中部到北部和中国南部地区的地方品种扩张期间被选择用于局部改良。这个方法为先前传统的选择分析方法提供了有效的补充。
图4 在大豆驯化、扩增和改良过程中检测具有选择信号的基因组区域和基因
在大豆驯化、改良和扩张过程中选择的基因中,观察到了8个克隆的大豆开花时间基因和与光周期响应相关的4个FT旁系同源基因。通过对基因的分析可知开花时间通路在大豆对环境的适应中发挥了重要作用,开花时间基因的旁系同源物在不同进化阶段被选择,表明该通路在大豆中的特异性。
GmSPA3c是拟南芥SPA3的四个共同直系同源物之一。在13个错义突变中,Hap11和Hap12在驯化过程中是独立选择的,在遗传改良过程中优先选择Hap11。携带 Hap11的品种开花明显早于携带Hap12的品种,Hap11的早期开花效应可能被选为大豆驯化和改良过程中较弱的花抑制剂,可以被优先选择并扩大了大豆对不同地区的适应性。
图5 GWAS鉴定GmSPA3c在调节开花时间中的作用及GmSPA3c单倍型的进化和地理分布特征
文章通过CRISPR/Cas9 方法对GmSPA3c Hap11的功能进行分析。GmSPA3c 的功能丧失使长日照条件下植物提早开花,开花抑制基因表达下调而开花激活基因表达上调。GmSPA3c属于开花抑制基因,GmSPA3c是E7的候选基因。
图6 确认GmSPA3c为开花抑制因子并比较Hap11和Hap12调节开花时间的活性
1. 本研究基于对野生和栽培样本的密集和多样化采样,首次全面分析了大豆的进化历史,包括野生大豆的扩散、驯化地点、地方品种的范围扩大以及随后的改良过程。
2. 本文推断了野生大豆的系统地理扩张路线,大豆可能起源于中国南方并传播到中国中部和北部,尽管大豆野生祖先起源于亚洲亚热带,但其在中国的温带地区被驯化。
3.开花时间的适应是一个连续的过程。本研究验证了一个选定基因 GmSPA3c 作为开花时间调节基因,也是开花基因座E7的候选者,在驯化、地方品种扩展和改良过程中经历了微弱但持续的选择。
Copyright@2011-2024 All Rights Reserved 版权所有:尊龙凯时 京ICP备15007085号-1