1、有关水稻落粒性的进化作物的进化往往开始于不落果或不落粒的植物。这种导致谷类作物进化的落粒性减轻的性状与大效应的遗传位点有关。然而,这种关键的遗传过渡的分子基础仍然是未知的。在此,我们证明水稻进化过程中落粒性的减少是由于人类对一个由未知功能的基因编码的DNA 结合域处的一个替换蛋白质的选择。谷粒从花梗上的脱落是由离层控制的,而这种替换破坏了离层正常发育所必需基因的功能。水稻,作为世界上的主要食物,是从野生杂草发育而来。因为野生杂草的谷粒成熟后自然脱落,所以谷物早期进化的必要阶段是选择成熟后不落粒的植物以达到有效收获的目的(1,2)(Fig.S1 ) 。这种选择进程并不一定是有意识的,因为不过早落
2、粒的植物有较好的机会被收获并在下一年被种植。因此,在进化过程中不落粒等位基因的频率增大并最终代替落粒的等位基因。我们发现一个基因位点,该位点可以解释大多数谷类作物和它的原始亲本间的落粒性状的表型差异,这个发现证明对该基因位点的选择应该会加速进化过程(3-5)。然而,选择的分子遗传基础尚未清楚。水稻是由一个或两个亲缘关系很近的物种-O.nivara 和 O.rufipogon-广布东南亚到印度(6,7)。我们最近对 O. sativa ssp. indica 和野生一年生的 O. nivara 杂交所获得的 F2 代群体进行分析发现了 3 个 QTL-sh3, sh4 , sh8-是栽培稻的落粒
3、性状减弱的主要因素(5)。这些 QTL 中,sh4 解释了 69%的表型变异,其它两个 QTL 分别解释了 6.0%,3.1%的表型变异。故野生稻中的 sh4 基因是一个显性的引起落粒的基因。两个先前使用O.sativassp.indica 和野生多年生物种 O.rufipogon.杂交来对QTL进行的研究发现四个和五个QTL(8,9)。两个研究都在 sh4的位置定位了一个QTL,并且这个QTL在检测到的QTL中具有最大或几乎最大的表型效应。而且,对O.sativassp.indica japonica 和O.rufipogon.以及其他两个亲缘关系很近的野生品种O. glumaepetula
4、 和 O.meridionalis的遗传分析发现了三个野生品种中都具有的一个单显性基因和落粒相关 (10,11)。将该位点命名为sh3,并将其定位到和sh4相同的染色体位点。 我们进行分析将sh4定位到分子标记RC-123R和M280(SSR标记)之间(5),在O. sativa基因组中这两个分子标记之间的物理距离为1360kb(12) (Fig. 1A).。因为O. nivara中的显性基因位点的效应很大,我们可以不管其它两个小效应的QTL位点而从表型将F2代中纯和隐性单株(ss)和至少在sh4 位点含有O. nivara基因的显性个体(ns,nn)区分开。我们对489个F2代个体的三个落粒
5、QTL位点的基因型进行检测,发现在sh4位点具有ns和nn的植株在拍打时全部的成熟谷粒都会落下,而该位点基因型为ss的植株即使在激烈拍打时不落粒或部分落粒。有了这个可靠的表型检测方法,我们种植了12000株F2代秧苗并将扫描它们在分子标记RC-123R和M280之间的重组。我们对一个标记位点的基因型为 ns而另一标记位点为ss 的单株进行选择,总共有134个单株符合条件并将其种植以进行表性检测。对标RC-123R和M280之间的SSR标记和SNP标记进行检测,最终将栽培水稻中的不落粒的突变基因定位在一个未知功能基因的1.7kb处(Fig. 1B and table S1)。经预测该基因是一个转
6、录因子,它的编码区域被定位到水稻第四条染色体上已有基因LOC_Os04 g57530上的第34014305和34012126碱基对之间(The TIGR Rice Genome Annotation Database)。我们对两个作图群体亲本中的1.7kb序列进行比较发现了七个突变(Fig. 1C)。这七个突变包括一个内含子突变:(a)1-bp 的替换;第一外显子处的三个突变:(b)一个15-bp或是三个氨基酸的插入或缺失,(c)一个 3bp或一个氨基酸的插入或缺失,(d)一个1 bp或一个氨基酸的替换;以及起始密码子5 , 端上游的三个突变:(e)-55位点1bp的替换,(f) -343位点
7、和-344位点之间3bp的插入和缺失(g)-558位点和-559位点间8bp的插入或缺失。为估测这些突变的多态性及进化的方向,我们对以下品种中的1.7kb进行测序:可以代表O.sativa多样性的 14个栽培品种 (14),可以覆盖野生品种分布的 21个O.nivara 的品种(15) ,O. rufipogon的六个品种,现存的四种野生A 种基因组的水稻(Fig. 1C and table S2)。栽培种在f位点具有多态性,其它的栽培种内含有和O. nivara相同的序列。在剩余的六个突变位点中,所有的栽培种都具有相同的序列,而这些同源序列和O. nivara并不相同。令人惊奇的是三个O.
8、nivara品种在这六个位点的序列和O. sativa相同。我们随后发现由这三个品种所得的植株都具有非落粒的性状。温室观察发现这三个品种具有栽培稻的其它特性,如:直立的分蘖、短刺或光周期敏感。这暗示三个品种是杂草稻,并且从栽培稻中获得并固定了sh4的等位基因。其它的具有明确的落粒性状的野生稻品种在d位点与栽培稻明显的分离,而在O. sativa中此位点由T突变为G 导致天门冬氨酸替换为精氨酸。在剩余的五个突变中,序列多态性存在于野生品种中(Fig. 1C)。也就是说,在这些位点处,一些野生品种和栽培品种虽有相同的序列但具有落粒性。因此,结果证明水稻进化中非落粒品种的形成是对d位点氨基酸替换选择
9、的结果。在Genbank中对蛋白序列进行 BLAST搜索发现了三个与sh4相似的预测基因,包括水稻基因(XP_469180 ),与sh4 的氨基酸具有32% 的同源性;两个拟南芥基因(NP_174416 and NP_181107)与 sh4分别具有32%和29%的同源性。这些基因的功能都尚未被鉴定。据预测两个拟南芥基因是转录因子(16),并且其中一个在数据库中具有 cDNA序列(AAT99796 )。其它一组较为相似的基因也是来自于水稻和拟南芥,但是和sh4的氨基酸序列只有20-22%的相似性。我们运用Prosite和核定位技术对 sh4蛋白进行检测,发现其包括一个Myb3 DNA 结合域及
10、一个核定位信号,据此可推测说是一个转录因子。为了验证这个假设,我们将该基因与绿色荧光蛋白(GFP)基因融合形成sh4-GFP基因,并且该基因被质粒中的Ubi启动子启动。我们将该结构导入日本晴品种Taipei309中,经测验该品种适合于基因转化,由此可以确定GFP连接 sh4的核定位信号(Fig. 2) 。这些结果都支持sh4是一个转录因子的生物假说。利用RT-PCR检测 sh4在花和茎(谷粒脱离体的位置)中的表达发现,sh4并不在花、茎或叶子中表达。我们利用RT-PCR扩增了两个作图亲本sh4 基因cDNA序列的编码区域,将这两种cDNA进行比较后发现,和水稻基因组预测的一样,cDNA合成过程
11、中是在内含子的同一位置进行剪切。我们运用RT-PCR 来比较sh4基因在双亲花和种子的不同发育阶段表达的相关程度(Fig.3b)。及检测当种子成熟时该基因的表达量虽有增加,但明显的增加发生在授粉后的第12天。在O.sativa 中sh4 的表达量在第18持续增加,而在O.nivara中的表达量因落粒而无法检测。我们检测了同一发育阶段的花和谷粒与茎之间的连接强度,授粉后第九天花和谷粒与茎脱离所需的力量与其它发育阶段所需的力量在任何一亲本中并没有显著性的差异(Fig. 3C)。该力量在授粉后的第12天开始下降,O.nivara中的下降速度比 O.sativa中的要快。授粉后的第、18天O.niva
12、ra的谷粒几乎落尽而无法检测。在O.sativa中谷粒脱离茎所需的力量是早期阶段所需力量的一半;之后该力量一较慢的速度下降但并不会降低到像O.nivara 中允许落粒的程度。我们运用转基因水稻来确认基因的功能并检测替换氨基酸的功能:我们制作了两含有O.sativa的启动子及两个亲本间重组的编码区,两个结构只在d点具有差异。结构1具有O.nivara中3 , 未翻译区到突变位点d之间的序列和O.sativa 中突变位点e到5 , 调控区之间的序列。结构2具有O.nivara中3 , 端到突变位点c之间的序列及 O.sativa中突变位点d到到5 , 调控区之间的序列(Fig. 1B)。将具有两种
13、结构的 质粒导入Taipei309 中。经RT-PCR检测转基因植物中导入片段的表达后发现在突变位点b和c处有一断18bp的缺失。结构1经转化表达后显示谷粒与茎之间的连接强度显著性的减少,而转化表达结构2后,发现其和对照之间并无显著性差异(Finger.3D ) 。因此该结果支持了由遗传图谱和序列比较所得到得结论,d位点氨基酸的替换是水稻驯化过程中落粒性减弱的主要原因。衰老树叶、凋萎的花器及成熟果实等程序化的器官分离是植物功能和适应性的基础活动,并且这些活动受离层的控制(植物器官和母体的结合处) 。然而,遗传控制离层发育的分子遗传机理尚不清楚。对大豆、马铃薯和拟南芥等双子叶植物的研究发现,离层
14、由许多小的,密集的薄壁细胞层组成。做为响应环境和激素信号的一种机制,离层的破裂伴随着细胞扩张和控制离层中层薄壁细胞破裂的水解酶的分泌(18) 。在包括杂草的单子叶植物中,有关离层的发育和功能的机制人们知之甚少。离层发育的基因调控机制尚未弄清。在此我们发现组成水稻离层的细胞大多数是单层的薄壁细胞。在O. nivara中谷粒和花梗之间有一层完整的离层细胞,经观察它是由在维管束和表皮细胞之间的一层径向连续的离层细胞构成(Fig.4A)。然而在O. sativa中的离层是不连续的。在径向上离层细胞线是不连续的,并且在维管束处取而代之的是与相邻花梗细胞类似的后壁细胞(Fig. 4, B and C)。在
15、两种品种中,这种解剖学特征在幼花(检测的花为开花前 15天的花)至谷粒成熟阶段都能观察到。因为Japonica品种比 indica较难落粒(19),Taipei309的谷粒与花梗之间的连接强度比indica的作图亲本强(Fig.3, C and D)。相应的japonica的离层不连续程度较高并且离维管束较远。谷粒与花梗之间的连接强度低于100g的转基因植株中,离层细胞数目明显增多,并且这些细胞的连续性较高,离维管束较近(Fig. 4D)。结果显示sh4在花发育的早期阶段对离层细胞的形成具有重要作用。在种子成熟后期sh4的过量表达说明该基因可能在离层活动的激活中叶具有重要作用。栽培稻中赖氨酸替
16、换天冬氨酸削弱了sh4的以上两种或其中一种作用。在水稻进化过程中人类的选择可能会增加落粒性减弱的基因突变频率但却不会消除离层的形成或功能。这种选择方式阻止了收获期间因落粒而导致的谷物减产,但是一定程度的离层被保留下来,这样水稻产量才不会因落粒性存在而不能提高。在O. sativa的成熟后期,Sh4 的表达量和谷粒连接强度之间的反相关表明:栽培稻种的氨基酸替换并没有敲除基因的功能。Sh4 的表达量在O. sativa中比O.nivara中增长的慢的原因可能是水稻栽培中基因调控区域对较优落粒平衡的选择。多种水稻品种间sh4调控序列、基因表达水平和表型变异的比较应该会为水稻进化史中农艺性状选择的遗传
17、基础提供进一步见解。作物进化的遗传分析,尤其是进化相关基因的克隆一定程度上解释了植物的发育和进化。在玉米和马铃薯的发育中调控基因的突变是明显的形态学变化的主要原因(20-23)。在此,我们证明,预测DNA结合域中积极作用氨基酸对中性氨基酸的替代是水稻驯化生理过度的关键。这与积极作用氨基酸是DNA结合域表面关键残基的发现相一致(24)。Sh4的克隆有助于理解单子叶植物的发育途径、细胞程序化分离及种子分布,并为选择最有效的收获途径提供借鉴。图1:sh4的分子克隆。(A)QTL作图得 sh4的染色体位置。虚线表示一个LOD单位的支持区间。(B)sh4的精细定位。竖线代表SSR和SNP分子标记。横线上
18、面数字表示按标记在染色体上位置顺序的编号;线下数字:对分子标记进行检测后在包含sh4基因区间内的重组数目。水平白色箭头表示标记5和6间ORF的起始位置和大小。不落粒突变位点被定位到分子标记9和11之间,该基因有两个外显子(黑色区域)和一个内含子(灰色区域)。该基因的其实和终止密码子都已标明。基因下面的横线表示转基因所用的两种结构;红色和蓝色分别代表来自O.nivara和O.sativa的基因序列。(C) 作图亲本间的七个多态性位点。栽培种水稻和野生水稻种七个位点的比较。S和n分别代表O.sativa 和O.nivara的序列。同一物种中具有相同序列的品种数目已被标出。(D) O.sativa中
19、sh4蛋白的序列。作图亲本间的差异序列已被标出:红色代表替换(O.nivara中突变位点d和k)蓝色表示插入或缺失(突变位点b、c;O.nivara 中的缺失序列)。划线部分表示预测的 Myb3 DNA结合域。绿色部分表示预测的核定为信号。Sh4-GFP结构编码的重组蛋白在图中为sh4基因编码的起始位置到氨基酸E和后面的GFP。氨基酸缩写如下:A, Ala; C, Cys; D, Asp; E, Glu; F, Phe; G, Gly; H, His; I, Ile; K, Lys; L, Leu; M, Met; N, Asn; P, Pro; Q, Gln; R, Arg; S, Ser;
20、 T, Thr; V, Val; W, Trp; and Y, Tyr.图2:sh4的亚细胞定位。转入Ubi:sh4-GFP结构的水稻品种TaiPei309根部用DAPI 染色并在各种情况下观察。(A)不同干扰条件下的表皮细胞的对比。(B) DAPI染色后的细胞核。(C)sh4-GFP的细胞核定位。(D)合并后的图像。图3:sh4的表达及花和谷粒的分离(A)来自花和茎连接处组织总RNA 的RT-PCR结果(FP );茎的其他部分的RNA(P);未开的花RNA(F);叶的RNA(L)。花上面展示的是O. nivara中成熟谷粒与茎的分离。(B)实效PCR检测sh4的相关表达,来自叶片的总RNA(
21、L),开花前3天花或谷粒与茎连接处的总 RNA(-3),开花当天RNA(1)种子发生过程每3天检测一次RNA。(C)开花当天花和谷粒脱离经所需力量(1) 及种子形成过程中每3天检测一次该力量大小。(D)转基因植株谷粒脱离茎所需力量大小:对照(转入结构为空质粒)植株、含有结构1的植株、含有结构2的植株。图4花和花梗连接处的纵向荧光成像(A)O.nivara,具有完整的离层(al).(B) O. sativa ssp. indica 具有不完整的离层。(C) O. sativa ssp. japonica Taipei 309,具有不完整的离层。(D)转入结构1的Taipei309比Taipei3
22、09 具有较完整的离层f花、p茎、v维管束。参考文献1. J. R. Harlan, Crops & Man (American Society of Agronomy , Madison, WI, 1975).2. J. F. Hancock, Plant Evolution and The Origin of Crop Species (CABI, Cambridge, MA, ed. 2, 2004).3. V. Poncet et al., Theor. Appl. Genet. 100, 147 (2000).4. A. H. Paterson, New Phytol. 154, 5
23、91 (2002).5. C.-B. Li, A.-L. Zhou, T. Sang, New Phytol. 170, 185 (2006).6. H. I. Oka, Origin of Cultivated Rice ( Japan Scientific Society Press, Tokyo, 1988).7. S. D. Sharma, S. Tripathy, J. Biswal, in Rice Breeding and Genetics: Research Priorities and Challenges, J. S. Nanda, Ed. (Science Publica
24、tions, Enfield, NH, 2000), pp. 349369.8. L. Xiong, K. Liu, K. Dai, C. Xu, Q. Zhang, Theor. Appl. Genet. 98, 243 (1999).9. H. W. Cai, H. Morishima, Theor. Appl. Genet. 100, 840 (2000).10. Sobrizal, K. Ikeda, P. L. Sanchez, A. Yoshimura, Rice Genet.Newslett. 16,74 (1999).11. Y. S. Nagai et al., Rice G
25、enet. Newslett. 19, 74 (2002).12. Q. Feng et al., Nature 420, 316 (2002).13. To screen a large number of seedlings for recombinants,we developed a method of rapid DNA is olation for plants with tough leaves unsuitable for high-throughput protocols (25).14. A. J. Garris, T. H. Tai, J. Coburn, S. Kres
26、ovich, S. McCouch, Genetics 169, 1631 (2005).15. D. A. Vaughan, The Wild Relatives of Rice: A Genetic Resources Handbook (International Rice Research Institute, Philippines, 1994).16. J. L. Riechmann et al., Science 290, 2105 (2000).17. D. Choi, Y. Lee, H.-T. Cho, H. Kende, Plant Cell 15, 1386(2003)
27、.18. S. E. Patterson, Plant Physiol. 126, 494 (2001).19. T. T. Chang, in Rice: Origin, History, Technology, and Production, C. W. Smith, R. H. Dilday, Eds. (Wiley, New Jersey, 2003), pp. 325.20. J. Doebley, A. Stec, L. Hubbard, Nature 386, 485 (1997).21. A. Frary et al., Science 289, 85 (2000).22. J
28、. Liu, J. Van Eck, B. Cong, T. D. Tanksley, Proc. Natl. Acad. Sci. U.S.A. 99, 13302 (2002).23. H. Wang et al., Nature 436, 714 (2005).24. K. Yamasaki et al., Plant Cell 17, 944 (2005).25. Materials and methods are available as supporting material on Science Online.26. Data have been deposited into GenBank with accession numbers DQ383371 to DQ383414.