1、 水稻 OsSsr1 基因 的生物信息学分析 摘要 : OsSsr1 (GeneBank登录号为 NM_001065574)是 NJH12表达谱中的一个表达量上调基因 ,为了进一步分析其序列特征、启动子序列、亚细胞定位及在水稻不同组织和各种逆境胁迫下的表达模式 ,通过生物信息学手段对 其 进行 分析。 序列分析表明 OsSsr1 的开放阅读框为 2004 bp,编码一个由 667 个氨基酸组成并含有 5 个跨膜区的蛋白 ,该蛋白 N 端含有一个信号肽。 OsSsr1 基因在氷稻不同不同组织中均有表达 ,在叶部的表达量最高 ,其次为根 ,在幼穗中的表达量最低 ;表达水平受干旱、高温、高盐、低温、
2、机械伤害、稻瘟病菌等 的影响。 前言 : 水稻是中国也是全世界重要的粮食作物之一,盐害是水稻生产中最不利的限制因素之一 1-4。 然而水稻在生长发育过程中常常受到干旱 ,低温和高盐等非生物胁迫,严重影响水稻的产量和品质。因此,分离鉴定水稻耐逆相关基因,培育耐逆品种,对水稻的高产稳产具有重要意义 5。 当植物遭受非生物胁迫时 ,植物会发生一系列形态、生理、化学和分子上的变化。干旱、高温和土壤盐渍化是最常见的非生物胁迫。全球农业用地大约 22%是盐碱地 6,并且由干旱而造成的盐碱地也在逐年增加 7。植物在逆境条件下对不同环境因子响应的方式通常会重叠。尽管对麦类植物进行千旱和髙盐处理的基因表达谱显示
3、 ,在不同的胁迫下响应的基因有所差异 ,但是它们可能诱导相似的防御反应 8。 一些研究结果表明,来自水稻黄单胞菌的 Harpin 蛋白质的编码基因 hrf1 转化水稻,能够提高其对稻瘟病、水稻白叶枯病和干旱的抗性 9-11。封伟等 12利用农杆菌介导法将 OsSsr1 基因转入烟草,提高了烟草在盐胁迫下脯氨酸的积累水平和活性氧清除能力,从而增强了其对 NaCl 的耐受能力 。虽然过量表达 OsSsr1 可显著提高转基因植株的抗逆能力,但其序列结构特征、表达模式仍不清楚。常 闪闪等 5人 为探明 OsSsr1 基因的亚细胞定位及在水稻不同组织和各种逆境胁迫下的表达模式,通过生物信息学手段、洋葱表
4、皮亚细胞定位、 RiceXPro 数据库和 Real-time PCR 对其进行相关 的 研究,得出其启动子序列包含 TGACG-motif、 ABRE、TCA-element 和 W box 等多个与逆境相关的顺式作用元件。 GFP 融合表达显示, OsSSR1 蛋白质定位于细胞膜。 RiceXPro 数据库中数据分析表明, OsSsr1 基因在水稻不同发育期的不同组织中均有表达,在叶中的表达量最高,胚中的表达量最低。 Real-time PCR 结果表明,OsSsr1 表达水平受干旱、高温、高盐、低温、机械伤害、稻瘟病菌、 MeJA 和 ABA 的诱导上调。 方法 : 查找相关 文献 ,找
5、到 OsSsr1 的 登录号为 : NM_001065574, 登录 NCBI,输入 OsSsr1(Oryza sativa L. salt-sensitive related gene 1,)基因的 登录号 ,搜索 OsSsr1 的 序列。 1. 用 NCBI 网站 上的 BLAST-blastn(http:/blast.ncbi.nlm.nih.gov/Blast.cgi )进行 序列比对分析。 2. 用 ORF Finder( http:/www.ncbi.nlm.nih.gov/gorf/gorf.html) 进行分析 ,并找到序列的 ORF 区 (开放读码框架 ), 3. 用 ExP
6、ASy 网站上 的 ProtParam( http:/web.expasy.org/protparam/) 进行预测 蛋白质的分 质量 和等电点 。 4. 用 SingalP4.0( http:/www.cbs.dtu.dk/services/SignalP-4.0/)对 OsSsr1 进行 信号肽 预测 。 5. 使用 TargetP( http:/www.cbs.dtu.dk/services/TargetP/)对 OsSsr1 进行 亚细胞定位分析。 6. 使用 PredictProtein( http:/www.predictprotein.org/) 来 进行 螺旋和折叠的含量分析
7、。 7. 使用 NNPP( http:/www.fruitfly.org/seq_tools/promoter.html) 程序预测分析 OsSsr1启动子 元件。 8. 使用 Swiss-model( http:/www.swissmodel.expasy.org/interactive) 进行同源建模预测三维结构预测 和分析。 9. 使用 MEGA4.0 软件 中的 Neibor-joining 算法构建 系统发育树 。 10. 使用 TMHMM Server v2.0( http:/www.cbs.dtu.dk/services/TMHMM/) 检测 蛋白质的 潜在跨膜区。 11. 使用
8、 plantCARE( http:/bioinformatics.psb.ugent.be/webtools/plantcare/html/) 在线分析 OsSsr1 的启动子序列 结果 与分析 1. 在 NCBI上 输入 登录 号 为 NM_001065574 时 ,得到 OsSsr1基因的 FASTA序列 为下 :如 图 1 2. 使用 BLAST-blastn 进行序列比对的结果如 图 2 图 1 如 上图,根据颜色 比例尺, hit 的得分区间, 与之 比对结果相对较好的也就只有这 4 条 ,由于 blast 是区段比对,对于给定的序列, blast 会把具有相识性的片段 (hit)找
9、出来,显示的是 hit 的信息,所以要判断两个序列的相似性,单看 hit 值 是不够的。 在 Descriptions 图中看出 E value 都 是为 0, 而 Oryza sativa Japonica Group cDNA clone:J013001G11, full insert sequence 的 score 值相对来说是 最大 的, 而 Score 值表示两序列的同源性,分值越高表明它们之间相似的程度越大, 所以他们两个的相似程度是最大的。 3. 序列的 ORF 区分析, 得到的结果如下 。 序列分析表明, OsSsr1 完整的开放阅读框为 2 004 bp, 编码一个由 66
10、7 个氨基酸组成的蛋白质。 图 2 4. 蛋白质的分质量和等电点分析如 图 3、 图 4. 由 分析结果可知: 预测此蛋白质 的分子量( Molecular weight)是 199973.6,理论 上的等电点( Theoretical pI) 为 4.85,氨基酸 的组合 大概 有 Ala24.8%、 Cys21.6%、 Gly26%、Thr27.6%。不稳定指数()计算为 42.68, 所以 这种蛋白质是不稳定的。脂肪指数为24.80, GRAVY 的 总平均为 0.69。 此外 该蛋白质不包含任何 Trp 残基,这可能导致在所计算的消光系数超过 10的误差。考虑的序列的 N 末端为 T(
11、苏氨酸)估计半衰期是 7.2小时(哺乳动物网状细胞,在体外),大于 20 小时(酵母,体内), 大于 10 小时(大肠杆菌,体内)。 5. 对 OsSsr1 进行信号肽 预测分析 。 如下图 5、 图 6 所示 ,输入基因的 FASTA 序列 , 得到如下的结果 . 如 上图, S值表示每个氨基酸对应 1个 S值,在结果显示的图表中有一个曲线显示S值的变化趋势,(在 full 模式中可以看见具体数值),信号肽区域的 S 值较高。 C值表示剪切位点值。每个氨基酸会有一个 C值,在剪切位点处 C值是最高的。 Y 值表示 Y-max 综合考虑 S值和 C值的一个参数,其比单独考虑 C值要更精确。因为
12、在一条系列中 C值可能有不止一个较高的位点,但是剪切位点只有一个;此时的剪切位点就由 Y-max 值来推测的,为 S值是陡峭的位置和具有高 C值的位点。 在 上图中 position 为 23 和 24 时 , C值 是最大的, Y 值 也达到了最高峰, 所以此点 为信号肽的 剪切 位点。 表 1:信号 肽分析结果文本 Table 1: Signal peptide analysis text Measure Position Value Cutoff signal peptide? max. C 24 0.291 max. Y 24 0.502 max. S 8 0.972 mean S 1
13、-23 0.870 S 1-23 0.701 0.450 YES 由 表 1 可以 看出 1-23 有 信号肽, CTA-CC D=0.701 , D-cutoff=0.450 而 23 或者 24 为信号肽的剪切位点。 6. 对 OsSsr1 进行亚细胞定位分析。如 图 7结果 所示 由 图 7中 的 sequence预测可能的 值是 叶绿体,即序列包含 CTP,叶绿体转运肽 ; 线粒体,即序列包含 MTP,靶向肽线粒体 ; 分泌途径,即该序列含有 SP 信号肽 ; 7. 螺旋和折叠的含量分析。结果 如 图 8. 表 2: 蛋白质 的二级结构组成 Table 2: The compositi
14、on of the protein secondary structure Sec str type Helix shEet Loop % in protein 63.27 2.55 34.18 从 表二可以看出 蛋白质 的 螺旋结构占 最高的含量,其次是 环 的含量,而 折叠结构的 含量最少,达到了 2.55%, 上图 中红色的 表示 Helix,螺旋结构; 蓝色表示 shEet,折叠结构;绿色表示 Loop,环 (转角和无规则卷曲 )。 8. 分析 OsSsr1 启动子元件 如图 9, 在 框 内输入 FASTA 序列 ,得到 图 10 所 示的结果。 从 图 10 中 可以看出 启动子预测有 两种,而从 2299 到 2349 的 序列的 得分 最高,达到 0.97(最高 分为 1) , 所以它有可能是 启动子 序列:TATGGAAGGTTTAAAAGTCTCGAGAGCTCAACTGGAGATCACTACAAGAA 而另 一个的得分是 0.93, 相比第一个要小一些, 排除 其他因素的干扰,也有可能 是 启动子元件 , 序列为: TGCCAGCCCCTATATATATCCCAGATTTTCTCCTTCCTTTTCTCTTGACT 9. 三维结构预测和分析。