1、浅谈原核表达的技巧摘要:原核表达是表达外源基因常用的方法,具有操作简单、快捷,需时较短,表达产量高,适合工业化等优点。本文作者根据自己的实践经验,总结了原核表达的一些技巧。 关键词:原核表达 表达载体 限制性内切酶 将植物、动物、微生物等的目的基因插入合适载体后导入大肠杆菌用于表达大量蛋白质的方法一般称为原核表达。这种方法在蛋白纯化、定位及功能分析等方面都有应用。大肠杆菌用于表达重组蛋白有以下优点:易于生长和控制;易于培养,实验耗费少;可选择多种大肠杆菌菌株及与之匹配的具各种特性的质粒。原核表达是近年来表达外源蛋白常用的方法,本文根据自己的实践经验,着重谈谈对原核表达中的技巧问题。 一、原核表
2、达一般程序 表达前准备-获得目的基因-构建含目的片段的表达载体(测序验证)-转化表达宿主菌- 诱导靶蛋白的表达-表达蛋白的分析。 二、原核表达中各操作步骤的关键因素及技巧 1.表达前的准备要素:原核表达注重表达前对目的片段、表达载体及表达菌株的分析、选择。正所谓“磨刀不误砍柴功”,经过细致、周全的分析、准备、设计可带来较为顺当的实验,可免去许多不必要的麻烦。 (1)对表达载体的分析 载体的选择:同样的载体,同样的系统,很可能表达这个蛋白表达量起高,但另外一个就是做不出来,所以表达载体的选择非常重要,没有万能的载体。选择载体通常我们关心质粒上的几个功能组件及所带来的问题:是否为诱导表达型载体,启
3、动子的强弱、多克隆位点、限制性内切酶的位置、终止密码子的有无及位置,融合 Tag的有无,筛选报告基因的位置等。所选载体一定要保持原来的遗传背景(有些载体经过多次交换已变异)。选择表达载体时,要根据所表达蛋白的最终应用考虑,如果为了方便纯化,可选择融合表达;如果为了获得天然蛋白,可选择非融合表达。融合表达时在选择外源 DNA 同载体分子连接反应时,对转录和转译过程中密码结构的阅读不能发生干扰。 翻译的起始位点:要表达目的蛋白,在该基因的 5端必须有一起始位点,现在大部分的表达载体都提供起始位点,起始密码子与核糖体结合位点的距离都已被优化,一般情况下不需要自己再加,实际操作时要留意载体图谱上是否注
4、明有起始密码子和终止密码子,如无,还得根据自己的实际情况加上。 在起始密码子附近的 mRNA 二级结构:外源基因其始转录后,保持 mRNA 的有效延伸、终止及稳定存在是外源基因有效表达的关键,尤其是在起始密码子附近的 mRNA 二级结构可能会抑制翻译的起始或者造成翻译暂停从而产生不完全的蛋白。如果利用 Primer Premier 软件分析 DNA 或 RNA 结构上有柄(stem)结构,并且结合长度超过 8 个碱基,这种结构会因为位点专一突变等因素而变得不稳定,影响正常的翻译。 (2)对目的片段的分析 基因(或蛋白)的大小:原核表达的成功与否与所要表达的蛋白(或基因)大小有关,一般说来小于
5、5kD 或者大于 100kD 的蛋白都是难以表达的。蛋白越小,越容易被内源蛋白水解酶所降解。在这种情况下可以采取串联表达,在每个表达单位(即单体蛋白)间设计蛋白水解或者是化学断裂位点。如果蛋白较小,那么加入融合标签GST、Trx 、MBP 或者其它较大的促进融合的蛋白标签就较有可能使蛋白正确折叠,并以融合形式表达。如果蛋白较大,大于 60kD 的蛋白建议使用较小的标签(如 6组氨酸标签)。对于结构研究较清楚的蛋白可以采取截取表达。当然表达时要根据目的进行截取,如果是要进行抗体制备而截取,那么一定要保证截取的部位抗原性较强。对于抗原性也可以利用软件分析,比如 Vector NIT Suite 或
6、者一些在线软件,不过在分析之余也要认识到这是一种资料统计的结论,如果蛋白和免疫动物亲缘关系较远的话还是不妨一试的。 表达序列的 GC 含量:表达序列中的 GC 含量超过 70的时候可能会降低蛋白在大肠杆菌中的表达水平。GC含量可以利用 DNA STAR、VectorNTI Suite 等软件进行预测。 亲疏水性:经常做表达的人都发现表达亲水区域时表达量会比较高,如果你要表达一个膜蛋白,它的疏性会增加实验难度。有许多软件可以对氨基酸的亲疏水性进行分析,比如 VectorNIT Suite,除此之外还可以利用在线跨膜区预测软件对跨膜区进行预测。 2.获得目的基因 基因工程中,目的基因的制备有直接分
7、离法、构建基因组文库分离法,构建 cDNA 基因文库分离法、聚合酶链式反应扩增法(PCR)和化学合成法。原核表达一般都是利用 PCR 把目的基因克隆扩增出来。PCR 法的关键是设计引物,可以使用两个软件,PrimerPremier 或者 Oligo 来分析。如果要表达全长,用不着考虑太多,从一头一尾找至少 8 个匹配序列在加上与载体匹配的序列就行。注意以下几点:、先查查表达外源片段中含有什么内切酶位点,否则设计重了,酶切后电泳就会老发现有预期外的小片段出现。根据载体上的酶切位点设计引物,现在许多类似 T 载原理的克隆方法也可以应用到原核表达中,如果 T 载克隆方法要定向,设计引物时很多时候要多
8、加 4个碱基。、在设计酶切位点的 5 端要加保护碱基,使限制性内切酶能有效识别,不同内切酶所需的保护碱基不同,Sal不需要保护碱基,EcoR 需要 1 个,Not需要 2 个,Hind最好有 3 个,一般情况下,都设计 2 个,可参考有关书籍。、特别 注意起始密码子和终止密码子的读码框,不要造成目的片段碱基移码。如果载体上有起始密码子 ATG,可不另加,但是通常 ATG 后不是紧跟外源片段的,中间还含有载体序列,这种情况一定要保证中间这段序列不会造成你外源序列的移码。按情况需要,可以加 1 到 2 个碱基在引物中使读码框正确。同理,正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,
9、如果你对载体的不放心,也可以在引物中设计上终止密码子。、在 PCR 反应体系中,引物的最适浓度为 0.1-1.0umol/I。引物过多会影响 PCR 的产量。所设计的一对引物之间的 Tm 值相差不宜过大,最好能一样。一般来说,PCR 反应的退火温度不超过 Tm 值上下 5;一对引物不宜形成发夹结构、互相配对,若配对时最好不要是 G-C 的结合(可以用软件分析);3 端以 G、C 结尾为宜;把上游引物设计成有义链,下游设计成反义链,否则没有片段出现。 3.构建重组表达载体 将目的片段有效地插入表达载体中是原核表达中较为关键的步骤,一般构建的重组载体有插入重组和置换重组两种类型,优先考虑能产生粘性
10、末端的限制性内切酶,以便高效连接。作者将构建重组表达载体分为酶切过程和连接过程。 (1)酶切过程:将目的片段和表达质粒用限制性内切酶进行双酶切,酶切产物经琼脂糖电泳后,用试剂盒回收有效片段。酶切反应体系首先应根据所切底物的大小和浓度计算出限制性内切酶的用量,试剂公司提供的限制性内切酶包装上通常标明总的酶活性单位和容积活性。对于能被高效切割的 DNA 样品(起决于特定的识别序列)用酶量少,反之则多。 (2)连接过程:在 T4DNA 连接酶作用下,载体和片段连接。连接反映体系中,连接酶的用量越大,反应速度越大,但用量过大,酶液中的甘油会影响连接效果,也会造成浪费,一般 20l 体系中用 5U 足够
11、。另外,连接酶的最适温度虽为 37,在此温度中酶的活性最高,但此温度能使粘性末端的氢键结合不稳定,易脱开。建议在26,4h 反应可得较好效果。目的片段和载体的摩尔比例在 2:1(或 3:1)为好,DNA 总量应根据实际浓度控制在一定范围,多了,DNA 分子运动慢,反而影响连接效果,假阳性多。少了,片段和载体在反映体系中难以碰撞连接,以至没有连接的菌落。20l 体系中,10l 底物即可。 4.转化表达宿主菌 将连接产物转化感受态大肠杆菌,根据重组载体的标志(如抗 Amp 或蓝白斑)作筛选,挑取单菌落,碱裂解法小量抽提质粒,用 PCR 和双酶切法作初步鉴定后进行测序验证,进一步检测目的基因的插入方
12、向、阅读框架及片段序列是否正确。测序时可挑选多个菌落进行测定,因为在 PCR、连接等过程中,有不确定因素会导致目的片段发生碱基错配甚至移码突变。将经过测序分析正确的大肠杆菌质粒 DNA 转化表达宿主菌的感受态细胞。 5.诱导表达 原核表达,一般需要诱导表达,诱导表达过程中,把构建好的载体转化到宿主菌中表达,不同的表达载体对应有不同的表达菌株,一些特别设计的菌株更有助于解决一些表达难题。在此不再多说,请参照有关书籍。 6.表达蛋白的分析、纯化、检测 诱导表达成功后,表达蛋白的分析、纯化、检测应该顺当,按一般的实验步骤做没太大的问题。 虽然,在大肠杆菌中表达的蛋白由于缺少高级修饰和糖基化、磷酸化等
13、翻译后加工,常形成包涵体而影响表达蛋白的生物学活性及构象等缺点,但原核表达具有的操作简单、快捷,需时较短,表达产量高,适合工业化等优点,仍是我们合成外源蛋白的首选。原核表达的全过程有许多不确定因素,所以每完成一步都得检验结果是否正确,当实验遇到困难时如何进行分析,找到问题的症结是我们实验的关键。 原核表达个人秘笈:表达前的分析比什么都重要生物通原核表达技术专辑:表达不同于其它一些实验,比如:提取质粒、PCR、电镜切片,这些人为控制的因素比较多,出问题相对来说也比较好分析。表达呢,你把质粒克隆好啦,交给细胞,然后有些事情就不全是你要怎样就怎样了。原核表达在表达当中来说还是比较简单,细菌培养条件简
14、单、生长速度快,需要的仪器和培养基都比较便宜。当然,它也存在一些缺乏高级修饰、细胞内部还原性过高等缺点。原核表达从一开始的设计就非常重要,所谓好的开始是成功的一半。做足准备功夫,可是省去很多将来后悔的事情。首先,我们要根据是否要求可溶将载体分成两大类,如果希望可以同时尝试多种表达系统,也有许多商业化的系统供选择。 RealTime ready 智力大冲浪!答对 5 题,即获赠美国傲仕优质保温杯!前面已经介绍过许多公司的商业化载体、菌株和多系统表达体系,现在我想先从自己的蛋白分析讲起。同样的载体、同样的系统,很可能表达这个蛋白表达量奇高,但是另外一个就是做不出来,所以没有万能的载体,只有永恒的分
15、析。当然如果你的蛋白曾经在原核系统中成功表达出来那是最好的,选择同样的载体表达成功率会高很多。如果没有也最好尝试找一些曾经表达过和你的蛋白拥有相类似结构的文献。比如大部分含有哺乳动物 src 同源的 SH2 蛋白相互作用域的蛋白都是用 pGEX 系列载体表达出来的。根据经验而言,含有较少半胱氨酸和脯氨酸的、平均大小为 60kD 的单体蛋白较容易表达。在下面将列出几个影响表达的因素,大家可以在表达前根据这几个因素自己分析一下:1. 翻译起始位点现在大部分的表达载体都提供起始位点,所以它已经把起始密码子与核糖体结合位点的距离进行优化了,一般情况下不需要自己再加,不过还是要留意载体图谱上是否注明有起
16、始密码子和终止密码子2. GC 含量表达序列中的 GC 含量超过 70的时候可能会降低蛋白在大肠杆菌中的表达水平。GC 含量可以利用 DNA STAR、Vector NTI Suite 等软件进行预测。3. 二级结构在起始密码子附近的 mRNA 二级结构可能会抑制翻译的起始或者造成翻译暂停从而产生不完全的蛋白。如果利用软件分析 DNA 或 RNA 结构上有柄(stem)结构,并且结合长度超过 8 个碱基,这种结构会因为位点专一突变等因素而变得不稳定。4. 基因或者蛋白的大小一般说来小于 5kD 或者大于 100kD 的蛋白都是难以表达的。蛋白越小,越容易被降解。在这种情况下可以采取串联表达,在
17、每个表达单位(即单体蛋白)间设计蛋白水解或者是化学断裂位点。如果蛋白较小,那么加入融合标签 GST、Trx、MBP 或者其它较大的促进融合的蛋白标签就较有可能使蛋白正确折叠,并以融合形式表达。对于另一个极端,大于 60kD 的蛋白建议使用较小的标签,如 6组氨酸标签。对于结构研究较清楚的蛋白可以采取截取表达。当然表达时要根据目的进行截取,如果是要进行抗体制备而截取,那么一定要保证截取的部位抗原性较强。对于抗原性也可以利用软件分析,比如 Vector NIT Suite 或者一些在线软件,不过在分析之余也要认识到这是一种数据统计的结论,如果蛋白和免疫动物亲缘关系较远的话还是不妨一试的。5. 亲疏
18、水性这也是一种经验之谈,相信经常做表达的人都发现表达亲水区域时表达量会比较高,如果你要表达一个膜蛋白,那么劝你做好长期抗战的准备吧。有许多软件可以对氨基酸的亲疏水性进行分析,比如 Vector NIT Suite,除此之外还可以利用在线跨膜区预测软件 http:/www.cbs.dtu.dk/services/TMHMM/ 对跨膜区进行预测。对于自己表达的蛋白有所了解后就可以开始对载体进行选择了,目前商业化的载体基本上包含以下几个元件:除了上面标出的元件外还需要有复制起点,它对于控制质粒的拷贝数非常重要;另外就是筛选标记了,比如蓝白斑筛选的 lacZ,各种抗生素标记。在以上几个元件中,我们需要
19、注意的是负责调节与启动的元件,也就是调控子和启动子。其中启动子对于蛋白表达的速度起着举足轻重的作用,它与最终蛋白的表达量、是否可融密不可分。这里,对于世面上广泛销售的几种原核表达载体使用的启动子进行总结。启动子 来源 调控手段(浓度) 强度 LacUV5 乳糖操纵元 lacI/IPTG (0.1-1mM) 强 Trp 色氨酸操纵元 trpR 3-吲哚丙烯酸 强 Tac 结合了色氨酸启动子的-35 序列和乳糖启动子的-10 序列 lacI/IPTG (0.1-1mM) 强 PL 噬菌体 cI 阻遏物/温度 强 噬菌体 T5 T5 噬菌体 lacI/IPTG (0.1-1mM) 强 pBAD 阿拉
20、伯糖操纵元 AraBAD/阿拉伯糖(1m-10mM) 严谨 T7 T7 RNA 聚合酶 lacI/IPTG (0.1-1mM) 非常强 乳糖操纵子是应用最广泛的调控模式,除了 IPTG 这种化学诱导方式之外还有利用吲哚丙烯酸和阿拉伯糖的化学诱导。如果你害怕这些化学物质会损害细菌的生长,那么你可以尝试利用温度诱导的载体,如:pDH2。它利用 PL 启动子,在温度上升到 42后进行诱导表达。可以看到在所有启动子里属 T7 启动子最强,它可以将大肠杆菌的资源最大程度地调用过来表达外源蛋白。这样一些难表达的蛋白都可以在 pET 系统里面表达出来,但是是不是越强就越好呢?如果你需要表达蛋白是可溶的,那么
21、 T7 启动子就不那么适合了。较弱的启动子转录速度较慢,这样对于表达可溶、稳定、完整的蛋白比较有利。Novagen 可以说是的 pET 系统是最王牌的 T7 启动子表达系统,可是当 T7 启动子的强启动效应不受欢迎的时候怎么办呢?在这里给读者留个小小的疑问,看看大家有没有仔细看笔者写的 Novagen 篇。提示一下,虽然它转录速度快,但是可以控制它的拷贝数,又或者是利用这些原理 Novagen 载体也可以毒性高的外源蛋白。载体上除了启动子这个需要注意之外,另外一个就是标签了。很多标签是为了增加蛋白的可溶性,也有一些是为了方便鉴定表达产物,所以在表达时可以选择加标签。是否加标签要看个人需要,笔者
22、认为如果是表达一个人家没表达过的蛋白最好还是加标签,这样方便将来鉴定。如果从经济角度考虑最好加入 6组氨酸标签,笔者曾经以为加什么标签都无所谓(前提是不需要融合表达),结果加了个 Novagen 的 T7Tag,等到鉴定的时候发现单抗那么贵。而且还不好买的,一些较少人用的标签会让你很伤脑筋。这也是表达前要准备的功课之一哦。好了,如果你选好了载体,那么下一步就是设计引物的。相信大多数人都是利用 PCR 把目的基因调出来的吧。设计引物可以使用一下两个软件,Primer Premier 或者 Oligo。如果要表达全长,其实也就没那么多要考虑,从一头一尾找至少 8 个匹配序列在加上与载体匹配的序列就
23、可以了。不过,我还是有以下几点提醒一下各位:1. 这一点其实很容易理解,但是有时也容易被遗忘。那就是先查查表达外源片段中含有什么内切酶位点,不要设计重了,否则酶切时发现怎么老是有预期外的小片段出现。2. 根据载体上的酶切位点设计引物,现在许多类似 T 载原理的克隆方法也可以应用到原核表达中了,如果 T 载克隆方法要定向很多时候要多加 4 个碱基,设计引物时候可别忘了加。在设计酶切位点的 5端不要忘了加保护碱基,不同内切酶所需的保护碱基不同,Sal不需要保护碱基,EcoR需要 1 个,Not需要 2 个,Hind最好有 3 个。一般情况下,都设计 2 个。3. 注意启始密码子和终止密码子的读码框
24、。如果载体上有 ATG 可以不另外加了,但是通常 ATG 后不是紧跟外源片段的,如果中间含有载体序列,务必确定中间这段序列不会造成你外源序列的移码。按情况需要,可以加 1 到 2 个碱基在引物中使读码框正确。有始有终,同样正常的终止密码子才能保证蛋白的产出。大部分载体也有终止密码子,如果你对载体的不放心,也可以在引物中设计上终止密码子,这样万无一失。4. 还有就是设计一对引物需要注意的地方:一对引物之间 Tm 值相差不宜过大,能一样最好;一对引物不宜形成发夹结构、互相配对,若配对时最好不要是 G-C 的结合(可以用软件分析) ;3端以 G、C 结尾为宜等等。如果要详细研究可以看一下 PCR 技术的相关书籍,很厚。还有就是记得把上游引物设计成有义链,下游设计成反义链,否则就没有片段出现了。虽然这是很小的地方,可是经常会被忽略。5. 如果你是进行截取表达,那么除了之前提到的要注意截取亲水区,还有一点就是对密码子的使用频率进行分析。如果在大肠杆菌中使用较少的密码子在外源片段中连续出现,还是避开它为上策。看完这么多是不是觉得有点思绪万千呢。以前给我上课的一位教授说过,做试验,那要大胆设计,小心求证。快去合成引物开始表达吧。万一表达不出来,我这还有下篇呢。