1、重组DNA技术与基因工程,5,2,3,4,1,6,重组DNA技术与基因工程的基本概念,重组DNA技术所需的基本条件,重组DNA技术的操作过程,目的基因的克隆与基因文库的构建,外源基因在大肠杆菌中的表达,外源基因在酵母中的表达,大肠杆菌表达外源基因的优势,全基因组测序,共有4405个开放阅读框架,基因克隆表达系统成熟完善,繁殖迅速、培养简单、操作方便、遗传稳定,被美国FDA批准为安全的基因工程受体生物,A 大肠杆菌作为表达外源基因受体菌的特征,5 外源基因在大肠杆菌中的表达,大肠杆菌表达外源基因的劣势,缺乏对真核生物蛋白质的复性功能,缺乏对真核生物蛋白质的修饰加工系统,内源性蛋白酶降解空间构象不
2、正确的异源蛋白,细胞周质内含有种类繁多的内毒素,A 大肠杆菌作为表达外源基因受体菌的特征,5 外源基因在大肠杆菌中的表达,B 外源基因在大肠杆菌中高效表达的原理,启动子,终止子,核糖体结合位点,密码子,质粒拷贝数,5 外源基因在大肠杆菌中的表达,启动子 启动子最佳距离的探测,目的基因,E,E,A,启动子,A 酶切开,Bal31酶解,目的基因,启动子 启动子的筛选,Apr,ori,galK,pKO1,终止密码子,采用鸟枪法战略,将合适大小的DNA片段,克隆到启动子探针质粒pKO1上。,受体细胞染色体DNA上的galE、galT与质,粒上报告基因galk的表达产物联合作用,,可将培养基中的半乳糖酵
3、解成红色素物质,转化galE+、galT+、galK-的大肠杆菌受体菌株,含有外源启动子活性的重组克隆,启动子 启动子的构建,-35 区序列,-10 区序列,PlL,PrecA,Ptrp,Plac,PtraA,Ptac,启动子,T T G A C A,G A T A C T,T T G A T A,T A T A A T,T T G A C A,T T A A C T,T A G A C A,T A A T G T,T T T A C A,T A T A A T,T T G A C A,T A T A A T,Ptac = 3 Ptrp = 11 Plac,启动子 启动子的可控性,P,乳糖启动
4、子Plac的可控性:,O,P,O,高效转录,阻遏蛋白,诱导,乳糖 异丙基-b-D-硫代半乳糖苷(IPTG),野生型的Plac与其控制区,Olac偶联在一起,在没有,诱导物存在时,操纵子,基底水平转录,处于基底水平表达;诱,导物可以使启动子Plac介,导的转录大幅提高。,启动子 启动子的可控性,Plac,乳糖启动子Plac的可控性:,O,Plac,O,高效转录,葡萄糖代谢,野生型的Plac上游附近拥有代谢,激活因子(CAP)结合区,小,分子cAMP激活CAP,CAP结,基底水平转录,启动子控制区,进而促进Plac介,导的转录。葡萄糖代谢使cAMP,减少,也能阻遏Plac介导的基因,转录。因此,基
5、因工程中使用,的乳糖启动子均为抗葡萄糖代,谢阻遏的突变型,即Plac UV5。,CAP,cAMP,cAMP浓度降低,Plac UV5,O,高效转录,Ptrp,色氨酸启动子Ptrp的可控性:,Otrp,除去色氨酸,色氨酸启动子Ptrp受色氨酸-阻遏,蛋白复合物的阻遏,转录呈基底,状态。在培养系统中去除色氨酸,基底水平转录,或者加入3-吲哚丙烯酸(IAA),,便可有效地解除阻遏抑制作用。,在正常的细菌培养体系中,除去,色氨酸是困难的,因此基因工程,中往往添加IAA诱导Ptrp介导的目,基因的表达。,色氨酸,或加3-吲哚丙烯酸,高效转录,阻遏蛋白,(IAA),Otrp,Ptrp,高效转录,Otrp,
6、Ptrp,启动子 启动子的可控性,l 噬菌体启动子PlL的可控性:,噬菌体启动子PL受CI阻遏蛋白阻,遏,很难直接诱导控制。在基因,工程中常使用温度敏感型的cI突,变基因cI857控制PL。cI857阻遏蛋,白在42时失活脱落,PL便介导,目的基因的表达。但在大型细菌,培养罐中迅速升温非常困难,因,此常使用一个双质粒控制系统,,用色氨酸间接控制目的基因表达,Ptrp,A,B,cI857,PL,目的基因,阻遏作用,Ptrp,A,B,PL,表达,色氨酸,启动子 启动子的可控性,上述Plac、Ptrp、Ptac、PL启动子均为大肠杆菌RNA聚合酶的特异性识别和作用元件,而来自大肠杆菌T7噬菌体的T7
7、表达系统则采用噬菌体DNA编码的T7-RNA聚合酶表达重组大肠杆菌中的外源基因,这种RNA聚合酶选择性地作用于T7噬菌体DNA的启动子结合,在不降低转录启动效率的前提下,它沿DNA模板链聚合mRNA的速度比大肠杆菌的RNA聚合酶快五倍。装有T7启动子的表达载体很多,如pET载体家族等。大肠杆菌BL21(DE3)和HNS174(DE3)株的基因组中整合有T7-RNA聚合酶编码基因,其表达则由PlacUV5启动子控制。然而即使,不用IPTG诱导,T7-RNA聚合酶仍能少量表达,出现泄露现象。,启动子,依赖于噬菌体RNA聚合酶的启动子,终止子 强化转录终止的必要性,外源基因在强启动子的控制下表达,容
8、易发生转录过头现象,即RNA聚合酶滑过终止子结构继续转录质粒上邻近的DNA序列,形成长短不一的mRNA混合物。 过长转录物的产生在很大程度上会影响外源基因的表达,其原因如下: 转录产物越长,RNA聚合酶转录一分子mRNA所需的时间就相应增加,外源基 因本身的转录效率下降; 如果外源基因下游紧接有载体上的其它重要基因或DNA功能区域,如选择性标 记基因和复制子结构等,则RNA聚合酶在此处的转录可能干扰质粒的复制及其 它生物功能,甚至导致重组质粒的不稳定性; 过长的mRNA往往会产生大量无用的蛋白质,增加工程菌无谓的能量消耗; 更为严重的是,过长的转录物往往不能形成理想的二级结构,从而大大降低外源
9、 基因编码产物的翻译效率。,终止子 强终止子的选择与使用,目前外源基因表达质粒中常用的终止子是来自大肠杆菌rRNA操纵子上的rrnT1T2以及T7噬菌体DNA上的Tf。对于一些终止作用较弱的终止子,通常可以采用二聚体终止子串联的特殊结,筛选Apr、Tcs的转化子,终止子也可以象启动子那样,通过特殊的探针质粒从细菌或噬菌体基,构,以增强其转录终止作用。,基因组DNA中克隆筛选。,核糖体结合位点,外源基因在大肠杆菌细胞中的高效表达不仅取决于转录启动的频率,而且在很大程度上还与mRNA的翻译起始效率密切相关。大肠杆菌细胞中结构不同的mRNA分子具有不同的翻译效率,它们之间的差别有时可高达数百倍。mR
10、NA翻译的起始效率主要由其5 端的结构序列所决定,称为核糖体结合位点(RBS),大约涉及30,个碱基的长度。,大肠杆菌核糖体结合位点包括下列四个特征结构要素:位于翻译起始密码子上游的6-8个核苷酸序列 5 UAAGGAGG 3,即Shine-Dalgarno(SD)序列,它通过识别大肠杆菌核糖体小亚基中的16S rRNA 3 端区域3 AUUCCUCC 5并与之专一性结合,将mRNA定位于核糖体上,从而启动翻译;翻译起始密码子,大肠杆菌绝大部分基因以AUG作为阅读框架的起始位点,但有些基因也使用GUG或UUG作为翻译起始密码子;SD序列与翻译起始密码子之间的距离及碱基组成;基因编码区5 端若干
11、密码子的碱基序列。,核糖体结合位点 核糖体结合位点的结构,SD序列的影响:,一般来说,mRNA与核糖体的结合程度越强,翻译的起始效率就越高,而这种结合程度主要取决于SD序列与16S,个换成嘧啶碱基(C或T),均会导致翻译效率大幅度降低。,5 UAAGGAGG 3,5 AGGAGG 3,5 GAGG 3,保守程度增强,rRNA的碱基互补性,其中以AGGAGG尤其是GAGG四至六个嘌呤碱基序列尤为重要。对多数基因而言,上述四至六个嘌呤碱基中任何一,核糖体结合位点,核糖体结合位点对外源基因表达的影响,核糖体结合位点,核糖体结合位点对外源基因表达的影响,SD序列与起始密码子之间的序列的影响:,SD序列
12、下游的碱基若为AAAA或UUUU,翻译效率最高;而CCCC或GGGG的翻译效率则分别是最高值的50%和25%。紧邻AUG的前三个碱基成份对翻译起始也有影响,对于大肠杆菌b-半乳糖苷酶mRNA而言,在这个位置上最佳的碱基组合是UAU或CUU,如果用UUC、UCA,或AGG取代之,则酶的表达水平低20倍。,核糖体结合位点,核糖体结合位点对外源基因表达的影响,SD序列与起始密码子之间的距离的影响:,SD序列与起始密码子之间的精确距离保证了mRNA在核糖体上定位后,翻译起始密码子AUG正好处于核糖体复合物结构中的P位,这是翻译启动的前提条件。在很多情况下,SD序列位于AUG之前大约七个碱基处,在此间隔
13、中少一个碱基或多一个碱基,均,会导致翻译起始效率不同程度的降低。,核糖体结合位点,核糖体结合位点对外源基因表达的影响,起始密码子及其后续若干密码子的影响:,大肠杆菌中的起始tRNA分子可以同时识别AUG、GUG和UUG三种起始密码子,但其识别频率并不相同,通常GUG为AUG的50%而UUG只及AUG的25%。除此之外,从AUG开始的前几个密码子碱基序列也至关重要,至少这一序列不能与mRNA的5 端非编码区形成茎,目前广泛用于外源基因表达的大肠杆菌表达型质粒上,均含有与,环结构,否则便会严重干扰mRNA在核糖体上的准确定位。,启动子来源相同的核糖体结合位点序列,序列和间隔是最佳的。,密码子 生物
14、体对密码子的偏爱性,不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码,子使用频率并不相同,具有一定的偏爱性,其决定因素是:,生物基因组中的碱基含量 在富含AT的生物(如单链DNA噬菌体,fX174)基因组中,密码子第三位上的U和A出现的频率较高;而在GC,丰富的生物(如链霉菌)基因组中,第三位上含有G或C的简并密码子,占90%以上的绝对优势。,密码子与反密码子相互作用的自由能(中等强度规律),细胞内tRNA的含量,如GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少;,如GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;,密码子 生物体对密码子
15、的偏爱性,mRNA编码序列衰减核糖体定位,细菌全mRNA范围的核糖体作图发现,在营养丰富的条件下,稀有tRNA所对应的密码子并不导致翻译迟缓。取而代之的是,基因编码区内的SD样序列高频引发核糖体在mRNA上的翻译停顿。这种停顿是由于mRNA与正在翻译着的核糖体上16S rRNA之间的碱基配对造成的。因此,均由嘌呤碱基构成的密码子在原核细菌蛋白质编码基因中是不受欢迎的,如:AGG、GGA、GAG、GGG,尤其是其双密码子组合。,翻译启动,翻译停顿,mRNA,Gene-Wei Li et al. Nature. 484(7395) 2012,密码子 生物体对密码子的偏爱性,5 端编码序列衰减mRN
16、A二级结构,稀有密码子在大多数生物基因的5端编码区富集。一项针对14000多个大肠杆菌合成型报告基因的表达结果显示,在翻译起始密码子ATG之后的十个密码子中,稀有密码子的取代能使蛋白的表达水平平均提升大约4倍。而且,降低RNA的二级结构而非密码子稀有性本身对这种蛋白表达的增加效,Daniel B. Goodman et al. Science. 342(6157) 2014,应负责。(由红至蓝偏爱性依次递增),密码子 密码子偏爱性对外源基因表达的影响,由于原核生物和真核生物基因组中密码子的使用频率具有较大程,度的差异性,因此外源基因尤其是高等哺乳动物基因在大肠杆菌中高,效翻译的一个重要因素是密
17、码子的正确选择。一般而言,有两种策略,可以使外源基因上的密码子在大肠杆菌细胞中获得最佳表达:,化学合成外源基因,同步表达相关tRNA编码基因,按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适宜的相应简并密码子,重组人胰岛素、干扰素以及生长激素在大肠杆菌,外源基因全合成:,密码子 密码子偏爱性对外源基因表达的影响,中的高效表达均采用了这种方法。,密码子 密码子偏爱性对外源基因表达的影响,对于那些含有不和谐密码子种类单一、出现频率较高、而本身分子量又较大的外源基因而言,则选择相关tRNA编码基因同步克隆表达的策略较为有利。例如,在人尿激酶原cDNA的412个密码子中,共含有22个精氨酸密码子
18、,其中7个AGG、2个AGA,而大肠杆菌受体细胞中tRNAAGG和tRNAAGA的丰度较低。为了提高人尿激酶原cDNA在大肠杆菌中的高效表达,将大肠杆菌的这两个tRNA编码基因克隆在另一个高表达的质粒上。由此构建的大肠杆菌双质粒系统有效地解除了受体,同步表达相关tRNA编码基因:,细胞对外源基因高效表达的制约作用。,密码子 密码子偏爱性对外源基因表达的影响,Gloria A. Brar Cell 167(7)2016,密码子序列背景对翻译全过程的影响,研究表明,密码子序列而非密码子本身贡献于翻译调控,因此密码子优化未必能奏效。,质粒拷贝数,质粒拷贝数对细菌生长代谢的影响,目前实验室里广泛使用的
19、表达型质粒在每个大肠杆菌细胞中可达数百甚至上千个拷贝,质粒的扩增过程通常发生在受体细胞的对数生长期内,而此时正是细菌生理代谢最旺盛的阶段。质粒分子的过度增殖以及其后目的基因的高效表达势必会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性以及目的基因宏观表达水平的下降。 解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的轨道。,质粒拷贝数,质粒扩增时序的控制,pCP3拥有一个温度可诱导型的复,制子。在28时,每个细胞的质粒拷贝,数为60;在42时,拷贝数迅速增至,300600。在此温度下,受体细胞染色,体上的CI基因表达的温度敏感型阻遏蛋,白失活。因此,用一种手段可同时控制,质粒拷贝数和
20、基因的表达。,质粒拷贝数 高拷贝质粒的转录-复制冲突(TRC),解决这一难题的有效策略是在外源基因表达盒与载体重组时,使基因的转录方向与质粒复制叉的移动方向保持一致。,S. Hamperl and K. A. CimprichCell 167(6)2016,包涵体型异源蛋白的表达,分泌型异源蛋白的表达,融合型异源蛋白的表达,寡聚型异源蛋白的表达,整合型异源蛋白的表达,蛋白酶抗性或缺陷型表达系统的构建,C 大肠杆菌基因工程菌的构建策略,5 外源基因在大肠杆菌中的表达,包涵体型异源蛋白的表达 包涵体及其性质,在某些生长条件下,大肠杆菌能积累某种特殊的生物大分子,它们致密地集聚在细胞内,或被膜包裹或
21、形成无膜裸露结构,这种水不溶性的结构称为包涵体(Inclusion Bodies,IB)。富含蛋白质的包涵体多见于生长在含有氨基酸类似物培养基的大肠杆菌细胞中,由这些氨基酸类似物所合成的蛋白质往往会丧失其理化特性和生物功能,从而集聚形成包涵体。由高效表达质粒构建的大肠杆菌工程菌大量合成非天然性的同源或异源蛋白质,后者在一般情况下也以包涵体的形式存在于细菌细胞内。除此之外,包涵体中还含有少量的DNA、RNA和,脂多糖等非蛋白分子。,包涵体型异源蛋白的表达,以包涵体形式表达目的蛋白的优缺点,能简化外源基因表达产物的分离操作,包涵体表达形式的优点:,包涵体的水难溶性及其密度远大于其它细胞碎片和细胞成
22、分,菌体经超声波裂解后,直接通过高速离心即可将重组异源蛋白从细菌裂解物中分离出来。,能在一定程度上保持表达产物的结构稳定,在形成包涵体之后,大肠杆菌的蛋白酶降解作用基本上对异源重组蛋白的稳定性已构不成威胁。,包涵体型异源蛋白的表达,以包涵体形式表达目的蛋白的优缺点,包涵体表达形式的缺点:,以包涵体形式表达的重组蛋白丧失了原有的生物活性,必须通过有效的变性复性操作,才能回收得到具有正确空间构象(因而具有生物活性)的目标蛋白,因此包涵体变复性操作的效率对目标产物的收率至关重要。然而,这也是一个技术难题,尤其当目标蛋白分子中的Cys残基数目较高时,体外复性蛋白质的成功率相当低,一般不超过30%。,包
23、涵体型异源蛋白的表达,以包涵体形式表达目的蛋白的操作,如果未进行特殊设计(如分泌型表达或融合型表达),外源基因在大肠杆菌中表达的蛋白量占细胞总蛋白量20%以上时,表达产物一般倾向于形成包涵体。因此,以包涵体形式表达目的基因操作的关键就是选择高表达的载体。事实上,这种高表达率也是包涵体,法的长处所在。,C 共价修饰的蛋白质,蛋白质变复性的动力学原理,I 有效变复性过程中的中间状态,X 脱离有效变复性过程而进入集聚的中间状态,N 天然状态的蛋白质,U 变性状态的蛋白质,A 集聚状态的蛋白质,在细菌细胞内,集聚状态和共价修饰的蛋白质不能进入复性过程,因此永远成,为无活性的蛋白质。包涵体中的蛋白质就属
24、于这两种状态,因此需要在体外进行人,工变性(解除共价修饰和驱散集聚体)复性操作。,包涵体型异源蛋白的表达,包涵体的溶解与变性的主要任务是拆开错配的二硫键和次级键,,在人工条件下,使包涵体溶解并重新进入复性途径中。能有效促进包,涵体溶解变性的试剂和条件包括:,清洗剂,促溶剂,成的氰酸盐污染,后者能与多肽链中的氨基反应;,混合溶剂,极端pH,包涵体的溶解与变性,SDS、正十二醇肌氨酸,廉价,但影响复性和纯化;,盐酸胍、尿素,前者昂贵,尿素便宜,但常被自发形,如尿素与醋酸、二甲基砜等联合使用,溶解力增强;,廉价,但许多蛋白质在极端pH条件下发生修饰反应。,包涵体型异源蛋白的表达,包涵体的复性与重折叠
25、的主要任务是:,通过次级键的形成使蛋白质复性,将多肽链中被拆开的游离巯基重新折叠,异源蛋白的复性与重折叠,包涵体型异源蛋白的表达,包涵体复性操作的方法包括:,分段稀释法,逐步降低变性剂的浓度,防止二次集聚的发生,一步稀释法,蛋白复性与浓度无关,但集聚与浓度关系很大,试剂添加法,精氨酸、甘氨酸、甘油、蔗糖、PEG、Ca2+,蛋白修饰法,氨基柠檬酸酐酰化,蛋白带负电,抑制集聚,产物隔离法,将变性的蛋白分子固定化,避免其相互碰撞,分子伴侣法,GroEL、GroES、DnaK,固定化,共表达,异源蛋白的复性与重折叠,包涵体型异源蛋白的表达,异源蛋白的二硫键形成,在包涵体变性体系中,始终存在着还原剂,使
26、多肽链中的巯基保持还原状态,防,化学氧化法(A)需要电子受体,最廉价的电子受体为空气,二硫键形成是随机,二硫键交换(B)需要还原型和氧化型谷胱甘肽(GSH和GSSG),二硫键形成,止二硫键错配导致严重的集聚。在变性操作结束后,这些游离型的巯基必须重新配对,形成二硫键,此时多肽链也重新发生折叠。形成二硫键的方式主要有:,的,仅适用于那些不含游离半胱氨酸残基的蛋白质的重折叠;,相对特异,因此适用性较广,重折叠效果好。,+,2e,+,2H+,A,S-S-R,HS,+,B,R-S-S-R,2R-SH,包涵体型异源蛋白的表达,分泌型异源蛋白的表达,在大肠杆菌中表达的异源蛋白按其在细胞中的定位可分为两种形
27、式:即以可溶性或不溶性(包涵体)状态存在于细胞质中;或者通过运输或分泌方式定位于细胞周质,甚至穿过外膜进入培养基中。蛋白产物N端信号肽序列的存在是蛋白质分泌的前提条件。,分泌型异源蛋白的表达 以分泌形式表达目的蛋白的优缺点,分泌表达形式的优点:,目的蛋白稳定性高 重组人胰岛素原若分泌到细胞周中,其稳,定性大约是在细胞质中的10倍。,目的蛋白易于分离,目的蛋白末端完整 相当多的真核生物成熟蛋白N端并不含有,甲硫氨酸残基。当这些真核基因在大肠杆菌中表达时,蛋白质,N端的甲硫氨酸残基往往不能被切除。如若将外源基因与大肠,杆菌的信号肽编码序列重组在一起,一旦分泌型表达,其N端,的甲硫氨酸残基便可在信号
28、肽的剪切过程中被有效除去。,分泌型异源蛋白的表达,以分泌形式表达目的蛋白的优缺点,分泌表达形式的缺点:,相对其它生物细胞而言,大肠杆菌的蛋白分泌机制并不健全。外源真核生物基因很难在大肠杆菌中进行分泌型表达,少数外源基因即便能分泌表达,但其表达率通常要比包涵体方式低很多,因此目前用于产业化的异源蛋白分泌型重组大肠杆菌尽管有,但并不普遍。,分泌型异源蛋白的表达,蛋白质的分泌机制,原核细菌周质中含有多种分子伴侣可阻止分泌蛋白的随机折叠,分泌在细胞周质或培养基中的重组蛋白很少形成分子间的二硫键交联,因此与包涵体相比,分泌型重组蛋白具有较高比例的正确构象,生物活性的回收率增加,且,对蛋白酶不敏感。,Ds
29、bC纠正错配的二硫键,分泌型异源蛋白的表达 分泌型目的蛋白表达系统的构建,包括大肠杆菌在内的绝大多数革兰氏阴性菌不能将蛋白质直接分,泌到胞外,但有些革兰氏阴性菌能将细菌的抗菌蛋白(细菌素)分泌,到培养基中,这一过程严格依赖于细菌素释放蛋白,它激活定位于内,上的磷酸酯酶,导致细菌内外膜的通透性增大。,因此,只要将细菌素释放蛋白编码基因克隆在一个合适的质粒上,即可构建完全分泌型的受体细胞。此时,用另一种携带大肠杆菌信号,肽编码序列和目的基因的表达质粒转化上述完全分泌型受体细胞,并,使用相同性质的启动子介导目的基因的转录,则可实现目的蛋白从重,组大肠杆菌中的完全分泌。,融合型异源蛋白的表达,除了直接
30、表达异源蛋白外,还可将外源基因与受体菌自身的蛋白质编码基因拼接在一起,并作为一个开放型阅读框架进行表达。由这种杂合基因表达出的蛋白质称为融合蛋白。在这种融合蛋白结构中,通常受体细菌的蛋白部分位于N端,异源蛋白位于C端。通过在DNA水平上人工设计引入的蛋白酶切割位点或化学试剂特异性断裂位点,可,以在体外从纯化的融合蛋白分子中释放回收异源蛋白。,融合型异源蛋白的表达,以融合形式表达目的蛋白的优缺点,目的蛋白稳定性高 尤其对分子量较小的多肽效果更佳;,目的蛋白易于分离 利用受体蛋白成熟的抗体、配体、底物进,目的蛋白表达率高 与受体蛋白共用一套完善的表达元件;,胞内形成良好的空间构象,且大多具有水溶性
31、;,目的蛋白。在实际生产中,产品主要的成本往往就在该工段。,行亲和层析,可以快速获得纯度较高的融合蛋白;,目的蛋白溶解性好 由于受体蛋白的存在,融合蛋白往往能在,目的蛋白需要回收 融合蛋白需要裂解和进一步分离,才能获,融合型异源蛋白的表达 融合型目的蛋白表达系统的构建,融合蛋白表达质粒的构建原则:,受体细胞的结构基因能高效表达,且其表达产物可以通过亲和,层析进行特异性简单纯化;,两个结构基因拼接位点处的序列设计十分重要,它直接决定着,为目的蛋白分离回收创造条件;,外源基因应装在受体蛋白编码基因的下游,为融合蛋白提供终,止密码子。在某些情况下,并不需要完整的受体结构基因,目,的是尽可能避免融合蛋
32、白分子中两种组份的分子量过于接近,,融合蛋白的裂解工艺;,两个蛋白编码序列应保持一致的翻译阅读框架。,用于融合蛋白构建的受体蛋白:,谷胱甘肽转移酶(GST) 维持良好空间构象,硫氧化还原蛋白(TrxA) 维持良好空间构象 pTrxFus,麦芽糖结合蛋白(MBP) 促进分泌,金黄色葡萄球菌蛋白A(SAPA) 免疫亲和层析 pRIT2T,外膜蛋白(OmpF) 促进分泌,b-半乳糖苷酶(LacZ) 免疫亲和层析,泛素蛋白(Ubi) 维持良好空间构象,融合型异源蛋白的表达 融合型目的蛋白表达系统的构建,周质定位因子(DsbA) 促进分泌 pET39b(+),融合型异源蛋白的表达 融合型目的蛋白表达系统
33、的构建,用于融合蛋白构建的载体pET39:,T7 启动子,lac 操作子,RBS,DsbA编码基因,His Tag,凝血酶切割位点,S Tag,肠激酶切割位点,MCS,His Tag,T7 终止子,T7 启动子:为噬菌体DNA编码的RNA聚合酶特异性识别,因此相应的受体菌必须表,DsbA:为大肠杆菌周质定位因子,可将重组表达产物定向高效地分泌到周质中。,His Tag:为连续六个组氨酸序列,能特异性吸附含有镍离子的层析介质上。,凝血酶和肠激酶切割位点:用于从重组融合蛋白中回收目标蛋白。,达噬菌体RNA聚合酶,如:E.coli BL21(DE3)等。,S Tag:为15个氨基酸的序列,能特异性吸
34、附含有S-蛋白的层析介质上。,Pinpoint Xa,tac,生物素结合肽编码序列,Xa因子识别位点编码序列,SP6,T7,Apr,ori,MCS,ATC GAA GGT CGC GAA GCT TCA GCT GGG ATC CGG TAC CGA TAT CAG ATC TCC CGG GGC GGC CGC,Xa-1,Ile Glu Gly Arg Glu,ATC GAA GGT CGC GAA AGC TTC AGC TGG GAT CCG GTA CCG ATA TCA GAT CTC CCG GGG CGG CCG C,Xa-2,ATC GAA GGT CGC GAA AAG CT
35、T CAG CTG GGA TCC GGT ACC GAT ATC AGA TCT CCC GGG GCG GCC GC,Xa-3,NruI HindIII PvuII BamHI KpnI EcoRV BglII SmaI NotI,Xa因子切割位点,融合型异源蛋白的表达 融合型目的蛋白表达系统的构建,正确阅读框的维持,融合型异源蛋白的表达,目的蛋白的回收,融合蛋白中受体蛋白部分的存在可能会影响目的蛋白的空间构象和生物活性,如果将之注入人体还会导致免疫反应,因此在制备和生产药用目的蛋白时,将融合蛋白中的受体蛋白部分完整除去是必不可少的工序。融合蛋白的位点专一性断裂方法有两种: 化学断裂法 酶
36、促裂解法,融合型异源蛋白的表达 目的蛋白的回收,用于蛋白位点专一性化学断裂的最佳试剂为溴化氰(CNBr)。它与多肽链中的甲硫氨酸残基侧链的硫醚基反应,生成溴化亚氨内酯,后者不稳定,在水的作用下肽键断裂,形成两个多肽降解片段。其中上游肽段的甲硫氨酸残基转化为高丝氨酸残基,而下游肽段N端的第一位氨基酸残基保持不变。这一方法的优点是产物回收率较高(可达到85%以上),专一性强,而且所产生的目的蛋白的N端不含甲硫氨酸,与真核生物细胞中的成熟表达产物较为接近。然而,如果异源蛋,化学断裂法:,白分子内含有甲硫氨酸残基,则不能用此方法。,酶促裂解法:单残基位点,蛋白内切酶,切割位点,梭菌蛋白酶 Arg-C,
37、葡萄球菌蛋白酶 Glu-C,假单孢菌蛋白酶 Lys-C,猪胰蛋白酶 Arg-C,Lys-C,蛋白酶酶促裂解法的特点是断裂效率更高,同,时每种蛋白酶均具有相应的断裂位点决定簇,,因此可供选择的专一性断裂位点范围较广。几,种断裂位点专一性最强的商品化蛋白酶分别在,多肽链中的精氨酸、谷氨酸、赖氨酸残基处切,开酰胺键,形成不含上述残基的下游断裂肽段,与溴化氰化学断裂法相似。用上述蛋白酶裂解,用上述蛋白酶裂解融合蛋白的前提条件是外源,蛋白分子内部不能含有精氨酸、谷氨酸或赖氨,酸残基,如果外源基因表达产物为小分子多肽,这一限制条件并不苛刻,但对大分子,量的异源蛋白来说,上述三种氨基酸残基的出现频率是相当高
38、的。,Arg C,N,N,C,受体蛋白,目的蛋白,融合型异源蛋白的表达 目的蛋白的回收,酶促裂解法:多残基位点,为了克服仅切单一氨基酸残基的蛋白酶所带来的应用局限性,可在受体蛋白编码序列与不含起始密码子的外源基因之间加装一段编码寡肽序列(Ile-Glu-Gly-Arg)的人工接头片段,该寡肽为具有蛋白酶活性的凝血因子Xa的识别和作用序列,其断裂位点在Arg的C末端。纯化后的融合蛋白用Xa处理,即可获得不含上述寡肽序列的目的蛋白。由于Xa的识别作用序列由四个氨基酸残基组成,大多数蛋白质中出现这种寡肽序列的概率极少,因此这种方法可广泛,用于从融合蛋白中回收各种不同大小的目的蛋白产物。,融合型异源蛋
39、白的表达 目的蛋白的回收,酶促裂解法:多残基位点,另一种识别多残基位点的蛋白内切酶为来自牛十二指肠粘膜上皮组织的肠激酶EK(Asp-Asp-Asp-Asp-Lys),它具有较高的序列专一性,且在pH4.5-9.5、4-45的较广范围内均能有效地酶解,融合蛋白分子。,融合型异源蛋白的表达 目的蛋白的回收,启动子,受体基因,接头,目的基因,Met,Arg,Stop,Lys,Glu,Ile-Glu-gly-Arg,Arg,Lys,Glu,Ile-Glu-gly-Arg,表达,亲和层析,酶解回收,融合型异源蛋白的表达 目的蛋白的回收,酶促裂解法:多残基位点,Asp-Asp-Asp-Asp-Lys,As
40、p-Asp-Asp-Asp-Lys,寡聚型异源蛋白的表达,从理论上讲,外源基因的表达水平与受体细胞中可转录基因的拷贝数(即基因剂量)呈正相关。然而重组质粒除了含有外源基因外,还携带其它的可转录基因,如作为筛选标记的抗生素抗性基因等。随着重组质粒拷贝数的不断增加,受体细胞内的大部分能量和原料被用于合成所有的重组质粒编码蛋白,而细胞的正常生长代谢却因能量不济受到影响,因此通过增加质粒拷贝数提高外源基因表达产物的产量往往不能获得满意的效果。 另一种通过增加外源基因剂量而提高目标蛋白产量的有效方法是构建寡聚串联型异源蛋白表达载体,即将多拷贝的外源基因克隆在一个低拷贝质粒上,以取代单拷贝外源基因在高拷贝
41、载体上表达的策略,寡聚型异源蛋白的表达 以寡聚形式表达目的蛋白的优缺点,目的蛋白高效表达,在不提高质粒拷贝数的前提下,增加目的基因的拷贝数,可以,稳定表达小分子短肽,在一定程度上改善表达量;,目的产物回收困难,短肽由于缺乏有效的空间结构,在细菌细胞中的半衰期较短。,串联短肽具有与蛋白质相似的长度及空间结构,因而抗蛋白酶,降解的能力大幅度提高;,寡聚短肽需要裂解和进一步分离,才能获最终分子,但裂解后,的短肽分子容易出现序列不均一性;,寡聚型异源蛋白的表达 寡聚型目的蛋白表达系统的构建,P,SD,gene,gene,gene,gene,T1 T2,H2N,COOH,Met,Met,Met,Met,
42、mRNA,CNBr,基本战略:,构建举例:,EcoRI,BamHI,Bgl II,EcoRI,BamHI,Bgl II,EcoRI + BamHI,Bgl II + BamHI,BamHI,寡聚型异源蛋白的表达 寡聚型目的蛋白表达系统的构建,整合型异源蛋白的表达,以整合形式表达目的蛋白的优缺点,目的基因稳定表达,整合型的目的基因随受体细胞染色体DNA的复制而复制,在大,多数情况下相当稳定,工程菌在没有选择压力存在下可以连续,目的基因表达率低,单拷贝整合的目的基因表达率受到限制,此时可通过强化表达,元件而加以补偿。,培养而不丢失目的基因表达盒,这对以改良物种遗传性状为目,的的基因工程案例特别有意
43、义。,整合型异源蛋白的表达,DNA体内重组的基本原理,在生物体细胞尤其是原核细菌细胞内,广泛存在着DNA的遗传重组机制,其可能的生物学功效是促进生物种群的进化。细胞内的遗传重组可分为两大类:,转位因子依赖型,同源序列依赖型,整合型异源蛋白的表达,DNA体内重组的基本原理,转位因子是指生物细胞内天然存在的一类无复制能力的DNA可移动因子,不同生物种群拥有结构不同的转位因子,例如:,转位因子依赖型的体内重组:转位因子家族,噬菌体 G片段(G-Fragment),原核细菌 插入顺序(IS),真核细菌 转座子(Tn、Ty),高等植物 可移动因子(Ac、Ds),高等动物 跳跃基因(mobil gene)
44、,IS(1 kb),Ty(5 kb),Tn(2 - 20 kb),ACCATGGTT,TTGGTACCA,抗药性基因,转位酶基因,识别位点,阻遏基因,IR,IR,IR,IR,IS,IS,整合型异源蛋白的表达,DNA体内重组的基本原理,转位因子依赖型的体内重组:转位因子结构,整合型异源蛋白的表达 DNA体内重组的基本原理,转位因子依赖型的体内重组:整合形式,整合型异源蛋白的表达 DNA体内重组的基本原理,转位因子依赖型的体内重组:P1噬菌体的Cre-loxp系统,Cre,Cre,5 - ATAACTTCGTATA - ATGTATGC - TATACGAAGTTAT - 3,3 - TATTGA
45、AGCATAT - TACATACG - ATATGCTTCAATA - 5,loxP 反向重复序列,整合型异源蛋白的表达,DNA体内重组的基本原理,在很多原核细菌细胞中,染色体DNA链上的两个同源区之间可发生所谓的同源重组,其频率与细菌种类、两个同源区之间的距离同源区的长度、同源程度密切相关。一般地说,距离越远、长度越长、同源性越高,重组的频率也就越高,反之亦然。 同源重组有整合和交换两种形式,前者只需要一个断裂位点,而后者涉及两个断裂位点。,同源序列依赖型的体内重组:基本形式,整合型异源蛋白的表达,DNA体内重组的基本原理,同源序列依赖型的体内重组:同源整合,ori,目的基因,同源区域,标
46、记基因,整合位点,染色体DNA,ori,目的基因,同源区域,标记基因,交换区域,染色体DNA,ori,标记基因,+,整合型异源蛋白的表达,DNA体内重组的基本原理,同源序列依赖型的体内重组:同源交换,蛋白酶抗性或缺陷型表达系统的构建,无论是在真核生物还是在原核细胞中,重组目的蛋白表达后都会面临被降解的命运,其稳定性甚至还不如半衰期较短的受体细胞内源性蛋白质。 在大多数情况下,重组目的蛋白的不稳定性可归结为对受体细胞蛋白酶系统的敏感性。然而越来越多的实验表明,重组目的蛋白在受体细胞内的半衰期可以通过蛋白序列的人工设计以及受体细胞的改造加以调整和控制。,蛋白酶抗性或缺陷型表达系统的构建,实验结果表
47、明,大多数不稳定的重组目的蛋白是被大肠杆菌中的蛋白酶La和Ti降解的,两者分别由lon和clp基因编码,其蛋白水解活性依赖于ATP。lon基因由热休克等环境压力激活,细胞内异常蛋白或重组异源蛋白的过量表达也可作为一种环境压力诱导lon基因的表达。lon-的大肠杆菌突变株可使原来半衰期较短的细菌调控蛋白(如SulA、RscA、lN)稳定性大增,因此被广泛用作外源基因高效表达的受体菌,蛋白酶缺陷型受体细胞的改造,lon基因缺陷的大肠杆菌受体(lon -):,蛋白酶抗性或缺陷型表达系统的构建,大肠杆菌中庞大的热休克蛋白家族对异常或异源蛋白的降解也有重要作用,其机理是胁迫异常或异源蛋白形成一种对蛋白酶识别和降解较有利的空间构象,从而提高异常或异源蛋白对蛋白酶的敏感性。热休克基因dnaK、dnaJ、groEL、grpE以及环境压力特异性s因子编码基因htpR的突变株均呈现出对异源蛋白降解作用的严重缺陷,特别是lon-和,