1、mi引物设计原则1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74,不适于Taq DNA聚合酶进行反应。2. 引物序列在模板内应当没有相似性较高,尤其是3端相似性较高的序列,否则容易导致错配。引物3端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。3. 引物3端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5端序列对PCR影响不太大,因
2、此常用来引进修饰位点或标记物。4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。5. 引物所对应模板位置序列的Tm值在72左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm4(G+C)2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。6. G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3端G值较低(绝对值不超过9),而5端和中间G值相对较高的引物。引物的3端的G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。7. 引物二聚体及
3、发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。8. 对引物的修饰一般是在5端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定。引物序列应该都是写成5-3方向的,Tm之间的差异最好控制在1度之内,另外我觉得扩增长度大一些比较好,500bp左右。要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。 引物应用核酸系列保守区内设计并具有特异性。 产物不能形成二级结构。 引物长度一
4、般在1530碱基之间。 G+C含量在40%60%之间。 碱基要随机分布。 引物自身不能有连续4个碱基的互补。 引物之间不能有连续4个碱基的互补。 引物5端可以修饰。 引物3端不可修饰。 引物3端要避开密码子的第3位。1.引物的特异性 引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-de
5、aza-2-脱氧GTP取代dGTP对扩增的成功是有帮助的。 3.长度 寡核苷酸引物长度为1530bp,一般为2027mer。引物的有效长度:Ln=2(G+C)+(A+T),Ln值不能大于38,因为38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74),不能保证产物的特异性。 4.G+C含量 G+C含量一般为40%60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值510。若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为5580,其Tm值最好接近72以使复性条件最佳。 5.碱基础随机分布 引物
6、中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3端不应超过3个连续的G或C,因这样会使引物在G+C富集序列区错误引发。6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。 7.引物之间 两引物之间不应不互补性,尤应避免3端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。 8.引物的3端 引物的延伸是从3端开始的,不能进行任何修饰。3端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3端不
7、能发生错配。 在标准PCR反应体系中,用2U Taq DNA聚合酶和800mol/L dNTP(四种dNTP各200mol/L)以质粒(103拷贝)为模板,按95,25s;55,25s;72,1min的循环参数扩增HIV-1 gag基因区的条件下,引物3端错配对扩增产物的影响是有一定规律的。AA错配使产量下降至1/20,AG和CC错七下降至1/100。引物A:模板G与引物G:模板A错配对PCR影响是等同的。 9.引物的5端 引物的5端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白
8、质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。 10.密码子的简并 如扩增编码区域,引物3端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。Hairpin 发卡结构如果自由能值大于0 则该结构不稳定从而不会干扰反应如果自由能值小于0 则该结构可以干扰反应二聚体可以在序列相同的两条引物或正反向。引物之间形成如果配对区域在3 末端问题会更为严重3 末端配对很容易引起引物二聚体扩增使Pair Rating 匹配度评分匹配度低的引物对常常不太有效是因为在同样退火温度下Tm低的引物决定扩增的特异性而Tm高的引物更易于形成非特异性结合而造成错误的起始
9、【1】引物的长度以1530bp为宜,否则会影响扩增的特异性。【2】 】碱基尽可能随机分布,避免相同的碱基成串排列,引物的G+C含量在4060之间,若G+C含量太低,可在5端加上一些G或C,若GC含量太高,可在5端加上一些A或T。【3】 应避免每条引物内部形成二级结构及两条引物的3端互补形成引物二聚体,避免在引物的3端有3个G或3个C成串排列,3端的末位碱基最好选T、C、G,而不选A,也有建议在引物的两端用12个嘌呤碱基。【4】 尽可能使用两条引物的Tm值相同(最好相差不要超过5),退火温度根据较低的Tm值选定,也可以通过改变引物的长度来平衡两条引物的退火温度。Tm值可以根据Tm=4(G+C)+
10、2(A+T)计算。而对于较长的引物,Tm值需要考虑动力学参数、从“最近邻位”的计算方式得到,现有的PCR引物设计软件大多数都采用这种方式。(注:对于Tm值的计算有争议的地方是附加序列应不应该计算在内,我觉得有值得商讨的地方。因为从理论上只有最开始的循环引物的附加序列是不与模板链结合的,而在后来的PCR反应中,引物的附加序列是和模板链结合了的。)【5】 引物的3端要与模板严格配对,而5端碱基没有严格的限制,只要与模板DNA结合的部分足够长,其5端碱基可不与模板DNA配对而呈游离状态,这样,我们可以在引物的5末端加上酶切位点(引入酶切位点时,要考虑到进行双酶切的共用缓冲液,否则给下游工作带来困难)
11、、启动子,方便下游操作。【6】 不要在扩增序列的二级结构区设计引物,以免退火困难。也要考虑引物设计处模板的特异性。PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。 要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。 现在可以在这一保守区域里设计一对引物。一般引物长度为1530碱基,扩增片段长度为100600碱基对。 让我们先看看P1引物。一般引物序列中G C含量一般为40%60
12、%。而且四种碱基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则P1引物设计的就不合理。应重新寻找区域设计引物。 同时引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的互补。 引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但3端绝对不能进行任何修饰,因为引物的延伸是从3端开始的。这里还需提醒的是3端不要终止于密码子的第3位,因为密码子第3位易发生简并,会影响扩增的特异性与效率。 综上所述我们可以归纳十条PCR引物的设计原则: 引物应用核酸系列保守区内设计并具有特异性。 产物不能形成二级结构。 引物长度
13、一般在1530碱基之间。 G C含量在40%60%之间。 碱基要随机分布。 引物自身不能有连续4个碱基的互补。 引物之间不能有连续4个碱基的互补。 引物5端可以修饰。 引物3端不可修饰。 引物3端要避开密码子的第3位。 PCR引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。如前述,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。 1.引物的特异性 引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区DN
14、A二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(G)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2-脱氧GTP取代dGTP对扩增的成功是有帮助的。 3.长度 寡核苷酸引物长度为1530bp,一般为2027mer。引物的有效长度:Ln=2(G C) (A T ,Ln值不能大于38,因为38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74),不能保证产物的特异性。 4.G C含量 G C含量一般为40%60%。其Tm值是寡核苷酸的解链温度,即在一
15、定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值510。若按公式Tm=4(G C) 2(A T)估计引物的Tm值,则有效引物的Tm为5580,其Tm值最好接近72以使复性条件最佳。 5.碱基础随机分布 引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3端不应超过3个连续的G或C,因这样会使引物在G C富集序列区错误引发。 6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp。 7.引物之间 两引物之间不应不互补性,尤应
16、避免3端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。 8.引物的3端 引物的延伸是从3端开始的,不能进行任何修饰。3端也不能有形成任何二级结构可能,除在特殊的PCR(AS-PCR)反应中,引物3端不能发生错配。 在标准PCR反应体系中,用2U Taq DNA聚合酶和800mol/L dNTP(四种dNTP各200mol/L)以质粒(103拷贝)为模板,按95,25s;55,25s;72,1min的循环参数扩增HIV-1 gag基因区的条件下,引物3端错配对扩增产物的影响是有一定规律的。AA错配使产量下降至1/20,AG和CC错七下降至1/100。引物A:模板G与引物G:模板A错配对PCR影响是等同的。 9.引物的5端 引物的5端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3 等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。 10.密码子的简并 如扩增编码区域,引物3端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。 特殊目的的引物设计将在有关章节讨论。随着人们对引物的认识,一些引物的计算机设计程序也应运而生,下面将讨论有关引物计算机设计方法。