1、mi 引物设计原则1. 引物的长度一般为 15-30 bp,常用的是 18-27 bp,但不应大于 38,因为过长会导致其延伸温度大于 74,不适于 Taq DNA 聚合酶进行反应。2. 引物序列在模板内应当没有相似性较高,尤其是 3端相似性较高的序列,否则容易导致错配。引物 3端出现 3 个以上的连续碱基,如 GGG 或 CCC,也会使错误引发机率增加。3. 引物 3端的末位碱基对 Taq 酶的 DNA 合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为 A 的错配效率明显高于其他3 个碱基,因此应当避免在引物的 3端使用碱基 A。另外,引物二聚体或发夹结构也可能导
2、致 PCR 反应失败。5 端序列对 PCR 影响不太大,因此常用来引进修饰位点或标记物。4. 引物序列的 GC 含量一般为 40-60%,过高或过低都不利于引发反应。上下游引物的 GC 含量不能相差太大。5. 引物所对应模板位置序列的 Tm 值在 72左右可使复性条件最佳。Tm 值的计算有多种方法,如按公式 Tm4(G+C)2(A+T),在 Oligo 软件中使用的是最邻近法(the nearest neighbor method)。6. G值是指 DNA 双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用 3端 G值较低(绝对值不超过 9),而 5端和中间 G值相对较高
3、的引物。引物的 3端的 G值过高,容易在错配位点形成双链结构并引发 DNA 聚合反应。7. 引物二聚体及发夹结构的能值过高(超过 4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使 PCR 反应不能正常进行。8. 对引物的修饰一般是在 5端增加酶切位点,应根据下一步实验中要插入 PCR产物的载体的相应序列而确定。引物序列应该都是写成 5-3 方向的,Tm 之间的差异最好控制在 1 度之内,另外我觉得扩增长度大一些比较好,500bp 左右。要设计引物首先要找到 DNA 序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这
4、一段不能形成二级结构,那就可以在这一区域设计引物。 引物应用核酸系列保守区内设计并具有特异性。 产物不能形成二级结构。 引物长度一般在 1530 碱基之间。 G+C 含量在 40%60%之间。 碱基要随机分布。 引物自身不能有连续 4 个碱基的互补。 引物之间不能有连续 4 个碱基的互补。 引物 5端可以修饰。 引物 3端不可修饰。 引物 3端要避开密码子的第 3 位。1.引物的特异性 引物与非特异扩增序列的同源性不要超过 70%或有连续 8 个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区 DNA 二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机
5、软件可以预测估计 mRNA 的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(G)小于 58.6lkJ/mol 时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2-脱氧 GTP 取代 dGTP 对扩增的成功是有帮助的。 3.长度 寡核苷酸引物长度为 1530bp,一般为 2027mer。引物的有效长度:Ln=2(G+C) +(A+T),Ln 值不能大于 38,因为38 时,最适延伸温度会超过 Taq DNA 聚合酶的最适温度( 74), 不能保证产物的特异性。 4.G+C 含量 G+C 含量一般为 40%60%。其 Tm 值是寡核苷酸的解链温度,即在一定盐浓度条件下,50
6、%寡核苷酸双链解链的温度,有效启动温度,一般高于 Tm 值 510。若按公式 Tm=4(G+C)+2(A+T)估计引物的 Tm 值,则有效引物的 Tm 为 5580,其 Tm 值最好接近 72以使复性条件最佳。 5.碱基础随机分布 引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其 3端不应超过 3 个连续的 G 或 C,因这样会使引物在 G+C 富集序列区错误引发。6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于 3bp。 7.引物之间 两引物之
7、间不应不互补性,尤应避免 3端的互补重叠以防引物二聚体的形成。一对引物间不应多于 4 个连续碱基的同源性或互补性。 8.引物的 3端 引物的延伸是从 3端开始的,不能进行任何修饰。3端也不能有形成任何二级结构可能,除在特殊的 PCR(AS-PCR)反应中,引物 3端不能发生错配。 在标准 PCR 反应体系中,用 2U Taq DNA 聚合酶和 800mol/L dNTP(四种 dNTP 各 200mol/L)以质粒(103 拷贝)为模板,按 95,25s;55,25s;72,1min 的循环参数扩增 HIV-1 gag 基因区的条件下,引物 3端错配对扩增产物的影响是有一定规律的。A A 错配
8、使产量下降至1/20,AG 和 CC 错七下降至 1/100。引物 A:模板 G 与引物 G:模板 A 错配对 PCR 影响是等同的。 9.引物的 5端 引物的 5端限定着 PCR 产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物 5端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合 DNA 序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。10.密码子的简并 如扩增编码区域,引物 3端不要终止于密码子的第 3 位,因密码子的第 3 位易发生简并,会影响扩增特异性与效率。Hairpin 发卡结构如果自由能值大于 0 则该结构不稳
9、定从而不会干扰反应如果自由能值小于 0 则该结构可以干扰反应二聚体可以在序列相同的两条引物或正反向。引物之间形成如果配对区域在 3 末端问题会更为严重 3 末端配对很容易引起引物二聚体扩增使Pair Rating 匹配度评分匹配度低的引物对常常不太有效是因为在同样退火温度下 Tm 低的引物决定扩增的特异性而 Tm 高的引物更易于形成非特异性结合而造成错误的起始【1】引物的长度以 1530bp 为宜,否则会影响扩增的特异性。【2】 】碱基尽可能随机分布,避免相同的碱基成串排列,引物的 G+C 含量在4060之间,若 G+C 含量太低,可在 5端加上一些 G 或 C,若 GC 含量太高,可在 5端
10、加上一些 A 或 T。【3】 应避免每条引物内部形成二级结构及两条引物的 3端互补形成引物二聚体,避免在引物的 3端有 3 个 G 或 3 个 C 成串排列,3端的末位碱基最好选T、C、G,而不选 A,也有建议在引物的两端用 1 2 个嘌呤碱基。【4】 尽可能使用两条引物的 Tm 值相同(最好相差不要超过 5),退火温度根据较低的 Tm 值选定,也可以通过改变引物的长度来平衡两条引物的退火温度。Tm 值可以根据 Tm=4(G+C)+2(A+T)计算。而对于较长的引物,Tm 值需要考虑动力学参数、从“ 最近邻位 ”的计算方式得到,现有的 PCR 引物设计软件大多数都采用这种方式。(注:对于 Tm
11、 值的计算有争议的地方是附加序列应不应该计算在内,我觉得有值得商讨的地方。因为从理论上只有最开始的循环引物的附加序列是不与模板链结合的,而在后来的 PCR 反应中,引物的附加序列是和模板链结合了的。)【5】 引物的 3端要与模板严格配对,而 5端碱基没有严格的限制,只要与模板 DNA 结合的部分足够长,其 5端碱基可不与模板 DNA 配对而呈游离状态,这样,我们可以在引物的 5 末端加上酶切位点(引入酶切位点时,要考虑到进行双酶切的共用缓冲液,否则给下游工作带来困难)、启动子,方便下游操作。【6】 不要在扩增序列的二级结构区设计引物,以免退火困难。也要考虑引物设计处模板的特异性。PCR 引物设
12、计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板 DNA 序列。因此,引物的优劣直接关系到 PCR 的特异性与成功与否。 要设计引物首先要找到 DNA 序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。 现在可以在这一保守区域里设计一对引物。一般引物长度为 1530 碱基,扩增片段长度为 100600 碱基对。 让我们先看看 P1 引物。一般引物序列中 G C 含量一般为 40%60%。而且四种碱基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则 P1 引物设计的就不合理。应重新
13、寻找区域设计引物。 同时引物之间也不能有互补性,一般一对引物间不应多于 4 个连续碱基的互补。引物确定以后,可以对引物进行必要的修饰,例如可以在引物的 5端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但 3端绝对不能进行任何修饰,因为引物的延伸是从 3端开始的。这里还需提醒的是 3端不要终止于密码子的第 3 位,因为密码子第 3 位易发生简并,会影响扩增的特异性与效率。 综上所述我们可以归纳十条 PCR 引物的设计原则: 引物应用核酸系列保守区内设计并具有特异性。 产物不能形成二级结构。 引物长度一般在 1530 碱基之间。 G C 含量在 40%60%之间。 碱基
14、要随机分布。 引物自身不能有连续 4 个碱基的互补。 引物之间不能有连续 4 个碱基的互补。 引物 5端可以修饰。 引物 3端不可修饰。 引物 3端要避开密码子的第 3 位。 PCR 引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA 序列。如前述,引物的优劣直接关系到 PCR 的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保 PCR 的成功,但遵循某些原则,则有助于引物的设计。 1.引物的特异性 引物与非特异扩增序列的同源性不要超过 70%或有连续 8 个互补碱基同源。 2.避开产物的二级结构区 某些引物无效的主要原因是引物重复区 DNA 二级结构的影响,选择
15、扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计 mRNA 的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(G)小于 58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用 7-deaza-2-脱氧 GTP 取代dGTP 对扩增的成功是有帮助的。 3.长度 寡核苷酸引物长度为 1530bp,一般为 2027mer。引物的有效长度:Ln=2(G C) (A T ,Ln 值不能大于 38,因为38 时,最适延伸温度会超过 Taq DNA聚合酶的最适温度(74),不能保证产物的特异性。 4.G C 含量 G C 含量一般为 40%60%。其 Tm 值是寡核苷酸的解
16、链温度,即在一定盐浓度条件下,50%寡核苷酸双链解链的温度,有效启动温度,一般高于 Tm 值510。若按公式 Tm=4(G C) 2(A T)估计引物的 Tm 值,则有效引物的Tm 为 5580,其 Tm 值最好接近 72以使复性条件最佳。 5.碱基础随机分布 引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其 3端不应超过 3 个连续的 G 或 C,因这样会使引物在 G C 富集序列区错误引发。 6.引物自身 引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于
17、3bp。 7.引物之间 两引物之间不应不互补性,尤应避免 3端的互补重叠以防引物二聚体的形成。一对引物间不应多于 4 个连续碱基的同源性或互补性。 8.引物的 3端 引物的延伸是从 3端开始的,不能进行任何修饰。3端也不能有形成任何二级结构可能,除在特殊的 PCR(AS-PCR )反应中,引物 3端不能发生错配。 在标准 PCR 反应体系中,用 2U Taq DNA 聚合酶和 800mol/L dNTP(四种dNTP 各 200mol/L)以质粒(103 拷贝)为模板,按 95,25s ;55,25s;72,1min 的循环参数扩增 HIV-1 gag 基因区的条件下,引物 3端错配对扩增产物
18、的影响是有一定规律的。AA 错配使产量下降至 1/20,A G 和CC 错七下降至 1/100。引物 A:模板 G 与引物 G:模板 A 错配对 PCR 影响是等同的。 9.引物的 5端 引物的 5端限定着 PCR 产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物 5端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3 等;引入蛋白质结合 DNA 序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。 10.密码子的简并 如扩增编码区域,引物 3端不要终止于密码子的第 3 位,因密码子的第 3 位易发生简并,会影响扩增特异性与效率。 特殊目的的引物设计将在有关章节讨论。随着人们对引物的认识,一些引物的计算机设计程序也应运而生,下面将讨论有关引物计算机设计方法。