1、这里为您介绍二代测序的相关流程和应用。随着人类基因组工程的完成,对于低花费的测序技术的需求促进了高通量二代测序技术的发展。这些新的测序平台允许进行高通量测序,具有广泛的应用: 全基因组从头测序或者重测序 目标序列重测序 转录组分析 微生物组研究 基因调控研究NGS 序列二代测序仪器有很多种组合,在通量、片段长度、准确度、每一轮测序成本、每百万碱基对测序成本、初始成本、规格和技术方面存在存在差异。 从规格和初始成本的角度而言,二代测序仪器可轻松地分类为更窄的范围,也就是所谓的“台式测序仪”和高通量仪器。台式测序仪使得任何实验室都可以像使用 real-time PCR 一样,自己进行测序。这些仪器
2、可以和一些靶标序列富集技术相结合,用在一些临床的应用中,其中:选定的靶标基因用于深度分析,以检测稀有的突变,或者检测多样样本中(比如癌症样本)中的突变。目前,这些仪器的通量在 10 Mb 到 7.5 Gb 之间,但是随着硬件,软件和试剂的持续改善,通量也在稳步增加。高通量测序仪非常适合于大量的,基因组范围的研究,每次测序能测定 600 Gb 的序列。一些这样的高通量和高精度的平台,能测定的片段长度相对较短,这对于高重复性的序列和未知基因组的从头测序就可能成为问题。与此相反,也有一些仪器能测序的片段较长(达到 2500 bp),但是其精度和测序能力(90 Mb)要低很多。还有一些测序能力位于两者
3、之间的仪器(800 bp,700 Mb)。因此,应用决定了哪一种仪器是最合适的。有一种新的方法被称作“纳米孔测序”。这种技术中,根据一个 DNA 链通过一个合成的或者蛋白纳米孔道所引起的电流的改变,可以确定通过这个孔道的碱基。这理论上可以仅用一步就测序一个完整的染色体,而不需要生成新的 DNA 链。DNA 测序二代 DNA 测序的工作流程如下: DNA 样本制备 文库构建和验证 文库分子大规模平行克隆扩增 测序二代测序 DNA 样本的质量控制首先,评价基因组 DNA 的质量是非常必要的(完整性和纯度)。凝胶电泳法基因组 DNA 的完整性和大小,可以用常规或者脉冲场琼脂糖凝胶电泳 (PFGE)来
4、检测。常规的凝胶电泳的精确度不高,这是因为大的DNA 分子在凝胶中移动的时候,本质上是用一种与尺寸无关的方式一起移动的。但是,它仍然能够提供完整性(大小范围)和纯度(RNA 污染物在凝胶底部形成脱尾条带)方面的有效信息。因此,它仍然是评价基因组 DNA 质量的有效方法之一。注:RNA 污染会导致 DNA 浓度高估,并且抑制一些下游步骤。如果能肯定有 RNA 污染,则可使用去 DNase 的 RNase I 处理样本。分光光度测定法分光光度仪在 260 nm 和 280 nm 处读数的比例(A 260/A280)可以用来估计 DNA 相对于一些吸收紫外光的杂质(比如蛋白)的纯度。纯净的 DNA
5、的 A260/A280 比例大约为 1.71.9。注:想要获得精确的 A260/A280 值,需要在弱碱性的缓冲溶液中测定吸光度 (比如, 10 mM TrisCl, pH 7.5)。第二个步骤是测定基因组 DNA 的浓度。分光光度法DNA 的浓度可以通过使用分光光度仪测定其在 260 nm 波长的吸光度来确定。Nanodrop 目前被广泛使用,因为它需要的样本量少(1 l),并且使用方便(不需要比色皿)。为了确保结果的可靠性,读数应该在 0.1 到 1.0 之间。 注:吸光度测定不能区别 DNA 和 RNA。RNA 污染物会导致 DNA 浓度高估。但是,纯净 RNA 的 A260/A280
6、比值在 2.0 左右,而纯净的DNA 大约为 1.8。因此,如果这个值为 1.95,那么说明样本里面有 RNA 杂质。注:苯酚在 270275 nm 的波长范围内有最大的吸光度,非常接近于 DNA。因此苯酚能提高样本在 260 nm 附近的吸光度,从而导致高估 DNA 的产量和纯度。荧光法荧光法使用荧光染料测定 DNA 的浓度,具有特异性和灵敏性。 Hoechst 33258 结合到 DNA 上后,能增大 458 nm 波长附近的发光强度,除此之外,也可以使用一些更加灵敏的荧光染料,比如 PicoGreen 染料。基于 PicoGreen 染料的实验,比紫外吸光光度法灵敏10, 000 倍,而
7、比使用 Hoechst 33258 染料的方法至少灵敏 400 倍。和紫外吸光光度法不同,PicoGreen 实验对双链 DNA 的选择性要远高于 RNA 和单链 DNA。DNA 标准品和样本与荧光染料混合,并且使用荧光计检测。将样本的测定结果与标准品的测定结果相比较,以确定 DNA 的浓度。Real-time PCR 可以使用 real-time PCR 技术来测定 DNA 样本的数量和质量。多重 PCR 技术使用引物集在多个位点扩增不同大小的片段,是检测DNA 损伤和片段化的有效质控手段。此类技术试验专门测定可经 PCR 扩增,适于二代测序的 DNA 分子。上述提到的这些常规方法,通常不能
8、测定的样本中扩增得到的 DNA 的量,或者会高估了 DNA 的量。与它们相比, real-time PCR 更加适用于预测 DNA 样本是否适合于二代测序。 文库制备对于大多数商业化的二代测序平台,使用诸如桥式扩增或者乳液 PCR 方法,对文库中的 DNA 片段进行克隆扩增,以产生足够拷贝数量的测序模板非常必要。通过将平台特异性的适配子与感兴趣的 DNA 源(比如基因组 DNA、双链 cDNA 或者 PCR 扩增子等所产生的DNA 片段)退火,得到片段文库。适配子序列的存在,使得我们可以对文库分子进行选择性的克隆扩增。因此,这种方法不需要像传统的方法那样,在微生物中间体中,对基因组片段进行微生
9、物克隆。另外,适配子序列中,还含有平台特异性的测序引物的结合位点。通常情况下,一个常规的 DNA 文库构建方案包含四步: 片段化 DNA 对 DNA 片段进行末端修复 连接适配子序列(不适用于单分子测序) 对可选的文库进行扩增目前有四种方法用于产生基因组 DNA 碎片:酶消化法、超声波法、喷雾法和水动力剪切法。这四种方法都可以用于文库构建,但是每一种方法都有其优点和局限性。核酸内切酶消化的方法快速并且容易,但是难以精确的控制片段长度的分布。另外这种方法可能会对基因组 DNA 的呈递引入偏倚。另外三种技术使用物理的方法将 DNA 的双链打断,这种断裂是随机的,因此能在文库中对 DNA 进行无偏的
10、呈递。可以使用琼脂糖凝胶电泳或者自动化的 DNA 分析方法,对 DNA 片段的尺寸分布进行控制。片段化 DNA 之后,需要将 DNA 修复,产生 5磷酸化的平末端 DNA,以便能够和测序平台特异性的适配子相连接。文库构建的效率直接依赖于 DNA 末端修复的效率和准确性。末端修复混合溶液将 5或者 3的粘性末端转变成 5磷酸化的平末端 DNA。在大多数情况下,末端修复通过 T4 DNA 聚合酶的 53聚合酶活性和 35的核酸外切酶活性完成。而 T4 多聚核苷酸激酶确保平末端的 DNA 片段 5端的磷酸化,以便进行后续的适配子连接。根据所使用的测序平台,平末端 DNA 片段可以直接与适配子连接,或
11、者需要在其片段的 3端增加一个单独的突出的腺苷酸 A,以便与平台特异性适配子上突出的胸苷酸 T 相互配对。通常情况下,使用 Klenow 片段(具有最低的 3到 5端的核酸外切酶活性),或者使用其它具有末端转移酶活性的聚合酶催化这一步骤。T4 DNA 连接酶将双链的适配子与文库片段修复过的末端相连,然后使用回收反应或者根据 DNA 的尺寸,选择性去除文库中未连接的适配子和适配子二聚体。大小筛选方法包括使用琼脂糖凝胶电泳分离,使用磁珠或者使用高等的基于柱的纯化方法。在连接过程中可能出现适配子的二聚体,它们会和与适配子连接的文库片段共同扩增,从而降低测序平台对真正文库片段测序的能力并且降低测序的质
12、量,因此在测序之前,必须将它们从文库中除去。一些测序平台要求文库片段的长度分布在比较窄的范围内,以得到最佳的结果,很多时候,这只能通过去除凝胶电泳上的相应的片段条带实现。这种方法也可以用来去除适配子二聚体。完成这一步骤之后,应该对 DNA 片段文库的质量进行检测,并进行定量检测。根据浓度和测序文库的适配子设计,既可以直接稀释溶液并用于测序,也可以对文库进行选择性扩增。在文库扩增阶段,使用高保真的 DNA 聚合酶,合成完整的适配子序列,通过与 PCR 引物的重叠,用于后续的克隆扩增和与测序引物结合,或者提高 DNA 文库的产量。为了得到最佳的文库扩增结果,要求 DNA 聚合酶具有高保真性和最小的
13、序列偏倚。文库质量评估方法,参见 NGS 文库质控。为了充分利用测序能力,不同样本得到的测序文库可以放在一起,在同一轮实验中一同测序。通过将 DNA 片段与具有不同特征的适配子相连接,可以实现这一过程,即对于每一个样本使用不同的短核苷酸序列作为适配子。有一些其它的方法可以用于简化文库构建。有一种新方法使用转位酶/DNA 的复合物进行体外转座,以便在同一个试管中同时将 DNA 片段化并标记。通过对所标记的 DNA 片段进行有限次数的 PCR 扩增,可以构建完整的测序文库,这节省了操作步骤和时间。但是,使用体外转座构建的文库,与传统方法构建的文库相比,具有更高的序列偏倚。NGS 文库质控高质量的文
14、库是成功进行第二代测序的关键。文库构建包含复杂的步骤,比如片段化样本、修复末端、将末端腺苷酰化、连接适配子和扩增文库。根据使用的平台和文库类型,这些步骤也会发生变化。监控每一个步骤非常必要,包括在片段化样本之后检查片段的尺寸,以及连接适配子之后检查片段的大小和浓度。文库验证过程中,需要分析文库中片段的大小和数量,这是质控的最后步骤。评估文库中片段的大小琼脂糖和 PAGE 凝胶电泳是传统的检测片段大小的方法,它们比较耗时。 最近,基于微流技术的电泳或者毛细管电泳越来越广泛的用于检测片段的大小和浓度。即买即用的芯片和胶盒省去了配置凝胶的步骤,使用方便。它们具有更高的通量,并且省去了很多的手动操作时
15、间。除此之外,它们的灵敏度更高(对于检测的限制更少),并且能完全自动化的获取数据和输出电子化的数据资料。这些仪器能同时检测片段的大小和浓度。 测定文库中的片段数量 分光光度法和荧光法 参见分光光度法和荧光法电泳设备 如前所述,基于微流技术的电泳和毛细管电泳除了提供片段大小的信息之外,还提供了定量检测数据。但是,电泳、分光光度法和荧光法的一个共同的局限性是,都只检测总的核苷酸的浓度,而非与适配子连接的分子的浓度。Real-time PCR 将适配子连接到文库分子的两端,使得可以在平行的 PCR 扩增步骤中扩增上百万个独立的 DNA 分子(乳液 PCR 或者桥式 PCR)。在有些仪器中,乳液 PC
16、R 可以将一个 DNA 分子扩增到数百万个相同序列的拷贝,并全都结合在同一个珠子上。在另一种平台上,桥式PCR 能够将一个 DNA 分子转变成一个包含相同序列的多个拷贝的 DNA 簇。因此,两端连接了适配子的扩增之后的分子,决定了乳液PCR 中模板和珠子的比例以及桥式 PCR 中产生的最佳 DNA 簇。对扩增后的文库中的分子进行精确的定量检测,对于确保片段的质量和高效的获得数据是非常重要的。低估扩增文库中的分子数量,会导致混杂的信号以及难以解析的数据;相反地,高估分子的数量会降低结合模板的珠子或者 DNA 簇的产量,并且没有充分利用测序能力。Real-time PCR 能够特异性的定量检测两端
17、结合有适配子的 DNA 分子,因此能够对扩增文库中的分子进行高度精确的定量检测。 Real-time PCR 的灵敏性非常高,可以对浓度非常低的文库分子进行定量检测,即使其浓度低于传统方法可以检测的阈值。因此,这种方法能尽量减少对文库的扩增,降低可能的偏倚。用于决对定量检测的数字 PCR数字 PCR 能够对二代测序的文库进行绝对定量检测,而不需要标准品。这个技术对文库进行有限的稀释,并进行大量独立的 PCR 反应;因此,大多数反应没有模板,得到阴性的结果。一个单独的阳性 PCR 反应统计为一个单独的模板分子。通过统计所有阳性 PCR 的数量,能够确定文库分子的绝对数目。数字 PCR 的主要优点
18、在于: 单分子的敏感性 与 PCR 扩增的效率无关,因为成功的扩增被统计为一个分子,而与最终产物的数量无关但是,这种技术需要特殊的仪器,并且花费较高,因此尚未广泛用于文库定量检测。宏基因组学 Metagenomics DNA 测序的应用领域之一是宏基因组领域,即从环境样本中直接回收的遗传物质的非培养研究。宏基因组学是指一个环境样本中所包含的所有微生物基因组的功能和序列分析。这个词汇起源于“meta”(在这里指对于基因多样性的系统性理解)和“genomics”(对一个物种的遗传物质的综合分析)。宏基因组不是一个新的学科,但由于二代测序技术所带了的诸多可能性,宏基因组的应用经历了巨大的提升。据估计
19、,微生物中仅有 1%左右是可培养的,因此宏基因组学的研究能极大的拓展我们对于环境的认识。很多年以来,“宏基因组”这个词汇仅与环境样本的分析有关,比如,分析从极端的生存环境下分离得到的 DNA,以便发现能用于工业的新的生物催化剂。但是,通量的极大提高,以及所花费的费用和时间的降低,将这个领域的应用扩展到了很多其他方面。宏基因组学可分成几个领域,包括: 病理基因组学/感染基因组学 微生物组分析 环境宏基因组学注:这并不是全面的分类,研究者可以选择其他的分类标准。 病理基因组学/感染基因组学和疾病的诊断相关,用于确定有疾病症状的患者体内未知的病原体。这通常是极具挑战性的过程,因为微生物的数量可能非常
20、少(每毫升血液中大概有 110 个细胞)。与之相反,微生物组分析则涉及到数量巨大的微生物,比如口腔或者直肠拭子中的微生物。此时,我们的目标是分析这些菌群的组成。考虑到人体仅包含 1%的人类细胞而其它 99%都是微生物细胞,微生物组分析在未来的诊断技术中有潜在的巨大应用。更多细节,请见人类微生物组工程(www.hmpdacc.org)。 环境宏基因组学的目标除了包括传统的寻找新的生物催化剂之外,还包括研究和鉴定栖息环境。 从理论上来讲,环境宏基因组学有两种不同的研究方法: 全基因组分析:对所有存在的 DNA 进行测序 16S 分析:仅对 16S rRNA DNA 进行测序第一种方法只是简单的对样
21、本中存在的所有 DNA 进行测序。这可以完整地描绘所有出现过的微生物,并且可能发现新的酶或者酶家族,以及抗生素的抗性。另一方面,这种方法需要较高的测序能力,因而,相对于第二种方法,其通量较低并且花费较高。与此相关的进一步的方法正在研发。在宏基因组的应用中,通常需要能提供较高的片段长度的测序仪,这是因为通常没有参考序列可供参照。对于 16S rRNA 分析而言,测序仪的读长需要覆盖整个区域(另请参照二代测序仪)。RNA 测序RNA 测序(RNA-seq)是使用深度测序技术来研究生物体转录组的方法。此方法在构建合适的文库之后,对样本中的 RNA 直接测序,得到丰富的数据集以进行分析。这项技术的高灵
22、敏度和高分辨率使得它成为研究整个转录情形的有价值的工具。数据的定量性以及测序技术的高动态范围使得其对基因表达的分析具有高度的灵敏性。数据的单个碱基的分辨率提供了关于单核苷酸多态性(SNP)、选择性剪接、外显子/内含子边界、非翻译区及其它元件的详细信息。除此之外,RNA-seq 不需要预先知道参考序列,这使得从头的转录组分析和新的变异体和突变体的检测成为可能。RNA-seq 是研究转录组的强大、革命性方法,但是使用这种技术需要非常仔细以获得最高质量的数据。 RNA-seq 中需要考虑的因素 第一个需要考虑的因素是样本富集。总 RNA 通常只包含比例很少的编码 RNA 或者功能 RNA;样本中大部
23、分 RNA 是核糖体RNA(rRNA:大约占到了总 RNA 的 8090%)和较少的转运 RNA (tRNA)。为了避免将 8090%的测序资源用在重复的 rRNA 序列上,通常在测序之前,需要从样本中去除 rRNA。这通常可以通过特定的消耗 rRNA 实现,也可以通过使用寡聚胸腺嘧啶富集技术选择性富集 Poly A 实现。消耗 rRNA 的方法可以同时保留编码 RNA 和非编码 RNA(一项非常重要的研究内容)的信息,而 Poly A 富集则仅保留了编码 mRNA。Poly A 富集可能会丢掉特定的 RNA 和具有高转换率的 RNA。 有一些其他的方法可以避免 rRNA 的影响,比如选择性降
24、解大量转录物,或者不扩增 rRNA 的扩增技术。但是这些方法不像 rRNA 消耗或者 poly A 富集那么常见,并且可能扭曲转录物表征的正常水平。 另外一个需要考虑的因素是要研究的 RNA 的大小。RNA 转录物跨越比较大的大小范围;与常规的 RNA 分析相比,关注小 RNA 的实验(比如 microRNA 或者长度范围在 1535bp 的 RNA),需要特别的纯化和文库构建方案。大多数其他大小的 RNA 片段可以同时测序(RNA 测序的常用步骤之一是将 RNA 分割成普通长度,比如 200300 nt 长度的片段)。RNA-seq 测序操作步骤 一旦确定了移除核糖体的方法和要研究的片段大小
25、,就可以将 RNA 构建成一个文库。对于大多数测序仪器而言,这包括首先将 RNA 打碎成片段,其次通过逆转录方法构建双链 cDNA。在后续的文库构建过程中,这些双链的 cDNA 被当作普通的基因组 DNA 来对待。如果想要保留 RNA 的直接信息(链型),必须使用修改过的文库构建方案,比如将 mRNA 与连接适配子直接相连,或者标记 cDNA 的一条链以便在测序之前移除。 在进行测序计划过程中,需要考虑三个主要的因:测序深度、读长和是否使用双端测序数据。测序深度可以提供 RNA 转录物的丰度信息,并且较大的测序深度使得对于稀有转录物的检测更加灵敏。读长也很重要,因为较长的读段对于检测剪接事件更
26、加灵敏(内含子外显子边界,外显子外显子边界)。双端测序数据能提供更多关于转录物结构的信息,特别是相互分隔的较远的外显子。一般而言,从头分析以及寻找新的结构变异要求较高的测序深度和读长,并且会得益于双端测序数据。典型的测序应用包含 100200 M 片段,长度为 2 x 50100 bp。与之相反,表达分析得益于较高的测序深度,但是读长和双端测序数据则对结果的改善作用较小。这方面应用的一个典型实验包含 1030 M 片段,读长为 1 x 35100 bp。基因调控研究 二代测序技术也是研究基因调控网络的强有力的工具。比如 ChIP-seq 技术(染色质免疫共沉淀测序)可以用于分析蛋白-DNA 的
27、相互作用。二代测序技术也能用于确定基因组的全局甲基化模式。 ChIP-Seq 染色质免疫共沉淀技术(ChIP)是用于研究转录因子和修饰组蛋白基因调控机制的强大、多功能方法。这种技术用于确定活细胞中染色质上那些与转录因子、共调节因子、修饰组氨酸、染色质重塑蛋白或者其它的核因子相互结合的区域。 整个操作过程非常耗时,包含了很多步骤和变量,每一个步骤都需要研究者根据自己的模型体系进行优化。将细胞与甲醛交联之后,将染色质中共价相连的基因组 DNA 和核因子复合物分离出来,然后经过超声波处理,剪切成可以处理的大小。抗体与目标核蛋白特异性免疫共沉淀时,也将与这些核蛋白特异性结合的基因组 DNA 也沉淀下来
28、了。去除化学交联并经过核酸纯化处理的这些 DNA 可用于测序、基于微阵列的基因组杂交或者 PCR 扩增。 ChIP 与二代测序技术联用(ChIP-Seq)可研究与感兴趣蛋白相结合的位点在基因组的范围内的分布。与微阵列分析(ChIP-Chip) 相比,ChIP-Seq 技术提供了较高的空间分辨率,动态范围和基因组覆盖度,因而它对于 DNA 结合位点的检测具有超级的灵敏度和准确度。另外,ChIP-Seq 技术通常只要很少的起始样本输入量,并且不需要杂交探针,具有较高的灵活性,任何测序过基因组的物种都可以使用这种方法进行研究。高效的 ChIP-Seq 过程需要优化几个关键的变量。首先,甲醛交联的温度
29、和时间需要优化。如果蛋白和 DNA 交联的过于紧密,则在测序之前无法将染色质有效地打碎成片段,并且去除交联也会遇到困难。通常情况下,最好以在 37C 下与 1%的甲醛共培育 10 分钟起始,然后在此基础上进一步优化。有几种不同的方法可以将染色质打成碎片,比如超声波和酶消化(比如使用微球菌核酸酶)。如果使用二代测序技术来分析免疫共沉淀的 DNA,染色质碎片的大小应在大约 100300 核苷酸长度范围内,并且每一个测试系统中(细胞的类型、组织的类型),将染色质打碎成片段的参数也需要严格优化。ChIP 实验的成功与否取决于所使用的抗体的量和特异性。最好选用能从多家抗体厂商处获得的,经过 ChIP 实
30、验验证的抗体。为了确定抗体能特异性地沉淀目标蛋白,可以使用蛋白印迹技术检测核提取物。如果在结果中,仅能观察到一条特定大小的条带,则可认为该抗体是特异性的。使用选定的抗体进行免疫共沉淀,然后通过蛋白印迹分析技术确定抗体是否能特异性的沉淀目标蛋白。如果这样的实验失败了,那么还可以将选定的抗体与培养的细胞进行免疫荧光试验。如果仅有细胞核显色,则说明抗体至少能特异性的识别一种位于细胞核内并可结合到 DNA 上面的蛋白。根据目标蛋白的丰度,经过验证的抗体的量以及用于免疫共沉淀的染色质的量必须经过优化,以便获得足够的 DNA 进行测序。对于识别组蛋白和组蛋白修饰的抗体而言,每一次免疫共沉淀反应大概需要 1
31、00,000 到 1 百万个细胞中的染色质。如果转录因子与 DNA 结合的动态性较高或者与组蛋白相比,仅在有限的基因组位点上结合,那么实验就需要更多的染色质。为避免多余的抗体与非目标蛋白和染色质的非特异性结合,同时保证能沉淀足够多的目标蛋白,每一次免疫共沉淀反应使用的抗体的数量也非常重要。通常而言,110 g 的抗体即可得到合理的结果。可以用对照反应来比对 ChIP 反应的特异性。在平行的 ChIP 反应中,使用同样数量的染色质,可以使用同型的对照抗体或者没有抗体的珠子用来比照抗体和珠子与蛋白和染色质的非特异性的结合。通过比较阴性对照样本和 ChIP 样本中在特定位点沉淀的 DNA 的量,能计
32、算这个位点的富集因子。但是,在这种免疫共沉淀对照实验中得到的沉淀物的量通常很少,不足以提供足够的片段进行二代测序。因此,ChIP-Seq 实验通常使用输入对照样本作比对。在这种情况下,每个 ChIP 反应中通常有 1%交联并且打碎的染色质被用来去除交联并且与沉淀的样本一同纯化并进行后续的深度测序。这使得我们可以比对由于打碎染色质所引起的偏移,这些偏移表现在染色质的局部结构,DNA 扩增,测序,拷贝数量的变化,以及测定基因组区域的能力。 在沉淀的 DNA 碎片去除交联和纯化之后,建议使用 real-time PCR 技术确认与目标蛋白结合的基因组位点的回收和富集效果。通过比较输入对照组与 ChI
33、P 样本的 qPCR 结果,可以计算出输入物质的回收比例( CT 方法)。如果使用了同型对照抗体样本(或者空白珠子的对照样本),则可以与 ChIP 样本相互比对,以进一步对 qPCR 技术检测到的位点的富集进行定量分析(C T 方法)。为了能稳定地构建二代测序文库,至少需要 10 ng 的 ChIP DNA。因此,必须仔细的定量免疫共沉淀得到的 DNA。但由于每一次 ChIP反应得到的总的 DNA 量通常很低,因此需要比吸光光度定量法更加灵敏的方法。荧光测定方法(比如使用 PicoGreen)在定量 ChIP DNA 时具有较高的灵敏度和动态范围。如果仍然没有得到足够的 DNA,可将从几次 C
34、hIP 反应所得到的所有物质可以放到一起,用来构建一个测序文库。由于用于构建文库的起始材料的数量非常低,因此在片段与测序适配子连接之后对其进行扩增很有必要。这通常需要 1618 轮 PCR。太多轮的扩增会降低文库的复杂性,因此需要确定得到足够材料所需的最少 PCR 轮数。在确定文库的品质(使用一些商业化的仪器,比如 QIAxcel 或者 Bioanalyzer)和浓度(比如使用 qPCR 技术)之后,需要使用乳液PCR(emulsion PCR, Ion Torrent)或者桥式 PCR 技术(bridge PCR, illumina)对文库进行进一步的扩增,然后才能用于最后的深度测序。通常而
35、言,较短的 2536 核苷酸长度的单个读段对于定位目标蛋白在基因组上的结合位点就已经足够了。但是,为了能够定位更困难的区域(比如重复区域),也可以使用双末端测序方法(2 x 25 的核苷酸长度或者 2 x 36 的核苷酸长度)。所需要的总的测序读段取决于与因子结合的基因组位点的数目。对于转录因子而言,它们仅仅和基因组上有限的几个位点相结合,5 百万1 千 2 百万读段可能足够了。而如果要分析修饰后的组蛋白,由于它们结合在基因组更广泛的区域上,因此需要更多的测序读段。通过增加测序读段的数量,能够改进分析的灵敏性,从而确定亲和力更弱的位点。一些免费的软件(比如 MACS)能用来确定比统计水平具有更多读段的基因组区域(与局部本底相比或者与单独测序的输入对照样本相比)。对于这样的数据,上述的软件能够产生一个列表,显示那些显著增加的目标蛋白的结合位点。细胞收集,超声波参数和 ChIP 富集得到的基因组 DNA 的 real-time PCR 分析的优化都需要通过实验来确定。基于序列的甲基化分析请参考关于表观遗传学的试验方案和应用指南部分。