1、SNP1. SNP概念概念 2. SNP分类分类 4. SNP特性特性 5. SNP研究意义研究意义6. SNP分型技术分型技术1.SNP概念vSNP, single nucleotide polymorphism,单核苷酸多态性。 主要是指基因组水平上由单个核苷酸的变异所引起的 DNA 序列多态性。v一个 SNP 的含义是给定的一个群体中,超过 1 %的个体在给定的遗传区域内发生一次核苷酸改变,是一个物种中不同个体表型的主要遗传来源。v包括单个碱基的 转换 、 颠换 、 插入 和 缺失 等v转换 是指同型碱基之间 G-A, T-Cv颠换 是指发生在嘌呤与嘧啶之间 A-T、 A-C、 C-G、
2、 G-T1.SNP概念v依据排列组合原理一共可以有 6种替换情况:A-G、 A-T、 A-C、 C-G、 C-T 和 G-Tv但事实上, 转换 的发生频率占多数,而且是 C-T 转换为主。v其原因是 CpG的 C是 甲基化 的,容易自发 脱氨基形成 TvSNP在单个基因或整个基因组的分布是不均匀的:( 1) 非转录序列 要多于 转录序列( 2)在转录区 非同义突变 的频率,比其他方式突变的频率低得多。2.SNP分类v一是遍布于 基因组 的大量 单碱基变异 ; v二是分布在 基因编码区 (coding region)内,称其为 cSNP,属功能性突变。v从对生物的遗传性状上来看, cSNP又可分
3、为两种:( 1) 同义 cSNP, SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变的含义相同。( 2) 非同义 cSNP,指碱基序列的改变可以使其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。3.SNP特性v密度高 SNP在人类基因组的平均密度估计为 1/1000 bp ,在整个基因组的分布达 3106个,遗传距离为 2 3CM ,其中约有 2105个存在于编码区。密度比微卫星标记更高,可以在任何一个待研究基因的内部或附近提供一系列标记。v具有代表性 虽然 SNP在编码区的分布要低于其他位置,某些位于基因内部的 SNP有可能直接影响蛋白质结构或表达水
4、平,因此,它们可能代表疾病遗传机理中的某些作用因素。 3.SNP特性v遗传稳定性 与微卫星等重复序列多态性标记相比, SNP具有更高的遗传稳定性。v分布不均匀 由于选择压力的存在, SNP在整个基因组中的分布不均匀,在 3表达序列标签(express sequence tags, ESTs)中的分布比在其他基因组区域中的少,在非编码区的数目远远大于编码区。v易实现分析的自动化 由于每个 SNP位点通常仅含两个等位基因 双等位基因 (biallele),在检测时能通过一个简单的 “+/-”分析进行基因型分型,而无需分析片段的长度,因而易于自动化。4.SNP研究意义4.1 基因组制图4.2 疾病的
5、关联分析4.3 药物设计和应用4.4 个体识别和亲权鉴定SNPs作为第三代遗传标记 -路标的作用。传统研究策略(表征、蛋白、基因)逆向遗传学(表型、基因、蛋白)4.1基因组制图v“遗传图谱 ”、 “物理图谱 ”、 “放射杂交图谱 ”v将 SNP与 人类基因组序列 、 物理和遗传图谱 结合起来以期在序列变异、疾病关联基因、种族遗传和基因组扫描等方面作出进一步研究,将会对疾病的深入了解、诊断方法和新型有效的治疗方法的发展产生深远的影响。v2000年, SNP图谱, 2730个 SNPs 定位和作图。v2001年,国际 SNP图谱工作组 124万个 SNP的图谱。4.2疾病的关联分析v心脏病、癌症、
6、糖尿病、精神病等的遗传变异是人类遗传学家面临的一个主要挑战。v这类疾病通常隔代遗传,结果使曾经成功运用于孟德尔疾病的传统的 家系连锁分析 在此使用受限,复杂性疾病是 遗传和环境综合作用 的结果。v目前,发现这些多基因疾病微效基因最有力的方法是利用与疾病基因关联的 DNA 标记 ,对病例组和对照组的标记的等位基因频率进行统计学比较, SNP是这种分析很好的一种标记。4.3药物设计和应用vSNP 多态性的研究 ,表明遗传多态性与个体对药物的敏感性或反应性之间存在关联 药物基因组学(Pharmacogenomics) 。v通过比较服药后副作用严重个体与无此反应的对照的DNA ,确立一个易感个体的 SNP 简图,在通过比较具有良好作用个体与无作用个体的 DNA,建立一个正效应个体 cSNP 简图。两者共同组成一个综合的药物反应模型,有助于患者选取有效而副作用少的疗法。