1、基因组学” 1 第 1 章1)什么是 C-值悖理?什么是 N-值悖理?C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为 N 值悖理2)什么是序列复杂性? 基因组中不同序列的 DNA 总长,用 bp 表示。3)RNA 分子有哪些种类?mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰 RNA4)不编码蛋白质的 RNA 包括哪些类型?tRNA rRNA scRNA snRNA snoRNA 小分子干扰 RNA5)什么是假基因?假基因是如何形成的?来源于功能基因但已失去活性的 DNA 序列,有沉默
2、的假基因,也有可转录的假基因。产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使 mRNA 移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。6)假基因能否表达? 为什么?能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。7)如何划分基因家族? 什么是超基因家族?基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在 DNA 序列组
3、成上基本一致而略有不同的成员划分为一个基因家族。超基因家族:起源于共同祖先,由相似 DNA 序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。8)低等生物与高等生物基因组组成有何差别?为什么会产生这些差别?低等生物:1)结构紧凑,一般不存在内含子(古细菌除外);2)大小在 5 Mb 以下;3)缺少重复序列;4)很少非编码序列。高等生物:1)结构松弛,含有大量重复序列;基因组学” 2 2) 基因大多为断裂基因,由内含子和外显子构成;3)由线性 DNA 与蛋白质组成染色体结构; 4)含有细胞器基因组。9)有哪些结构异常的基因?举例说明。重叠基因:编码序列彼此重叠的基因。1.单
4、个的 mRNA 可以编码 2 种或多种蛋白质。例如:大肠杆菌噬菌体 X174 基因组长 5386bp,共编码 11个基因,有 7 个基因为重叠基因,其中 3 个重叠基因 A,A*和 B 共享部分 3端序列。2.由不同的启动子转录的彼此重叠的 mRNA,各自编码不同的蛋白质。例如:人类核基因组 INK4a/ARF 座位有 2 个蛋白质产物 p16 和 p19,他们利用同一座位的不同启动子,第一个外显子不同,但共享第二和第三个外显子,产生两个不同读框的 mRNA。基因内基因:一个基因的内含子中包含其他基因。例如:线虫基因组中一个编码甘氨酸合成酶的基因FGAM 有 21 个内含子,内含子 9 中含有
5、一个独立的基因,内含子 11 中含有 4 个独立的基因。反义基因:与已知基因编码序列互补的负链编码的基因。例如:大麦有 3 个可在种胚糊粉层专一性表达的-淀粉酶基因,2 个为 A 型,一个为 B 型,由赤霉素诱导表达。基因组中已检测到编码 A 型 -淀粉酶反义 RNA 基因,它的表达受控于脱落酸,这是脱落酸拮抗赤霉素的分子机制之一。第 2 章名词解释基因组学” 3 遗传图、物理图、重叠群、小卫星、微卫星问答题:1.理想的遗传作图标记应该满足哪些条件?RFLP、SSLP 和 SNP 标记各有什么特点和优缺点?2. 造成遗传图发生偏离的因素有哪些?1)什么是遗传图?遗传作图的理论基础是什么?遗传图
6、是应用遗传学分析方法将基因或其他 DNA 序列标定在染色体上构建的连锁图。基础:孟德尔 1865 年首次描述的遗传学原理。2)什么是分子标记?有哪些分子标记? 各有什么特点?是指以 DNA 片段为标记,通过 DNA 片段的电泳使 DNA 产生多态性。限制性片段长度多态性(restriction fragment length polymorphisms,RFLP) 特点:1).处于染色体上的位置固定。2).同一亲本及其子代相同位点上的多态性片段特征不变。3).同一凝胶电泳可显示同一位点不同的多态性片段,具有共显性特点。4).有两种等位形式。简单序列长度多态性(simple sequence l
7、ength polymorphisms,SSLP) 具有多等位性。又可分为可变串联重复(variable number of tandem repeat,VNTR)特点:多态信息含量较高,但数量有限,而且在基因组上分布不均匀,不适合 PCR 扩增。简单串联重复序列(single sequence repeat,SSR)特点:1) 染色体上的位置相对固定;2) 操作简单,可以用 PCR 扩增;3) 同一凝胶电泳可显示不同多态性片段,表现为共显性;4) 有多种等位形式。单核苷酸多态性(single nucleotide polymorphisms,SNP)特点:1)理论上同一碱基位置 SNP 等位
8、形式最多为 4,但多数为 2.2)直接从 STS 测序中可寻找到 SNP.3)数量极大,4)SNP 与人类易感性疾病有关, 涉及药物基因组学.5)编码区 SNP 主要分布在密码子的第 3 个碱基位置.3)什么是 RFLP?为什么会产生 RFLP?基因组学” 4 限制性片段长度多态性(restriction fragment length polymorphisms):由于同源染色体同一区段DNA 序列的差异,当用限制酶处理时,可产生长度不同的限制性 DNA 片段,这些 DNA 片段经琼脂糖凝胶电泳分离,可直接显示不同个体同一位点的 DNA 组成的差异。凡是可以引起酶切位点变异的突变如点突变和一
9、段 DNA 的重新组织(如插入和缺失造成酶切位点间的长度发生变化)以及碱基突变等均可导致 RFLP 的产生4) 什么是 SSR 标记? 为什么会产生 SSR?SSR 标记有哪些优点? SSR 标记:是一类由几个核苷酸(一般为 16 个)为重复单位组成的长达几十个核苷酸的串联重复序列。主要产生于 DNA 复制时出现的“滑序”事件以及 SSR 序列等位形式之间的不等交换。优点:1) 染色体上的位置相对固定,数量丰富且分布均匀;2) 操作简单,可以用 PCR 扩增;3) 同一凝胶电泳可显示不同多态性片段,表现为共显性;4) 有多种等位形式。5)什么是 SNP?基因组中单个核苷酸的突变。6)是什么原因
10、造成染色体不同区段之间交换频率的差别?同源染色体之间的不均等交换。7)什么是重组热点?染色体上某些比其他位点有更高交换频率的位点。基因组学” 5 第 3 章名词解释限制性作图 、序列标记位点、序列标记位点作图、作图试剂、克隆文库、指纹问答物理作图的主要方法有哪些?原理分别是什么?各有什么优缺点?什么叫序列标记位点?序列标记位点需要具备什么条件?如何在基因组当中寻找序列标记位点?如何组建克隆重叠群?1)什么是基因组物理图? 物理图与遗传图有何不同?有了遗传图为什么还要绘制物理图?直接检测 DNA 标记在染色体上的实际位置。前者是描述的基因相对位置,后者是具体的碱基位置因为遗传图存在以下缺点:1.
11、遗传学图谱分辨率有限。 2.遗传学图的覆盖面较低。 3.遗传图分子标记的排列会出现偏差。2)如何制备与分离大分子 DNA?采用脉冲凝胶电泳(pulsed-filed gel electrophoresis ,PFGE)将一个方向不断变换的电场,取代简单的单一电场(单向电场)使电泳中受阻的 DNA 分子在电场改变时扭转迁移方向,较小的分子比较大的分子重新排列的快,以此达到分离的目的。分辨率达到 10Mb。3)何谓限制性作图?将限制性酶切位点标定在 DNA 分子的相对位置。4)什么是 YAC 载体? 它有什么优缺点?酵母人工染色体(yeast artificial chromosome,YAC),
12、具有酵母染色体的特性,以酵母细胞为宿主,能在酵母细胞中复制。优点: 容量大, 插入片段可达 1400 kb. 缺点: 转化效率低;插入子稳定性差;嵌合克隆比例高, 达 48%;插入 DNA 的制备相当困难。 5)什么是 BAC 载体? 它有什么优缺点? 细菌人工染色体(bacterial artificial chromosome,BAC),具有细菌染色体的特性,以细菌细胞为宿主,能在细菌细胞中复制。优点:单拷贝复制,不会因重组发生嵌合;采用类似制取质粒的方法直接克隆 DNA,便于机械化操作。6)什么是重叠群(contig)? 如何构建重叠群?相互重叠的 DNA 片段组成的物理图成为重叠群。基
13、因组学” 6 最早采用染色体步移法,首先丛集引文库中挑选一个随机或者指定的克隆,将该克隆的起始末端序列分离纯化作为探针,然后再基因文库中找到与之重叠的第二个克隆。在第二个克隆的基础上重复操作程序寻找第三个克隆,一次延伸,直到完成所需要的重叠群。7)STS 作图依据的原理是什么?两个 STS 出现在同一片段的机会取决于他们在基因组中的距离,彼此靠的越近,分离的几率越小。两个 STS 之间相对距离的估算与连锁分析的原理一样,它们之间的图距根据它们的分离频率来算。8)什么是 DNA 指纹? 有哪些 DNA 指纹?DNA 指纹:指确定 DNA 样品所具有的特定 DNA 片段组成。种类:限制性带型(re
14、striction pattern)指纹;重复序列(repetitive DNA)指纹;重复序列 DNA PCR(repetitive DNA PCR)或者分散重复序列 PCR(interspersed repeat element PCR, IRE-PCR);STS作图(STS content mapping)指纹。基因组学” 7 第 4 章名词解释:顺序间隙、物理间隙、支架、覆盖面问答:自动化测序的原理?基因组测序与组装有哪些策略?他们各有什么优缺点?重叠群之间的间隙有哪两种?1)DNA 测序中采用的 DNA 多聚酶与细胞的 DNA 多聚酶有什么差别?1.高酶活性2.无 53外切酶活性3.
15、无 35外切酶活性2) 鸟枪法测序与作图法测序有何差别?鸟枪法测序把基因组全部打散成短序列,测序后通过程序寻找互相覆盖的部分进行连接得到整个的序列结果。适合小,简单,重复序列少的基因组,测序速度快,并且无须提供相关的遗传图谱和物理图谱,效率高。作图法先将 DNA 分解成长序列,然后把长序列通过 mapping 定位到染色体上某段位置,再把长序列打散成短序列进行测序,适合大分子 DNA 克隆,测序时间长,依赖遗传图谱和物理图谱,效率低。3)为何原核生物基因组更适合鸟枪法测序?因为原核生物基因组结构紧凑,一般不含有内含子(古细菌除外),大小在 5Mb 以下,缺少重复序列,很少非编码的序列。而鸟枪法
16、适合基因组小,简单,重复序列少的测序。4)图解说明 BAC 克隆测序与序列组装的过程.书 82 页5)为何 BAC 克隆测序和全基因组鸟枪法测序都会留下间隙(gap)?任何基因组的测序都不可避免的会出现序列间隙和物理间隙。6)什么是物理间隙? 什么是序列间隙? 如何填补这两类间隙?物理间隙:构建基因组文库被丢失的 DNA 序列,他们从已有的克隆群体中永远的消失。物理间隙的缝合需要利用其他载体或者宿主菌重新构建一个基因组文库,然后利用间隙两侧的序列作为探针,或者制备相应的 PCR 引物,从新文库筛选阳性克隆,重新测序。基因组学” 8 序列间隙:测序时遗漏的序列,这些序列任然保留在尚未挑选到的克隆
17、中。序列间隙可以通过利用相邻已知顺序作为探针,筛选已有的基因组文库,挑选阳性克隆重新测序进行缝合。7)大型基因组鸟枪法测序的缺点是什么? 如何克服这些缺点?容易产生间隙,组装时容易出错与作图法结合或多次测序多次组装8)基因组鸟枪法测序要构建大小不同的插入片段克隆文库 ,原因何在 ?1.采用多个基因组文库时因为任何一种载体都会因某些插入片段与宿主菌的不兼容而不能扩增,使一些DNA片段丢失2.多种质粒文库也增加了克隆片段的总长,扩大了覆盖面3.10kb 文库的构建有助于在 2kb 质粒来源的两端测序序列组装时校正由重复序列产生的差错4.Fosmid 和 BAC 文库的构建可以使下片段 DNA 文库
18、组建的重叠群在大分子克隆中有效而准确地归并与整合,避免了再全基因组范围内直接进行重叠群排序所产生的错误,可提高序列组装的效率,保证序列组装的可信度。9)为何着丝粒区和近端粒区 DNA 的测序非常困难?重复序列多基因组学” 9 第 5 章1)简述原核生物和真核生物基因结构的特点与差别.真核生物有内含子外显子2)什么是 ORF? 开放读框(open reading frame),由一系列指令氨基酸的密码子组成。3)什么是序列同源性? 什么是序列一致性? 什么是序列相似性?同源性:起源于同一祖先但发生变异的序列之间的关联性。一致性:同源 DNA 序列的同一碱基位置上相同的碱基成员,或蛋白质中同一氨基
19、酸位置相同的氨基酸成员的比例。相似性:同源蛋白质氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。4)什么是直系同源基因? 什么是共生同源基因? 它们的差别是什么?直系同源基因:不同物种之间的同源基因,他们来自物种分割之前的同一祖先。共生同源基因:同一生物内部的同源基因,他们常常是多基因家族的不同成员,其共同的祖先可能存在于物种形成之前或之后。直系来自不同物种,共生来自同一物种。5)蛋白质结构域在基因注解中有何意义?由于蛋白质的整体功能是通过各个结构之间的协同作用而实现的,因此结构域的组成提供了蛋白质功能解毒的关键信息。6)基因剔除的原理.在一段无关片段的两侧连接与带换基因两侧相同的顺序,将这
20、一构件导入目的细胞,由于同源片段之间的重组,可以使无关片段取代靶基因整合到染色体中。为了便于筛选,用于取代的外源 DNA 中含有报告基因。基因剔除是最简便的基因失活的方法,用于高等生物基因功能的研究。基因组学” 10 第 6 章1)异染色质与常染色质的差别是什么?异染色质,分布在细胞核周缘,结构致密,着色深。常染色质,分散在整个细胞核当中,结构比较松弛,着色浅。2)何谓 SAR? 何谓 MAR?骨架附着区(scaffold attachment region,SAR):与染色体骨架附着区结合的 DNA 序列。基质附着区(matrix attachment region,MAR):与核基质结合结
21、合的 DNA 序列。3)什么是 CpG 岛? CpG 岛有什么分布特点? CpG 岛是如何产生的?CpG 岛:基因组中富含双碱基 CpG 的序列。特点:1.主要在脊椎动物中发现,其它种属基因组中也有 CpG 岛, 但特征不明显.2.绝大多数 CpG 岛中很少出现胞嘧啶甲基化, 因此被认为是基因转录活跃区.3.CpG 岛主要分布在基因的启动子区和第一个外显子区.4.绝大多数管家基因含有 CpG 岛, 是寻找基因的一个指标.5.在染色体上分布很不均匀,但与基因的分布频率一致。产生原因:1. 由于细胞内胞嘧啶甲基化与脱氨基事件常常发生, 导致复制时的 CA 错配.在下一轮复制时原来的胞嘧啶(C)位置
22、由胸腺嘧啶(T)取代, 即发生碱基代换. 因此基因组 DNA 顺序进化的总趋势是 A/T比例增加.2. 管家基因对生物的存活极其重要, 启动子区是基因调控的主要成分, 因此很少发生可遗传的 CA 的突变, 保留了较平均值更高的 G/C 比.4)叶绿体和线粒体基因组起源于原核生物的依据何在?1.细胞器基因表达的过程很多方面与细菌相似;2.细胞器基因与细菌基因相似性高于核基因。5)真细菌和古细菌操纵子的组成有何差异?6)什么是 DNA 转座子? 什么是 RNA 转座子(或逆转座子)? 这两类转座子的转座方式有何特点?DNA 转座子:基因组中广泛存在的一类可以移动位置的遗传因子,涉及 DNA 的直接转座。RNA 转座子:以 RNA 为中介进行转座。第一类本身含有编码转座子酶的基因,可以自主转录。第二类本身不含有编码转座子酶的基因,需要在转座的时候提供转座酶才能转座。