1、分子流行病学进展及其在疾病预防控制中的应用Molecular Epidemiology and its Application in Disease Prevention & Control,沈 洪 兵 南京医科大学公共卫生学院,分子流行病学的定义(Molecular Epidemiology),分子流行病学是阐明疾病和健康状态相关生物标志(或分子事件)在人群和生物群体中的分布及其影响因素,并研究防制疾病、促进健康的策略与措施的科学。应用先进的技术测量生物学标志的分布情况,结合流行病学现场研究方法,从分子或基因水平阐明疾病的病因及其相关的致病过程。,Cancer,传统流行病学(宏观、群体),E
2、xposure,传统流行病学和分子流行病学,传统流行病学,分子流行病学,传统流行病学与分子流行病学的关系(EDC模型)(Schulte,1993),暴露,疾病,Medical Practice etiology diagnosis treatment prevention,分子流行病学?,Gene discovery &CharacterizationSNPsHaplotypes,Human Genome ProjectHapMap Project,分子流行病学的特点,与传统流行病学不同 研究的水平不同 所解决的问题不同 与分子生物学的区别 研究对象不同(人群) 研究内容和方向不同(强调与宏观
3、暴露的关系) 研究方法不同(流行病学思维和方法)宏观与微观相结合!,分支 肿瘤分子流行病学 传染病分子流行病学 ,分子流行病学的发展趋势 研究手段越来越多,技术越来越成熟研究内容(生物标志物)越来越丰富应用范围越来越广(病因、危险度评估、早期诊断、个体化治疗),生物标志(biological markers, biomarkers)是可以测量的、能代表生物结构和功能的大分子物质,如DNA、RNA (miRNA)或抗原、抗体、蛋白质(酶)等。,分子流行病学的主要研究内容:生物标志,一、暴露标志(exposure marker),(一)外暴露标志主要指环境因素暴露,包括生物性因素和非生物性因素1、
4、生物性病原因子的鉴定2、病原生物进化变异规律(进化树)3、环境化学污染物(非生物因素)暴露(二)内暴露标志1、传染性疾病: 感染状况、抗原抗体检测、病原体基因监测2、慢性非传染性疾病 内暴露剂量、 生物效应剂量,内暴露剂量包括对化学毒物、饮食中的营养素和可能致癌剂以及微生物感染的测定。例如:,吸烟 - 血或尿中的烟草代谢产物可替宁浓度(Cotinine)多环芳烃 - 尿中的1- 羟基芘水平饮食暴露- 黄曲霉毒素B1(AFB1)和尿中N-亚硝基化合物( N - nitroso compounds)的浓度、血液中营养素水平工作暴露和环境污染 - 血清或脂肪组织中的杀虫剂DDT(dichloro-d
5、iphenyl-trichloroethane)、多氯联苯PCBs(polychlorinated biphenyl)、二氧杂芑(Dioxins)环氧化物含量吸烟和环境污染 - 尿中的致突变因子(mutagenicity)的测定。,体内剂量标志,可替咛(Cotinine),香烟中的尼古丁,体液,铅,环境中的铅,体液和组织(发、指甲、牙齿),二氯二苯二氯乙烯,二氯二苯三氯乙烷,脂肪组织,黄曲霉素,食物原料,体液,二、效应标志(effect marker),传染病 酶学的改变,血液生化(免疫)指标的变化 病原体基因的整合慢性非传染性疾病(危险性预测) 主要是基因毒性标志物,包括癌基因激活、点突变和
6、染色体异常 基因表达异常和代谢异常 基因突变或染色体畸变,生物学效应标志,三、易感性标志(环境-基因),(一)遗传性疾病 HNPCC, BRCA1/2(二)慢性病(易感性分子标志物) DNA修复通路(肺癌、肠癌) 代谢酶系统(膀胱癌)(三)传染病 免疫系统(HLA) 炎症通路,宿主易感性标志(非传染病),传染病慢性丙肝病人中,HLA-B44出现频率高达30%以上对白喉毒素敏感的基因定位在5号染色体长臂对脊髓灰质炎病毒敏感性基因定位在19号染色体长臂,What is a SNP? 基因多态性,A mutation in the DNA sequence with a frequency of 1
7、%,遗传性多态性标志物,人类基因组计划研究结果表明,不同个体的基因99.9%是一样的,但在序列上有极小(0.1%)的遗传差异,其中主要是 SNP。 SNP是指在人群中出现的频率1%的先天突变。SNP存在于整个人类基因组中,可能每100300bp就存在一个SNP,估计总数在数百万个。 研究表明,正是这0.1%的差异授予你我他特有的表型;这个小小的差异还与个体对疾病(包括肿瘤)的易感性、对药物的反应性差别有密切关系。,单核苷酸多态性(Single nucleotide polymorphism, SNP),人类基因组计划(HGP),基因组多态性数据库(SNPs),Human Genome Proj
8、ect,Biology,Response,Disease,Prevention,Collins et al., Nature, 2003,人类基因组计划,单核苷酸多态与人类个体差异,单核苷酸多态与个体疾病易感性差异,Cancer,Exposure,Cancer-free,CIR by 70 yrsM: 15.9% F: 9.5%,(Peto, BMJ, 2000),Genetic susceptibility?,Screening, prevention,研究问题 1:,Why only 20% smokers develop lung cancer?,SNPs?,NSCLC,No respo
9、nse,Response,Chemotherapy,SNPs & Chemosensitivity,SNPs?,研究问题 2:,Why some lung cancer patients have no response to chemotherapy?,基因检测-危险度评价,从科学研究临床实践,人类基因组流行病学,1998年由Khoury和Dorman提出人类基因组流行病学(human genome epidemiology, HuGE)的概念,定义:应用流行病学与基因组信息相结合的研究方法,开展以人群为基础的研究,评价基因组信息(基因或基因变异及其相应编码的产物)对人群健康和疾病的流行病学
10、意义。,分子流行病学常用技术及方法,核酸技术(DNA & RNA)核酸体外扩增 (PCR)核酸电泳图谱 核酸酶切电泳图谱 (RFLP)扩增片断长度多态性(AFLP)核酸分子杂交 有原位杂交、斑点杂交、转印杂交(包括Southern blot检测DNA和Northern blot检测RNA)等。核酸序列分析蛋白质技术 蛋白质分离鉴定技术主要有:电泳、凝胶电泳、蛋白质转印杂交(Western blot)、色谱分析、蛋白质测序等。,酶学技术 包括定性和定量检测,要求一定的条件。多位点酶电泳(multilocus enzyme electrophoresis, MEE)法。免疫学技术: 酶联免疫吸附试
11、验(ELISA)、荧光免疫试验(FIA)、放射免疫试验(RIA)、免疫细胞化学检测(ICC)等;色谱(质谱)技术: 高效液相色谱技术HPLC)、液相蛋白色谱技术(FPLC)等。,PCR-RFLPPCR-SSCP, PCR-based resequencingReal-time PCRMatrix-assisted laser desorption/ionizationtime-of-flight (MALDI) mass spectrometryDynamic allele-specific hybridization (DASH)DNA-chip analysisDHPLC,illumina
12、 高通量基因分型平台,SNPstream基因分型系统,Automated Liquid HandlerSpectroPREPTM,Nanoliter DispenserSpectroJETTM,MALDI-TOF Mass SpectrometerSpectroREADERTM,Automated AnalysisSpectroTYPERTM,Miniaturized BiochipSpectroCHIPTM,MassARRAYIntegrated Components,核酸分子杂交,蛋白质检测鉴定系统,SDS-PAGE,酶联免疫吸附试验(ELISA),高效液相色谱(HPLC, LC/MS/M
13、S),Accessible Genome and GeneticVariation database,Affordable High-throughputPlatform Service,分子流行病学在疾病预防和控制中的应用,(一)病因的探讨及病因致病机制的研究 1、传染病病因及流行规律的探讨 研究已知或新发传染病的病原体和流行特点 病原学诊断(基因诊断)、基因分型 研究分布特点,传染源追踪和传播途径确定 观察病原体在体内持续时间和消长规律,丙型肝炎病毒基因分型,Simmonds双等级基因命名系统,病原体基因分型,不同基因型HCV,其临床表现以及对抗病毒治疗的敏感程度有显著差异。1b型对干扰素
14、治疗的持续应答率为20%,而非1b型对干扰素治疗的持续应答率可达60-70%。,1a, 1b 2a, 2b, 3a,1a, 1b 2a, 2b, 2c, 3a,4,5a,1b,1b, 6,1b, 3a,1b, 3a,3b,4,Clinical Microbiology Reviews, 2000, 13(2) 223-235,HCV 1b型是我国主要流行型,1a, 1b, 2b, 3a,2a,如SARS 在广东流行可分三个阶段:早期由病人分离到的SARS 病毒与果子狸分离到的SARS 病毒高度同源,因此怀疑SARS 是一种动物来源的疾病。,上海预防医学杂志2005,SARS病毒来源及变异分析,
15、中期SARS 病毒分子结构稳定, 病毒传播力强, 超级传播事件发生多。后期SARS 病毒碱基缺失可达几百个,病毒的传播力大大减少。,案例:1990年7月,美国佛罗里达州一名AIDS妇女,怀疑在当地一牙科诊所手术时感染了HIV,因为该诊所的牙科医生也是一名AIDS患者。随后当地卫生部门对该牙医诊治过的一千余名患者进行HIV检测,共发现7名HIV感染者有在该诊所的就诊史。那么这7名HIV感染者是否与该牙医有关呢?,传染病传播途径分析,Science 1992,针对这一问题可采取的分析方法:1、传统流行病学分析方法:接触者调查,分析感染者可能的危险行为如输血、静脉吸毒、不洁性交史等。2、分子流行病学
16、方法:比较HIV病毒基因序列的差异,分析不同病例感染株遗传关系的远近。,Science 1992,与牙医感染株的遗传变异性比较,与对照感染株的遗传变异性比较,病人D,当地对照,牙医及病人A,B,C,E,G,病人F,进化树分析,以结核为例:与结核病人密切接触,感染和发病的危险增加。这些接触者与源病例之间,是否产生了结核分枝杆菌的传播?开展结核病成“簇”性研究,可以从分子角度解答这样的问题。成簇的过程就是用聚类分析对分离株的基因进行分型或分群的过程,可以分析结核病的传染源和传播途径。,揭示传染病传播机制,结核杆菌DNA指纹图谱有助于基因分型,流行病学常用结核杆菌基因分型方法IS6110-RFLPS
17、poligotyping MIRU-VNTR,Bauer等对丹麦1549株结核菌进行IS6110为基础的DNA指纹分析,成簇率49%。同样方法检测格陵兰岛成簇率为79%。,J Clin Microbiol,1998,Beijing家族结核菌株在全球的分布,江苏省北部地区(苏北) 在2003年1-7月爆发了较大规模的无菌性脑膜炎,涉及范围之广、发病人数之多,在国内较少见。,不明原因疾病爆发调查,疾病暴发原因分析,问卷调查收集基本资料血清学检测病原体分离培养,Echo30 型肠道病毒感染,病毒序列测定和比对,均为Echo30型肠道病毒。进化树分析显示分离株与国外1999年和2000年分离株的亲缘关
18、系最近;但自成一簇,与国外毒株存在地区差别。,2、非传染病的病因及病因致病机制的研究 例:载脂蛋白与心血管疾病 HBV感染与肝癌(基因组整合) EBV感染与鼻咽癌 HPV感染与宫颈癌 HP感染与胃癌,心脑血管病的研究 载脂蛋白与心血管疾病 四组老年人apooA-I、apoB-100与apoA-I/apoB-100比值人群类别 检测例数 apoA-I(mg/dl) apoB-100(mg/dl) apoA-I/apoB-100 对照组 85 148.230.1 97.328.3 1.580.8冠心病组 146 141.651.9 113.935.8* 1.400.7*高血压组 90 135.13
19、2.9* 107.059.2* 1.441.07*高血压并冠心病组,57 140.231.3 110.934.2* 1.410.8*,注:病例组与对照组相比*P0.05;*P0.01,HBV肝癌,正常人,HBV感染,正常:HBV肝癌,AUC: 99.90.1%,2/5,灵敏度:0.969,特异度:0.994,HBV:HBV肝癌,AUC: 99.20.6%,MiRNA 谱(Profile),例:恶性肿瘤的形成过程及其影响因素,前致癌物,终致癌物,DNA损伤,基因突变,癌前病变,恶性肿瘤,遗传易感性因素,(二)疾病易感性的测定 (传染病和非传染病),测定疾病易感性,可以进行高风险人群筛选,采取更有
20、效的预防和控制措施 高危险易感基因(高外显性) 连锁研究(linkage!) 如BRCA1、BRCA2与乳腺癌(40-80) 一般人群中频率T) (DNA pol, PARP domain ) Arg399Gln (GA) (PARP domain),1246-bp,5764%,Distribution of Select Variables and XRCC1 Variant Alleles in Lung Cancer Cases and Cancer-free Controls,XRCC1 T-77C Polymorphism and Lung Cancer Risk,Hu Z, She
21、n H. Pharmacogenetics & Genomics 2005 15(7): 457-64.,XRCC1 T-77C and Cumulative Smoking,Pack-years of smoking,-77TT -77CT/CC,Adjusted OR,Hu Z, Shen H. Pharmacogenetics & genomics 2005 15(7): 457-64.,P value for the test of additive gene-smoking interaction: 0.027,This significant association with lu
22、ng cancer was validated in another independent case-control study in a Chinese population,Hao et al. 2006 Oncogene,GWAS,(三)疾病防治措施的研究,1、传染病的预防 (1)新疫苗的研制核酸疫苗(2)研究疫苗预防效果与疫苗无应答的关系,如对乙肝疫苗低应答或无应答人群中,白种人和日本人携带HLA-DR3和HLA-DR7比率较高;而中国人HLA-DR14-DR52基因的携带率较高 (3)疫苗株引起的感染,2、非传染病的防治作为抗氧化剂的胡萝卜素可减少或防止DNA的损伤叶酸可改变DNA
23、甲基化或减少染色体断裂,(四)疾病诊治效果和预后评价,1、治疗效果评价 从分子水平研究药物治疗后体内某些指标的变化情况(传染病和非传染病)2、疾病预后的评价 胃癌病人nm23基因、P27KIPI基因、TGF-BRI基因表达与生存率的关系,结果发现,癌组织内上述基因高表达组手术后3年和5年生存率均高于低表达组或阴性组,我国2000年全国流调结核菌耐药状况,初始耐药:18.6% 初始耐多药率:7.6%获得性耐药:46.5% 获得性耐多药率:17.1%总耐药:27.8% 总耐多药率:10.7%,miR-196a2 rs11614913 多态性与肺癌生存率 (CC vs CT/TT),Hu Z She
24、n H. Journal of Clinical Investigation, July, 2008IF=16.9,(A) MMP9 Arg279Gln and NSCLC survival (P = 0.03); (B) MMP9 Arg668Gln genotypes and NSCLC survival (P = 0.01); (C) Combined effect of MMP9 Arg279Gln and Arg668Gln on NSCLC survival (P = 0.007),Arg279Gln,Arg668Gln,A,B,C,Jin GShen H. Int J Cance
25、r, 2009,The 4 miRNAs Expression and NSCLC Patients Survival of all Sample Sets,Risk Score Analysis of 303 NSCLC Patients,Each patient was assigned a risk score according to a linear combination of the expression level of the miRNA, weighted by the regression coefficients from the training samples,分子
26、流行病学研究中需要注意的问题,1、重视宏观流行病学研究设计(研究设计类型、样本量!)2、重视暴露因素和危险因素的收集和利用,提高研究质量和水平(很多时候缺乏环境暴露的评估和环境基因交互作用的分析;)3、分子标志物的检测同样要防止偏倚的产生(假阳性),注意重复性(大样本多中心)和生物学合理性4、分子流行病学亦存在流行病学的许多局限性,小 结,分子流行病学产生的原因? (流行病学)实践的需求是学科发展的根本动力。分子流行病学怎样产生? 学科分化、交叉和融合产生新的学科或学科分支。 分子生物学提供了条件。,分子流行病学是什么? 阐明人群和医学相关生物群体中生物标志的分布及其与疾病/健康的关系和影响因素,并研究防治疾病、促进健康的策略与措施的科学。,分子流行病学做什么? 暴露测量及其与疾病的关系 效应测量及其与疾病的关系 易感性测量及其与疾病的关系 生物标志(测量指标)的研究,分子流行病学怎么做? 研究目的 测量指标选定 测量方法选定:分子生物学技术 研究设计:流行病学调查研究方法 资料处理分析及质量控制,展 望,分子流行病学是一门新兴的边缘学科,尚有很多不成熟的地方,但已显示出了强大的生命力。随着先进的生物标志检测技术、计算机技术、信息技术和统计学方法等的不断引入,分子流行病学将把流行病学提高到一个崭新阶段。,Thanks!,