R语言在遗传统计学中的应用.ppt

上传人:ga****84 文档编号:381222 上传时间:2018-09-29 格式:PPT 页数:22 大小:303.50KB
下载 相关 举报
R语言在遗传统计学中的应用.ppt_第1页
第1页 / 共22页
R语言在遗传统计学中的应用.ppt_第2页
第2页 / 共22页
R语言在遗传统计学中的应用.ppt_第3页
第3页 / 共22页
R语言在遗传统计学中的应用.ppt_第4页
第4页 / 共22页
R语言在遗传统计学中的应用.ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、遗传与疾病,人类的某些性状及部分疾病与人体的遗传因素密切相关阐明遗传因素与人体疾病或健康状态的关系有非常重要的意义遗传统计学在这其中起着至关重要的作用,遗传与疾病,疾病的易感基因研究,研究的特点,收集的数据即包含一般的表型数据也包含基因型数据数据分析时需要用到不同的遗传模型需要一些遗传统计特有的分析方法:LD的计算,家系图的绘制等,R在遗传统计中的应用,数据整理获取位点的基本信息Hardy-Weinberg平衡检验连锁不平衡的计算关联研究常用分析方法家系图的绘制,数据整理,R中的genetics包专门为基因型数据提供一个新的类 genotypegenotype函数是genetics包里最基本的

2、函数,可以将以下四种形式的初始基因型数据转换成便于分析的带有genotype类的数据,以一个字符分隔的向量 g1 - genotype(c(C-C,C-T,C-C,T-T, C-C,),sep=-)2. 可以按某一位置分隔的向量 g2 - genotype(c(DD,DI,DD,II,),sep=1)3. 两个分开的向量 allele1 - c(D,D,D,I,) allele2 - c(D,I,D,I,) g3 - genotype(allele1, allele2),4. 数据框或矩阵中的两列 data - data.frame(allele1 = c(D,D,D,I,), allele2

3、 = c(D,I,D,I,) g4 - genotype(data$allele1,data$allele2) 或 data1 - cbind(allele1 = c(D,D,D,I,), allele2 = c(D,I,D,I,) g5 - genotype(data1),获取位点的基本信息,多态位点的基本信息包括:位点分型成功率 (call rate)、等位基因频率、基因型频率、杂合度和多态信息含量 (PIC)一个简单的例子:#载入popn数据data(popn,package=DGCgenetics) #获取A位点的基本信息summary(popn$A),Number of sample

4、s typed: 1489 (96.9%)Allele Frequency: (2 alleles) Count Proportion1 1786 0.62 1192 0.4NA 94 NAGenotype Frequency: Count Proportion1/2 704 0.472/2 244 0.161/1 541 0.36NA 47 NAHeterozygosity (Hu) = 0.4802686Poly. Inf. Content = 0.3648558,Hardy-Weinberg定律,Hardy-Weinberg定律是由英国数学家哈迪(D.H. Hardy)和德国医生温伯格(

5、W. Weinberg)于1908年分别独立发现的,也称遗传平衡定律(genetic equilibrium law)该定律可以简单描述为,遗传平衡群体的等位基因频率与基因型频率在世代间维持恒定该定律的适用条件是:随机婚配,群体足够大,没有突变、选择、迁移和遗传漂变,Hardy-Weinberg平衡检验,关联研究中Hardy-Weinberg平衡检验常被用来评价基因分型的质量。我们通常对病例和对照组分别进行Hardy-Weinberg平衡检验如果某一位点在对照组中不符合Hardy-Weinberg平衡,我们通常会怀疑该位点的基因型鉴定的质量如果该位点在对照组平衡而在病例组出现不平衡,则该位点可

6、能和疾病有关,Hardy-Weinberg平衡检验,genetics包里面提供两种不同的检验方法一种是Pearsons chi-square test,可以用HWE.chisq函数进行该检验,另一种是Fisher exact test,对应于HWE.exact函数HWE.chisq常用于MAF较高、样本量较大的场合;MAF较低的位点建议使用HWE.exact函数,LD的计算,连锁不平衡则是指人群中两个位点处在同一个单体型的频率比期望值高评价连锁不平衡程度的指标包括D、r2等genetics包提供计算LD各种指标的函数,并能以文字和图形两种形式显示位点间的连锁不平衡程度,LD的计算,#用LD函数

7、计算位点间的LDldresult data(popn,package=DGCgenetics) #首先载入popn数据 (geno chisq.test(geno)Pearsons Chi-squared testdata: genoX-squared = 23.7385, df = 2, p-value = 7.003e-06, (alle chisq.test(alle) Pearsons Chi-squared test with Yates continuity correctiondata: alleX-squared = 23.6881, df = 1, p-value = 1.1

8、33e-06,Logistic回归,1. 共显性模型 summary(glm(affected A + sex, family=binomial, data=popn)Call:glm(formula = affected A + sex, family = binomial, data = popn)Deviance Residuals: Min 1Q Median 3Q Max -1.4081 -1.2428 -0.6515 1.1134 1.8190 Coefficients: Estimate Std. Error z value Pr(|z|) (Intercept) -0.6589

9、 0.1354 -4.868 1.13e-06 * A1/2 -0.3752 0.1234 -3.041 0.00236 * A2/2 -0.7832 0.1695 -4.620 3.84e-06 *sexFemale 1.1866 0.1335 8.890 summary(glm(affected allele.count(A,2) + sex, family=binomial, data=popn)Call:glm(formula = affected allele.count(A, 2) + sex, family = binomial, data = popn)Deviance Res

10、iduals: Min 1Q Median 3Q Max -1.410 -1.239 -0.655 1.117 1.814 Coefficients: Estimate Std. Error z value Pr(|z|) (Intercept) -0.65396 0.13054 -5.010 5.45e-07 *allele.count(A, 2) -0.38817 0.08107 -4.788 1.69e-06 *sexFemale 1.18676 0.13349 8.890 summary(glm(affected carrier(A,2) + sex, family=binomial,

11、 data=popn)Call:glm(formula = affected carrier(A, 2) + sex, family = binomial, data = popn)Deviance Residuals: Min 1Q Median 3Q Max -1.4078 -1.1979 -0.7465 1.1571 1.6817 Coefficients: Estimate Std. Error z value Pr(|z|) (Intercept) -0.6566 0.1352 -4.857 1.19e-06 *carrier(A, 2)TRUE -0.4788 0.1164 -4.

12、115 3.87e-05 *sexFemale 1.1835 0.1332 8.884 2e-16 *,家系图的绘制,library(kinship) #载入kinship包p1 - scan(nlines=6,what=list(0,0,0,0,0,0) 1 100 101 102 1 11 101 0 0 1 21 102 0 0 2 11 103 101 102 1 21 104 101 102 1 11 105 101 102 1 1ped - as.data.frame(p1)names(ped) - c(famid,id,dadid,monid,sex,aff)par(xpd=TRUE)ped1=pedigree(ped$id, ped$dadid, ped$monid, ped$sex, ped$aff)plot(ped1,symbolsize=1.2),谢谢各位,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。