ImageVerifierCode 换一换
格式:PPT , 页数:58 ,大小:9.45MB ,
资源ID:202881      下载积分:6 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-202881.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(医学统计定量描述规培.ppt)为本站会员(h****)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

医学统计定量描述规培.ppt

1、第二章 计量资料的统计描述,卫生统计学教研室任艳峰,Qualitative dataanalysis (ranked),Quantitative data analysis,Statistical description,Statistical Inference,Statistical Inference,Statistical description,Design,Collection of data,Sorting data,Statistical analysis,Statistical analysis,Statistical description,Statistical desc

2、ription,Statistical Inference,Statistical Inference,Parameter Estimation,Hypothesis Test,熟悉频数表的划记步骤,频数表的用途。 掌握集中趋势指标的定义、适用范围和计算。 掌握离散趋势指标的定义、适用范围和计算。,学习目标,定量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频数分布表,通过频数表以显示资料的分布类型。,第一节 频数分布表与频数分布图,频数(frequency) 某数值在数据中出现的次数。相对频数(frequency) 也叫频率,数值在总观察例数中所占的比例。频数表(frequen

3、cy table) 将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。,如1998年某山区96名孕妇产前检查次数资料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。这是什么类型的资料?,一、离散型定量资料的频数分布,1998年某地96名孕妇产前检查次数分布,图中横坐标表示产前检查次数,纵坐标表示各检查次数的孕妇例数占总孕妇数的频率(比例)。从直条高度和分布情况看出,产前检查次数分布呈负偏态分布。,二、连续型定量资料的频数分布,1.找出最大值 和最小值,(一)频数分布表的编制方法,2.计算全距 (range,R)也叫极差,(1)根据数据多少,组

4、段数一般515个左右(10);(2)根据(R/预计组段数)估计组距大小 (22.22/10=2.22);(3)确定组段数和组距;两端的组段包含最大值和最小值;尽量取整数作为组段的端点;组距尽量取相等为宜。,3.确定组段数和组距(class interval),4.列表:根据下限X上限的原则确定每一例数据所归属的组段。,标 题,120名正常成年男子血清铁含量(mol/L)频数表,1.揭示资料的分布特征;(1)集中趋势:大部分数据向中间集中,中间数据居多。(2)离散趋势:从中央到两侧,频数分布逐渐减少。2 .揭示资料的分布类型; 正态分布:中间高两侧低、左右对称的单峰分布。 偏态分布:集中位置偏向

5、一侧,分布不对称。3.便于发现某些特大或特小的可疑值;4.便于计算指标和统计分析。,(二)、频数分布表的用途,正偏态,正态分布,负偏态,120例健康成年男子血清铁含量分布,频数分布图,120例健康成年男子血清铁含量分布,频数分布图,频率密度=频率/组距,第二节 集中趋势的描述,集中趋势指某计量资料大多数观察值所在的中心位置。常用指标有:1.算术均数(arithmetic mean),简称均数(mean)2.几何均数(geometric mean)3.中位数 (median),算术均数(mean),1.定义:算术平均数是由所有数据之和除以数据个数所得的商数。反映一组同质的观察值在数量上的平均水平

6、。总体均数用希腊字母,样本均数用 表示。,2. 适用范围:(1)描述对称分布资料的集中趋势;(2)描述正态分布资料的集中趋势。,3.均数的计算公式:,(1)直接法:,(2)加权法,f 为组段的频数X0为组段的组中值X0=(上限+下限)/2,例:测得8只正常大鼠的血清中酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试计算算数均数。,几何均数(geometric mean),1. 定义: n个观察值的连乘积的n次方根,几何均数用G表示。2. 适用范围:(1)成倍数关系或等比关系的资料(2)对数正态分布资料,3. 计算公式:,(

7、1)直接法:,(2) 加权法:,例:7名慢性迁延性肝炎患者的HBsAg滴度资料为:1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,4.几何均数的特点:,(1) 观察值不能同时存在大于和小于0的数据,不能有等于0的数据。 (2)同一组资料所得几何均数小于等于均数。,中位数(median),1.中位数:将一组观察值按照从小到大,或者大到小的顺序排列,位次居中的观察值水平。中位数用M表示。百分位数(percentile):一个位置指标,用Px表示。描述观察值序列在某百分位置的水平。,PX,理论上适用于任何分布类型 ;(2)尤其偏态分布资料;(3)开口资料

8、;(4)分布类型不清的资料;,2.中位数的适用范围:,(1)直接法,3. 计算公式:,(2) 加权法:,Px :百分位数 L : Px所在组段的下限值 i : 组距 fx : Px所在组段的频数 n : 样本例数 f L : 该组段之前的累计频数,例: 某药厂观察9只小鼠口服山红景醇提物(RSAE)后在缺乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。,中位数实例,10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.

9、2,对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人, 6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。,例:试对下表资料求其中位数M。,M = P50,描述离散趋势的指标,第三节、离散趋势的描述,离散程度指某计量资料的所有观察值与中心位置的发散程度。,描述离散趋势的指标,极差(range),极差(range,R):又称全距,一组观察值中最大值和最小值的差。2. 计算公式:,3. 特点,(1)简单明了,计算简单,应用广泛。(2)只能反映最大值

10、和最小值的变异,不能反映所有数据的变异。(3)样本含量n变大时,R也会变大。(4)样本含量不变时,R抽样误差也较大,不稳定。,4. 适用范围:任何分布类型资料,资料做粗略分析。,四分位间距,2. 计算公式:,1.四分位数(quartile):是特定的百分位数,下四分位数P25,记作QL;上四分位数P75,记作QU。上四分位数P75,与下四分位数P25之差即是四分位间距。,(1)避免了极差受极端值的影响;(2)样本含量n变大时,Q比R稳定;(3)只能反映中间50%的数据的变异,不能反映所有数据的变异;(4)去头弃尾,丢失大量的信息。,3. 特点,(1) 偏态分布资料;开口资料;分布类型不清的资料

11、(2) Q与M一起使用,描述偏态分布资料的集中趋势和离散趋势。,4. 适用范围,方差 (variance),1.方差 (variance,2/S2):总体(样本)内所有个体观察值与总体(样本)均值的离均差平方和(sum of square)的均值。,2. 计算公式:,自由度:df/ 表示随机变量能“自由”取值的个数 例如有一四个数据的样本,受到均数为5的条件的限制,在自由确定4、2、5三个数据后,第四个数据只能是9,=3任何统计量自由度的个数为=n-限制条件的个数。,(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观察值,信息利用充分(3) 对数据的变化反应灵敏,3. 特点,4.

12、适用范围: 正态分布资料或近似正态分布资料.,标准差 (standard deviation),1.标准差 (standard deviation,S ) :即方差的正平方根;其单位与原变量X的单位相同。总体标准差:样本标准差:S,2. 计算公式:,(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观察值,信息利用充分(3)对数据的变化反应灵敏,3. 特点,(1) 正态分布资料或近似正态分布资料(2) 标准差和均数相结合,描述正态分布资料的集中趋势和离散趋势,4. 适用范围,变异系数 (coefficient of variation),1.变异系数 (coefficient of variation,CV ):标准差与相应均数的比值;其意义是标准差为均数的多少倍,常用百分比表示。,2. 计算公式:,3. 适用范围(1) 比较度量衡单位不同的多组资料变异度(2) 比较均数相差悬殊的多组资料的变异度,均数差别较大的变量间变异度比较,不同年龄组男子身高(cm)的变异度,量纲不同变量间变异度的比较,计量资料的统计描述图表描述统计指标描述集中趋势指标:均数、几何均数、中位数离散趋势指标:标准差、四分位数间距、变异系数、极差,总 结,谢谢大家!,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。