use光盘符例题ex2-1.ppt

上传人:ga****84 文档编号:343592 上传时间:2018-09-24 格式:PPT 页数:29 大小:263KB
下载 相关 举报
use光盘符例题ex2-1.ppt_第1页
第1页 / 共29页
use光盘符例题ex2-1.ppt_第2页
第2页 / 共29页
use光盘符例题ex2-1.ppt_第3页
第3页 / 共29页
use光盘符例题ex2-1.ppt_第4页
第4页 / 共29页
use光盘符例题ex2-1.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、计量资料的统计描述,赵耐青复旦大学卫生统计教研室,目录,概述,统计图表,统计指标,频数表;频数/频率图,集中趋势;离散趋势,计量资料的统计描述,统计图表,频数表某市1995年110名7岁男童身高资料,统计图表,频数表的制作,确定组数:不宜过多或过少,一般10组,确定组距:可等可不等; 一般等组距=极差/组数; 本例组距=(134.5-110.2)/10=2.43,实际取2,确定各组上下限(每个组段的起点和终点): 第一组包含最小值 组段不能重叠 每一组段都为半开半闭区间 最后一组应为闭区间 离散型资料的组段通常为一个取值,利用Stata产生频数表,Excel文件:直接粘贴到Stata软件中求最

2、大值和最小值的命令:su x 最小值为110.2,取最小区组的下限为110gen y=int(x-110)/2)*2)+110tab y注意:stata命令一般都是小写英文字母,统计图表,表2.1 110名7岁男童身高频数分布,统计图表,连续变量,离散变量,以直方顶点的纵坐标(等距分组)或直方的面积大小(不等距分组)表示频数的多少,以各直条的长短表示频数的多少,频数分布图,统计图表,连续变量频数分布图,等距分组:横轴表示观察变量,纵轴表示每个横轴组段的频数。,统计图表,连续变量频数分布图,不等距分组:横轴表示观察变量取值,由于不等距分组会影响频数描述,所以纵轴表示每个横轴单位的频数/组距,统计

3、图表,频数表/图的用途揭示资料分布类型:频数图较频数表更直观描述频数分布的重要特征:集中趋势与离散趋势便于发现特大与特小的可疑值便于进一步计算统计指标和做统计处理,统计指标,集中趋势描述算术均数:简称均数总体均数,样本均数当数据对称分布时,位于分布的中心,是频数分布最集中的位置 直接法: 加权法: (一般适合频数表资料),统计指标,集中趋势描述几何均数G适用于经对数转换后呈对称分布的数据,如医学上的滴 (一般适合频数表资料),统计指标,集中趋势描述中位数将一组观察值从小到大排列位置居中的数适用于 任何分布的定量数据 不完全资料(开口资料):没有确切最大值或最小值的资料当n为偶数时当n为奇数时,

4、统计指标,集中趋势描述中位数计算离散型变量:直接法连续型变量:借助频数分布表以组中值代替公式中的X计算公式LM中位数所在组下限;iM中位数所在组的组距;fM中位数所在组的频数; 中位数所在组前一组的累积频数,统计指标,离散程度的描述极差极差(range):最大值-最小值 优点:简单明了 缺点:不能反映其它数据的变异 样本量较大时极差也较大 不宜比较,统计指标,离散程度的描述四分位间距百分位数(percentile):位置指标第x百分位数Px:将所有数据从小到大排列后,处于第x百分位置的数值。中位数记为 P50。连续型变量,统计指标,离散程度的描述四分位间距上下四分位数(QU、QL):第25百分

5、位数和第75百分位数四分位间距P75-P25:上下四分位数之间的距离,包括了一半的数据,越大表明离散程度越高 描述了50%数据的分布宽度比极差稳定 四分位数范围P25P75(inter-quartile range)描述了50%数据分布的宽度反映分布的位置特征,统计指标,离散程度的描述方差方差variance :适用于对称分布的资料总体方差 样本方差离均差平方和:描述每个数据X相对于 分布的集中程度;与样本含量n有关,样本含量不同时不宜直接比较),统计指标,离散程度的描述方差方差:相当于平均每个数据的离均差的平方;可用于不同样本含量数据离散度的比较。自由度(degree of freedom)

6、:当 选定时n个X中能自由变动的X的个数,统计指标,离散程度的描述标准差标准差(standard deviation),统计指标,离散程度的描述变异系数变异系数coefficiedt of variatlion (CV) CV=标准差/均数100%描述了数据的变异相对其平均水平的大小描述的是相对离散度无单位量纲比较度量衡单位不同资料的变异度比较均数相差悬殊资料的变异度,数据分析中的一般统计描述策略,如果资料近似呈对称分布,则如果资料取对数后才呈对称分布,则如果资料呈偏态分布在确认性研究中,往往统计描述采用均数,中位数,标准差, , ,最小值,最大值。,小 结,集中趋势指标:不同分布情况下,描述

7、指标的选择,离散趋势指标:各个指标的应用和特点,如何从集中趋势和离散趋势两个角度对数据进行合理的描述,STATA命令,等距分组频数图(例2.1)use 光盘符:例题ex2-1 打开数据库文件ex2-1.dta gen f=int(x-110)/2)*2+110产生用以作频数表的新变量“f”tab f对变量“f”作频数表graph f,bin(13) freq作频数图,STATA命令,不等距分组频数图(例2.2)use 光盘符:例题ex2-2 打开数据库文件ex2-2.dta graph num age, c (J) s(.) xlab (0 5 to 60) ylab(0 5 to 25) 作频数图,其中c(J),以阶梯状横线连接各数据点。Xlab 和ylab为x轴和y轴的刻度,STATA命令,求均数、标准差(例2.1)use 光盘符:例题ex2-1 直接法sum x 综述变量x 间接法gen xx=int(x-110)/2)*2+111sum xx 综述变量“xx”作频数图,STATA命令,求几何均数(例2.5)use 光盘符:例题ex2-5 means x w=f 以f为权重变量,求变量x的平均数 求均数、中位数、四分位数范围、标准差、方差、偏度系数、峰度系数(例2.6) use 光盘符例题ex2-6 summarize x,detail 综述变量x,Thank You !,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。