ImageVerifierCode 换一换
格式:PPT , 页数:29 ,大小:263KB ,
资源ID:343592      下载积分:100 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-343592.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(use光盘符例题ex2-1.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

use光盘符例题ex2-1.ppt

1、计量资料的统计描述,赵耐青复旦大学卫生统计教研室,目录,概述,统计图表,统计指标,频数表;频数/频率图,集中趋势;离散趋势,计量资料的统计描述,统计图表,频数表某市1995年110名7岁男童身高资料,统计图表,频数表的制作,确定组数:不宜过多或过少,一般10组,确定组距:可等可不等; 一般等组距=极差/组数; 本例组距=(134.5-110.2)/10=2.43,实际取2,确定各组上下限(每个组段的起点和终点): 第一组包含最小值 组段不能重叠 每一组段都为半开半闭区间 最后一组应为闭区间 离散型资料的组段通常为一个取值,利用Stata产生频数表,Excel文件:直接粘贴到Stata软件中求最

2、大值和最小值的命令:su x 最小值为110.2,取最小区组的下限为110gen y=int(x-110)/2)*2)+110tab y注意:stata命令一般都是小写英文字母,统计图表,表2.1 110名7岁男童身高频数分布,统计图表,连续变量,离散变量,以直方顶点的纵坐标(等距分组)或直方的面积大小(不等距分组)表示频数的多少,以各直条的长短表示频数的多少,频数分布图,统计图表,连续变量频数分布图,等距分组:横轴表示观察变量,纵轴表示每个横轴组段的频数。,统计图表,连续变量频数分布图,不等距分组:横轴表示观察变量取值,由于不等距分组会影响频数描述,所以纵轴表示每个横轴单位的频数/组距,统计

3、图表,频数表/图的用途揭示资料分布类型:频数图较频数表更直观描述频数分布的重要特征:集中趋势与离散趋势便于发现特大与特小的可疑值便于进一步计算统计指标和做统计处理,统计指标,集中趋势描述算术均数:简称均数总体均数,样本均数当数据对称分布时,位于分布的中心,是频数分布最集中的位置 直接法: 加权法: (一般适合频数表资料),统计指标,集中趋势描述几何均数G适用于经对数转换后呈对称分布的数据,如医学上的滴 (一般适合频数表资料),统计指标,集中趋势描述中位数将一组观察值从小到大排列位置居中的数适用于 任何分布的定量数据 不完全资料(开口资料):没有确切最大值或最小值的资料当n为偶数时当n为奇数时,

4、统计指标,集中趋势描述中位数计算离散型变量:直接法连续型变量:借助频数分布表以组中值代替公式中的X计算公式LM中位数所在组下限;iM中位数所在组的组距;fM中位数所在组的频数; 中位数所在组前一组的累积频数,统计指标,离散程度的描述极差极差(range):最大值-最小值 优点:简单明了 缺点:不能反映其它数据的变异 样本量较大时极差也较大 不宜比较,统计指标,离散程度的描述四分位间距百分位数(percentile):位置指标第x百分位数Px:将所有数据从小到大排列后,处于第x百分位置的数值。中位数记为 P50。连续型变量,统计指标,离散程度的描述四分位间距上下四分位数(QU、QL):第25百分

5、位数和第75百分位数四分位间距P75-P25:上下四分位数之间的距离,包括了一半的数据,越大表明离散程度越高 描述了50%数据的分布宽度比极差稳定 四分位数范围P25P75(inter-quartile range)描述了50%数据分布的宽度反映分布的位置特征,统计指标,离散程度的描述方差方差variance :适用于对称分布的资料总体方差 样本方差离均差平方和:描述每个数据X相对于 分布的集中程度;与样本含量n有关,样本含量不同时不宜直接比较),统计指标,离散程度的描述方差方差:相当于平均每个数据的离均差的平方;可用于不同样本含量数据离散度的比较。自由度(degree of freedom)

6、:当 选定时n个X中能自由变动的X的个数,统计指标,离散程度的描述标准差标准差(standard deviation),统计指标,离散程度的描述变异系数变异系数coefficiedt of variatlion (CV) CV=标准差/均数100%描述了数据的变异相对其平均水平的大小描述的是相对离散度无单位量纲比较度量衡单位不同资料的变异度比较均数相差悬殊资料的变异度,数据分析中的一般统计描述策略,如果资料近似呈对称分布,则如果资料取对数后才呈对称分布,则如果资料呈偏态分布在确认性研究中,往往统计描述采用均数,中位数,标准差, , ,最小值,最大值。,小 结,集中趋势指标:不同分布情况下,描述

7、指标的选择,离散趋势指标:各个指标的应用和特点,如何从集中趋势和离散趋势两个角度对数据进行合理的描述,STATA命令,等距分组频数图(例2.1)use 光盘符:例题ex2-1 打开数据库文件ex2-1.dta gen f=int(x-110)/2)*2+110产生用以作频数表的新变量“f”tab f对变量“f”作频数表graph f,bin(13) freq作频数图,STATA命令,不等距分组频数图(例2.2)use 光盘符:例题ex2-2 打开数据库文件ex2-2.dta graph num age, c (J) s(.) xlab (0 5 to 60) ylab(0 5 to 25) 作频数图,其中c(J),以阶梯状横线连接各数据点。Xlab 和ylab为x轴和y轴的刻度,STATA命令,求均数、标准差(例2.1)use 光盘符:例题ex2-1 直接法sum x 综述变量x 间接法gen xx=int(x-110)/2)*2+111sum xx 综述变量“xx”作频数图,STATA命令,求几何均数(例2.5)use 光盘符:例题ex2-5 means x w=f 以f为权重变量,求变量x的平均数 求均数、中位数、四分位数范围、标准差、方差、偏度系数、峰度系数(例2.6) use 光盘符例题ex2-6 summarize x,detail 综述变量x,Thank You !,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。