1、第二讲 定量资料的统计描述主要内容1、频数分布表的编制和用途频数分布的特征和类型2、集中趋势指标 均数、几何均数、中位数3、离散趋势指标 极差、四分位数间距、方差、标准差、变异系数百分位数(一)、频数分布表的编制 某地儿研所测得该地 150名 12岁健康男童体重(kg) 原始数据如下,试编制频数表。25.2 34.9 34.3 38.1 41.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5
2、39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.231.4 34.1 25.3 29.6 38.2 43.7 3
3、3.8 24.5 29.2 45.9 32.5 23.536.8 27.2 34.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.827.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.237.6 25.5 37.3 37.5 41.5 38.4 44.2 43.2 31.5 40.2 34.5 37.437.8 33.4 32.2 33.4 32.4 32.8 36.8 45.7 41.2 40.9 36.5 47.935.7 39.3 42.2 35.3 30.1 27.2 1. 找出最
4、大值和最小值,计算极差。l 最大值为 51.2kg,l 最小值为 20.1kg,l 极差 R=51.2-20.1=31.1kg。l 极差( R) 也叫全距,它是一组变量值中最大值与最小值之差。2.按极差大小决定组段数、组段和组距。 l 确定组段数:组段数的多少一般根据观察单位的多少来确定,过多或过少均不能更好地反映资料的分布特征,以能够反映频数分布的特点为宜,一般分为 815组,观察单位少时可相对少些,观察单位较多时组段数可酌情多些。本例初步确定为 10个组。l 确定组距:相邻组段下限值之差称为组距,一般分组时取组距相等。组距 =极差 /组数,常取整数作组距,取整只是为了方便资料的整理汇总。本
5、例组距=30.1/10= 3.113。l 划分组段:各组段应有明确的界限,便于汇总,每个组段的起点称 “下限 ”,终点称 “上限 ”。l 第一组段必须包括最小值,一般取略小于最小值的整数作为第一组的下限,但是第一组的下限值不能等于最小值。l 各组段即不重叠,也不能留空隙,所以每一组段均为半开闭区间,后一组的下限就是前一组的上限。l 组段中的横线 不能省略,它表示连续型资料。l 最后一个组段应该包括最大值,并且封口,但最后一个组段的上限不能等于最大值。l 本例最小值为 20.1,故取 20为第一组的下限。l 第二组下限即 20+3=23,余类推。 l 最后一个组段为 5053,包括最大值 51.2。l 3.列表划记,统计各组段频数。l 4.计算频率与累计频率频数分布的两个特征l 体重虽有轻有重,但都向 35组段集中,数据大多数集中在 3238组段,共 83人,占总人数的 55%,这种趋势称为集中趋势。l 另一方面,随体重逐渐变大或变小,仍有小部分变量值存在,称这种特征为离散趋势,其变异程度是可以测定得。l 集中趋势和离散趋势是频数分布的两个重要特征,测定其集中趋势和离散趋势就可较全面地分析所研究的事物。