1、数据分布特征的描述n 1 集中趋势的测定 典型的变量取值n 2 离散程度的测定数据的差异程度就是各变量值远离其中心值的程度,因此也称为离中趋势 n 3 偏态与峰度的测定(是否有对称轴、几个最高值)补充材料之二:什么是分布?n 有序对的集合,一般形式: ( x_1,n_1) ( x_2,n_2) . ( x_k,n_k)n 其中 x_k表示变量 X的一切可能的取值, n_k为其对应的数值, 当 n代表不同的含义时就表示不同的分布: 频次分布 概率分布 百分比分布(频率分布、相对频次分布) 。数据分布的特征集中趋势集中趋势 (位置位置 )离中趋势离中趋势(分散程度分散程度 )偏态和峰度偏态和峰度(
2、形状)(形状)考查:均衡性 与 代表性 数据分布的特征和测度峰峰 度度偏偏 态态数据的特征和测度分布的形状集中趋势 离散程度众众 数数中位数中位数离散系数离散系数方差和标准差方差和标准差四分位差四分位差异众比率异众比率位置位置平均数平均数数值数值平均数平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数第一节 集中趋势的测定一 . 定类数据:众数二 . 定序数据:中位数和分位数三 . 定距和定比数据:数值平均数四 . 众数、中位数和算术平均数的比较数据分布的特征和测度(本节位置)数据的特征和测度分布的形状集中趋势 离散程度众众 数数中位数中位数离散系数离散系数方差和标准差方差和标
3、准差四分位差四分位差异众比率异众比率位置位置平均数平均数数值数值平均数平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数峰峰 度度偏偏 态态集中趋势(Central tendency)1. 一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2. 测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4. 低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据的测量数据5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定的数据的类型来确定