1、计量经济学与应用3. 数据 与 检验本章内容1. 变量关系与研究方法2. 数据统计概述3. 描述性统计4. 数据的 分布与推断性检验5. 数据类型与相关关系数据统计概述一些概念 总体 ( population) : 打算研究的全部 个体 -大同小异 样本( sample) : 总体中,具有代表性的 一部分 随机化 ( randomization) : 使样本具有 代表性 的重要方法 参数 : 定量反映总体的某个性质 通常用希腊字母表示,如 , - 常常 未知 统计量 :定量反映样本的某个性质通常用拉丁字母表示,如 s, p数据统计概述总体率由样本率估计 例如,设样本的个体数 (即样本含量 )为
2、 n,若 x为样本的某指标阳性个体数,则可用样本阳性率 估计研究人群的阳性率 (总体阳性率 ); 由于个体差异和偶然性的影响 , 样本率也存在抽样误差 -由抽样造成样本率与总体率 (研究人群的率 )的差异 样本率是随机的,但在概率意义下也是有规律的 -样本率的 分布。统计分析 统计分为描述性统计和推断性统计。 描述性统计 主要是对一字数据进行概述和描绘。 推断性统计 是通过检测部分(称为 样本 )从而得到对整体 (称为 总体 )的一般性认识的过程。为使这种推断有效,样本对总体而言必须具有 代表性,且必须设定误差 概率 。 描述性统计 是用一组两组反应整体数据特征的信息来对改组数据予以描述。他同
3、事也指用表、图、图形以及其他的图形表达形式来描述一组数据。 推断性 统计 (含估计和假设检验)是指从一个取自全体的样本的特殊性得到有关总体的一般性特征。因此推断性统计相当于归纳推理(恰与由整体特征得出个体特征的演绎推理相反) 统计分析 通过利用相关经济数据及评估结果,为估计经济变量之间不精确、不能通过实验获得的经济滚系提供适当的技术支持。变量类型定性变量分类 变量 (categorical variable)或名义变量 (nominative variable)。 分类变量的水平 (level) :代码 (code) 用 1、 2、 3、 4、 5等来表示各个水平。 二分类变量 (binary
4、 variable), 也称 0-1变量或 假变量(dummy variable)有序 变量 (ordinal variable) 种种 可能的 “ 取值 ” 中自然地存在着次序。变量类型定性 变量 离散 型变量 只能取整数值。 例如,手术病人数 ; 新生儿数 连续型 变量 可以取实数轴上的任何数值 。由 测量而得到的大多属于连续型 变量。 “ 连续 ” : 指该变量可以在实数轴上连续变动 。 例如,血压、身高、体重 等变量转化只能由高级向低级转化 , 不能作相反方向的转化连续型 有序 分类 二值描述性统计 频数表和直方图 平均水平 度量 变异性 度量 相对数频数表与直方图 描述样本特征,直观反映 概率分布 频数 表 -连续型变量 /离散型变量直方图直方图,是一种二维统计图表,它的两个坐标分别是统计样本和该样本对应的某个属性的度量 。离散型 变量 直条图连续型 变量 - 直方图