1、区间估计和假设检验 赵耐青复旦大学卫生统计教研室2内容假设检验2可信区间与假设检验的关系3STATA命令4区间估计13统计推断点值估计 参数估计区间估计统计推断假设检验:均数间的比较比例、率的比较4点估计和区间估计v参数估计可以分为点估计和区间估计v点估计就是估计某个参数为某个数值 (如样本均数,样本率等 )v由于随机抽样存在抽样误差,由于点估计无法评价抽样误差的大小,而区间估计可以在 95%可信度的尺度上估计参数的范围,范围越小,说明参数估计的抽样误差就越小。5总体均数的区间估计v假定资料 近似服从正态分布 。v对于随机抽样而言,计算统计量v 因此v基于随机抽样而言和 成立的概率为 0.95
2、前提下v总体均数的区间估计 v这个区间称为总体均数的 95%可信区间总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计总体均数的区间估计6总体均数的 95%可信区间举例v例如:在某地区 7岁男孩的人群中随机抽样,抽取 200人,测量其身高,得到样本均数为121cm,样本标准差为 5.4cm,估计该地区 7岁男孩人群的平均身高在什么范围内 。7( 1-) 100%可信区间及其意义v更一般而言,可以计算( 1-) 100%可信区间,称 ( 1-)为可信度。v可信度的意义:在同一正态总体中随机抽100个样本,每个样本可以计算一个 95%可信区
3、间,平均有 95个可信区间包含该总体的总体均数。8( 1-) 100%可信区间及其意义v可信度 1-越大,计算可信区间包含总体均数的正确率就越高,但可信区间的宽度就越大,也就是估计总体均数的精度就越差。v一般而言, 95%可信区间是兼顾了正确性和估计精度,对于特殊情况,可以计算 90%可信区间或 99%可信区间。v对于随机抽样前而言,随机抽取一个样本量为 n的样本,计算 95%可信区间,则该区间将包含总体均数的概率为 95%,不包含其总体均数的概率为 0.05,这是一个小概率事件,对于一次随机抽样而言,一般是不会发生的,所以 95%可信区间一般被认为就是总体均数的范围。9假设检验 ( hypothesis testing)v样本均数与总体均数不等或两样本均数不等,有两种可能: 由抽样误差所致 两者来自不同的总体假设检验 是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法10总体随机抽样不是抽样误差?即: 0?样本总体0=0?即:抽样误差?假设检验问题总体总体总体总体总体不是抽样误差?即: ?总体总体?即:抽样误差?不是抽样误差?即: ?总体总体