1、 统计中的几个基本概念一、 总体与样本总体 :1 指 同质 观察单位的集合2 指 同质 观察单位某个变量值的集合(同质是指 被研究指标 的主要 影响因素 相同)总体根据有无时间和空间的限制又分为 有限总体 和 无限总体样本 :从总体中按 随机抽样 的方式抽取 一定数量 的观察单位所组成的集合样本 要具备以下两个条件:( 1) 可靠性 :样本中的每一个个体均来自 既定 的 同一总体( 2) 代表性 :样本 中受试对象的构成分布与总体构成分布齐同。随机抽样 足够 数量 分层抽样总体 和 样本 的关系如下:总体抽样研究 过程统计推断 过程样本统计分析的基本思想总 体样本抽样推断样本统计描述二、同质与
2、 变异同质:是指 被研究指标 的主要影响因素相同变异 :指同质事物间的 差异 。是客观存在的现象,可分为以下两类:个体变异 :指同一特征或同一条件下个体间的差异。同质条件:都是鼻咽癌患者 都用相同治疗方法变异现象:疗效各不相同随机测量变异 : 指同一个体重复观测结果未必相等的现象。三、 概率 与 频率1、 频率 :某变量值出现的次数(频数) /重复观察的总次数。对一个随机事件重复观察时,尽管每进行n次试验,所得到的频率可能各不相同,但随着 n的增大,频率会逐渐稳定在 某个常数附近波动 。频率的 稳定性 说明随机事件发生的可能性大小是事件本身固有的一种客观属性。2、 概率 :表示 随机事件 发生
3、可能性大小的 数值 。( 用 P表示 )通常由 频率的稳定值 反映。确定性事件: ( 1) 必然事件 P=1,( 2)不可能事件 P=0;随机性事件 ( 3) 概率 取值介于 0 1之间。概率越接近 0,表明事件发生的 可能性越小。概率越接近 1,表 明事件发生的可能性越大。概率 和 频率 有区别:频率 是 已经 进行 试验的结果,描述的是 样本中事件出现的可能性大小(样本信息), 样本不同,其值也不同 ,具有 偶然性 ;概率 刻画的则是 总体 中随机事件出现的可能性大小(总体信息),是一种客观存在, 是个确定数值 ,具有 必然性 。v小概率原理 :概率很小的随机事件在 一次 或少量 实际观察中是不可能发生的(尽管理论上有发生的可能)v小概率: P0.05或 P0.01五、 参数与统计量1、 参数 :根据总体分布特征而计算的总体指标。一般用小写的希腊字母表示。2、 统计量 :根据样本计算的相应指标 (样本指标 )。用拉丁字母表示。v六、 假设检验与两类错误v1、 假设检验 :先对 总体 的 参数 或 分布 作出某种假设,然后用适当的方法根据 样本 对总体提供的信息,运用 “小概率原理 ”推断假设是否成立。