1、http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 1 应用统计分析部分 第一章:抽样分布与设计 一、抽样分布 1、 抽样的特点 抽样的目的是用被抽取部分个体所求得的数值推断总体的数量特征。其中,抽取部分个体称为总体的一个样本 。特别样本个数就是样本容量;样本取值就是样本观察值。 抽样是对所研究的总体,按照随机原则抽取部分个体进行的调查。 抽样的特点: 随机原则:每个元素(或个体)有同等抽中的机会(具有代表性) 推断总体特征:样本的数值特征 推断 总体数量特征。 推断的精确性:把推断的误差控制在一定的精确度内(可靠性要求) 2、样本平均数的分布 正态总体
2、分布: 如果从正态分布总体 N( , 2 )中随机抽取样本,则样本平均数 x 的分布具有如下性质: a: 样本的平均数 x 的分布也是正态分布。 b: 样本的平均数 x 的平均数 x 等于总体的平均数 c: 当从 无限总体抽样(或从有限总体采用放回抽样)时,样本平均数 x 分布的方差 2x 等于总体的方差除以样本容量。即 2x n2 特别 :当从有限总体不放回抽样时,样本平均数 x 分布方差为: 2x n2 ( 1NnN );简记 2x n2 (1- Nn ) 总结 :样本平均数服从正态分布: x N( , 2x ) 非正态总体分布: 如果总体不服从正态分布时,样本平均数 x 分布性质则由 中
3、心极限定理 来解释如下: a:只要数学期望 和方差 2 存在,从总体中随机相互独立抽取 n 个样本,则样本平均数 ni ixnx 11 是随机变量; http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 2 b:当 n 够大 (一般 n30) 时,则 x N( , 2x ) c:特别总体服从二点分布 p(x=i)=p, p(x=0)=1-p 时,则期望 p 方差 p(1-p) 故放回抽样时 p PN( , nPP )1( );不放回抽样时 p PN( , (1-Nn ) nPP )1( )。 样本平均数之差的分布: 如果总体 1: X ),( 211 N
4、,抽 n1 个样本, 1111 ni ixnx如果总体 2: Y ),( 222 N ,抽 n2 个样本, 2121 ni iyny则 yx ),(22212121 nnN 二、抽样设计 1、 简单随机抽样 : 事前编好随机数据表 总体(全部编号) 标签(混合) 用手随机模取 抽样 摇号机 2、 类型抽样 (分层抽样或分类抽样 ): 总体(按特征标志分组) 组 1 随机抽样 组 k 随机抽样 分配原则:等数;等比例;最优 设:总体为 N(总体样本为 n) ;分成 k 组,第 i 组包含 Ni 个单位,样本为 ni 等数: n1=n2=.= n k=kn 等比例:NnNnNn .2211;样本数
5、 NNnn ii 最优:标志变动程度为 i , ki iiiiiNNnn1 ,样本数 ki iiiiiNnNn1 http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 3 样本平均数 i 组 : .).2,1(1 kinxxinjijii ; 总体:iki iNxNx 11 样本平均数总体方差 : 21222 1ixki ix NN 全样本平均数的方差 2x 是各类型方差的加权综合 样本平均数 i 组方差: ki iiiix nNNi 12222 1 2ix 是第 i 组内资料的方差,取各类型样本方差的加权数综合 3、 整群抽样: 总体(按标志分成若干群)
6、 随机抽取 r 个群 样本 总体分为 R 个群,每群含为 M 个单位。设 ijx 为第 i 个群中的第 j 个单位的标志值。 i 群平均数: mj iji xmx 11 i=1, 2, , r 总体平均数: rxrm xxri irimj ij 11 1 总体方差: Rxxix /)( 22 样本平均数的群间方差 其中, ix 为总体各群的平均数; x 为总体的总平均数 样本方差: rxxix /)( 22 样本的群间方差 其中, ix 为抽样各群的样本平均数; x 为抽样各群全体样本的平均数 http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 4 整群
7、不放回抽样样本平均数的方差 : )1(22 R rRrxx 注:等距抽样;多阶段抽样;双相抽样;穿插抽样 (略 )。 第二章:参数估计与假设检验 一、参数估计问题 随机变量特征 (概率分布;均值;方差 ) 如何? 解决方式:根据样本来估计所要的信息;具体思路:用样本统计量估计总体参数。 1、参数点估计量优劣的判别准则和常用的估计量 点估计:用样本统计量估计总体参数一个明确的估计值 准则:无偏性 -令 为被估计参数; 为 的无偏估计量;则 )(E 一致性:样本容量越大,估计量的值越接近于被估计总体参数 有效性: )(1E , )(2E ,如果 1 的方差比 2 的方差小,则 1 比2 有效 常用
8、估计量: 用样本的平均数 ni ixnx 11 估计总体平均数 ,即 )(xE 用样本方差 ni i xxns 122 )(11 和标准差 s 估计总体方差 2 和标准差 即 22222 )()()()( xExExExEsE ; )(sE 用样本中具有某特征单位的比例 nap 估计总体比率 p,即 ppE )( 2、参数区间估计问题 区间估计:用样本估计总体参数可能取值的区间 (给出了点估计可靠性的一种描述,是点估计的补充) 选择两个统计量 1 和 2 估计 P( 1 )2 1- (事先给定的正数 ) http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 )
9、 5 )( 1E , )( 2E 且 10 单边检验 假设检验: 以样本为依据构造合适的检验统计量分析样本统计值与参数假设值的差距 就是原假设的显著性检验 检 验统计量 = 样本统计量 -被假设的参数 统计量的标准差 结论:差距大 假设值的真实性小 差距小 假设值的真实性大 http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 9 例: Z=nx/ (标准正态分布统计量 ) t=nSx/ (t 分布的统计量 ) 假设检验的步骤: 根据题意提出原假设 H0 和备择假设 H1 选择显著性水平 ( 0.05 和 0.01) 选择检验统计量及其分布 根据显著性水平
10、确 定统计量的否定域或临界值(注意是双边还是单边检验) 根据样本数据计算统计量的数值并作出推断: 如果统计量的值落在否定域内 否定原假设 如果统计量的值落在接受域内 差异不显著(接受原假设) 1、总体平均数的假设检验: 假设: H0: =0; H1: 0 双边检验 例:已知方差: 50 , n=25, x =70 , =0.05 , 0=90 检验: Znx/ 5/509070 2 构造统计量 P( Z 2Z) = , 205.0Z=1.96 ; 205.0Z=-1.96 Z(-1.96, 1.96) 否定原假设 假设: H0: 0; H1: 0 单边检验 例 P190(例 8.11) 2、
11、总体方差的假设检验 例 198(例 8.17) http:/ (海量营销管理培训资料下载 ) http:/ (海量营销管理培训资料下载 ) 10 第三章:回归相关分析 为了研究分析各种经济现象,就需要寻找能说明这些经济现象的各种经济变量,并确定这些变量之间的因果关系,探索这些变量之间的数量变化规律。这就是回归相关分析 一、建立回归分析模型的步骤: 1、理论模型设计 选择模型中将包含的变量(选择某变量作为经济系统的“果” ,正确地选择作为“因”的变量) 。 按照经济行为理论和样本数据显示出 变量之间关系 构造描述变量之间关系的数学表述式。 拟定模型中待估参数的符号及其大小的理论期望值范围。 2、
12、样本数据的收集 常用的样本数据:时间序列数据,截面数据,虚变量数据(政策变量取值:0 和 1) 选择样本数据的出发点:可得性和可用性。 样本数据的质量:实整性,准确性,可比性 (数据的口径问题 )和一致性 (样本和母体必须一致。 3、模型参数的估计 样本数据估计整体参数的具体取值。 4、模型检验 经济意义检验 模型参数估计值的可靠性检验( R2拟合优度检验, t变量显著性检验;F-方程显著性检验) 应用检验(样本容量变化的灵敏度分析进行稳定性检验,精度检验,预测能力检验) 二、多元回归分析模型综述: 1、 理论模型设定: Y 1 2x2+3x3+ kxk+ 其中, Y 为被解释变量(果) ; 1, 2 . k 待估的参数 (未知参数 ) ; x1, x2, x3 .xk 为解释变量(因); 为随机扰动项 抽取样本代入设定模型得: Yi 1 2x2i+3x3i+ kxki+i i 1,2, , n 样本容量 : n30(最低: n3k 或 nk) 如果 ,令 Y= Y1 = 1 = 1 X= 1 X 21 X31 Xk1 Y2 2 2 1 X 22 X32 Xk2 . Yn k n 1 X 2n X 3n Xkn 则样本模型: Y=X+
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。