《薪酬设计回归分析》.doc

上传人:您的****手 文档编号:518559 上传时间:2018-10-17 格式:DOC 页数:28 大小:761KB
下载 相关 举报
《薪酬设计回归分析》.doc_第1页
第1页 / 共28页
《薪酬设计回归分析》.doc_第2页
第2页 / 共28页
《薪酬设计回归分析》.doc_第3页
第3页 / 共28页
《薪酬设计回归分析》.doc_第4页
第4页 / 共28页
《薪酬设计回归分析》.doc_第5页
第5页 / 共28页
点击查看更多>>
资源描述

1、泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 265 页相关与回归分析第一节 简单线性相关分析一、相关关系的概念与种类(一)相关关系的概念在自然界和人类社会中,普遍着存在现象之间的相互依赖、相互制约的关系。一些现象在数量上的发展变化经常伴随着另一些现象数量上的发展变化。现象间的数量关系可分为两种基本类型:函数关系。它是指现象间存在的严格依存的、确定的因果关系,一种现象的数量变化必然决定着另一种现象的数量变化,这种关系可通过精确的数学表达式来反映,比如,圆面积同其半径的关系为 s=r 2,自由落体落下的距离同时间的关系为 h= gt2,等等。相关关系。指的是现象之间确实1存在着数

2、量关系,但这种关系不是严格确定的,当一种现象的数量发生变化时,另一种现象的数量可能在一定范围内发生变化,出现不同的数值。比如,单位产品成本同产量之间的关系,一般说来,当工厂规模扩大,产品产量增加时,单位产品成本会随之下降,这种变化趋势体现了规模经济的效应,具有客观性和普遍性。但由于影响产品成本的因素众多,有主要的,也有次要的,有必然的,也有偶然的,有随机的,也有非随机的,有观察得到的,也有观察不到的,等等。同一产量水平下,可能会出现各种各样的单位成本,或者某一确定的单位成本对应着不同的产量,两者的关系不是唯一确定的。粮食收获量与施肥量之间、商品价格与需求量之间、身高与体重之间等都具有类似的特征

3、,这种关系就是相关关系。函数关系与相关关系既有区别,又有联系。由于观察和实验中的误差,函数关系往往通过相关关系表现出来;而当对现象之间的内在联系和规律性了解得更加清楚的时候,相关关系又可能转化为函数关系。在社会经济领域里,一般说来,函数关系反映了现象间关系的理想化状态,相关关系则反映了现象间关系的现实化状态,只有在大量观察时,在平均的意义上,它才能被描述。综上所述,相关关系是现象之间确实存在的,但关系数值不固定的相互依存关系。相关分析则是研究一个变量与另一个变量或另一组变量之间相关密切程度和相关方向的一种统计分析方法。(二)相关关系的种类现象之间的相关关系是很复杂的,从不同的角度看,相关关系有

4、不同的种类。1.固定相关和随机相关。按变量的性质(是否是随机变量),相关关系可分固定相关和随机相关。固定相关是指一个随机变量与另一个或一组非随机变量之间的的泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 266 页相关关系。例如,农作物的施肥量是一个可控制的变量,农作物收获量是一个不确定的变量,两个变量之间的关系表现为一个随机变量与另一个非随机变量之间的固定相关。随机相关是指一个随机变量与另一个或一组随机变量之间的相关关系。例如,大学生的身高和体重之间的关系就是两个随机变量之间的随机相关关系,如果观察某一身高的一组学生时,其体重各不相同,会形成一个分布;如果观察某一体重的一组学生

5、时,其身高也不相同并形成一个分布,两个变量均为随机变量。2.简单相关和多元相关。按变量的多少,相关关系可分为简单相关和多元相关。简单相关,又称单相关,是指一个随机变量与另一个随机变量或非随机变量之间的相关关系;多元相关,又称复相关,是指一个随机变量与另一组随机变量或非随机变量之间的相关关系。按变量之间的相关方向不同,简单相关又可分为正相关和负相关。当自变量的值增加,因变量的值也相应地增加;自变量的值减少,因变量的值也随之减少时,这样的相关关系就是正相关。反之,当自变量的值增加时,因变量的值随之减少;自变量的值减少时,因变量的值反而增加,具有这种特点的相关关系就是负相关。多元相关可进一步分解为简

6、单相关和偏相关。偏相关是指在测定一个随机变量与某个或某些随机变量或非随机变量之间的相互关系后,该随机变量与某一新增加的随机量或非随变量之间的相关关系,又称之为净相关。3.线性相关和非线性相关。按变量之间的相关形式,相关关系可分为线性相关和非线性相关。若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系表现为线性组合时,则称它们之间的相关关系为线性相关。反之,若一随机变量与另一个或一组随机变量或非随机变量之间的相关关系不能表现为线性组合,而只能表现为非线性组合时,则称它们之间的相关关系为非线性相关。4.完全相关、不完全相关和不相关。按变量之间的相关程度不同,相关关系可分为完全相关、不完全

7、相关和不相关。若一个变量的值完全由另一个或一组变量的值所决定,则称变量之间的这种相关关系为完全相关,即函数关系。若一个变量的值与另一个或一组变量的值有关,但其中要受到随机因素的影响,则称变量之间的这种相关关系为不完全相关。若一个变量的值完全不受另一个或一组变量值的影响,则称变量之间不相关。大量社会经济现象之间的相关关系都属于不完全相关,不完全相关是相关分析的基本内容。完全相关和不相关可视为相关关系中的特例。二、简单线性相关图表判定两变量之间的相关程度和相关方向是简单线性相关分析的重要内容之一。其最简单、最直观的方法就是列相关表、绘制相关图。简单线性相关关系有固定简单线性相关与随机简单线性相关之

8、分。简单线性相关图表可用于直观地表明这两类简单线性相关变量之间的相关程度和相关方向。(一)固定简单线性相关图表已知有两个变量,设 y 是随机变量,x 是非随机变量,对应于 x 的每一个给定泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 267 页的取值,y 有多个可能的取值,但在一次试验中,y 只取其中一个可能值。由于 x 是非随机变量,在实验中其取值可以控制并重复进行,所以在 n 次试验中,x 可能取n 个相同或不同的值,相应地也有 n 个 y 的值,即得到一一对应的样本资料(x,y)。将这些数据按 x 的取值由小到大依次对应排列,即构成固定简单线性相关表,又称之为一维相关表。

9、例 9.1 某地区居民人均收入水平(x)与其食品支出占生活费支出比重(y)之间具有相关关系,编制相关表如下(见表 9-1):表 9-1 一维相关表人均收入水平(元)x280 320 390 530 650 670 790 880 910 1050食品支出占生活费支出比重(%)y68.3 67.5 66.2 64.9 56.7 60.2 54.4 49.0 50.5 43.6从表 9-1 可以粗略看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重有下降的趋势。将一一对应的(x,y)描点于坐标系上,即构成散点图,又称相关图。在相关图上,以横轴表示非随机变量(x) ,以纵轴表示随机变量(y

10、),通过观察各对变量值坐标点的分布状况,可以大致判断变量之间相关的形态、方向和密切程度。利用表 9-1 资料,可绘制相关图如下(见图 9-1):图 9-1 居民人均收入水平与其食品支出的关系图从图 9-1 可以看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重明显降低,并大致呈线性下降趋势,即负线性相关。yx010203040506070800 100 200 300 400 500 600 700 800 900 1000 1100人 均 收 入 水 平 ( 元 )食品支出占生活费用支出的比重(%)泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 268 页一些常见的相

11、关分布状态可用下述各图表示(见图 9-2):xxxxxxxxxxxx较显著的线性正相关 较显著的线性负相关xxxxxxxxxx不显著的线性负相关 不相关图 9-2 几种常见的相关散点图(二)随机简单线性相关图表设 x 、y 为两个随机变量,将观测值(x,y)分组之后按顺序排列,x 从小到大排列,y 从大到小排列,形成一棋盘式平衡表,称之为二维相关表。例 9.2 某地区为研究降雨量和农作物平均每亩收获量的关系,从 40 个降雨量不同的试验田中获得 40 对数据。用 x 表示降雨量,y 表示平均每亩收获量。据此可编出二维相关表如下(见表 9-2) 。该表中,中间每一格列出的是 x、y 的联合频数,

12、它表明 x 和 y 同时取某值的次数;最后一列每一格是每一行的联合频数的和,它表明 y 取某值的次数;最后一行每一格则是每一列的联合频数的和,它表明 x 取某值的次数。表 9-2 二维相关表 降雨量(毫米)x i频数 fij收获量(公斤)y j8 10 12 14 16 18 行和(fj)260 1 2 1 4泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 269 页240 2 2 2 6220 2 3 5 1 11200 1 3 6 3 13180 1 2 3160 1 1 1 3列和(f i) 3 6 14 11 5 1 40从表 9-2 可以粗略看出,降雨量与收获量之间大致

13、呈线性正相关关系。利用表 9-2 资料,可绘制相关图如下(见图 9-3):图 9-3 降雨量与收获量之间相关图三、简单相关系数(一)简单相关系数的意义简单线性相关图表虽然直观,但不能精确地描述现象间的相关关系。测量两个变量之间线性相关程度和相关方向的指标,称为简单相关系数。总体相关系数一般用 R 表示,定义式为(式 9.1)YX2式中, 和 表示变量 X 和 Y 的标准差,对有限总体而言,其计算公式为XY(式 9.2)N2)((式 9.3)Y2)(表示两个变量 X 和 Y 之间的协方差,计算公式为XY213 3521y1222261312111x020406080100120140160180

14、2002202402602800 2 4 6 8 10 12 14 16 18 20降 雨 量 ( 毫 米 )平均每亩收获量(公斤)泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 270 页(式 9.4)NXYXY)()(2 这里,变量 X 和 Y 为总体变量,N 为总体单位数, 和 分别为变量 X 及 YXY的总体平均数,计算式为(式 9.5)X(式 9.6)NY要理解相关系数 R 的意义,首先要明确协方差 和标准差 、 在反映XY2XY变量之间相关关系中的作用。协方差 反映了变量 X 和 Y 的共变性,可以显示两个变量的相关方向和相关XY2关系的密切程度,它可能出现以下几种情

15、况:第一,所有相关点均为正相关,则 0,说明两个变量之间正线性相关。XY2第二,所有相关点均为负相关,则 0,说明两个变量之间负线性相关。第三,在全部相关点中,既有正相关、又有负相关和零相关,在计算协方差时就会出现正负抵销。抵销的结果如为正数则是正相关,如为负数则是负相关。数值大表示相关程度强,数值小则表示相关关系弱。若正、负全部低销掉了,结果为零,则表示不相关。第三种情况是实际经济生活中最常见到的情况。此外,还有两种极端的情况:当所有相关点都是零相关时,抵销结果为零,表示两个变量完全没有相关关系。当所有相关点全部落在直线上时,表示两个变量完全线性相关,即存在函数关系。进一步,相关系数是一个界

16、于+1 和-1 之间的数,即-1R1,若 R=1,说明两个变量之间存在完全正线性相关;若 R=-1 说明两个变量之间存在完全负线性相关;若 0 R 1,说明两个变量之间存在一定程度的正线性相关;若-1 R 0,说明两个变量之间存在一定程度的负线性相关;若 R=0,说明两个变量之间没有线性相关关系。(二)简单相关系数的计算在实际工作中,总体相关系数 R 一般是未知的,往往需要用样本资料推断总体的相关情况,因而需要计算样本相关系数。1.固定简单线性相关系数的计算设 x 和 y 为样本变量,其中 y 为随机变量,x 为非随机变量, n 为样本容量,泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28

17、 页,共 271 页、 分别为变量 x 及 y 的样本平均数, 、 和 分别表示变量 x 和 y 的样本xy xsyx2标准差及它们之间的样本协方差,其计算为(式 9.7)n(式 9.8)y(式 9.9)nxsx2)((式 9.10)yy2)((式 9.11)nxsxy2于是,就可得到与总体相关系数计算形式相同的样本相关系数(记为 r)的公式(式 9.12)yxsr2经过简单的推导,上式还可变化为下面易于计算的形式(式 9.13)222)()(ynxnr根据表 9-1 的资料计算相关系数如表 9-3 所示:表 9-3 固定简单线性相关系数计算表序号人均收入水平(元)x食品支出占生活费支出比重(

18、%)yx2 y2 xy1 280 68.3 78400 4664.89 191242 320 67.5 102400 4556.25 216003 390 66.2 152100 4382.44 258184 530 64.9 280900 4212.01 343975 650 56.7 422500 3214.89 368556 670 60.2 448900 3624.04 403347 790 54.4 624100 2959.36 429768 880 49.0 774400 2401.00 431209 910 50.5 828100 2550.25 4595510 1050 43.

19、6 1102500 1900.96 45780合计 6470 581.3 4814300 34466.09 355959泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 272 页将表 9-3 数字代入上述相关系数计算公式,得: 222)()(ynxnyr= - 0.98223.58109.346164708130592.随机简单线性相关系数的计算如果 x 和 y 均为随机变量,计算样本相关系数的基本式仍为 yxsr2但由于存在联合频数(f ij) ,其具体的计算略有变化,经过不复杂的类推可得下式(式 9.14)2222 )()( jjjiii jiijij fyffxfyr 根据

20、表 9-2 资料计算相关系数,计算过程如表 9-4、表 9-5、表 9-6 所示:表 9-4 降雨量(x)数据的计算表降雨量(毫米)x i fi xi2 xifi xi2fi8 3 64 24 19210 6 100 60 60012 14 144 168 201614 11 196 154 215616 5 256 80 128018 1 324 18 324合计 40 504 6568表 9-5 平均每亩收获量(y)数据的计算表平均每亩收获量(公斤)y j fj yj2 yjfj yj2fj160 3 25600 480 76800180 3 32400 540 97200200 13 4

21、0000 2600 520000220 11 48400 2420 532400240 6 57600 1440 345600260 4 67600 1040 270400合计 40 8520 1842400表 9-6 平均每亩收获量(y)数据的计算表降雨量(毫米)x i 平均每亩收获量(公斤)y j fij xiyjfij8 160 1 1280泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 273 页8 180 1 14408 200 1 160010 160 1 160010 200 3 600010 220 2 440012 160 1 192012 180 2 4320

22、12 200 6 1440012 220 3 792012 240 2 576014 200 3 840014 220 5 1540014 240 2 672014 260 1 364016 220 1 352016 240 2 768016 260 2 832016 260 1 4680合计 40 109000根据以上各表资料可得:2222 )()( jjjiii jiijij fyffxfyr = 22850140568409= 0.67四、相关系数的统计推断总体相关系数 R 一般是未知的,能够计算出的只是样本相关系数 r,r 虽然能够提供关于总体相关程度与方向的某种信息,r 愈大,在一定

23、程度上说明总体相关程度愈高,但也可能犯错误。这就需要根据样本资料对总体相关系数 R 进行检验和估计。(一)关于总体相关系数 R 的检验由于相关系数 r 的分布复杂,不能直接利用它去进行统计推断,但如果设ZR= (式 9.15))1ln(2zr= (式 9.16)泉州智峰管理咨询有限公司 龚启海咨询机构提供第 28 页,共 274 页可以证明,当样本(x,y)抽自正态分布总体时,z r近似服从平均值为 ZR,方差为 的正态分布,于是31nz=(zr-ZR) (式 9.17)3n近似服从标准正态分布。据此可以检验 H0:R=R 0(R00)利用例 9.1 资料,计算的样本相关系数 r=-0.98,

24、是否可以认为总体相关系数R=-0.90,统计假设为H0:R=-0.90H1:R-0.90此时,ZR= =-1.472)90.ln(2)ln(2zr= =-2.29881.r于是,检验统计量z=(zr-ZR) 3n=(-2.298+1.472) 10=-2.185当显著水平 =5%时,查正态分布表可得 ,186.296.1025. ZZ故否定 H0,接受 H1,即不能认为总体的相关系数 R=-0.90。同理,也可以对总体相关系数进行单边检验。(二)关于总体相关系数 R 的区间估计首先,求出 ZR的估计区间。若与估计保证程度对应的概率度为 Z,Z R的估计区间就为zr- ZR zr+3n3n对于例 9.1,Z R的 95%置信估计区间为-2.298- ZR -2.298+1096. 1096.即 -3.039 ZR -1.557根据 ZR的置信区间,可以换算出 R 的置信区间:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 企业管理资料库 > 人力资源

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。