统计学原理与工业统计课程讲稿.DOC

上传人:国*** 文档编号:2022244 上传时间:2019-03-29 格式:DOC 页数:11 大小:214.50KB
下载 相关 举报
统计学原理与工业统计课程讲稿.DOC_第1页
第1页 / 共11页
统计学原理与工业统计课程讲稿.DOC_第2页
第2页 / 共11页
统计学原理与工业统计课程讲稿.DOC_第3页
第3页 / 共11页
统计学原理与工业统计课程讲稿.DOC_第4页
第4页 / 共11页
统计学原理与工业统计课程讲稿.DOC_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、 统计学原理与工业统计 课程讲稿授课题目(教学章、节或主题):第 7 章 相关分析与回归分析 授课方式(请打) 理论课 讨论课 实验课 习题课 其他课时安排 3教学要求(分掌握、熟悉、了解三个层次):熟悉掌握:相关分析的概念及种类;回归系数的计算,相关系数与回归系数的计算了解:回归分析与相关分析的区别与联系。教学重点、难点及关键知识点:相关分析的概念及种类;回归分析与相关分析的区别与联系、回归系数的计算,难点的相关系数与回归系数的计算。方法及手段:老师讲解,举例练习。教学基本内容(教学过程) 改进设想第七章 相关分析与回归分析第一节 相关分析一切客观事物都是互相联系的,这种联系可以通过一定的数

2、量关系反映出来。相关分析就是研究两个或两个以上变量之间相关程度的大小以及用怎样的函数关系来表示的一种统计方法。一、函数关系与相关关系的概念1、函数关系:是变量之间的一种完全确定的关系,即一个变量的数值完全由另一个或一组变量的数值所确定。例如, = 。s2r2、相关关系:是变量之间的一种不完全确定的关系,即一个变量虽然受另外一个或一组变量影响,却并不由这一个或一组变量完全确定。例如工龄与工资的关系(工龄除受工资影响,还受工种、职务、部门等因素影响)。3、二者的区别与联系(1)区别:相关关系是现象之间数量上的不严格的相互依存关系,现象中的变量关系是对等的;函数关系是现象之间数量上严格的相互依存关系

3、,变量关系不对等。相关关系是统计学的研究范围,函数关系是数学的研究范围。(2)联系函数关系在实际生活中往往通过相关关系表现,其在统计意义上就是完全相关关系。统计学原理与工业统计 课程讲稿在统计研究中,相关关系使用函数关系的形式表现,而且当掌握现象之间的联系和规律性后,原来的相关关系可能变为函数关系。二、相关关系的种类1.按相关形式的不同,相关关系可以分为线性相关和非线性相关。线性相关是指当一个变量变动时,另一个变量也相应发生大致均等的变动。非线性相关是指当一个变量变动时,另一个变量也相应地发生变动,但这种变动是不均等的。2.按相关程度的不同,相关关系可以分为不相关、完全相关和不完全相关。不相关

4、是指两个变量的数量变化互相独立。例如,工人出勤率与棉花纤维强度是不相关的两种现象。完全相关是指一个变量的数量变化由另一个变量的数量变化唯一确定,此时的相关关系实际是函数关系。可以说,函数关系是相关关系的一种特殊情况。不完全相关是指两个变量之间的关系介于不相关和完全相关之间,大多数的相关关系都属于不完全相关,它是统计分析的主要研究对象。3.按相关方向的不同,相关关系可以分为正相关和负相关。正相关是指两个变量之间的变化方向是一致的。例如,工人的劳动生产率随其技术水平的提高而提高,二者是正相关;气温和冷饮的销售量负相关是指两个变量变化趋势相反。例如,随着劳动生产率的提高,产品的单位成本在下降,二者是

5、负相关;气温和羽绒服的销售量。需要注意的是:许多现象正负相关的关系仅在一定范围内存在。例如,运动员的成绩随训练的运动量增加而提高,但是,训练运动量增加到一定限度后,反而会使其成绩下降。4.按影响因素数量的不同,相关关系可以分为单相关和复相关。两个变量之间的相关关系称为单相关或简相关。例如,在计件工资条件下,工人工资与产量之间的关系为单相关。三个或三个以上变量之间的相关关系称为复相关或多元相关。例如,每吨水泥成本同水泥磨小时生产率、水泥磨日历时间之间的关系为复相关;降雨量、施肥量和农作物的产量之间的关系。三、相关图表与相关系数在统计学中,相关关系的判断可以通过相关图、相关表和相关系数来完成。1.

6、相关表:相关表是反映现象之间相关关系的表格。初步反映现象之间的相关形式、密切程度和相关方向。相关表有简单相关表和分组相关表两种。(1)简单相关表:资料未经分组,只将自变量按照从小到大的顺序并配合因变量的值一一对应而平行排列。例如,如下表的资料,可以发现随着产量的增加,单位成本有下降的趋势,说明两者之间存在着一定的依存关系。产量(件) 20 20 30 40 50 50 70 80单位成本(元) 16 15 15 15 14 15 14 13统计学原理与工业统计 课程讲稿(2)分组相关表如果原始资料很多,用简单相关表来表示现象之间的关系是很困难的。这时,需要将原始资料进行分组,然后编制相关表,这

7、种表称为分组相关表。分组相关表可以分为单变量分组表和双变量分组表两种。如下表就是一个单变量分组表。企业编号 生产性固定资产价值(百万元) 工业总产值(百万元)1 3 152 5 203 6 254 6 305 7 326 8 347 9 368 9 37双变量分组表是对自变量和因变量都进行分组而制成的相关表。这种表形似棋盘,故又称棋盘式相关表。其编制步骤为:首先,分别确定自变量和因变量的组数;其次,按两个变量的组数设计棋盘型表格;最后,计算各组次数置于相对应的方格之中。例如,根据对 30 个同类企业进行调查得到的产量和单位成本资料,编制的双变量分组表如表所示。产量 x(件)单位成本 y (元件

8、) 20 30 40 50 80合计18 4 416 4 3 1 1 915 1 2 3 3 1 1014 1 2 4 7合计 9 5 5 6 5 30由上表可以看出,单位成本集中在左上角到右下角的斜线上,表示产量与单位成本是负相关。2.相关图相关图又称散布图或散点图,是利用直角坐标第一象限,将自变量置于横轴上,因变量置于纵轴上,将两个变量相对应的变量值用坐标点的形式描绘出来,以表明相关点分布的状况。通过相关图可以发现:当 y 对 x 存在线性函数关系时,所有的相关点都会分布在某一直线上;当 y 与 x 存在线性相关关系时,相关点并不处在一条直线上,但是所有相关点的分布会呈现出某种趋势。因此,

9、利用相关图可以判断两个变量有无相关关系、相关的形态、方向和相关程度。相关图通常有以下几种形式:强正相关、弱正相关、强负相关、弱负相关、非线性相关和不相关。例如,根据表 6-4 中的资料,以需求量为纵坐标,居民收入为横坐标,绘制两变量的相关图如图 6-1 所示。统计学原理与工业统计 课程讲稿表 6-4年份 需求量(千件) 居民收入(万元) 年份 需求量(千件) 居民收入(万元)1985 116.5 255.7 1993 146.8 330.01986 120.8 263.3 1994 149.6 340.21987 124.4 275.4 1995 153.0 350.71988 125.5 2

10、78.3 1996 158.2 367.31989 131.7 296.7 1997 163.2 381.31990 136.2 309.3 1998 170.5 406.51991 138.7 315.8 1999 178.2 430.81992 140.2 318.8 2000 185.9 451.53.相关系数相关系数是指在线性相关条件下,用来说明两个变量之间相关关系密切程度的统计分析指标。通常用 r 来表示。相 关 系 数 的 值 介 于 1 与 +1 之 间 , 即 1 r +1。 其 性 质 如 下:(1)当 r0 时,表示两变量正相关,r0 时,两变量为负相关。(2)当|r|=1

11、 时,表示两变量为完全线性相关,即为函数关系。(3)当 r=0 时,表示两变量间无线性相关关系。(4)当 0|r|1 时,表示两变量存在一定程度的线性相关。且|r| 越接近 1,两变量间线性关系越密切;| r|越接近于 0,表示两变量的线性相关越弱。(5)一般可按三级划分:|r |0.3 为无直线相关关系,0.3|r|0.5 为低度线性相关;0.5| r|0.8 为显著相关;0.8| r|1 为高度线性相关。相关系数的基本计算公式为: 22)()(yxr上式是将各个离差相乘来计算相关系数的,因此把这一公式叫做“积差法”相关系数公式。利用这一公式计算 r 相当繁琐,人们利用代数推演的方法得到了许

12、多相关系数的简化公式。 22ynxnyyxr统计学原理与工业统计 课程讲稿110250190450x(万元)y(千件)图 6-1如果令2)(xlx 2)(yly )(yxlx则以协方差形式计算的相关系数可以表示为: yxlr例如,某产品单位成本与产量的资料如表,计算其相关系数。序号 产量 x(千件) 单位成本 y(元) xy x2 y21 5 16 80 25 2562 8 14 112 64 1963 9 12 108 81 1444 11 8 88 121 64合计 33 50 388 291 6602222 )4/50(6)4/3(918ynxnyr956.07.18354因为 r=-0

13、.956,所以单位成本与产量高度负相关。根据分组资料计算相关系数,需要采用加权法。计算公式为:积差法: fyfxr22)()(简捷法: 2222 )()()()( yfffxfffyr统计学原理与工业统计 课程讲稿第二节 回归分析一、回归分析的概念由于相关关系不能说明一个现象发生一定量的变化时,另一个变量将会发生多大的变化,即它不能说明两个变量之间的一般数值关系。因此,需要利用回归分析作进一步的说明。1、概念:回归分析是指将具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确立一个相应的数学表达式,来研究变量之间数量变动关系的统计分析方法。2、相关分析与回归分析关系。(1)联系:

14、相关分析是回归分析的基础,回归分析是相关分析的继续。如果只有相关分析而缺少回归分析,就会降低相关分析的意义;如果只有回归分析而缺少相关分析,也会影响回归分析的可靠性。因此,只有把二者结合起来才能达到统计分析的目的。(2)区别:相关分析研究的两个变量是对等关系的,而回归分析研究的两个变量不是对等关系的;相关分析对于两个变量只能计算出一个相关系数,而回归分析可以根据不同的目的分别建立两个不同的回归方程;相关分析的两个变量必须是随机变量,而回归分析的两个变量一个是随机变量,一个是给定的变量。由于相关分析与回归分析之间存在密切的关系,因此,在实际应用时往往要在相关分析的基础上进行回归分析。按自变量的个

15、数不同,回归分析包括一元回归和多元回归。其中,只有一个自变量的回归分析叫一元回归(也称简单回归);有两个或两个以上自变量的回归叫多元回归(也称复回归)。按照回归的形状不同,回归分析包括线性回归和非线性回归。其中,线性回归是最基本的形式,本节重点介绍一元线性回归。二、一元线性回归分析1.一元线性回归模型的确定一元线性回归方程是根据成对的两个变量的数据,来配合直线方程,并依据自变量的变动推算因变量的发展趋势和水平。一元线性回归方程的模型为: bxay式中, 为 y 的估计值;a 表示直线在 y 轴的截距;b 表示直线的斜率,称为 y对 x 的回归系数,它表明 x 每变动一个单位时,使 y 平均变动

16、的数量。一元线性回归方程应用的条件是:两个变量之间确实存在着显著的直线相关关系。否则,配合的回归模型就无法表明两个变量之间的依存关系。待定系数 a 和 b 一般是根据最小平方法原理求出的。根据未分组资料配合回归直线模型时,依最小平方法的原理,得到标准方程式: yxbxan2统计学原理与工业统计 课程讲稿解方程,求得待定系数 a 和 b: 22)(xnyxbynya以下表资料为例,配合直线方程:序号 产量 x(千件) 单位成本 y(元) xy x2 y21 5 16 80 25 2562 8 14 112 64 1963 9 12 108 81 1444 11 8 88 121 64合计 33

17、50 388 291 660307.159329140b8.7.50a则: xy3.128.当产量为 13 千件时,单位成本为: )(29.07. 元在根据分组资料配合回归直线模型时,待定参数 a 和 b 的计算公式为:22)()(xfffyxybfxfyxba表 6-6工人看管织机台数 x(组中值 )时劳动生产率 y(米)工人数fxf yf x2f xyf y2f6 14 10 60 140 360 840 1 9608 17 14 112 238 896 1 904 4 04610 22 21 210 462 2 100 4 620 10 16412 25 30 360 750 4 320

18、 9 000 18 75014 32 33 462 1 056 6 468 14 784 33 79216 37 32 512 1 184 8 192 18 944 43 80818 42 21 378 882 6 804 15 876 37 044合计 161 2 094 4 712 29 140 65 968 149 564根据表 6-6 中的资料,试配合趋势方程,并预测工人看管织机台数为 20 台时,时劳动生产率为多少?统计学原理与工业统计 课程讲稿把有关数据代入公式: 458.209 14 26785b.6.7 a将 a、b 的数值代入回归模型,得到: xy458.2当 x=20 台时

19、,时劳动生产率的估计值为: )(46.0.7米2.估计标准误差回归方程的一个重要作用在于根据自变量的值推算因变量的可能值,这个可能值也称估计值、理论值或平均值。它与真正的实际值可能一致,也可能不一致。因而,就产生了估计值的代表性问题。将一系列的 与 y 值加以比较,可以发现其中存在着一系列离差,有的是正差,有的是负差。回归方程的代表性一般是通过估计标准误差指标来反映的。估计标准误差是用来说明回归方程代表性大小的统计分析指标,简称为估计标准误或估计标准差,计算原理与标准差基本相同。估计标准误差小,说明回归方程的准确性高,代表性大;反之,说明回归方程的准确性差,代表性小。其基本计算公式为:式中,S y 代表估计标准误差,n 表示数据的项数。nySy2)(当实际观察值比较多且数值较大时,根据上述公式计算估计标准误差十分麻烦,这时可以采用简化公式来计算:对于未分组资料: nxybaySy2对于分组资料: ffxybafySy2估计标准误差是分析回归误差的一个重要尺度,它和相关系数之间存在着密切的关系。即: 21rSy

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 医药卫生

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。