1、 测试题1下列说法中错误的是( )A如果变量 x 与 y 之间存在着线性相关关系,则我们根据试验数据得到的点(i=1, 2,3, n)将散布在一条直线附近B如果两个变量 x 与 y 之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。C设 x,y 是具有线性相关关系的两个变量,且回归直线方程是 ,则 叫回归系数D为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量 x 与 y 之间是否存在线性相关关系2在一次试验中,测得(x,y)的四组值分别是(1,2) , (2,3) , (3,4) , (4,5) ,则 y 与 x 之间的回归直线方程是( )A B C D3回归直线 必
2、过点( )A (0,0) B C D4在画两个变量的散点图时,下面叙述正确的是( )A预报变量在 轴上,解释变量在 轴上 B解释变量在 轴上,预报变量在 轴上 C可以选择两个变量中任意一个变量在 轴上D可以选择两个变量中任意一个变量在 轴上5两个变量相关性越强,相关系数 r( )A越接近于 0 B越接近于 1 C越接近于1 D绝对值越接近 16若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为( )A0 B1 C1 D1 或 17一位母亲记录了她儿子 3 到 9 岁的身高,数据如下表:年龄(岁) 3 4 5 6 7 8 9身高( 94.8 104.2 108.7 117.8 1
3、24.3 130.8 139.0由此她建立了身高与年龄的回归模型 ,她用这个模型预测儿子10 岁时的身高,则下面的叙述正确的是( )A她儿子 10 岁时的身高一定是 145.83 B她儿子 10 岁时的身高在 145.83 以上C她儿子 10 岁时的身高在 145.83 左右 D她儿子 10 岁时的身高在 145.83 以下8两个变量有线性相关关系且正相关,则回归直线方程中, 的系数 ( )A B C D能力提升:9一个工厂在某年每月产品的总成本 y(万元)与该月产量 x(万件)之间有如下数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.8
4、7 1.98 2.07y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求每月产品的总成本 y 与该月产量 x 之间的回归直线方程。10某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了 10 个企业作样本,有如下资料:产量 x(千件) 40 42 48 55 65 79 88 100 120 140生产费用 y(千元) 150 140 160 170 150 162 185 165 190 185(1)计算 x 与 y 的相关系数;(2)对这两个变量之间是否线
5、性相关进行相关性检验;(3)设回归直线方程为 ,求系数 , 。综合探究:11一只红铃虫的产卵数 y 和温度 x 有关。现收集了 7 对观测数据列于表中,试建立y 与 x 之间的回归方程。温度 x 21 23 25 27 29 32 35产卵数 y个 7 11 21 24 66 115 325参考答案:基础达标:1B尽管两个变量 x 与 y 之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程 中的 和 ,从而可写出一个回归直线方程。2A由回归直线经过样本点的中心 ,由题中所给出的数据,将, 代入 中适合,故选 A。3D回归直线 ,必然经过样本点的中心,其坐标为 ,故选 D。4B5D6B7
6、C8A9解析:(1)画出的散点图如图所示:(2) , , , ,。所以所求回归直线方程为 。10解析:(1)制表:1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 76804 55 170 3025 28900 93505 65 150 4225 22500 97506 79 162 6241 26244 127987 88 185 7744 34225 162808 100 165 10000 27225 165009 120 190 14400 36100 2280010 140 185 19600 34
7、225 25900合计 777 1657 70903 277119 132938, , , , ,即 x 与 y 的相关系数 r0.808。(2)因为 ,所以可以认为 x 与 y 之间具有很强的线性相关关系。(3) , 。综合探究:11解析:散点图如图所示:由散点图可以看出:这些点分布在某一条指数函数 的图象的周围。现在,问题变为如何估计待定参数 c1 和 c2,我们可以通过对数变换把指数关系变为线性关系。令 ,则变换后样本点应该分布在直线 ( , )的周围。这样,就可以利用线性回归模型来建立 y 和 x 之间的非线性回归方程了。由题中所给数据经变换后得到如下的数据表及相应的散点图x 21 2
8、3 25 27 29 32 35z 1.946 2.398 3.045 3.178 4.190 4.745 5.784由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。计算得 , , , 。设所示的线性回归方程为 ,则有 ,得到线性回归方程 ,因此红铃虫的产卵数对温度的非线性回归方程为 。总结升华:(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系。根据已有的函数知识,可以发现样本点分布在一条指数函数曲线 的周围,其中 c1 和 c2 是待定参数。(2)选择适当的非线性回归方程。然后
9、通过变量代换,将非线性回归方程化为线性回归方程,并由此来确定非线性回归方程中的未知参数。(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有回归分析撰稿 吕宝珠 审稿 谷丹 责编:严春梅课程标准的要求回归分析的基本思想及其初步应用:(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;(3)理解线性回归模型;(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体计算公式(5)了解解释变量和随机变量的组合效
10、应的含义及表示总的效应的参数:总偏差平方和 ;了解样本的数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样本的各个点的随机误差的效应的平方和)的参数:残差平方和 ;了解表示解释变量效应的参数:回归平方和;了解刻画回归效果的相关指数的含义及计算公式。 (有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的) (6)了解残差分析的方法及意义,会读或会作残差图重点和难点分析回归分析的基本思想及其初步应用。内容精讲1相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点如下:相同点:均是指两个变量
11、的关系。不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系2回归分析:一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行
12、相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。3散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。粗略地看,散点分布具有一定的规律。4. 回归直线设所求的直线方程为 ,其中 a、b 是待定系数, ,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。5相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量 y 与 x 的一组观测值,把=叫做变量 y 与 x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 6相
13、关系数的性质:1,且 越接近 1,相关程度越大;且 越接近 0,相关程度越小.7显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每一次统计检验之前确定。8显著性检验:由显著性水平和自由度查表得出临界值,显著性水平一般取 0.01 和 0.05,自由度为,其中是数据的个数 在“相关系数检验的临界值表”查出与显著性水平 0.05 或0.01 及自由度 n-2(n 为观测值组数)相应的相关数临界值 0.05 或 0.01;例如时, 0.050.754, 0.010.874 求得的相关系数和临界值 0.05 比较,若 0.05,上面与是线性相关的,当 0.05
14、或 0.01,认为线性关系不显著。典型例题:1一个工厂在某年里每月产品的总成本 y(万元)与该月产量 x(万件)之间由如下一组数据:X 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07Y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.501)画出散点图;2)检验相关系数 r 的显著性水平;3)求月总成本 y 与月产量 x 之间的回归直线方程. 解析:i 1 2 3 4 5 6 7 8 9 10 11 12xi 1.08 1.12 1.19 1.28 1.36
15、 1.48 1.59 1.68 1.80 1.87 1.98 2.07yi 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50xiyi 2.43 2.264 2.856 3.264 3.590 4.07 4.643 5.090 5.652 6.096 6.653 7.245, , , ,1)画出散点图:2)在“相关系数检验的临界值表”查出与显著性水平 0.05 及自由度 122=10 相应的相关数临界值r 0.05=0.5760.997891, 这说明每月产品的总成本 y(万元)与该月产量 x(万件)之间存在线性相关关系。3)设回归直线方程 ,利用 ,计算 a,b,得 b1.215, ,回归直线方程为:2在 7 块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)施化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 4551)画出散点图;