1、1用 Excel 进行一元线性回归分析Excel 功能强大,利用它的分析工具和函数,可以进行各种试验数据的多元线性回归分析。本文就从最简单的一元线性回归入手.在数据分析中,对于成对成组数据的拟合是经常遇到的,涉及到的任务有线性描述,趋势预测和残差分析等等。很多专业读者遇见此类问题时往往寻求专业软件,比如在化工中经常用到的 Origin 和数学中常见的 MATLAB 等等。它们虽很专业,但其实使用 Excel 就完全够用了。我们已经知道在 Excel 自带的数据库中已有线性拟合工具,但是它还稍显单薄,今天我们来尝试使用较为专业的拟合工具来对此类数据进行处理。文章使用的是 2000 版的软件,我在
2、其中的一些步骤也添加了 2007 版的注解.1 利用 Excel2000 进行一元线性回归分析首先录入数据.以连续 10 年最大积雪深度和灌溉面积关系数据为例予以说明。录入结果见下图(图1)。图 1第二步,作散点图如图 2 所示,选中数据(包括自变量和因变量),点击“图表向导”图标;或者在“插入”菜单中打开“图表(H)(excel2007) ”。图表向导的图标为 。选中数据后,数据变为蓝色(图 2)。2图 2点击“图表向导”以后,弹出如下对话框(图 3):图 3在左边一栏中选中“XY 散点图”,点击“完成”按钮,立即出现散点图的原始形式(图 4):3灌 溉 面 积 y(千 亩 )0102030
3、4050600 10 20 30灌 溉 面 积 y(千 亩 )图 4第三步,回归观察散点图,判断点列分布是否具有线性趋势。只有当数据具有线性分布特征时,才能采用线性回归分析方法。从图中可以看出,本例数据具有线性分布趋势,可以进行线性回归。回归的步骤如下: 首先,打开“工具”下拉菜单,可见数据分析选项(见图 5)(2007 为” 数据”右端的”数据分析”):图 5用鼠标双击“数据分析”选项,弹出“数据分析”对话框(图 6):4图 6 然后,选择“回归”,确定,弹出如下选项表:图 7进行如下选择:X、Y 值的输入区域(B1:B11,C1:C11),标志,置信度(95%),新工作表组,残差,线性拟合
4、图。或者:X、Y 值的输入区域(B2:B11,C2:C11 ),置信度( 95%), 新工作表组,残差,线性拟合图。注意:选中数据“标志”和不选“标志”,X、Y 值的输入区域是不一样的:前者包括数据标志:最大积雪深度 x(米) 灌溉面积 y(千亩)后者不包括。这一点务请注意。5图 8-1 包括数据“标志”图 8-2 不包括数据“标志” 再后,确定,取得回归结果(图 9)。6图 9 线性回归结果 最后,读取回归结果如下:截距: ;斜率: ;相关系数: ;测定系数:356.2a813.b98.0R;F 值: 。97.02R457 建立回归模型,并对结果进行检验模型为: xy.至于检验,R、R 2
5、和 F 值可以直接从回归结果中读出。实际上,检验通过。有了 R 值,F 值和 t 值均可计算出来。F 值的8,05.639841.0R计算公式和结果为: 8,05.22 32.945.71)9846.01()(1kn 显然与表中的结果一样。t 值的计算公式和结果为: 8,05.2 .107.1tknRt 回归结果中给出了残差(图 10),据此可以计算标准离差。首先求残差的平方,然后求残差平方和 ,于是标准22)(iiiy 107.64.2.1 niS离差为7419.807.61)(12Svyknsniii于是 5.%5038.5.649y图 10 y 的预测值及其相应的残差等进而,可以计算 D
6、W 值(参见 图 11),计算公式及结果为 751.041.)91.()3.1( )8370(9)(DW222121 niiii取 , , (显然 ),查表得 , 。05.k080v9.ld29.u显然,DW=0.751 ,可见有序列正相关,预测的结果令人怀疑。94.ld图 11 利用残差计算 DW 值最后给出利用 Excel 快速估计模型的方法: 用鼠标指向图 4 中的数据点列,单击右键,出现如下选择菜单(图 12):8图 12 点击“添加趋势线(R)”,弹出如下选择框(图 13):图 13 在“分析类型”中选择“线性(L)”,然后打开选项单(图 14):9图 14 在选择框中选中“显示公式(E)”和“显示 R 平方值(R)”(如图 14),确定,立即得到回归结果如下(图 15):图 表 标 题y = 1.8129x + 2.3564R2 = 0.978901020304050600 10 20 30灌 溉 面 积 y(千 亩 )线 性 (灌 溉 面 积y(千 亩 )图 15在图 15 中,给出了回归模型和相应的测定系数即拟合优度。