1 第6 章 逐步回归分析 多元逐步回归方法的基本思路:自动地从大 量的可供选择的变量中选取最重要的变量,据以 建立回归分析的预测或者解释模型。 变量选取的根据是自变量对因变量作用程度 的大小:保留作用程度大的变量,剔除作用小的 变量。是否选取一个变量,定量判据之一就是相 关系数。假定有m 个自变量,1 个因变量(用y 表示),则全部变量(包括自变量和因变量)之 间的相关系数矩阵可以表作 6.1 基本原理根据相关系数定义一个自变量的“ 贡献” 系数 按照贡献系数的大小决定一个自变量的去留。 式中Pj 表示第j 个自变量对因变量的贡献系数,Rjy 表示第j 个自变量与因变量的相关系数,Rjj 表示相 关系数矩阵对角线上第j 行第j 列元素 (j=1,2,m) 。 第l 步计算的贡献系数表示为 在逐步回归分析过程中,我们不仅要引入 贡献最大的自变量,同时要考虑剔除贡献最小 的因变量。因此,变量的存留与否又涉及到另 一个统计判据F 检验。设定一个显著性水平 ,查F 检验表,找到F 检验的临界值F 。 在第l 步计算中,假如第v个自变量的贡献系 数最大,数值为根据F 检验来判断该自变量是否应该