1、第二章 多元线性回归( multiple linear regression)第一节 相关和回归第二节 一元线性回归模型第三节 多元线性回归模型第四节 方程的解释能力第五节 回归方程的检验和回归系数的推断统计第六节 多重共线性及其解决方案第七节 虚拟变量的应用第八节 计算机应用第九节 研究实例参见郭志刚主编, 社会统计分析方法 SPSS 软件应用 第二章,中国人民大学出版社 1999第一节 相关和回归n 一、相关统计量n 用一个数值表示两个变量间的相关程度(无单位度量)( -1+1)解读n X与 y的相关系数为 0.6, x与 z的相关系数为0.3n 答案:n 只能说明 x与 y相关程度高于
2、x与 z的相关程度,但不能说前者是后者的两倍n二、计算相关的思路n 定距: 数量上的 “共变 ”n 定类、定序: “连同发生 ” 隐含根据一个变量去预测或估计另一个变量的意思n 人们正是根据 预测的准确程度 来界定定类或定序变量之间的关系的 消减误差比例n三、相关测量逻辑展示n (一) Lambda相关测量法n 基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测准则,可以减少多少误差n 公式:练习:根据下表数据计算 lambda志愿 性 别男 女 总 数快 乐 家庭 10 30 40理想工作 40 10 50增广 见闻 10 0 10总 数 60 40 100思考并运算:如果数据有如下变化,lambda值会发生什么变化呢?志愿 性 别男 女 总 数快 乐 家庭 10 10 20理想工作 40 30 70增广 见闻 10 0 10总 数 60 40 100n 存在的问题:n 1、 Lambda系数以众值为预测准则,不理会众值以外的次数分布,对数据利用率低。n 2、因为上述计算方式, 如果全部众值集中在条件次数表的同一列或同一行中,则Lambda系数会等于 0,相关失去意义