SPSS 16 实用教程逻辑回归分析在前面学到的回归模型中,我们处理的因变量都是数值型区间变量,建立的模型描述的是因变量的期望与自变量之间的线性关系。线性回归模型:然而,在许多实际问题中,我们需要研究的响应变量不是区间变量而是顺序变量或名义变量这样的属性变量。7.8 逻辑回归分析7.8.1 统计学上的定义和计算公式比如在致癌因素的研究中,我们收集了若干人的健康记录,包括年龄、性别、抽烟史、日常饮食以及家庭病史等变量的数据。响应变量在这里是一个两点(0-1)分布变量,Y=1(一个人得了癌症),Y=0(没得癌症)。如果我们按照(1)建立一般线性模型:因为Y只能取0或1,而 的取值是连续的。显然不能用 来预测因变量 Y 。我们注意到,对于0-1型变量, E(Y)=P(Y=1)=p因而,我们似乎可以用 来预测Y=1的概率,即:问题1. Y=1的概率与自变量之间的关系到底是不是线性的?(答案是否定的)例如:我们分析一个人是否买车与其年收入的关系。对于年薪5000元、5万元、50万元三个人,让他们的年薪分别增加5000元对于其买车的可能性影响是不一样的。概率与自变量之间的关系图形往往是一个S型曲线