二分类模型性能评价(R语言,logistic回归,ROC曲线,lift曲线,lorenz曲线)解决分类问题有多种思路,包括应用支持向量机、决策树等算法。还有一种较常规的做法是采用广义线性回归中的logistic回归或probit回归。广义线性回归是探索“响应变量的期望”与“自变量”的关系,以实现对非线性关系的某种拟合。这里面涉及到一个“连接函数”和一个“误差函数”,“响应变量的期望”经过连接函数作用后,与“自变量”存在线性关系。选取不同的“连接函数”与“误差函数”可以构造不同的广义回归模型。当误差函数取“二项分布”而连接函数取“logit函数”时,就是常见的“logistic回归模型”,在0-1响应的问题中得到了大量的应用。logistic回归的公式可以表示为:二pxp(几+0R+乞兀)1+exp(几+氏X、+BpXJ其中p是响应变量取1的概率,在0-1变量的情形中,这个概率就等于响应变量的期望。这个公式也可以写成:bgit(P)=In(占2仇+禺尤+乞乞可以看出logistic回归是对0-1响应变量的期望做logit变换,然后与自变