.流失模型是典型的学习模型,有几个常用方法可以选决策树、逻辑回归(或者尝试神经网络,不利于应用和解释,也可以试试看)。决策树的特点:适用布尔、分类和连续的变量(对连续变量也会内部转化为分类变量)、结果容易解释、筛选变量快;但决策树不稳定,容易训练过度(在训练时看起来很准确,但应用时预测准确率大打折扣)逻辑回归的特点:逻辑回归的底层思想和多元回归接近,延续了回归算法不温不火的稳定风格,相比回归算法,logistic回归不要求变量有正态分布和等协方差前提,也可以尝试着用哑变量来融入分类变量,使用更方便,但逻辑回归准确率相对较低(所谓成也萧何,败也萧何)。和决策树相比,回归算法稳定性好的多我习惯于:1、使用决策树进行变量范围筛选2、使用逻辑回归进行预测3、个别时候尝试着用因子分析进行变量转载(我试过的模型,有时候有一点点小的提升,和变量共线性特点有关,但不会有超乎意料的收获)构建流失行为的特征内部自有数据 丰富的内部交易明细数据,包括本币活期储蓄波动率,本币活期储蓄月日均余额,电话银行总交易笔数. 可以构建的特征:不同交易的