1、 clementine 神经网路应用-我该选择哪些产品做促销活动 - 数据挖掘2010-06-30版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http:/analyst- P,我该选哪些产品做促销,才能使销量最大化?当然你完全可以说东西卖得好与不好管我什么事,那是采购和市场该管的。但作为有着高度职业责任心和团队合作精神的你和我来说,这点互助精神还是有的。我将从数据挖掘角度出发,阐述促销产品选型的一般思路,希望各位多多指点。哪些产品适合做促销,肯定是那些促销后销量增加最明显的产品。基于这样一个思路,根据以往促销活动的历史数据,字段大致如下:产品 ID,品类,成本,推广促销费用
2、,促销前销售额,促销后销售额等,建立预测模型来预测目前产品的促销效果。(1、字段类型根据业务不同也相应会有所不同 2、如果以前没做过促销,这个思路也就不能继续下去,只能根据产品经理自己的经验了)。预测模型过程如下:以促销前后的销售变化比率为输出变量(因变量),影响其变化的因素(产品类别、成本、促销费、促销前销售额等)为输入变量(自变量),采用神经网络或回归分析(自变量都为数值型时)算法。本例采用神经网络(自变量中有名义变量),具体操作过程如下:数据整理基础数据文件 GOODS1N(clementin 自带)Class 产品类别 cost 成本 promotion 促销费 before 促销前销
3、售额 afer 促销后销售额Class cost promotion before afterConfection 23.99 1467 114957 122762Drink 79.29 1745 123378 137097Luxury 81.99 1426 135246 141172Confection 74.18 1098 231389 244456Confection 90.09 1968 235648 261940Meat 69.85 1486 148885 156232Meat 100.15 1248 123760 128441Luxury 21.01 1364 251072 268134Luxury 87.32 1585 287043 310857。增加一个 increase 字段,即输出字段,产品促销后的销量增加比例。数据类型采用神经网络算法建模这块完全可以按照系统默认,为防止样本过度训练,系统默认样本比例为 50%。结果如下:变量重要性模型分析模型预测应用然后根据模型,对现有产品数据进行预测,根绝预测的销量增长比例倒序排列,排在前面的产品促销效果较好。所谓三分数据,七分业务,得出这样一个结果,还要业务部门多沟通,根据具体的业务情况选择促销产品。