基于数据挖掘技术的客户流失预警模型.doc

上传人:gs****r 文档编号:1809711 上传时间:2019-03-16 格式:DOC 页数:5 大小:105.50KB
下载 相关 举报
基于数据挖掘技术的客户流失预警模型.doc_第1页
第1页 / 共5页
基于数据挖掘技术的客户流失预警模型.doc_第2页
第2页 / 共5页
基于数据挖掘技术的客户流失预警模型.doc_第3页
第3页 / 共5页
基于数据挖掘技术的客户流失预警模型.doc_第4页
第4页 / 共5页
基于数据挖掘技术的客户流失预警模型.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、1基于数据挖掘技术的客户流失预警模型【摘要】结合客户细分的思想,提出了一种基于慢启动的频繁模式挖掘算法,并基于该算法提出了一种新的电信企业客户流失预警模型,湖南某大型电信企业基于该客户流失预警,在其一个地市分公司进行了客户维系与挽留二期工程的实施试点,试点结果表明,提出的客户流失预警模型具有良好的预警功能。 【关键词】客户流失 客户维系与挽留 预警模型 电信企业 一、引言 随着电信企业之间的竞争加剧,电信运营商不断推出新的套餐和新的业务,希望能够争取到更多的市场份额。但同时也在很大程度上加大了客户的不稳定性,使得客户离网现象频繁发生。研究表明,一个公司如果将其顾客流失率降低 5%,利润就能增加

2、 25%至 85%。由此可见,大量的客户流失让运营商蒙受巨大损失。 结合客户细分的思想,本文提出了一种新的电信企业客户流失预警模型。 二、相关定义 (一)客户流失的定义与分类 客户流失只指客户因为某些原因与电信运营商解除服务合同的行为。客户解除服务合同的原因有多种多样,但归纳起来主要有如下几类:自然流失:是指客户因为企业不能给提供所期望的产品和服务(如不能提2供宽带上网功能等)或者某些客观因素(如到异地工作或下岗等)而选择离网所导致的客户流失;恶意流失:是指客户因为个人私欲因素(如恶意欠费后为了逃避缴费等)而选择离网所导致的客户流失;竞争流失:是指客户因为企业竞争对手因素(如竞争对手提供了更优

3、惠的资费政策)而选择离网所导致的客户流失;失望流失:是指客户因为企业服务质量因素(如网络覆盖或服务态度等)而选择离网所导致的客户流失。 三、客户流失预警模型的构建 (一)客户细分 客户细分有多种方法,如依据客户的性别、年龄、支付能力、信用度等均可对客户进行分类。在客户流失预警模型中,我们依据客户对企业的贡献大小进行分类,主要分为以下三种:高价值客户、普通价值客户、低价值客户。假定企业每月均摊到每个客户的日常维护成本为 C,则各类客户定义如下:高价值客户:是指月均话费大于等于 kC 的客户;普通价值客户:是指月均话费介于 1C 到 kC 之间的客户;低价值客户:是指月均话费小于 1C 的客户。

4、(二)模型数据属性分析 影响客户流失预警判定的数据属性通常多种多样,这些属性之间存在着或强或弱的相关关系,以全部属性作为细分标准显然过于复杂,并且也难于在实时环境中识别和追溯目标;而任意选取其中某个或某几个属性又会影响对客户流失行为的解释力度,降低预警效果。因此,较为有效的方法是从这些相互关联的影响属性中,通过约简算法抽取对客户流失行为起关键影响的属性;或者对这些属性进行抽取整合,重新构造3少数关键指标,这些指标是原有影响属性(或称因子)的线性组合,能综合原有影响属性的最大信息,相互之间的相关性较小。 (三)流失客户的特征挖掘 基于慢启动的频繁模式挖掘算法。在传统的频繁模式挖掘研究中,项(It

5、em)是一个文字,在交易数据库中,它可以代表商品,在分类时,它可以代表属性的值。设 I=Il,I2,.,Im为项的全集,D=Tl,T2,.,Tn为事务数据库,其中,每个事务Ti(i1,2,n)包含事务 ID 号 TID 和一个 I 中项的子集Itemset。 定义一:I 的子集 XI 称作项集或模式。项集 X 的支持度计数supes_count(X)为 D 中包含项集 X 的事务数,X 的支持度 sup-port(X)=supes_count(X)/|D|,其中|D|是 D 中事务的个数。 定义二:对于预先指定的最小支持度阀值 ,如果项集(模式)X的支持度满足:support(X),则称项集(

6、模式)X 是频繁的。 定义三(频繁数):频繁数是指在事务数据 D 中,数据项的支持度大于最小支持度阈值的所有数据项个数的总和,记为 R。定义 4(最高频繁项次数):最高频繁项次数是指在所有的频繁模式中项数最高的频繁项的项的个数值,记为 M。 定义判决函数 f 为频繁项次数和频繁数的如下线性组合:f=R+M,其中, 和 为权重因子,满足 +=1。 基于上述公式,可给出基于慢启动的频繁模式挖掘算法的实现步骤如下: 4(1)最小支持度阈值指数递增过程)Step1:取一个较小的 值作为初始最小支持度阈值,根据式(1)计算判决函数 f 的值f1。Stepi:取 2i-1 作为最小支持度阈值,计算判决函数

7、值 fi,若 fifi-1,转入步骤 i+1。Stepi+1:取 2i 作为最小支持度阈值,计算判决函数值 fi+1,若 fi+1fi,转入步骤 i+2。 (2)最小支持度阈值线性递增过程)Stepi+2:取 2i-1+ 作为最小支持度阈值,计算判决函数值 fi+2,若 fi+2fi,转入步骤i+3。 Stepi+1+k:取 2i-1+(k-1) 作为最小支持度阈值,计算判决函数值 fi+l+k,若 fi+l+kfi+k,结束。这样最小支持度阈值线性递增过程结束,得到最小的判决函数值 fi+k,以及最终最小支持度阈值2i+(k-1)。 客户流失预警模型的建模过程主要包括如下几个步骤: 数据抽取

8、:首先,从业务系统中抽取离;网客户数据作为训练数据集合;对训练数据集合中的数据进行属性约简,并将约简后的属性集合作为模型的训练输入数据集合;采用基于慢启动的频繁模式挖掘算法对模型的训练输入数据集合进行频繁模式挖掘,并基于挖掘得到的流失客户特征构建分类器;输入新的客户数据作为测试数据集合;对测试数据集合中的数据进行属性约简,并将约简后的属性集合作为模型的测试输入数据集合;采用基于慢启动的频繁模式挖掘算法对模型的测试输入数据集合中的每个用户对应的数据集合进行频繁模式挖掘;将挖掘得到的新用户的特征与分类器中的特征集合进行模式匹配,判定5该用户是否会具有离网倾向。将有离网倾向的客户集反馈给客户维系与挽

9、留系统,为客户服务部门开展客户维系与挽留工作提供决策参考。 四、结论 本文实现了一个分组模糊神经网络,具有较好的逼近能力和泛化能力,同时也在一定程度上减少了训练时间。本文作者创新点:提出了一种用于模糊神经网络函数逼近的新方法,将分组的思想与模糊神经网络相结合应用于函数的逼近。 参考文献: 1何玉彬,李新忠.神经网络控制技术及其应用M.北京:科学出版社,2000, (12). 2韩峻峰,李玉惠等.模糊控制技术M.重庆:重庆大学出版,2003, (10). 3高隽.人工神经网络原理及其仿真实例M.北京:机械工业出版社,2007, (05). 4胡德文,王正志等.神经网络自适应控制M.长沙:国防科技大学出版社,2005, (09). 4王士同.神经模糊系统及其应用M.北京:北京航空航天大学出版社,2008, (07). 5伍世虔,徐军.动态模糊神经网络M.北京:清华大学出版社,2007, (06). 6王立新著,王迎军译.模糊系统与模糊控制教程M.北京:清华大学出版社,2009, (08).

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 学科论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。