K―means 算法在物流快递企业客户细分中的应用.doc

上传人:gs****r 文档编号:1892478 上传时间:2019-03-20 格式:DOC 页数:9 大小:115.50KB
下载 相关 举报
K―means 算法在物流快递企业客户细分中的应用.doc_第1页
第1页 / 共9页
K―means 算法在物流快递企业客户细分中的应用.doc_第2页
第2页 / 共9页
K―means 算法在物流快递企业客户细分中的应用.doc_第3页
第3页 / 共9页
K―means 算法在物流快递企业客户细分中的应用.doc_第4页
第4页 / 共9页
K―means 算法在物流快递企业客户细分中的应用.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、1Kmeans 算法在物流快递企业客户细分中的应用摘 要面对日益激烈的物流市场竞争和信息技术的迅猛发展,物流快递企业必须建立以“客户为中心”的服务模式,针对不同的客户需求制定对应的营销策略和价格策略,并进行分类管理。数据挖掘中的 K-means 聚类算法能对大型数据集进行高效分类,改进的 K-means 算法能够应用于复杂的物流客户关系管理,对客户进行准确和全面的分类管理。 关键词物流 CRM;客户分类;数据挖掘;K-means 聚类分析算法 DOI10.13939/ki.zgsc.2016.36.033 1 引 言 数据挖掘(Data Mining)是从大量不完全的、模糊有噪声的、随机的实际

2、应用数据中,提取隐含在其中的、潜在有用的、而且事先不不为人知的信息和知识的过程。1数据挖掘研究伴随着计算机应用技术的发展出现多种可供选择的方法,聚类作为最基本的数据挖掘方法,不仅可以独立地应用,还可以应用于其他数据挖掘方法的前期处理工作。当前运用最为广泛、最成熟的聚类方法就是均值聚类算法。K-means 算法能有效地处理大规模和高维的数据集合。改进后的 K-means 算法通过处理复杂的物流客户管理中的非数值数据获取更加准确和全面的客户分类。 2 物流快递客户关系管理现状分析 随着我国电子商务和物流快递业的快速发展,国内物流快递市场的运行环境发生了较大的变化,目前国内物流正面对一个全面开放的、

3、国2际国内全方位充分竞争的市场环境。物流快递企业意识到在充分竞争的商业时代,企业必须通过占有更多优势资源,拥有大量有效客户,提供最佳客户服务,提升原有客户体验,进而增强客户的忠诚度和满意度。企业必须通过实现客户价值来扩大自身的盈利,通过信息化管理来替代原有的传统管理手段。 因此,物流快递企业需要快速获取尽可能详细的客户需求信息,通过数据挖掘和分析来认知客户的行为和偏好,进而分析客户消费模式及习惯的变化的规律,提升自身的市场洞察能力。如何通过企业和客户的信息交流平台,提供个性化的物流方案,有效的管理客户,深层分析大量客户信息的数据仓库获取提高企业市场竞争力的有效信息。有效数据挖掘技术就是从海量数

4、据中挖掘出对企业有价值的潜在信息,从而支持客户关系分类管理的科学实现,满足现代充分竞争时代的企业需求与社会挑战。 3 物流快递客户关系管理 客户关系管理是一种改善企业与客户之间关系的新型管理方法,企业通过的交流和沟通理解客户,进而影响客户行为,最终长期获取客户、保留忠诚客户和创造更多利润。 客户细分是客户关系管理的重要组成部分,是企业客户关系管理的重要工具和关键环节。客户管理学中的二八法则表明,20%的客户创造企业 80%的利润,即相对较多利润是由相对较少的大客户创造的。因此,企业要坚持与高价值客户的维持良好的业务关系,同时注意发掘潜在价值的客户,合理使用自有资源,提供有差别的个性服务,才能在

5、激烈的市3场竞争中立于不败之地。 物流快递企业凭借自己独特的客户特性与市场特性为社会提供快递业务服务。物流快递企业有着多元的客户群体,从政府机关、企业集团和学校宾馆,直到普通个人都是其客户;而且物流快递企业客户的需求具有多样性,表现出来特征是不平衡性及随机性,从个人到团体,从农村到城市,从家庭到企业对物流快递服务有着多层次的个性需求。 4 数据挖掘技术 客户关系管理的数据挖掘技术是指从大量的有关客户的数 据中挖掘出隐含的、先前未知的、对企业决策有潜在价值的数据的方法。常用的数据挖掘方法有关联分析、序列模式分析、分类分析、聚类分析、孤立点分析等多种方法。聚类分析可以从给定的数据集中获取数据对象之

6、间所存在的有价值关联要素。在商业上通过聚类将顾客信息分组,描述顾客的购买模式,找出顾客的典型特征,制定个性化营销方案。 5 K-means 聚类分析算法在快递 CRM 中进行客户细分的应用 5.1 K-means 聚类算法 K-means 作为最常用的聚类算法,能有效地处理大规模和高维的数据集合,把大型数据集进行高效据分组,并根据一定的测量标准,从中找出不同组数据的相似性,进行聚类。 K-means 算法的最大优点效率较高,对例外数据非常敏感;缺点是不能处理分类数据,只能处理数值型数据,不能处理非凸面形状的聚类。 K-means 算法接受输入量 k 后将 n 个数据对象划分为 k 个聚类,根据

7、点到质心的距离把相似度较高的对象归入同一聚类中,相似度较小的对4象归为不同聚类中。然后利用各聚类中对象的均值所获得一个聚类中心来计算聚类相似度。 5.2 K-means 算法的处理流程 首先,从 c 个数据对象任意选择 k 个对象组成初始聚类中心。 其次,计算每个聚类对象的均值与每个对象的距离;并根据最小距离重新划分相应对象。 最后,重新计算有变化的每个聚类的均值。 循环以上两步,直到每个聚类不再发生变化。 5.3 K-means 算法的改进 K-means 算法只能处理数值型数据,而不能处理分类属性型数据。例如表示客户的属性有:名称、性质、住址等属性。K-means 算法改进后就能很好地处理

8、分类属性型数据。K-means 算法中的距离用相异度来替代,相异度的大小表示距离大小。一个样本和一个聚类中心的相异度用它们各个属性不相同的个数来表示,并用不相同个数的总和来表示某个样本到某个聚类中心的相异度。 5.4 算法的 C#实现 public class Kmeans doubleinPut;/数据 int k;/类别数 int Num;/文件数 int sub;/特征值数 intgroupNum ;/各组数目 public Kmeans(double,input) 5 inPut=input; Num=input.GetLength(0) ; sub=input.GetLength(1

9、) ; k=(int)Math.Sqrt(Num)+1; groupNum=new intk; public int,GetProcess() double,tmpCenter=new doublek,sub; for(int i=0; i tmpIn) tmpDis=tmpIn; index=j; int groupKnum=groupNumindex; resultPindex,groupKnum=i+1; groupNumindex+; #endregion #region /保存质心 for(int i=0; i 0) for(int j=0; j sub; j+) 7 double

10、tmp=0.0; for(int m=0; m kNum; m+) int groupIndex=resultPi,m-1; tmp+=inPutgroupIndex,j; tmpCenteri,j=tmp / kNum; #endregion #region /判断质心是否变化 bool judge=true; for(int i=0; i k; i+) for(int j=0; j sub; j+) judge=judge &(preCenteri,j=tmpCenteri,j) ; if(judge) break; #endregion return resultP; 6 测试数据及运行

11、结果分析 某物流快递公司的客户信息数据库的采集数据量为 126500。实验的硬件环境:PC 计算机,CPU 为 i5-2410M 2.30GHz,内存为 4G;软件环境:操作系统为 Windows 7,编程环境 2.0 c#。 运行结果: K-means 算法改进后的运行结果 K-means 算法改进后对客户的现有价值和潜在价值进行聚类分析,根据对客户进行分类制定相应的营销政策。实验结果表明,K-means 算法改进后对客户分类进行高效处理,解决物流快递企业客户分类的难题。 我们通过数据分析最终把客户分为 8 类,分别为:企业集团客户、普通企业客户、电商企业客户、家庭客户、普通物流客户、流动

12、型物流8客户、稳定型物流客户、潜在物流客户。分类的同时,我们可以得到客户的分组,以及每组的客户选择对用的产品价格和服务,从而为物流快递企业定制个性化服务、实现客户价值、设定合适价格和实行深度营销。当然研究也有以下局限性: 样本量太小。由于数据来源问题,样本量的选取不足,没有很多供研究的样本,进而具备更大的研究推广价值。 研究连续多期的数据,预测客户未来的需求,也是客户流失管理所关心的内容之一。 综合分析客户的背景资料结合现实进行分析会对企业的客户管理指导意义更大。 综上所述,K-means 算法改进后相对有效应用于物流客户聚类分组,能有效地指导各类行业中关于客户数据的聚类分组,建议在今后的研究

13、中能够通过对更加完备的数据的分析来进一步完善该研究方法。 参考文献: 1A.Feelders,H.Daniels,M.Holsheimer.Methodological and Practicalaspects of Data MiningJ.Information & Management,2000:271-281. 2Kumar P,Krishna PR,Bapi RS,De SK.Rough Clustering of Sequential DataJ.Data & Knowledge Engineering,2007,3(2):183-199. 3Hand D,Mannila H,Sm

14、yth P.数据挖掘原理M.张银奎,廖丽,9宋俊,等译.北京:机械工业出版社,2003. 4Michael J,Berry A,Gordon S.Linoff.数据挖掘客户关系治理的科学与艺术M.袁卫,译.北京:中国财政经济出版社,2004. 5卢海燕.将数据挖掘技术应用在客户关系管理中J.商场现代化,2008(11). 6左国才,杨金民.K-means 算法在电信 CRM 客户分类中的应用J.计算机系统应用,2010(2). 7王昆.一种基于 Bayesian CBR 的推荐系统研究D.石家庄:河北师范大学,2011. 8叶勇.基于危险理论的 WSN 入侵检测技术的研究D.衡阳:南华大学,2012. 9陈亮.图书智能检索系统中的数据挖掘技术研究与应用D.哈尔滨:哈尔滨工程大学,2012.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 学科论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。