1、聚类方法 (Clustering)统研会学术交流篇之 演讲人: 上海财经大学统计学系 吕江平主讲内容n 聚类方法原理介绍n 案例分析( SAS/Enterprise Miner)n 推荐参考书目什么是聚类n 聚类( Clustering)就是将数据分组成为多个类( Cluster)。在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大。什么是聚类n 早在孩提时代,人就通过不断改进下意识中的聚类模式来学会如何区分猫和狗,动物和植物聚类分析无处不在n 谁经常光顾商店,谁买什么东西,买多少?n 按忠诚卡记录的光临次数、光临时间、性别、年龄、职业、购物种类、金额等变量分类n 这样商店可以 .
2、n 识别顾客购买模式(如喜欢一大早来买酸奶和鲜肉,习惯周末时一次性大采购)n 刻画不同的客户群的特征(用变量来刻画,就象刻画猫和狗的特征一样)什么情况下需要聚类n 为什么这样分类?n 因为每一个类别里面的人消费方式都不一样,需要针对不同的人群,制定不同的关系管理方式,以提高客户对公司商业活动的相应率。聚类分析无处不在n 挖掘有价值的客户,并制定相应的促销策略:n 如,对经常购买酸奶的客户n 对累计消费达到 12个月的老客户n 针对潜在客户派发广告,比在大街上乱发传单命中率更高,成本更低!聚类分析无处不在n 谁是银行信用卡的黄金客户?n 利用储蓄额、刷卡消费金额、诚信度等变量对客户分类,找出 “
3、黄金客户 ”!n 这样银行可以 n 制定更吸引的服务,留住客户!比如:n 一定额度和期限的免息透资服务!n 百盛的贵宾打折卡!n 在他或她生日的时候送上一个小蛋糕!聚类的应用领域n 经济领域:n 帮助市场分析人员从客户数据库中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征。n 谁喜欢打国际长途,在什么时间,打到那里?n 对住宅区进行聚类,确定自动提款机 ATM的安放位置n 股票市场板块分析,找出最具活力的板块龙头股n 企业信用等级分类n n 生物学领域n 推导植物和动物的分类;n 对基因分类,获得对种群的认识n 数据挖掘领域n 作为其他数学算法的预处理步骤,获得数据分布状况,集中对特定的类做进一步的研究有贡献的研究领域n 数据挖掘n 聚类可伸缩性、各种 各种复杂形状类 的识别,高维聚类等n 统计学n 主要集中在基于 距离 的聚类分析,发现 球状类n 机器学习n 无指导学习(聚类不依赖预先定义的类,不等同于分类)n 空间数据技术n 生物学n 市场营销学