关联规则挖掘实验【实验原理】关联规则挖掘的目的是寻找数据之间有趣的关联或联系。回顾一下关联规则挖掘中最经典的例子一一啤酒与尿布的关联。沃尔玛通过对原始交易数据的分析,发现跟尿布一起购买最多的商品竟是啤酒!调查显示,美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。对于隐藏在啤酒和尿布这类表面上风马牛不相及的商品背后的关联,如果不通过数据挖掘的技术,是没有办法靠拍脑袋的办法想出来的。RapidMiner是世界领先的数据挖掘解决方案,它以工作流的方式支持各种类型的数据挖掘任务。耶鲁大学已将RapidMiner成功地应用在许多不同的应用领域,包括文本挖掘,多媒体挖掘,功能设计,数据流挖掘,集成开发的方法和分布式数据挖掘。本实验将根据一组人的经济统计数据,试图发现不同特征间的关联。原始数据如下表所示,列出了三个人的特征:是否有车、是否住宿舍公寓、是否住别墅、是否是穷人、是否是中产阶级、是否是富人。本实验希望从这些原始数据中发现这些不同特征间的关联规则,例如“穷人是否一定不住别墅”、“富人是否一定有车”等。图3.2-1实验使