什么是关联规则?关联规则数据挖掘是数据挖掘领域的热点之一。关联规则反映一个对象与其他对象之间的相互依赖性,如果多个对象之间存在一定的关联关系,那么,其中一个对象就能够通过其他对象进行预测。典型问题:a.分析超市中的购物篮数据; b.从海量商业交易记录中发现感兴趣的数据 关联,以帮助商家决策。 例如:商品分类设计、降价经销分析、货架摆 放策略.支持度、置信度、项集、项 关联规则可以采用与分类规则相同的方式产生。由于得到的关联规则数量庞 大,通常需要根据覆盖率(coverage)和准确率(accuracy)进行修剪。 覆盖率:又称为支持度(support),支持度是支持度计数与实例总数的比 值,支持度计数是应用规则后预测正确的实例数量; 准确率:又称为置信度(confidence),表示为支持度计数与应用规则的实例 数量的比值。 由于仅对高覆盖量的关联规则感兴趣,因此关联只寻找能够达到预定的最小覆盖量的属性值对组合,这些组合称为项集(itemset),其中的任一个属性值对称为一个项(item)。例如:套用购物篮分析案例,项就是购物篮中的商品,需要寻找的是购物篮中商品之间的关联。关联分析定义