1、基于数据挖掘的 A股行业轮动电气银行采掘通信农林采掘传媒有色医药家电传媒采掘医药有色机械建筑食品有色非银传媒银行医药传媒家电综合 军工非银计算机轻工银行电子食品电子建材钢铁A股行业轮动1070%1994-1995加息1999-2000加息2004-2006加息2015加息1990-1992降息1995-1998降息2001-2003降息 2007-2008降息美国加息对 A股行业的影响A股行业轮动分析行业轮动内外在驱动力分析宏观经济环境行业 上下游供需行业政策市场资金流动 大数据挖掘关联规则Web网页挖据聚类 自身理论体系尚未成熟?关联规则数据挖据经典案例 :尿布 啤酒Apriori 算法简介
2、银 行 非 银 房地 产T1 强 强T2 强 强 强T3 弱 弱 强T4 强 强 弱T5 强 强 强T6 弱 弱 强T7 强 强 弱T8 强 强 强T9 弱 弱 强T10 强 强 弱T11 弱支持度:Sup (A)=7/10=0.7置信度:Conf(A-B)=6/7=0.86提升度:Lift(A-B)=Conf(A-B)/Sup(B)=0.86/0.6=1.43A:本周期银行强,非银强B:下周期房地产强1.数据处理周频率数据(样本内: 2006-2014,样本外: 2015-2016)申万一级行业分类1.数据处理行业 i在 T时刻强弱定义2.规律筛选1.盈利能力2.风险波动3.逻辑性2.规律筛选规则钝化:半衰期收益处理T:历史收益时间点T0:回撤时间终点TC:半衰周期化工强,钢铁强,有色强 采掘强