Feature Selection for Classification李军政2017.5.101PPT课件单击此处添加文字内容综述单击此处添加文字内容特征选择流程单击此处添加文字内容几种常用的特征选择算法单击此处添加文字内容总结12342PPT课件综述nWhat从全部特征中选取一个特征子集,使构造出来的模型更好。nWhy在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果:l分析特征、训练模型耗时长l模型复杂、推广能力差l引起维度灾难3PPT课件维度灾难n随着维数的增加,特征空间的体积指数增加,从而导致各方面的成本指数增加n样本数量n存储空间n计算量n如何从中选出有用的特征?如何从中选出有用的特征?4PPT课件单击此处添加文字内容综述单击此处添加文字内容特征选择流程单击此处添加文字内容几种常用的特征选择算法单击此处添加文字内容总结12345PPT课件特征选择流程GeneratorEvaluationStopRuleValidationSubsetYesNoOriginalFeatureSet6PPT课件两个主要步骤n产生过