5.1 基本概念 5.2 类别可分性测度 5.3 基于类内散布矩阵的单类模式特征提取 5.4 基于K-L 变换的多类模式特征提取 第5章 特征选择与特征提取5.1 基本概念 由于测量上可实现性的限制或经济上的考虑,所获得的测量 值为数不多。 能获得的性质测量值很多。如果全部直接作为分类特征,耗 费机时,且分类效果不一定好。有人称之为“特征维数灾难” 。 特征选择和提取的目的:经过选择或变换,组成识别特征, 尽可能保留分类信息,在保证一定分类精度的前提下,减少特征 维数,使分类器的工作即快又准确。 1两种数据测量情况(1) 具有很大的识别信息量。即应具有很好的可分性。 (2) 具有可靠性。模棱两可、似是而非、时是时非等不易判别 的特征应丢掉。 (3) 尽可能强的独立性。重复的、相关性强的特征只选一个。 (4) 数量尽量少,同时损失的信息尽量小。 2对特征的要求 3. 特征选择和特征提取的异同 (1)特征选择 :从L 个度量值 集合 中按一定准 则选出供分类用的子集,作为降维(m 维,m L )的分类 特征。 (2)特征提取:使一组度量值 通过某种变换 产生新的m 个特征 ,作为降维的分类