5.1 基本概念5.2 类别可分性测度5.3 基于类内散布矩阵的单类模式特征提取5.4 基于K-L 变换的多类模式特征提取第5章 特征选择与特征提取5.1 基本概念 由于测量上可实现性的限制或经济上的考虑,所获得的测量值为数不多。 能获得的性质测量值很多。如果全部直接作为分类特征,耗费机时,且分类效果不一定好。有人称之为“特征维数灾难”。 特征选择和提取的目的:经过选择或变换,组成识别特征,尽可能保留分类信息,在保证一定分类精度的前提下,减少特征维数,使分类器的工作即快又准确。1两种数据测量情况(1) 具有很大的识别信息量。即应具有很好的可分性。(2) 具有可靠性。模棱两可、似是而非、时是时非等不易判别 的特征应丢掉。(3) 尽可能强的独立性。重复的、相关性强的特征只选一个。(4) 数量尽量少,同时损失的信息尽量小。2对特征的要求3. 特征选择和特征提取的异同(1)特征选择:从L 个度量 值集合 中按一定准 则选出供分类用的子集,作为降维(m 维,m L )的分类 特征。(2)特征提取:使一组度量值 通过某种变换 产生新的m 个特征 ,作为降维的分类特征, 其中 。(c) 是具有分类能