精选优质文档-倾情为你奉上1.属性的数据性质包括:相异性,有序性,可和差性和可乘除性四个性质2.根据属性所具有的数值性质不同可将属性分为定性属性和定量属性3.根据属性值得个数不同可将属性分为离散型和连续型4.根据属性的数值性质可将属性分为四种属性类型标称,序数,区间,比率5.非对称的属性是指自由出行属性非零值才是重要的属性6.数据集的一般特性包括维度,稀疏性,分辨率7.数据集的维度是数据集中的属性数目8.稀疏数据集是指该数据集的数据对象具有的属性数目9.记录数据分为事务数据,数据矩阵,稀疏数据矩阵三大类11.基于图形的数据分为带有对象之间联系的数据,具有图形对象的数据12.常见的有序数据有时间数据,序列数据,空间数据,时间序列数据13.空间数据的一个重要特点是空间自相关性,即物理上靠近的对象趋向于在其他方面也相似14.抽样方法有简单随机抽样,分层抽样,渐进抽样15.抽样偏倚是指样本包含的不同类型的对象与它们在总体中的出现情况下不成比例16.特征选择过程可以看作由四部分组成:于集评估度量,控制新的特征子集产生的搜索策略,