数据分析方法汇总一,描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、 缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、 正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、 假设检验 1、 参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。 1)U验 使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验 使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本 t检验:推断该样本来自的总体均数与已知的某一总体均数 0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使