多变量描述统计分析交叉表分析法 一、交叉表分析法的概念交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。当交叉表只涉及两个定类变量时,交叉表又叫做相依表。交叉列联表分析易于理解,便于解释,操作简单却可以解释比较复杂的现象,因而在市场调查中应用非常广泛。频数分布一次描述一个变量,交叉表可同时描述两个或更多变量。交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。下面是一个描述交叉表法应用的例子。 某保险公司对影响保户开车事故率的因素进行调研,并对各种因素进行了交叉表分析。表1 驾驶员的事故率类 别比率,%无事故61至少有一次事故39样本总数,人17800 从初始表1中可以看出,有61%的保险户在开车过程中从未出现过事故。 然后,在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。这样就出现了二维交叉表2。表2 男女驾驶员的事故率类 别男,%女