精选优质文档-倾情为你奉上对于分类数据的分析,最简单也是最广泛使用的是卡方检验,但卡方检验在处理分类数据时,有两个局限:1.卡方检验只能简单描述变量间的相关关系,而无法分析出具体的因果关系或变量间相互作用(效应)大小2.卡方检验通常用于2*2列联表,而对于高维列联表,则无法系统的评价变量间的关系,而对数线性模型则是分析高维列联表的常用方法。基于以上问题,我们除了可以使用Logistic模型之外,还可以使用对数线性模型进行分析。对数线性模型的结构类似于方差分析,思想也和方差分析一样,不同的是方差分析用于连续变量,而对数线性模型用于分类变量。在方差分析中,观测值y的变异由各因素的主效应、各因素之间的交互效应、随机误差三者之和组成。而对于分类变量也可以采用这种方法进行分解,只不过此时的观测值y为频数而不是实际的观测值,最终观测值变异的组成也不是相加关系,而是乘积关系。以两个分类变量、为例:Mij代表第i行第j列的频数i代表变量的主效应j代表变量的主效应()ij代表变量的交互作用ij代表随机误差分类数