1、对数线性模型对数线性模型问题?疾病性 别症状等 级 观测计 数0 0 1 22 73 91 1 52 83 101 0 1 252 153 71 1 202 103 5某项研究观察了 123名对象,其中疾病( 1:患病; 0:未患病),性别( 1:男性; 0:女性),疾病的症状等级( 1:低; 2:中;3:高)。其数据统计见下表( 3 X 2 X 2 三维列联表 )。研究列联表的一个主要目的:看看这些变量是否具有相关性。如,症状等级与疾病间是否具有相关。以上分析的结果:1、疾病与症状等级间有相关性;2、疾病与性别间无相关性。分析所用到的统计量:n 对数线性模型是用于离散型数据或整理成列联表格式
2、的计数资料的统计分析工具。n 在对数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。n 对于列联表资料,通常作 2 检验,但 2 检验无法系统地评价变量间的联系,也无法估计变量间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。二维表的对数线性模型假定不同的行代表第一个变量的不同水平,而不同列代表第二个变量的不同水平。用 Mij代表二维表第 i行,第 j列的频数。如果能用 来表示频数与行变量、列变量间的定量关系。则这个公式就称为对数线性模型。为行变量的第 i个水平对 的影响;为列变量的第 i个水平对 的影响;代表随机误差。这 两影响成为主效应( main effect)利用样本数据来拟合这个模型,可以 和 得到的 “ 估计 ” 。 有了估计的参数,就可以预测任何 i, j水平组合下的频数 Mij了。注意:1、估计之所以打引号是因为一个变量的各个水平的影响是相对的。2、只有事先固定一个参数值(如 )或者设定类似于的约束,才能估计出各个参数值。3、没有约束,这些参数是估计不出来的。二维表饱和对数模型三维表对数模型三 维表饱和对数模型