1、相关分析与回 归 分析相关分析与回 归 分析 专题(Correlation & regression)相关分析与回 归 分析相关分析(Correlation Analysis)相关分析与回 归 分析一、相关分析的意 义 :研究 问题过 程: 单变 量分析 双 变 量分析 多 变 量分析多 变 量分析与 单变 量分析的 最大不同 :揭示客 观 事物之 间的关 联 性。所以,相关分析的意 义 和目的在于:( 1)在 统计 学中有理 论 与 实 践意 义( 2) 对 相关关系的存在性 给 出判断( 3 ) 对 相关关系的 强 度 给 出度量和分析相关分析与回 归 分析二、相关分析的概念变 量之 间
2、的关系分 为 确定性关系和非确定性关系。确定性关系:当一个 变 量 值 (自 变 量)确定后,另一个 变 量 值 (因 变 量)也就完全确定了,确定性关系往往可以表示成一个 函数 的形式,比如 圆 的面 积 和半径的关系: S=r非确定性关系: 给 定了一个 变 量 值 后,另一个 变 量 值可以在一定范 围 内 变 化,例如家庭的消 费 支出和家庭收入的关系。研究者把 非确定性关系称 为 相关关系 。相关分析与回 归 分析三 .相关分析的特点和 应 用相关关系是普遍存在的,函数关系 仅 是相关关系的特例。1.相关关系的 类 型相关关系多种多 样 , 归纳 起来大致有以下 6种:l 强 正相关
3、关系 ,其特点是一 变 量 X增加, 导 致另一 变量 Y明 显 增加, 说 明 X是影响 Y的主要因素。l 弱正相关关系 ,其特点是一 变 量 X增加, 导 致另一 变量 Y增加,但增加幅度不明 显 。l 强 负 相关关系 ,其特点是 X增加, 导 致 Y明 显 减少, 说明 X是影响 Y的主要因素相关分析与回 归 分析l 弱 负 相关关系 ,其特点是 变 量 X增加, 导 致 Y减少,但减少幅度不明 显 , 说 明 X是 Y的影响因素,但不是唯一因素。l 非 线 性相关关系 ,其特点是 X、 Y之 间 没有明 显 的 线性 关系,却存在着某种非 线 性关系, 说 明 X仍是影响 Y的 因素
4、。l 不相关 ,其特点是 X、 Y不存在相关关系, 说 明 X不是 影响 Y的因素。相关分析与回 归 分析2.相关分析的 应 用( 1)相关分析可以在影响某个 变 量的 诸 多 变 量中判断哪些是 显 著的,哪些是不 显 著的。而且在得到相关分析的 结 果后,可以 用于其他分析 ,如回 归 分析和因子分析。( 2) 相关分析方法已广泛用于心理学、教育学、医学、 经济 学等各学科。它 对试验 数据的 处 理、 经验 公式的建立、管理 标 准的 测 定、自然 现 象和 经济现 象的统计预报 ,都是一种方便而且有效的工具。相关分析与回 归 分析四、相关系数l相关分析的主要目的是研究 变 量之 间 关
5、系的密切程度,以及根据 样 本的 资 料推断 总 体是否 样 关。反映 变 量之 间关系 紧 密程度的指 标 主要是 相关系数 r。 相关系数 r取 值 在-1到 +1之 间 ,当数 值 愈接近 -1或 +1时 , 说 明关系愈 紧 密,接近于 0时 , 说 明关系不 紧 密。相关分析与回 归 分析相关系数的 计 算l 样 本的相关系数一般用 r表示, 总 体的相关系数一般用 p表示。l 对 于不同 类 型的 变 量,相关系数的 计 算公式不同。在相关分析中,常用的相关系数有:Pearson简单 相关系数 : 对 定距 连续变 量的数据 进 行 计算。 如 测 度收入和 储 蓄,身高和体重。Spearman等 级 相关系数 :用于度量定序 变 量 间 的 线 性相关关系。如 军队 教 员 的 军衔 与 职 称。Kendall r相关系数 : 用非参数 检验 方法来度量定序 变 量间 的 线 性相关关系。 计 算基于数据的秩。相关分析与回 归 分析Pearson相关系数 应 用广泛,其 计 算公式及其性 质 如下: