第12章 双变量回归与相关 Linear Regression and Correlation Linear Regression and Correlation Content 1. Linear regression 2. Linear correlation 3. Rank correlation 4. Curve fitting 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X 1 ,Y 1 ), (X 2 ,Y 2 ), , (X n ,Y n ) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本直线回归、直线相关 英国人类学家 F.Galton首次在自然遗传 一书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家 Karl Pearson对上千个家庭的身高 、臂长、拃长(伸开大拇指与中指两端的最大 长度)做了测量,发现: 历史背景: 儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系: 。 也即高个子父代的子代在成年之后的身高 平均来说不是更高,而是稍矮于其父代水