1、第 14 章 簡單線性迴歸和相關分析 迴歸分析 迴歸分析 (regression analysis) 是以其他變數為基礎預測另一個變數的值。 這 個方法可能是最被廣泛應用的統計程序。 此方法包括推導一個數學方程式或模式,以描述想要預測的變數,稱為 依變數 (dependent variable),以及統計實作人員認為和依變數有關的變數之間的關係。 依變數以 Y 表達,而有關的變數,稱為 獨立變數(independent variables),以 X1, X2, ., Xk 表示 ( 其中 k 是獨立變數的個數 )。 14.2 第 14章 簡單線性迴歸和相關分析 第 400頁 相關分析 假如我們
2、 只 對關係是否 存在 感興趣,我們採用 相關分析 ,一個我們已經介紹過的方法。 在本章中,我們將呈現決定 兩個變數 間的關係,有時候稱為簡單線性迴歸。 描述這些關係的數學方程式也稱做 模式 ,分為兩種類型: 確定性模式 (deterministic model)或 隨機性模式 (probabilistic model)。 14.3 第 14章 簡單線性迴歸和相關分析 第 400.402頁 模式 確定性模式 (deterministic model):是指一個方程式或方程式集容許我們從獨立變數的數值去 決定 依變數的數值。 隨機性模式 (probabilistic model):是一種能將 隨
3、機性 呈現出來的方法,這對現實生活的應用比較實際。 例如,相同大小的所有房屋 (以平方呎計 )是否都以完全相同的售價賣出? 14.4 第 14章 簡單線性迴歸和相關分析 第 402頁 模式 要產生一個隨機模式,我們從一個確定性模式開始,用以 近似 我們想要的關係模式。接著我們再加一個項,用以衡量確定性元素的隨機誤差。 確定性模式: 蓋一棟新房子的成本大約是每平方呎 $100 而且大部分的土地售價約是 $100,000。近似的銷售價格 (y)將是: y = $100,000 + 100x 其中 y = 銷售價格, x 房屋的大小 ( 以平方呎計 )。 14.5 第 14章 簡單線性迴歸和相關分析
4、 第 402頁 第 14章 簡單線性迴歸和相關分析 模式 房屋大小 (依變項 )與房屋售價 (獨立變項 )之間關係的模式如下: 14.6 房屋大小 房屋 售價 大部分 的土地 售價為 $100,000 這個模式中,房屋售價完全 決定於 房屋大小。 模式 然而在現實生活,房屋成本在相同的房屋大小中仍將有所不同: 14.7 房屋大小 房屋 售價 100K$ 相同平方呎,但不同價格點 (如:裝潢的選擇 , 改善隔間 , 土地位置 ) 較低 vs. 較高 的變異性 x 房屋售價 = 100,000 + 100(大小 ) + 第 14章 簡單線性迴歸和相關 誤差變數 我們將使用隨機性模型表示房屋估計可賣
5、的價格: y = 100,000 + 100x + 其中 ( 希臘字母 epsilon) 表示隨機項 又稱 誤差變數(error variable) 實際 銷售價格和依據房屋大小來 估計 的價格之間的差異。甚至當 x 維持不變時, 的值也將會隨著一筆筆不同的銷售而改變。 14.8 第 14章 簡單線性迴歸和相關分析 第 402頁 簡單線性迴歸模型 含一個獨立變數的直線模型稱為 一階線性模型 (first- order linear model) 有時也稱為 簡單線性迴歸模型 (simple linear regression model)。 14.9 誤差變數 依變數 獨立變數 y-軸截距 直線斜率 第 14章 簡單線性迴歸和相關分析 第 402頁 01 yx第 14章 簡單線性迴歸和相關分析 簡單線性迴歸模型 注意係數 0 和 1是 母體參數 ,它們幾乎都是未知的。因此,由資料 估計 而得。 14.10 y x 長 高 =斜率 (=高 /長 ) = y-軸截距 xy 1010