1、第四章 相關分析 (correlation analysis),4-1相關分析4-2Pearson 積差相關係數4-3相關係數4-4點二系列相關4-5Spearman 等級相關4-6淨相關4-7部份相關,4-1 相關分析,相關分析探討的是兩個變數之間的關聯程度 (degree of association), 若是兩個變數是名目變數, 請使用X2卡方檢定, 這裏使用的是區間, 比率或順序的計量變數,在統計上, 使用的是兩個變數關連程度的統計量, 例如, 常用的Pearson 相關分析的Pearson相關係數, 就是用來表示兩個變數之間的關連程度相關係數(correlation coeffici
2、ent) 是本章最重要的判讀依據, 有大小和方向兩種特性, 我們分別介紹如下:相關係數的大小(magnitude):表示兩個變數之間, 相關程度的強弱, 相關係數的絶對值愈大, 代表相關程度愈強, 相反的, 相關係數的絶對值愈小, 代表相關程度愈弱, 若是相關係數的值為0, 代表零相關, 也就是没有相關。相關係數的方向(direction):表示兩個變數之間, 是正相關, 還是負相關, 相關係數是正值, 代表兩個變數中的一個變數增加時, 另一個變數也會增加, 相關係數是負值, 代表兩個變數中的一個變數增加時, 另一個變數就會減少, 反之亦然。一般常用的相關分析有Pearson積差相關係數, 相
3、關係數, 點二系列相關, Spearman等級相關, 淨相關, 和部份相關, (複相關大多都使用迴歸,請參考迴歸分析), 相關的內容我們分別介紹如後。,4-2 Pearson積差相關係數,Pearson積差相關係數(Product-Moment Correlation Coefficient) 是適用於2個變數都是連續變數, 可以是interval scale (區間變數)或ratio scale(比率變數), 相關係數的計算如下:,rXY樣本的相關係數是一次方的函數, 可以用散佈圖來查看。 rXY為正相關的圖如下: rXY為負相關的圖如下:,rXY的圖示,在判定rXY值時, 一般常用三級制,
4、 絶對值大於等於0.8時, 為高度相關, 大於等於0.4時, 為中度相關, 小於0.4時, 為低度相關研究假設如下:虛無假設 H0:= 0, 兩個變數之間無相關對立假設 H1:0, 兩個變數之間有相關範例:Trust有用性(使用資安產品可以加速工作時間)及Risk易用性(資安產品很容易使用)之間是否有相關存在。(題項:Trust、Risk)假設:,rXY值的判別,開啟範例 correlation.sav, 出現圖如下:1. 開啟範例 correlation.sav 2. 按 Analyze Correlate Bivariate 3. 在 Bivariate Correlations 視窗,選
5、取 信任 Trust和風險 Risk 變數4. 選取 信任 Trust和風險 Risk 變數,按 ,選取 Pearson (預設) 5. 按 OK,出現報表結果,如下圖:,操作步驟如下:,Correlations Correlations* Correlation is significant at the 0.01 level (2-tailed).說明:p-value= .001 .05,因此拒絕,表示 Trust 及 Risk 間具有顯著相關,相關係數為0.278,屬低度相關。,報表分析如下:,相關係數(Phi correlation coefficient) 適用於二個變數都是二分名義
6、變數 (nominal-dichotomous variable), 也就是都是二分類的變數。例如:性別, 民主和共產國家等等。相關係數值為卡方X2的另一種轉換值, 由於X2容易受到, 樣本數大小的影響, 於是將X2轉換成0 1之間, 0代表無相關, 1化表高度相關, 值的計算方式如下: =範例:學歷與職位間有無關係,題項:grade(學歷)、position (職位)說明: H0無關係 ,H1有關係,4-3 相關係數,1. 開啟範例 correlation.sav, 出現圖如下:2. 按 Descriptive Statistics Crosstabs 3. 在 Crosstabs 視窗,選
7、 grade (學歷)到 Row(s) ,選 position (職位)到 Column(s) 4. 按 Statistics,選 Chi-square,Phi and Cramers V 5. 按 Continue, 回到 Crosstabs 視窗 6. 按 OK,出現報表結果,如下圖 :,操作步驟如下:,Crosstabs Case Processing Summary 學歷 * 職位 CrosstabulationCount,報表分析如下:,Chi-Square Testsa 15 cells (75.0%) have expected count less than 5. The mi
8、nimum expected count is .03.Symmetric Measuresa Not assuming the null hypothesis.b Using the asymptotic standard error assuming the null hypothesis.說明:p-vlaue= .000 .05,故學歷與職位間有顯著相關。,點二系列相關(Point-biserial Correlation) 適用於一個變數為二分名義變數, 另一個為連續變數 (區間變數或比率變數), 點二系列的相關係數計算如下:注意:在SPSS軟體中, 没有處理點二系列相關係數的選項,
9、由於計算點二系列的相關係數值會與Pearson相關係數值一樣, 所以, 在處理點二系列相關問題時, 都會採用Pearson相關係數的步驟來計算。,4-4 點二系列相關,Spearman等級相關係數 (Rank Order Correlation Coefficient) 適用於兩個變數皆為順序尺度, 其目的是在算出兩組等級之間一致的程度, 例如, 可以用在兩個人對於N台筆記型電腦進行印象分數等級的評定或則是1個人對於N台筆記型電腦進行前後二次印象分數等級的評定。Spearman等級相關係數的計算如下:範例:某單位顧問對於廠商同樣的產品,前後加以評分給等第,我們想知道前後加以評分給等第之間是否有
10、相關存在,題項:Score1(分數1)、Score2(分數2)說明:,4-5 Spearman等級相關,1. 開啟範例 correlation.sav 2. 按 Analyze Correlate Bivariate 3. 在Bivariate Correlations 視窗,將 score1 (分數1)和 score2 (分數2)選入 variables,選取 Spearman 4. 按OK,出現報表結果,操作步驟如下:,Nonparametric CorrelationsCorrelations* Correlation is significant at the 0.01 level (
11、2-tailed).說明: p-value= .000 .05,拒絕H0,表示前後加以評分給等第之間的結果相近,相關係數達 0.766 ,屬於高度正相關。,輸出報表結果如下:,淨相關(Partial Correlation)又被稱為偏相關, 在前面Pearson相關係數討論中, 我們是直接探討二個變數之間的相關程度, 但是, 如果這二個變數同時與第三個變數有關係時, 也就是說, 這二個變數可能會受到第三個變數的干擾, 這時, 我們想了解原先二個變數的相關是否是由第三個變數所造成的影響, 就可以將第三個變數的影響效果控制住, 也就是計算與第三個變數有相關部份排除後, 原先二個變數的純淨相關淨相關
12、係數的展示式:例如有X1, X2兩變數, 第三變數為X3X1和 X2相關係數 = r12X1和 X3相關係數 = r13X2和 X3相關係數 = r23X1和 X2相關係數並排除r13和 r23時的淨相關係數= r12.3r12.3=,4-6 淨相關,研究假設:虛無假設H0:r= 0 兩者無淨相關對立假設H1:r 0 兩者有淨相關範例:易用性與傾向使用均與有用性成正相關,計算易用性與傾向使用的淨相關。(題項:PU、PEOU、ITU)說明:H0無關係,H1有關係,操作步驟如下:,1. 開啟範例 correlation.sav2. 按 Analyze Correlate Partial 3. 在
13、Partial Correlations 視窗,將 PEOU (易用性)和 ITU(傾向使用)選入 variables,將 PU(有用性)選入 Controlling for 4. 按 Options, 選取 Means and standard deviation 和 Zero-order correlations 5. 按 Continue,回到 Partial Correlations 視窗 6. 按OK,出現報表結果,輸出報表結果如下:,Partial CorrDescriptive Statistics,Correlationsa Cells contain zero-order (
14、Pearson) correlations.,說明:1. = .394,p-value=.000.05,因此拒絕H0 :r=0,表示未排除 PU前,PEOU與ITU具顯著相關。2. =.251,p-value=.002.05,因此拒絕H0 :r=0 ,表示排除PU後,PEOU與ITU具顯著相關。結論:PU(易用性)和PEOU(傾向使用) 兩者有淨相關值為 =.251 。,部份相關(part correlation) 又被稱為半淨相關 (semipartial correlation ), 原因是部份相關在處理時, 是處理淨相關的部份, 淨相關是X1和 X2變數, 排除第三變數 X3的影響後,
15、所得到X1和 X2的淨相關, 而部份相關則是在處理排除效果時, 僅處理第三變數X3與X1或 X2其中一個變數相關, 得到的結果稱為部份相關部份相關的表示式:r 1(2.3)=r (2.3):X2中排除X3的影響力r 12:X1和 X2的相關係數r 13:X1和X3的相關係數r 23:X2和X3的相關係數注意:請比較淨相關和部份相關的表示式, 會發覺只有分母部份不相同, 這意味著, 淨相關和部份相關的值不會一樣, 一般淨相關的絶對值會大於部份相關的絶對值。範例:易用性與傾向使用均與有用性成正相關,計算易用性與傾向使用的淨相關。(題項:PU、PEOU、ITU)說明:H0無關係 ,H1有關係,4-7
16、 部份相關,1. 開啟範例 correlation.sav 2. 按 Analyze Regression Linear 3. 在 Linear Regression 視窗,將 ITU(傾向使用)選入 Dependent,將PU(有用性)和 PEOU (易用性) 選入 independent 4. 按 Statistics,選取 Estimates,Model fit 和 Part and partial correlations 5. 按Continue,回到 Linear Regression 視窗 6. 按OK,出現報表結果,操作步驟如下:,RegressionVariables Ent
17、ered/Removed(b)a All requested variables entered.b Dependent Variable: 傾向使用 Model Summarya Predictors: (Constant), 易用性, 有用性,報表分析結果如下:,ANOVA(b)a Predictors: (Constant), 易用性, 有用性b Dependent Variable: 傾向使用Coefficients(a)a Dependent Variable: 傾向使用說明:由上表知,有用性與傾向使用的淨相關為.398,部份相關為.366。易用性與傾向使用的淨相關為.251,部份相關為.219。,