1、1,第二部份SPSS操作程序與方法,資料處理與數據查核,2,閱讀範圍,邱皓政著 量化研究與統計分析Chapter 4 原始資料的電腦化Chapter 6 SPSS統計軟體之運用Chapter 7 資料的描述與呈現陳景堂著 統計分析SPSS for Windows入門與應用 SPSS使用 (Chapter 24)資料的轉換 (Chapter 7)資料描述、統計量數 (Chapter 6、8),3,1. 原始資料的電腦化,Computerized Raw Data,4,課程目標,了解資料電腦化的一般原則了解編碼系統與編碼表的功能與內容了解並能操作文字資料的計量處理了解廢卷處理的概念與程序了解資料輸
2、入的方法與程序了解特殊題型的處理方式,5,原始資料的電腦化,原始資料(raw data): 反應受測者在問卷實際填答情形的資料型態紙本原始資料(raw data on paper)電腦化原始資料(computerized raw data)編碼或過錄(coding):由紙本原始資料轉換成電腦化原始資料的過程編碼與工具發展應同步進行編碼是一套資料處理之模式包含資料架構(framework):資料格式、符號特徵、內容廣度、遺漏處理處理流程(procedure) :資料分類、轉換、合併、刪除,6,資料的基本類型,7,文字資料的編碼與過錄,步驟一:依編碼系統進行分類與計量步驟二:以虛擬化變項(dumm
3、y variable)方式,進行資料備整虛擬化:資料收集完成後,以人為方式進行資料整理賦予數量符號之過程如將文字轉為數字:將每個類別賦予一個特定數字,如宗教信仰的調查,將天主教賦予1、基督教賦予2、道教賦予3等虛擬化的問題解釋上的困難:數字本身未具有特定數學邏輯與概念意義編碼的繁複性與主觀性分析方法的問題,8,編碼簿(Codebook),目的:記錄資料數量化之所有格式與內容,詳述資料處理步驟。功能提供標準化的作業流程溝通的功能工作憑據的建立與工作記憶的留存 內容變項名稱與標籤(說明用)變項數值與標籤(說明用)遺漏值處理SPSS可利用公用程式來確認編碼表,9,10,廢卷處理,回收控制與登錄遺漏與
4、補漏處理不良答題型態的處理反應心向的處理,11,原始資料的電腦處理,純文字資料檔(ASCII files)視窗環境的資料輸入SPSS軟體的使用直接輸入法間接輸入法轉檔功能的使用編輯功能的使用類別變項的加權輸入模式,12,ASCII檔案型態,13,SPSS資料視窗,14,資料電腦化的處理原則,資料輸入以編碼系統為依歸 充分的訓練 良好的作業環境與流程安排 資料保密工作的落實工作記憶的保留,15,上機練習,1 . SPSS使用練習 (陳景堂著 課本第二章),2 .資料定義與輸入練習 (陳景堂著 課本第三、四章),16,特殊題型之處理程序-複選題,1. 資料輸入(以個別題目型態輸入)2. 定義集群點
5、選統計分析複選題分析定義集合 定義集內的變數 3. 完成虛擬複選題變項 4. 次數分配表分析5. 交叉表分析,17,【例】下列為了解青少年人際網路與影響力之題組,複選變相矩陣型態資料,18,複選題分析對話框1,需先行定義集合才會浮現次數分配與交叉表之功能,19,複選題分析對話框2,20,複選題分析:次數分配表結果輸出,反應百分比,人次百分比,21,特殊題型之處理程序-排序題,1. 資料輸入(以個別題目型態輸入)2. 定義集群點選統計分析複選題分析定義集合 定義集內的變數(定義時需依不同的順位進行多次的集內變數定義) 3. 完成虛擬複選題變項 4. 分析:針對不同順位虛擬變數進行次數分配表分析或
6、交叉表分析,22,【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題,相關對應表格如下:,23,排序題定義對話框,24,排序題分析: 次數分配表結果輸出,Group $ Order 1 第一順位,25,排序題分析: 交叉表結果輸出,26,上機練習,1. 複選題練習,2. 特殊題型排序題練習,27,2. SPSS統計軟體之運用,Usage of the SPSS software,28,SPSS程式的基本操作流程,一、資料定義(data definition)使電腦能夠正確的辨認量化的數據,並對於數據賦予正確的意義。變項名稱指定(變項標籤)、變項數值的標籤、變項的格式類型、遺漏值的設定。
7、資料定義必需與編碼表配合,將適當的變項名稱與數據的意義加以標註,並設定適當的遺漏值,方能使後續的資料處理與分析能夠正確有效的進行。,29,標籤註記指令範例與說明,30,二、資料轉換(data transformation)進行資料分析前的一些校正與轉換的工作如反向題的反向計分,出生年月變項轉變成年齡之新變項的創造。廢卷處理、資料備便、遺漏值的補漏檢查等作業,也是在此一階段進行。SPSS軟體提供的觀察值選擇、重新編組或四則運算等指令,皆能協助轉換工作的進行。一旦轉換完成後,此一資料庫已可稱為乾淨的(clean and clear)的資料。,SPSS程式的基本操作流程,31,資料轉換指令,量化研究
8、的資料處理包括多種的資料整理的程序,例如COMPUTE、COUNT、 RECODE、 RANK、 SORT、SAMPLE、N等。,32,四則(邏輯)運算指令COMPUTE,提供使用者將資料進行各種邏輯運算處理 四則運算的表現則依一般數學關係式的模式(先乘除後加減),可配合函數來進行運算。語法為,COMPUTE 新變項=原有變項之四則運算,33,四則運算指令語法與範例,34,Recode,RECODE(轉換)指令的用途非常廣,可以將變項的數值進行各種轉換。如反向題轉換、分組類別的調整。語法如下: RECODE 變項名 (舊數值=新數值)範例:RECODE X2 (1=5)(2=4)(4=2)(5
9、=1). 反向題轉換RECODE X2 X8 X12 X25 (1=5)(2=4)(4=2)(5=1).(若有多題類似情形時)RECODE EDU (1=1)(2=2)(3=3)(4=3)(5=4)(6=4).(教育程度重新分組)VALUE LABELS EDU 1”國小及以下” 2 “國中” 3 “高中職” 4 大學及以上”.,35,COUNT(計數),COUNT指令用於計算一組變項當中,重複出現某一個數值的次數,並將此一次數指定為一個新變數的數值。例如,民意調查用十個指標去評估行政院長的施政滿意度,受訪者在十個題目上回答相當不滿意(1)、不滿意(2)、滿意(3)、非常滿意(4),施測完畢之
10、後,每一位受訪者在十題的反應中,出現幾個滿意、幾個不滿意,可以用COUNT指令來計數語法如下COUNT 新變項=舊變項名 (某數值) COUNT Y=I1 TO I10 (4) 計算受訪者在十題回答非常滿意的次數,放入新變項Y)COUNT Z=I1 TO I10 (lowest thru 2) 計算受訪者在十題回答不滿意與非常 不滿意的次數,放入新變項Z)COUNT MISS=I1 TO I10 (MISSING)計算受訪者在十題回答遺漏的次數放入MISS新變項),36,條件化邏輯指令IF、PROCESS IF、SELECT IF,在限定特定條件下,來進行新變項的創造 IF指令為一般性條件指令
11、,只有符合括弧內條件關係的情形下,才會執行後方的四則運算式。語法如下:IF (條件式) 新變項=邏輯運算範例:IF (A+B) LT 100) P=1. (當A+B大於10時,新變項P為1)IF (SYSMIS(GENDER) S=0. (當GENDER為遺漏值時,S為0)IF (CITY=”TPE” AND GROUP=1) K=1. (CITY為字串變項),37,邏輯運算子之縮寫與範例說明,38,PROCESS IF 與 SELECT IF,PROCESS IF 與 SELECT IF則是條件化的條件化指令。也就是在IF條件式的功能下,附加對於IF指令的操作條件。PROCESS IF對於資
12、料的限定化處理是暫時性的,SELECT IF對於資料的限定化處理是永久性的。完整的PROCESS IF與SELECT IF指令應包含兩行指令,條件式動作式每一筆資料經過PROCESS IF的二行指令處理完成後,才進行其他的指令。語法如下: PROCESS IF (條件式).,39,條件化指令語法與範例,40,RANK,RANK指令能將某一個變項的數值,產生等級、百分等級、常態分數等類型的分數。語法如下RANK 變項 /RANK INTO 新變項名 (產生等級變數於新變項) /NTILES(組數) INTO 新變項名(產生百分等級) /NORMAL INTO 新變項名 (產生常態等級) /RFR
13、ACTION INTO 新變項名 (產生比率等級) /SAVAGE INTO 新變項名(產生指數分數),41,SAMPLE與N,SAMPLE的功能在從資料庫中隨機抽取一定比率的樣本,而N指令則是抽取特定位置的樣本。語法如下:SAMPLE 百分比.SAMPLE 樣本數 FROM 總筆數N n範例:SAMPLE .25. (隨機取用某百分之25之樣本)SAMPLE 500 FROM 5000 (自總筆數5000當中隨機抽取500筆資料)N 100 (抽取前100筆資料作為樣本),42,資料轉換指令語法與範例說明,43,上機練習,資料的轉換練習 (陳景堂課本第七章),44,三、資料分析(data a
14、nalysis)依操作者的指令,進行各種的統計分析或統計圖表的製作。操作者必須具備良好的統計基本知識,才能在數十種統計指令當中選擇適合的統計方法來分析資料。操作者必須能夠閱讀分析之後的報表數據,從不同的指數與指標當,尋求關鍵且正確的數據來作為研究報告撰寫的根據。,SPSS程式的基本操作流程,45,3. 資料的呈現與描述,Description and Graphing of the Data,46,社會科學研究: 資料處理的角色與內容,資料分析前置作業流程,資料輸入,資料查核,資料轉換,資料呈現描述,工具發展,問卷與編碼表,電腦化原始資料 (.sav),備便資料檔.sav,語法檔.sps(資料
15、定義與轉換),結果輸出檔 .spo,資料的統計分析與報告,研究計劃: 方法設計與執行,47,資料呈現與描述,資料呈現:運用次數分配來整理並描繪變數數值分佈情形次數分配表次數分配圖利用統計圖表來表現出數據的特性與分佈情形摘要統計:透過描述統計的統計量運算,建立初步的統計指標,作為後續統計分析的基礎。,48,類別資料的次數分配表,類別資料由於缺乏計量單位數值的種類較少,最適合使用次數分配表,49,程度測量的次數分配表,連續變項的次數分配表,50,長條圖,類別資料的次數分配圖,51,直方圖,連續資料的次數分配圖,52,莖葉圖(Stem-and-Leaf Plot),普林斯頓大學John Tukey教
16、授於1977年所發展一種用以描述觀察值的簡便方法,可以快速的以人工將觀察值進行劃記,並以圖表的方式呈現出來,兼具次數分配表與長條圖的雙重優點。 莖葉圖最適合二位數資料之呈現,如考試成績莖葉圖製作係將每個觀察值切割為莖葉兩部份,中間以垂直線隔開。莖為觀察值中間十位數或以上之數字業則為個位數的數字。,53,莖葉圖範例,54,描述統計: 集中趨勢量數,基本概念描述測量觀察值集中情形為數據建立一個能夠描述其共同落點的最佳指標常用的集中量數眾數 (mode):一組數中出現最多的數中數(median):一組數中出現在最中間的數平均數 (mean) :將一變項中所有數值之總和除以總資料數所地之結果,55,集
17、中量數之測量特性與比較,56,描述統計: 離散量數,基本概念描述測量觀察值分散狀況的情形為數據建立數據分佈廣度的指標常用的離散量數全距 (Range): 一組數中最大值與最小值之差,為一群數分離程度最粗略之指標四分差:將資料由小至大排列後,依資料數平均分為四段,則每段各佔25%之個數,位居三個分段點之分數稱為第一四分位數、第二四分位數、第三四分位數變異數 (variable): 將資料值減去平均數後,求平方和後,在將加總後之數值除以人數。標準差 (standard deviation) : 變異數 之平方根,57,離散量數之測量特性與比較,58,描述統計: 偏態與峰度,高狹峰 低闊峰 常態峰,
18、負偏態 (左偏) 正偏態(右偏) 常態,59,偏態與峰度係數的計算,60,偏態與峰度係數的判斷,61,描述統計: 標準分數(Z score),標準分數將變項變量以原始平均數與標準差進行數學轉換得出一個平均數為零,標準差為1的變量標準分數為去單位化之分數,可以反應出原始數值的方向與分散情形,並作跨分配的比較。Z分數: 原始分數減去其平均數,再除以標準差後所得到的新分數。,62,常態曲線的特徵 (normality),1. 對稱性 (symmetry)2. 單峰分配 (unimodal)3. 平均數、眾數、中數落於分配的中心點4. 具有機率分配的機本特質,63,上機練習,1 .資料描述、統計量數 (課本第六章、第八章),64,第一次作業(陳景堂),1 . 課本第三章(p.3-9)、第5小題,2 . 課本第四章(p.4-38)、第1小題,3 . 課本第六章(p.6-18)、第2小題,4. 課本第七章(p.7-66)、第5、6 、 8 、 9、10小題,5. 課本第八章(p.8-8)、第4小題,