ImageVerifierCode 换一换
格式:PPT , 页数:27 ,大小:253.50KB ,
资源ID:345615      下载积分:100 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-345615.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(抽样www3.nccu.edu.tw~tsaichNCCUsocialmethod_sampling.ppt.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

抽样www3.nccu.edu.tw~tsaichNCCUsocialmethod_sampling.ppt.ppt

1、民意調查的抽樣,蔡佳泓政大選舉研究中心副研究員,課程大綱,抽樣原理隨機抽樣等距抽樣分層分段抽樣非隨機抽樣,抽樣原理(1),由於我們不可能訪問母體中所有的個體,所以必須進行抽樣。抽樣一定會有誤差,也就是根據樣本的調查結果跟真實母體之間有一定的差距,稱為抽樣誤差。抽樣誤差代表一種區間,也就是樣本估計的結果被包含在一定的上下限。,抽樣原理(2),抽樣誤差的估計為若干個樣本標準誤 /sqrt(n)。當我們做無數次抽樣之後,所得到的每一個樣本平均值將形成一個常態分布。而這些樣本平均值的離散程度就是樣本標準誤。如果樣本抽的次數夠多,真正的母體平均值應該等於所有樣本平均值的平均值加減一定的標準誤。但是我們不

2、可能抽無限次的樣本,只能假定單一抽樣就代表無限次抽樣後的平均值。因此我們對母體平均值的估計就是依照抽樣結果。,常態分布圖,抽樣原理(3),根據上圖,我們知道,68%的樣本平均值會落在加減一個標準誤的範圍中。如果是加減兩個標準誤的範圍,則會包含95%的樣本平均值。如果是加減三個標準誤的範圍,則會包含99%的樣本平均值。換句話說,68%的樣本平均值加減一個標準誤會包含 。以此類推。,抽樣原理(4),而又是從樣本的資料估計得來: =sqrt(n/n-1)*s. s為標準差, 計算方式為sqrt (xi-x_bar)2/n-1 。其中xi表示每一個觀察值。通常一個簡化的公式為設定 等於0.5 ,而抽樣

3、誤差公式可以快速計算為1/sqrt(n). 也就是樣本數的開根號的倒數。,信心水準與抽樣誤差,剛剛提到的68%或95%或99%通常稱為信心水準。意思為抽100次樣本, 有多少比率的樣本是我們確定會以一個特定區間包含母體平均數 。信心水準越高,所需要的區間也就越大, 的上下限也就差距越大。所以信心水準跟抽樣誤差之間必須取捨。通常我們是用95%信心水準,對應兩個標準誤的抽樣誤差,信心水準與抽樣誤差試算,信心水準與抽樣誤差例子,信心水準與抽樣誤差注意事項,上述的公式完全不考慮母體大小,只考慮樣本數大小 。根據上述的公式可以逆向推估需要的樣本。當母體非常小的時候, 例如低於100 , 抽樣誤差已經沒有

4、意義,可以考慮全查。,單純隨機抽樣,將每一個觀察值加以編號依照亂數表選中一個號碼每個觀察值應該有同樣的中選機率,等距抽樣(1),把全體總數N除以樣本數n得到K,起始為隨機亂數抽出R,然後每隔K個抽出一個樣本, R, R+K ,R+2K ,R+3K ,一直到R+(n-1)K。如果觀察值本身有分組, 則是依照各組人數從小而大排列, 然後各組內再編號以方便抽出。假如我們有4800個觀察值如下表,如何抽出16個樣本? 先抽一個亂數6 ,然後每隔300就抽一個。,等距抽樣(2),分層分段抽樣(1),主動將樣本分成若干層, 原則為層內同質性越大越好, 層外同質性越小越好。 例如: 依照都市化程度分鄉鎮;

5、依照學院特性分科系; 依照學校特色分學校 。人數越多的層應該分到越多樣本;在各層之下再分段以簡化抽樣。每一人的中選機率仍然會相同。,分層分段抽樣(2),例如調查政大的學生對政大的認同感。 根據資料,博士班學生約834人,碩士班約4,570人, 大學生約9,404人,總共14,808人。若想抽出樣本1 ,200人,則博士班學生約分配到67人,碩士班約368人, 大學生約765人。,分層分段抽樣(3),分層分段抽樣(4),先決定要抽出五個學院,K為1880 。 然後抽出起始亂數為1203,落在 法學院。 接下來為文學院,最後是 社科院, 有兩個中選。 每個中選單位必須訪問153人, 共765人。

6、以傳播學院為例,中選機率公式為(5*2556/9404)*(153/2556)=765/9404。而博士班以及碩士班中選機率皆同。,假設某一層涵蓋以下鄉鎮市,分層分段抽樣應用,每個鄉鎮市抽出同樣數目的樣本例如永和預計抽出60個樣本,便預計抽出3個里, 每個里20個樣本,假設永和有25個里,假設每個里人口為M,每一人的被抽取率為4*161139/1923496*3*M/161139*20/M=60/480874,加權,分層抽樣後,要對每一層做加權。加權的權值為:Wi = (Ni/N)(n/ni) 。因為:ni = (nNi)/N,即每一層的樣本數等於全部樣本數乘以每一層所佔的比例。而每一層佔總樣

7、本的比例為權值ni /n ,乘以每一層的平均數(xi/ni),相乘後將得到xi/n,亦即全部樣本的平均數,也就是對母體平均數的估計。,加權方式,通常我們如果有母體的交叉資料,例如每一個縣市的教育程度或性別,我們可以做事後加權。如果沒有的話,我們做反覆加權,即先對一個類別做加權,通過檢定後再做下一個加權,一直到全部通過為止。,反覆加權,反覆加權的意思為先對某一變數加權,若通過卡方檢驗,儲存資料後,再對另一變數加權,然後再檢驗,然後再對另一變數加權通常加權的變數為性別、教育程度、年齡、地區等,電話訪問之抽樣(一),電話號碼簿抽樣根據每個縣市之人口比例決定樣本數,再根據電話號碼簿之頁數決定平均每幾頁抽出一個樣本,在那一頁以隨機方式決定那一欄第幾個號碼為中選號碼抽出中選號碼後可在尾數或後兩位尾數加1或隨機處理,以找到未登記的號碼,電話訪問之抽樣(二),電話號碼由局碼及後面幾位數字組合而成,若已知所有局碼及後面有多少住宅電號,則可進行兩階段抽樣,即先抽出局碼再根據局碼後面的電話號碼數抽樣, 但是中華電信尚未開放此資料目前台灣估計有2600個局碼,實際訪問所得為700多個,非隨機抽樣,立意抽樣配額抽樣隨遇抽樣雪球抽樣非隨機抽樣無數學根據,無法據以推論母體,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。