1、第六章信賴區間,學習重點,解釋信賴區間計算母體平均的信賴區間計算母體比例的信賴區間計算母體變異數的信賴區間計算估計所需的最小樣本數計算某些特殊抽樣方法的信賴區間利用樣板計算信賴區間及樣本數,信賴區間 (confidence interval) 是一段包含某未知母體參數的數字範圍 。伴隨該區間的信心測度,表示我們對該區間真的包含該參數的信心。 利用抽樣得到某特定的估計後,該機率會被轉換為某種包含感興趣參數之數字範圍的信心水準。,信賴區間,我們都是一家人,1988年Newsweek 的封面故事發現了夏娃-隨機抽取147為來自不同人種、不同民族、出生地的孕婦所捐贈的應而胎盤,發現胎盤裡的DNA成份,
2、都有一段來自母親的粒線體(夏娃)夏娃活在距今14萬至29萬年前根據統計方法發現在95%或99%的信賴度下這突變粒線體DNA的平均百分比是目前人口母體的2%-4%,美國教授湯姆魯賓遜-我是成吉思汗的後人,亞洲以外第一個被確認為成吉思汗直係後裔的人牛津大學人類遺傳學教授賽克斯所創辦的牛津祖先基因檢測公司絕大多數Y-Clan代碼和姓氏一樣,從先人繼承而來,一個人的Y-Clan代碼可以和其他具有相同或類似姓氏的進行比較。但Y-Clan測試只能用于男性,因為只有男性才有Y染色體據估算,目前全世界有約1700萬人是成吉思汗的直係後代,約佔全球人口的0.5%,已知母體標準差,母體平均的信賴區間,已知母體標準
3、差,母體平均的信賴區間,上述公式可以計算的 95% 信賴區間。,已知母體標準差,母體平均的信賴區間,信賴係數1-,1-:confidence coefficient:error probability(1-)*100:confidence level,例如:從常態母體抽樣,樣本數 n = 25,而且得知樣本平均 。假設我們也知道母體標準差 。我們有 95% 的信心認為未知母體平均 會是區間 114.16, 129.84 內的某個數字。,已知母體標準差,母體平均的信賴區間,z/2 是標準常態曲線下右尾面積為/2的 z 值。例如,1.96 是 /20.025 的 z/2 值,因為z1.96 右邊的
4、標準常態曲線下的面積是0.025 (我們由表二發現,z1.96 的表列面積是 0.475,因此右尾面積是 /20.025 )。,已知母體標準差,母體平均的信賴區間,從同一個母體抽樣並固定樣本數,若信心水準愈高,則信賴區間愈寬。 例如:若我們想要得到 100% 的信賴區間,結果一定是 , 。,已知母體標準差,母體平均的信賴區間,從同一個母體抽樣,且固定信心水準,若樣本數愈大,則信賴區間愈窄。 例如計算的 80% 信賴區間,是依照樣本數 n2,500,而非 n25 。假設 及保持不變,則新的區間會比先前的窄上 10 倍 (因為 )。確實,新的區間為:,已知母體標準差,母體平均的信賴區間,已知母體標
5、準差,母體平均的信賴區間,已知母體標準差,母體平均的信賴區間,樣板在名為 Estimating Mean.xls 的工作簿,有幾個可以計算母體平均信賴區間的表單,當樣本統計量已知 樣本數據已知,已知母體標準差,母體平均的信賴區間,已知母體標準差,母體平均的信賴區間,已知母體標準差,母體平均的信賴區間,計算練習:6-5,某家汽車製造商希望估計一款新車在高速公路上平均每加侖汽油的里程數。依照類似車種的經驗來看,該製造商相信每加侖里程數的標準差是4.6。該款新車行駛高速公路100 次的一組隨機樣本,得知樣本平均是每加侖32英里。設定95% 的信心水準,計算每加侖里程數的信賴區間。,6-5 Ans,s
6、igma = 4.6n = 100 x bar = 3295% C.I. for :32 1.96(4.6/ ) = 32 .9016 = 31.098, 32.902 m.p.g.,6.7,最近三家新航空公司, MAXjet, LAvion, Eos 開始行銷商務客艙或是頭等客艙的服務。這些航空公司需要估計從紐約到巴黎的商務艙旅客願意付出來回票的最高費用。假設這三家其中一家願意提供服務,只要可以合理地確定(90%)旅客願意付出1,800美元。假設一組50位旅客的樣本表示樣本平均最高費用是1,700。進一步假設母體標準差是800美元。a. 建構一種90%信賴區間。b. 根據(a)小題的答案,航
7、空公司願意提供這一項服務嗎?,t 分配 (t distribution) :此分配的自由度與樣本標準差 S 的自由度相同。又稱為學生分配或學生 t 分配 。t 分配的平均是 0 ,當 df 2, t 分配的變異數等於 df/(df2) 。,未知 、 的信賴區間t 分配,未知 、 的信賴區間t 分配,未知 、 的信賴區間t 分配,小樣本與大樣本之常態分配當未知且假設為常態母體時,使用自由度 n1 的 t 分配是正確的分配。然而,若自由度夠大,標準常態分配近似 t 分配也很理想。例6-2,未知 、 的信賴區間t 分配,未知 、 的信賴區間t 分配,例6-3,母體比例 p 的大樣本信賴區間,例6-4
8、,母體比例 p 的大樣本信賴區間,6.21,某家藥用臉部護膚乳霜的廠商,有興趣瞭解某個年齡層因為使用這種護膚乳霜獲益的人數比例。一組68 位試用者的隨機樣本有42 位有效。計算在這個年齡層有效人數比例的99% 信賴區間。,6.21 ans,n = 68x = 4299% C.I.:= 0.4658, 0.7695,母體變異數的信賴區間,卡方分配為了計算母體變異數的信賴區問,必須學習卡方分配。卡方分配是數個獨立標準常態隨機變數平方和的機率分配。卡方分配的平均等於自由度個數 df,而其變異數等於自由度個數的兩倍。,母體變異數的信賴區間,E(2)=dfV(2)=2df,例6-5,母體變異數的信賴區間
9、,母體變異數的信賴區間,母體變異數的信賴區間,樣板在名為 estimating Variance.xls 的工作簿,有幾張計算母體變異數之信賴區間的表單,當:樣本統計量已知樣本數據已知,母體變異數的信賴區間,母體變異數的信賴區間,6.26,某種敏感的測量裝置不容許測量誤差有太大的變異。一組41個測量誤差的隨機樣本得知s2 102。計算測量誤差之變異數的99% 信賴區間。,6.26 ans,n = 41s 2= 10299% C.I.: 40(102)/66.766, 40(102)/20.707 = 61.11, 197.03,決定樣本數,統計學家最常被問到的問題是:需要多大的樣本?若忽略成本,在可能的範圍內樣本越多越好。樣本數越大,統計量的標準誤越小;標準誤越小,表示必須對抗的不確定性越小。,決定樣本數,抽樣預算有限時,應注意:你希望樣本估計多接近未知的參數?這個答案記作 B你想要什麼樣的信心水準,使得估計與參數間的距離小於或等於 B?最後,一個常被誤解的問題是:你的母體變異數計為何?,決定樣本數,決定樣本數,樣板,最佳化母體平均估計,樣板,最佳化母體比例估計,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。