1、統 計 在 教 學 上 的 探 討,黃必祥 博士 高雄師範大學數學系 97年3月18日,演 講 大 綱,隨機變數伯努力試驗及二項式分配 弱大數法則及中央極限定理常態分配及經驗法則信賴區間盒狀圖相關係數單一迴歸分析,投擲一枚骰子出現的情形: = 1, 2, 3, 4, 5, 6 令X為出現的點數 X(k) = k k = 1, 2, 3, 4, 5, 6 X = k k = 1, 2, 3, 4, 5, 6,隨機變數 X,.,投擲均勻骰子,出現 3 點的事件發生的機率,投擲 n 次,出現 3 點的次數為 y 次,當 n ,,則,例 1:投擲一枚均勻的骰子,X表示出現的點數, 則X的期望值為,伯努
2、力試驗,伯努力試驗出現的情形只有兩種(1:成功,0:失敗),,,註:X 具有伯努力分配,二項式分配,令Y是在 n 次獨立的伯努力試驗中成功的次數且每次伯努力試驗成功的機率為定數 p(母群體比例),,k = 0, 1, 2, , n,令,( 稱為樣本比例),,,,,例 2:投擲一枚骰子100次,設出現 3 點的機率為 p。 平均而言,出現 3 點的次數為何? Y:出現 3 點的次數,,,,,Y bin(100, p),E(Y) = 100p,弱大數法則,隨機樣本,,i = 1, 2, 3, , n,,,則,(註:,),,,,,,,例 3:X 為投擲一枚骰子是否出現3點的隨機變數,,,投擲 n 次
3、,設出現情形為,,,則,,i = 1, 2, 3, ., n,令,,則,根據弱大數法則,,即,,,且 E(Y) = np,因此,即,n = 3,中央極限定理,,i = 1, 2, 3, , n,則,Normal distribution,註:,,,隨機樣本,,,或,例 4:隨機樣本,具有伯努力分配,其成功的機率為p。,,,,i = 1, 2, 3, , n,根據中央極限定理得,即,常 態 分 配,令,則,,X的機率密度函數,標 準 常 態 分 配,f(x),經 驗 法 則,根據觀察值,(n足夠大),,大約95的觀察值落在,大約99.75的觀察值落在,則 大約68的觀察值落在,其次數分配圖呈鐘形
4、,,95信心水準之p的信賴區間,根據中央極限定理,:包含 p 的機率為0.95,95信心水準之p的信賴區間,例 5:在台南地區抽樣1000人,有570人支持某位候選人,p為台南地區支持該候選人的比例,則95(99%)信心水準之p的信賴區間為,即,註:,為估計誤差,95%:,99%:,即,取,則,註:若母群體個數為N(N不夠大),則抽樣人數為,( ),例 6:要求95的信心水準其最大估 計誤差為,則抽樣人數為何?,例 7:信心水準為95(99%),最大估計誤 差為3%,則抽樣人數為何?,若N = 3000人,則,95%:,99%:,盒狀圖(Boxplot)-(box-and-whisker pl
5、ot): The box plot is designed to indicate the median of the data and to highlight the behavior of the data at the ends of the distribution. It also highlights outliers, the observations that lie very far from the center of the distribution. 下內籬笆(Lower inner fence) = Q1 - 1.5(IQR) 上內籬笆(Upper inner fe
6、nce) = Q3 + 1.5(IQR),五數綜合之盒狀圖(Box Plot),(國中版本),七數 : min 10百分位 Q1 M Q3 90百分位 max數值 : 5 35 45 64.5 80 84 89,(國中版本-教師手冊),變數 平均數 中位數 TrMean 標準差 Min Max Q1 Q3國文 79.89 84.00 81.91 15.78 15 97 74.75 91.00英文 82.00 91.50 85.12 21.33 11 100 72.75 96.25數學 73.03 84.50 75.21 28.00 3 100 46.75 93.50理化 75.32 85.50
7、 77.47 24.48 10 100 58.75 74.00,盒狀圖 (Boxplot),例 8:,相關係數(Correlation Coefficient )-量測兩個變數線性強度的關係,樣本共變異數: (Sample Covariance),樣本相關係數:(Sample Correlation Coefficient),國文 英文 數學 英文 0.774 數學 0.756 0.823 理化 0.694 0.659 0.673,相關係數矩陣,針對某班的國文成績對數學成績作 迴歸分析,例 9: The regression equation is 國文 = 48.8 + 0.426 2數學
8、Predictor Coef SE Coef T P 常數 48.774 4.795 10.17 0.000 數學 0.42615 0.06141 6.94 0.000 標準差= 10.46 R-Sq = 57.2%,Regression Plot國文48.77440.4262數學,例 10: Nonsense example,Source: Kendall and Yule 1950 and Tufte 1974,Correlation coefficient of Y and X is 0.992,The regression equation is Y = 4.58 + 2.20 XPredictor Coef Stdev t-ratio pConstant 4.5822 0.4233 10.82 0.000X 2.2041 0.0807 27.31 0.000s = 0.7262 R-sq = 98.4% R-sq(adj) = 98.3%,謝謝指教,