統計筆記(32)估計理論:詳述總體均值的單樣本估計原理
基礎準備
推斷性統計學是統計科學的一部分,它提供了從樣本特徵對整個總體特徵做出推斷的邏輯和方法。推斷性統計學在理論上有4個組成部分:概率論、抽樣理論、估計理論和假設檢驗理論。這篇講述估計理論在總體均值的單樣本估計中的應用。
概率論:小白學統計(7)——推斷理論基礎(概率)
抽樣理論:
小白學統計(24)推斷性統計學:抽樣設計
小白學統計(25)通俗解釋“大資料”及推斷性統計學:抽樣分佈
小白學統計(27)抽樣分佈:詳述均值的抽樣分佈及中心極限定理
小白學統計(28)抽樣分佈:t分佈估計理論
估計理論提供了從樣本統計量估計未知總體參數的方法。樣本統計量是某些測量值樣本特徵的經驗性數值量度,不能將樣本的經驗抽樣分佈與樣本理論抽樣分佈及總體概率分佈混淆。
兩個概念
估計量:指任何一個對總體參數給出估計值的樣本統計量,例如樣本均值。
估計值:指從某一樣本計算得到的估計量的一個具體數值。
點估計
對於來自一個測量總體的任何隨機樣本,如果對隨機量(例如:樣本的均值、方差或標準差)算得一個具體的數值(某個樣本的均值、方差或標準差),用以估計總體的參數(例如:總體的均值、方差或標準差),則該數值稱為總體參數(例如:總體的均值、方差或標準差)的一個點估計。
用點估計反映總體參數時,應該給出盡可能多的附加資訊,使得便於評價估計值的準確度和精度。準確度受度量方法和抽樣設計影響;精度則由固定容量n的樣本標準差決定,標準差越小越精確。
儘管有點估計及其準確度和精度的一些資訊,但是仍然未能從樣本跳躍到總體,即未能把點估計與待估總體參數聯繫起來,給出估計對參數的接近程度或確定在估計值中存在多大的可能誤差,為了從樣本資訊推斷總體參數,需要用到區間估計。
區間估計
區間估計是一個從樣本到總體的推斷,區間估計將總體參數置於一個實區間上。區間的邊界值由三個因素決定:
1、樣本點估計值;
2、聯繫總體參數和樣本點估計的樣本統計量(如Z統計量,做正態變換得到);
3、該統計量的抽樣分佈(例如,樣本均值的理論抽樣分佈服從正態分佈,則Z統計量的抽樣分佈是標準正態分佈);
總體均值的區間估計公式推導
上述推導給出了總體均值的區間估計的概率形式,基於要求:容量為n的單樣本來自無限大且標準差已知的正態分佈總體。
置信水準
在進行資料分析時,經常需要輸入置信水準,大多數情況選擇95%的置信水準,當然也可以選擇其他的置信水準。什麼是置信水準呢?通過上面的公式推導,得到了總體均值區間估計的概率表示:
其中的1-α稱為置信係數,它的百分數表示形式(1-α)100%稱為置信水準。
例題分析
社會學家正在研究居住在鄉村的10-12歲兒童的看電視習慣,從N=39200個鄉村兒童中無放回抽取n=50個兒童作為隨機樣本,得到每週看電視的平均時間為12.5小時,假設兒童每週看電視時間的總體服從正態分佈,且標準差為2.2小時,則兒童每週平均看電視時間μ的96%置信區間是多少?
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。
留言列表