close

統計筆記(32)估計理論:詳述總體均值的單樣本估計原理

基礎準備

推斷性統計學是統計科學的一部分,它提供了從樣本特徵對整個總體特徵做出推斷的邏輯和方法。推斷性統計學在理論上有4個組成部分:概率論抽樣理論估計理論假設檢驗理論。這篇講述估計理論在總體均值的單樣本估計中的應用。

概率論:小白學統計(7)——推斷理論基礎(概率)

抽樣理論:

小白學統計(24)推斷性統計學:抽樣設計

小白學統計(25)通俗解釋“大資料”及推斷性統計學:抽樣分佈

小白學統計(27)抽樣分佈:詳述均值的抽樣分佈及中心極限定理

小白學統計(28)抽樣分佈:t分佈估計理論

估計理論提供了從樣本統計量估計未知總體參數的方法。樣本統計量是某些測量值樣本特徵的經驗性數值量度,不能將樣本的經驗抽樣分佈樣本理論抽樣分佈及總體概率分佈混淆。

兩個概念

估計量:指任何一個對總體參數給出估計值的樣本統計量,例如樣本均值。

估計值:指從某一樣本計算得到的估計量的一個具體數值。

點估計

對於來自一個測量總體的任何隨機樣本,如果對隨機量(例如:樣本的均值、方差或標準差)算得一個具體的數值(某個樣本的均值、方差或標準差),用以估計總體的參數(例如:總體的均值、方差或標準差),則該數值稱為總體參數(例如:總體的均值、方差或標準差)的一個點估計。

用點估計反映總體參數時,應該給出盡可能多的附加資訊,使得便於評價估計值的準確度和精度。準確度受度量方法和抽樣設計影響;精度則由固定容量n的樣本標準差決定,標準差越小越精確。

儘管有點估計及其準確度和精度的一些資訊,但是仍然未能從樣本跳躍到總體,即未能把點估計與待估總體參數聯繫起來,給出估計對參數的接近程度或確定在估計值中存在多大的可能誤差,為了從樣本資訊推斷總體參數,需要用到區間估計。

區間估計

區間估計是一個從樣本到總體的推斷,區間估計將總體參數置於一個實區間上。區間的邊界值由三個因素決定:

1、樣本點估計值;

2、聯繫總體參數和樣本點估計的樣本統計量(如Z統計量,做正態變換得到);

3、該統計量的抽樣分佈(例如,樣本均值的理論抽樣分佈服從正態分佈,則Z統計量的抽樣分佈是標準正態分佈);

總體均值的區間估計公式推導

35cb55a473ec49477b63ba6de0a29606.jpg

398c217533b1930e5a29aa0eb359f620.jpg

上述推導給出了總體均值的區間估計的概率形式,基於要求:容量為n的單樣本來自無限大且標準差已知的正態分佈總體。

置信水準

在進行資料分析時,經常需要輸入置信水準,大多數情況選擇95%的置信水準,當然也可以選擇其他的置信水準。什麼是置信水準呢?通過上面的公式推導,得到了總體均值區間估計的概率表示:

ac2d21c690b2eb9e54a9174faef0f602.jpg


其中的1-α稱為置信係數,它的百分數表示形式(1-α)100%稱為置信水準。

例題分析

社會學家正在研究居住在鄉村的10-12歲兒童的看電視習慣,從N=39200個鄉村兒童中無放回抽取n=50個兒童作為隨機樣本,得到每週看電視的平均時間為12.5小時,假設兒童每週看電視時間的總體服從正態分佈,且標準差為2.2小時,則兒童每週平均看電視時間μ96%置信區間是多少?

e6916a074f846257d3fc6ec1791413dd.jpg

 

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()