close

統計筆記(31)推斷統計基礎:置信度與置信區間

基礎準備

結束了描述性統計學部分的內容後,就進入到推斷統計學階段。在這個階段,主要任務就是交給大家用樣本資訊推斷總體資訊的原理及方法。點估計和區間估計,置信度和置信區間是推斷性統計學的基礎性內容。統計基礎請前往下方獲取導航頁。概念定義

先定義一些區間估計的概念:

θ:待估計的總體參數;

θL:由樣本確定的置信下限;

θU:由樣本確定的置信上限;

α:顯著性水準,是大於0小於1的數值;

1-α:置信度;

如果由樣本確定的兩個統計量θLθU滿足P(θL<θ<θU)=1-α,就稱隨機區間(θL ,θU)θ的置信度為1-α的置信區間。θLθU分別稱為置信度為1-α的置信下限和置信上限,1-α稱為置信度。曾經估計小學生的平均身高是在1.40m1.50m之間,可靠程度為95%。現在可以用公式將以上的敘述表達出來:

P(1.40<x̅ <1.50)=95%

式中的 x̅  表示小學生的平均身高。(1.40<x̅ <1.50)是置信區間;95%是置信度,1.40m1.50m分別是置信下限和置信上限。

置信區間的分類

雙側置信區間:上例中的(1.40<x̅ <1.50)屬於雙側置信區間;

單側置信區間:在有些場合下,我們只關心總體參數某一側的界限。例如,對於產品的壽命來說,消費者只關心其壽命的下限,對其上限則希望越長越好;而對於許多成本,則正好相反。

區間估計原理

下面以估計正態總體的均值為例,說明區間估計的原理。

3e4af49d4ef47ef9bc0f47d956922bea.jpg

 

置信度與置信區間的關係

在估計總體參數時,一般都會給出一個較高的置信度,如95%99%等。但是,當樣本容量n一定時,置信度越高,置信區間就越大,也即估計的參數的相對精度就會越低。反之,置信度越低,則精度相對就會越高。

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()