統計筆記(31)推斷統計基礎:置信度與置信區間
基礎準備
結束了描述性統計學部分的內容後,就進入到推斷統計學階段。在這個階段,主要任務就是交給大家用樣本資訊推斷總體資訊的原理及方法。點估計和區間估計,置信度和置信區間是推斷性統計學的基礎性內容。統計基礎請前往下方獲取導航頁。概念定義
先定義一些區間估計的概念:
θ:待估計的總體參數;
θL:由樣本確定的置信下限;
θU:由樣本確定的置信上限;
α:顯著性水準,是大於0小於1的數值;
1-α:置信度;
如果由樣本確定的兩個統計量θL和θU滿足P(θL<θ<θU)=1-α,就稱隨機區間(θL ,θU)是θ的置信度為1-α的置信區間。θL和θU分別稱為置信度為1-α的置信下限和置信上限,1-α稱為置信度。曾經估計小學生的平均身高是在1.40m和1.50m之間,可靠程度為95%。現在可以用公式將以上的敘述表達出來:
P(1.40<x̅ <1.50)=95%;
式中的 x̅ 表示小學生的平均身高。(1.40<x̅ <1.50)是置信區間;95%是置信度,1.40m和1.50m分別是置信下限和置信上限。
置信區間的分類
雙側置信區間:上例中的(1.40<x̅ <1.50)屬於雙側置信區間;
單側置信區間:在有些場合下,我們只關心總體參數某一側的界限。例如,對於產品的壽命來說,消費者只關心其壽命的下限,對其上限則希望越長越好;而對於許多成本,則正好相反。
區間估計原理
下面以估計正態總體的均值為例,說明區間估計的原理。
置信度與置信區間的關係
在估計總體參數時,一般都會給出一個較高的置信度,如95%或99%等。但是,當樣本容量n一定時,置信度越高,置信區間就越大,也即估計的參數的相對精度就會越低。反之,置信度越低,則精度相對就會越高。
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。