統計筆記（31）推斷統計基礎：置信度與置信區間－HCHUNGW的部落格

統計筆記（31）推斷統計基礎：置信度與置信區間

基礎準備

結束了描述性統計學部分的內容後，就進入到推斷統計學階段。在這個階段，主要任務就是交給大家用樣本資訊推斷總體資訊的原理及方法。點估計和區間估計，置信度和置信區間是推斷性統計學的基礎性內容。統計基礎請前往下方獲取導航頁。概念定義

先定義一些區間估計的概念：

θ：待估計的總體參數；

θ_L：由樣本確定的置信下限；

θ_U：由樣本確定的置信上限；

α：顯著性水準，是大於0小於1的數值；

1-α：置信度；

如果由樣本確定的兩個統計量θ_L和θ_U滿足P(θ_L<θ<θ_U)=1-α，就稱隨機區間(θ_L ,θ_U)是θ的置信度為1-α的置信區間。θ_L和θ_U分別稱為置信度為1-α的置信下限和置信上限，1-α稱為置信度。曾經估計小學生的平均身高是在1.40m和1.50m之間，可靠程度為95%。現在可以用公式將以上的敘述表達出來：

P(1.40<x̅ <1.50)=95%；

式中的 x̅ 表示小學生的平均身高。(1.40<x̅ <1.50)是置信區間；95%是置信度，1.40m和1.50m分別是置信下限和置信上限。

置信區間的分類

雙側置信區間：上例中的(1.40<x̅ <1.50)屬於雙側置信區間；

單側置信區間：在有些場合下，我們只關心總體參數某一側的界限。例如，對於產品的壽命來說，消費者只關心其壽命的下限，對其上限則希望越長越好；而對於許多成本，則正好相反。

區間估計原理

下面以估計正態總體的均值為例，說明區間估計的原理。

置信度與置信區間的關係

在估計總體參數時，一般都會給出一個較高的置信度，如95%或99%等。但是，當樣本容量n一定時，置信度越高，置信區間就越大，也即估計的參數的相對精度就會越低。反之，置信度越低，則精度相對就會越高。

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流，內容版權歸原作者所有。

統計學大數據分析心得人工智慧心得經濟學系

HCHUNGW

HCHUNGW的部落格

HCHUNGW 發表在痞客邦留言(0) 人氣()

HCHUNGW的部落格

破軍突破革新希望多元開放平等進步