統計筆記(44)假設檢驗原理:兩類錯誤
在進行假設檢驗時,一般按以下四個步驟順序進行:
1、根據問題建立原假設和備擇假設;
2、選擇適當的樣本統計量,並確定以H0為真時的抽樣分佈;
3、選定顯著性水準α,確定臨界值;
4、進行判別,得出結論。
理想的假設檢驗是當H0是正確的假設時,能夠判別為接受。當H0是不正確的假設時,能夠判別為拒絕。但是,在由樣本統計量資料判斷總體參數時,由於樣本資料具有隨機性,因此在判別時,就可能有四種結果出現:
1、H0為真但判別為拒絕,此類錯誤為“棄真”錯誤,即將真的當成假的,也稱為第一類錯誤。
2、H0為真並被接受,這是正確的判別。
3、H0為假並被拒絕,這是正確的判別。
4、H0為假並被接受,此類錯誤稱為“取偽”錯誤,即將假的當成真的,也稱為第二類錯誤。
由上表可以看到,當檢驗結果拒絕原假設時,判斷可能是正確的,也有可能是“棄真”錯誤。
雖然不能判斷犯“棄真”錯誤的概率有多大,但是由前述知道,拒絕域的概率為α。
因此,在假設檢驗中,犯“棄真”錯誤的概率的最大值就是給定的顯著性水準α。
當檢驗結果接受原假設H0時,判別可能是正確的,也有可能犯“取偽”錯誤。通常用β表示犯“取偽”錯誤的概率,β的概率是由真正的總體參數的分佈所決定的。在假設檢驗中,由於真實總體參數值不可知,因此,β的概率值也不可知。
所以在檢驗中,如果結論是拒絕H0,接受H1,那麼犯錯誤的概率很小(α)。但是如果結論是接受H0,拒絕H1,則犯錯誤的概率(β)是不可知。
從這一點來看,所謂接受H0,實質是不能拒絕H0,即在沒有足夠證據證明情況下只能接受。
雖然β在檢驗時是未知的,但對於一個固定的總體來說,當給定α以後,β的數值也就隨之確定,如下圖:
當真實總體均值為μ1時,卻假設總體均值為μ0,(μ1>μ0)。
如果樣本資料落入α區域,則結論是正確的,即拒絕μ0。如果樣本資料落入接受域,就會接受原假設μ0,這就犯了“取偽”錯誤。這時樣本資料落入接受域的概率並不是1-α,而是β,因為樣本是從真實總體μ1中抽取的,樣本是服從μ1的分佈。
從上圖還可以看出,當α增大時,β就會減小;當α減小時,β就會正大。
所以,在假設檢驗中通常只控制α的數值,通過α的取值大小來控制在檢驗中犯“棄真”或是“取偽”錯誤的概率。通常這種只對α的檢驗被稱為顯著性檢驗。
在進行假設檢驗時,一般按以下四個步驟順序進行。
1、根據問題建立原假設和備擇假設;
2、選擇適當的樣本統計量,並確定以H0為真時的抽樣分佈;
3、選定顯著性水準α,確定臨界值;
4、進行判別,得出結論。
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。
留言列表