統計筆記(50)假設檢驗時,樣本容量的確定
如果統計量的數值落在接受域內,則作出的結論可能犯“取偽”錯誤,而且犯“取偽”錯誤的概率β是不可知的。
如果統計量的數值落在接受域內,則作出的結論可能犯“取偽”錯誤,而且犯“取偽”錯誤的概率β是不可知的。但是,在實踐中,有些決策既需要控制犯“棄真”錯誤的概率α,也需要控制犯“取偽”錯誤的概率β。在這種情況下,可以通過樣本容量的改變來滿足這種要求。
例如,我們假設
H0:μ=μ0
H1:μ>μ0
如果σ已知,n為大樣本(或正態總體),則可以確定
上式即為在α和β都確定後的樣本容量計算公式。在使用上式時還需注意,當假設為H0:μ=μ0 ; H1:μ<μ0時,上式中的分母為(µ0-µ1)2,其值與(µ1-µ0)2相等,因此n不變。當假設為H0:μ=μ0 ; H1:μ≠μ0時,公式中的Zα用Zα/2代替。
下面我們通過一個例題來說明n的確定方法。
例題:有人說某學院學生平均每天的鍛煉時間至少30min。隨機在該學院中選取100名學生,他們每天平均的鍛煉時間為31min,已知學生鍛煉時間的標準差為12min。試在α=0.05的顯著性水準下,檢驗該人的說法是否可信。
解:本例是對總體均值的單側檢驗問題。
根據題意假設
H0:μ=30; H1:μ>30。
已知n=100為大樣本,樣本均值為31min,標準差為12min,根據上式可以構造統計量,即
查標準正態分佈表得Z0.05=1.64。所以Z=0.833落在接受域內。即接受原假設,拒絕備擇假設,此人的說法不可信。
上面這個例子中的結論有可能犯“取偽”錯誤,即真實的運動時間已經超過了30min,但卻沒有得到證明。現在我們來重新對上例進行檢驗。仍然假設H0:μ=30; H1:μ>30,給定α=0.05。 β也可同時給出,但β是與真實的總體的均值聯繫在一起的。 因此當我們無法知道真實的總體均值時,可以逐一假設真實總體均值,從而得出不同的β值。 在本例中,先假設真實總體的均值μ1=33min。首先有公式計算:
由標準正態分佈表中可查到臨界點0.86到0點的概率為0.3051.所以由-0.86到-∞的概率為β=0.5-0.3051=0.1949。
依此類推,可以通過計算得到在不同假設真值μ條件下的β值。如下表所示:
μ值 |
z值 |
β |
1-β |
30.1 |
1.556 |
0.9406 |
0.0594 |
31 |
0.8066 |
0.791 |
0.209 |
32 |
-0.03 |
0.488 |
0.512 |
33 |
-0.86 |
0.1949 |
0.8051 |
34 |
-1.693 |
0.0455 |
0.9545 |
35 |
-2.526 |
0.0057 |
0.9943 |
上表中的1-β表示原假設不真時,被拒絕的概率;1-β也稱為功效函數。 可以看到,當μ值離30很近時,1-β值很小,並且以原假設的30為極限;當μ離30較遠時,1-β值逐漸增加。這就是說,如果真實的μ值離原假設的30相距不遠時,犯“取偽”的錯誤的可能性是很大的;反之,相距較遠時,則犯“取偽”的錯誤的可能性就很小。本例中當μ1=35時,β=0.0057,即取偽的錯誤概率只有0.57%,幾乎不可能發生。
根據給定α以及確定樣本容量n以後,就可以知道在不同真實總體均值的情況下,β值的大小。在上表中,當μ1=33時,β=0.1949。但如果在檢驗中,我們希望μ1=33時,犯“取偽”錯誤的概率β=0.1,而不是0.1949。就是說在檢驗時,如果學生鍛煉時間是33min,那麼檢驗者只想冒β=0.1的風險接受H0為假時的假設,而不是β=0.1949。 對此,只能通過調整樣本容量來完成。如檢驗前確定α=0.05,μ1=33時,β=0.1,則根據公式計算n,即
即滿足上述要求的樣本容量是137人,比原來調查的100人增加了37人。
有本例可以看到,當n一定時,α增大,β將減小;α減小,β將增大。當α一定時,n增大,β將減小;n減小,β將增大。所以,在實際檢驗中,當n一定時,研究者並不是選擇很小的α。因為這樣的選擇雖然可以使“棄真”錯誤減少,但同時也增加了“取偽”錯誤的概率。
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。