close

統計筆記(50)假設檢驗時,樣本容量的確定

如果統計量的數值落在接受域內,則作出的結論可能犯取偽錯誤,而且犯取偽錯誤的概率β是不可知的。

如果統計量的數值落在接受域內,則作出的結論可能犯取偽錯誤,而且犯取偽錯誤的概率β是不可知的。但是,在實踐中,有些決策既需要控制犯棄真錯誤的概率α,也需要控制犯取偽錯誤的概率β。在這種情況下,可以通過樣本容量的改變來滿足這種要求。

例如,我們假設

H0:μ=μ0

H1:μ>μ0

如果σ已知,n為大樣本(或正態總體),則可以確定

 

2016100417045028.jpg

上式即為在αβ都確定後的樣本容量計算公式。在使用上式時還需注意,當假設為H0:μ=μ0   ;   H1:μ<μ0時,上式中的分母為0-µ1)2,其值與1-µ0)2相等,因此n不變。當假設為H0:μ=μ0   ;   H1μ0時,公式中的ZαZα/2代替。

2016100417045028.jpg

 

 

下面我們通過一個例題來說明n的確定方法。

例題:有人說某學院學生平均每天的鍛煉時間至少30min。隨機在該學院中選取100名學生,他們每天平均的鍛煉時間為31min,已知學生鍛煉時間的標準差為12min。試在α0.05的顯著性水準下,檢驗該人的說法是否可信。

:本例是對總體均值的單側檢驗問題。

根據題意假設

H0:μ=30; H1:μ>30

已知n100為大樣本,樣本均值為31min,標準差為12min,根據上式可以構造統計量,即

2016100417045189.jpg

 

查標準正態分佈表得Z0.051.64。所以Z0.833落在接受域內。即接受原假設,拒絕備擇假設,此人的說法不可信。

上面這個例子中的結論有可能犯取偽錯誤,即真實的運動時間已經超過了30min,但卻沒有得到證明。現在我們來重新對上例進行檢驗。仍然假設H0:μ=30; H1:μ>30,給定α0.05。 β也可同時給出,但β是與真實的總體的均值聯繫在一起的。 因此當我們無法知道真實的總體均值時,可以逐一假設真實總體均值,從而得出不同的β值。 在本例中,先假設真實總體的均值μ133min。首先有公式計算:

2016100417045277.jpg

 

 

由標準正態分佈表中可查到臨界點0.860點的概率為0.3051.所以由-0.86到-∞的概率為β0.50.30510.1949

依此類推,可以通過計算得到在不同假設真值μ條件下的β值。如下表所示:

μ值

z

β

1-β

30.1

1.556

0.9406

0.0594

31

0.8066

0.791

0.209

32

-0.03

0.488

0.512

33

-0.86

0.1949

0.8051

34

-1.693

0.0455

0.9545

35

-2.526

0.0057

0.9943

上表中的1β表示原假設不真時,被拒絕的概率;1β也稱為功效函數。 可以看到,當μ值離30很近時,1β值很小,並且以原假設的30為極限;當μ30較遠時,1β值逐漸增加。這就是說,如果真實的μ值離原假設的30相距不遠時,犯取偽的錯誤的可能性是很大的;反之,相距較遠時,則犯取偽的錯誤的可能性就很小。本例中當μ135時,β0.0057,即取偽的錯誤概率只有0.57%,幾乎不可能發生。

根據給定α以及確定樣本容量n以後,就可以知道在不同真實總體均值的情況下,β值的大小。在上表中,當μ133時,β0.1949。但如果在檢驗中,我們希望μ133時,犯取偽錯誤的概率β0.1,而不是0.1949。就是說在檢驗時,如果學生鍛煉時間是33min,那麼檢驗者只想冒β0.1的風險接受H0為假時的假設,而不是β0.1949。 對此,只能通過調整樣本容量來完成。如檢驗前確定α0.05μ133時,β0.1,則根據公式計算n,即

2016100417045312.jpg

 

即滿足上述要求的樣本容量是137人,比原來調查的100人增加了37人。

有本例可以看到,當n一定時,α增大,β將減小;α減小,β將增大。當α一定時,n增大,β將減小;n減小,β將增大。所以,在實際檢驗中,當n一定時,研究者並不是選擇很小的α。因為這樣的選擇雖然可以使棄真錯誤減少,但同時也增加了取偽錯誤的概率。

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()