close

統計筆記(45)單樣本的假設檢驗

基礎準備

假設檢驗基礎概念回顧:

小白學統計(41)假設檢驗的前世今生

單樣本假設檢驗的應用

假設檢驗需要設立一對統計假設:原假設(零假設)和備擇假設(對立假設)。其中原假設一般是一明確的語句:未知的總體參數等於某個特殊的數值,然後對其進行檢驗。

因此,單樣本假設檢驗可用於探測參數的變化,例如:在科學研究中,檢驗某新型的汽油添加劑是否能增加每升油的行駛公里數?

某新型血壓藥對體溫是否有影響?在工業品質控制中,工廠檢查其薯片產品是否與列在包裝上的脂肪含量一致;檢查巧克力的重量是否與包裝上重量一致等等。

單樣本假設檢驗步驟

單樣本假設檢驗步驟如下:

(1)選擇零假設和對立假設;

(2)選擇顯著水準α

(3)決定檢驗統計量,由此統計量及α來確定檢驗的決策規則,並用P或臨界值描述;

(4)從總體取一隨機樣本,並從樣本計算檢驗統計量的值,若可能,計算P值;

(5)由樣本結果和決策規則決定是拒絕還是接受原假設(零假設);

(6)檢驗的功效。

(1)選擇零假設和對立假設

一個零假設和一個對立假設組成一對統計假設(原假設和對立假設的概念描述請回顧:假設檢驗原理——原假設和備擇假設的建立),這樣成對的統計假設可以分為兩類三種:單側假設核對總和雙側假設檢驗(兩類);無方向對立假設、左向對立假設和右向對立假設(三種)。那如何選擇統計假設呢?

單側假設檢驗:只有一個方向上的變化是重要的(某種新型減肥藥實際減肥多少)或研究的假設預告了一個具體的變化方向(某種新的治療腫瘤會減小)時用單側假設合適。有的需要檢驗是否變大,有的檢驗是否變小。

雙側假設檢驗:對於探索性研究和品質控制,因為任何一個方向的變化都要檢查,單檢驗就不合適了,應該用雙側假設檢驗,例如控制產品的重量和產品內某種物質的含量。

(2)選擇顯著水準α

回憶估計理論,總體均值的區間估計概率公式如下:

其中,1-α稱為置信度或置信係數,(1-α)100%稱為置信水準。以雙尾為例,如下圖:

0e76f94d58b4463562d0865d87090a25.jpg

 

在假設檢驗理論中,α是假設檢驗的顯著水準,這是因為它用以評估樣本結果的顯著性,如果點估計值與零假設中的假設參數有很大差別,以至於P≤α,則拒絕零假設,該結果稱為統計顯著;如果P>α,則接受零假設,該結果稱為不是統計顯著的。如上圖所示,臨界域即為統計顯著域,接受域為非統計顯著域。

顯著水準α在試驗前設定為0.050.01。例如當α=0.05時,分析人員會在報告中說明統計假設檢驗是在0.05顯著水準(或5%顯著水準)下進行的如果P≤0.05,則拒絕零假設,該結果稱為統計顯著;如果P>0.05,則接受零假設,該結果稱為不是統計顯著的。

從上圖中可以看出,如果P≤0.05,陰影面積比P≤0.01的大,所以P≤0.05可說成是顯著的結果P≤0.01可說成是高度顯著的結果P≤0.01P≤0.05發生第一類錯誤的概率α小。

(3)決定檢驗統計量,由此統計量及α來確定檢驗的決策規則,並用P值或臨界值描述;

(4)從總體取一隨機樣本,並從樣本計算檢驗統計量的值,若可能,計算P值;

根據假設檢驗的總體參數和已知的資訊,選擇假設檢驗的統計量。在上一篇:假設檢驗的前世今生中解釋過合適的統計量是假設檢驗的基礎。

對於總體均值的假設檢驗,可用下表選擇:

a44078a121fe5cb736146f94465816b9.jpg

 

對於總體方差的假設檢驗,可以用卡方分佈。

下面以Z統計量為例,說明假設檢驗原理:

如果在(1)中設定的總體均值的統計假設是雙側假設:H0:μ=μ0H1:μμ0。假定零假設為真,則可知:如果所有容量為n的隨機樣本來自於無限大的正態總體(已知標準差為σ),且對每一樣本計算均值,該情況下均值的抽樣分佈是正態分佈:

 

bf43152fb6d38dbfd02e01a95c1cad6f.jpg

因為抽樣分佈為正態

分佈,可進行正態變換,將抽樣分佈統計量變換為Z統計量:

5465b4af68c748d579d4c053fc992f8d.jpg

 

變換後的Z統計量可以用來度量零假設為真的可能性。如果對一個給定樣本計算Z統計量的特定值,幾座z1,若z1=0,該樣本均值一定等於μ0(紅框公式),因而H0:μ=μ0很可能為真。然後,當z1是一較大數時,在零的正或負向,即z1=αz1=-α,則樣本均值與μ0有相當距離,因此,H0:μ=μ0不太可能為真。通過計算P值,即可將可能性量化,進而進行統計假設檢驗決策。如下圖所示:

d5b1ab2dd9f0c89b617409d6dc983d51.jpg

 

P值得計算:

對於雙側假設檢驗,P值就是兩個陰影部分的面積和(如上圖所示);如果是單側假設檢驗,就是左側面積或者右側面積。陰影部分面積用標準正態分佈表查得。

(5)由樣本結果和決策規則決定是拒絕還是接受原假設(零假設);

將計算得到的P值與顯著水準α比較,P≤α,則拒絕零假設,接受對立假設;如果P>α,則接受零假設。

另外也可以通過比較臨界z值來決定是拒絕還是接受零假設。因為P值和z值是等價的,例如,如果z1>1.645成立,則P≤0.05成立。

(6)檢驗的功效

在兩類錯誤介紹中:假設檢驗——兩類錯誤,可列出下面的表格:

4c50759b7e901a9113feb0ebd20779bb.jpg

 

 

從表格可以知道,第一類錯誤(零假設為真拒絕)的概率α是檢驗的顯著性水準:若P≤α,則拒絕零假設。然而在任何此種統計決策中,存在第二類錯誤:就是零假設不真被接受,它的概率是βα1-α是已知的,由研究者在檢驗前設置,但β1-β的值是不能確定的,因為不知道總體的參數,所以無法證明H0的真與不真。但是αβ的關係是相反的:α越大,β越小,反之亦然。如下圖所示:α越大,接受域越小,接受不真的零假設的概率β也越小。

2c2253f25f57a77bdec6bd9c2e98902d.jpg

 

假設檢驗的功效就是正確拒絕錯誤零假設的概率1-β。求解方法見例題。

範例分析

如果某電池生產商最近設立了一個改進計算器電池的專案,要求改進的電池比現有的電池使用時間長,已知現在計算器中,電池壽命的量度是正態分佈的,均值為100.3min,標準差為

6.25min。現在開發了一種改進電池,在理論上可能持續更長時間,由初步檢驗可以假定期壽命量度也是正態分佈,標準差為6.25min。選取了一個n=20的改進電池的樣本,得到均值為

105.6min,在顯著水準α=0.05下,作H0: μ=100.3min的單側檢驗,並用P值(z值)敘述決策。

 

e4e2b7307e82d27be1ab1f9729eaec83.jpg

88a22cb314cd844f9661bb402e6db08a.jpg

 

 

假設功效,如下圖所示:

50d254c628fb2f6ca32d78ebbd0d8289.jpg

 

 

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有,如涉作品、版權和其他問題請給「我們」留言處理。

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()