close

統計筆記(54)兩個總體均值差的假設檢驗

兩個總體均值差的假設檢驗

基礎準備

兩樣本參數估計:兩樣本估計和假設檢驗基礎

兩樣本假設檢驗:兩樣本估計和假設檢驗範例分析

成對樣本假設檢驗:成對樣本兩個總體均值差的假設檢驗

根據兩個樣本之間的關係,可以劃分為獨立樣本和成對樣本(兩樣本估計和假設檢驗基礎),它們的區間估計方法是不同的,成對樣本的區間估計和假設檢驗請回顧:小白學統計(52)成對樣本兩個總體均值差的假設檢驗);如果是從兩個互相之間沒有影響的樣本中得到的資料,稱之為來自獨立樣本。下面介紹來自兩個獨立樣本的均值之差的區間估計。

對兩個總體均值差異的檢驗,在實踐中有許多應用。例如,要確定兩個城市收入水準是否有明顯不同;要分析男、女消費者平均購物支出是否有差別;需要判斷醫生與律師哪一種職業收入更高;想研究兩種購物環境下,顧客的停留時間是否一致等。這些研究都可歸於兩個總體均值之差的檢驗問題。

兩總體均值差假設檢驗

σ1σ2已知的正態總體,獨立樣本

如果X1N(µ1σ12)X2N(µ2σ22)σ1σ2已知。n1n2是來自兩個獨立樣本的樣本容量,則根據下面公式,可以構造Z統計量,得:

006VeGrogy1ghgx5vmi8dj30g20613zv.jpg

 

如果研究的問題是兩個總體均值是否有差異,則可建立如下雙側假設:

H0: µ12;

H1: µ1≠µ2

上述假設也可以記為:

H0: µ1–µ20;

H1: µ1–µ20

如果在研究中要檢驗一個總體均值是否大於(或小於)另一總體的均值,這時就應進行單側檢驗,記為:

H0: µ1–µ2=0

H1: µ1–µ2>0

H0: µ1–µ2=0

H1: µ1–µ2<0

範例分析

1:有甲、乙兩條生產線同時罐裝產品,已知兩條生產線產品的品質都服從正態分佈。甲(總體1X1N(10.32),乙(總體2X2N(20.42)。現分別從甲、乙兩條生產線上隨機抽10件和8件產品,測得它們的平均品質為249.4g250.2g。問甲、乙鏈條生產線罐裝產品的品質是否有明顯差異。(α0.05

解:本例是關於兩總體均值是否有差異的雙側檢驗問題。

H0: µ12;

    H1: µ1≠µ2

根據上述已知條件總體1方差為0.32,總體2方差為0.42,樣本1容量為10,樣本2容量為8,總體1的樣本均值249.4g,總體2的樣本均值250.2g。可選取統計量Z,得:

006VeGrogy1ghgx1zbkz0j30h603nq44.jpg

 

已知α0.05,為雙側檢驗。查正態分佈表,臨界值為±Z0.05/2=±1.96。因為Z=-4.70<-1.96-Z0.05/2,統計量落在拒絕域內,所以拒絕原假設,接受備擇假設,即甲和乙兩條流水線罐裝產品的品質存在顯著的差異。

σ1σ2未知,假定σ12兩樣本容量小於30

前面介紹過(回顧: 小白學統計(35)不同條件的總體均值單樣本估計方法總述 ),對於正態總體,標準差未知的情況,需要用到t分佈進行均值的區間估計和假設檢驗,這是對於單樣本而言的;對於兩正態總體,標準差未知,當σ12時,可以將兩總體均值差的問題轉化為單個總體均值區間估計和假設檢驗的問題了,此情況的公式推導請回顧: 小白學統計(51)兩樣本估計和假設檢驗基礎 。根據上述條件,應該用t統計量,由下面公式:

201610041727555.jpg

 

σ1σ2未知且不相等兩樣本容量小於30

與上述情況稍有不同,當兩正態總體標準差不等時,如何進行區間估計和假設檢驗呢?同樣是運用t分佈,不同的是自由度不再是n1+n2-2,而是由下式計算得到得自由度對應的t值來進行區間估計和假設檢驗。

2016100417275662.jpg

 

範例分析

2:某燈飾廠聲稱該廠聲稱的新型節能燈的平均壽命比老型節能燈的壽命更長。現隨機從新、老兩種節能燈中各抽取15只進行檢測。新型(設為總體1)的檢測結果是X15306hS1150h;老型(設為總體2)的檢測結果是X25200hS2120h。已知節能燈的壽命服從正態分佈。問在α0.05的顯著性水準下,上述樣本資料能否證明燈飾廠說法。

解:本例是關於兩個總體均值差異的單側檢驗問題。對燈飾廠聲稱的1>2就是要檢驗的問題,所以將1>2設為備擇假設,有

H0: µ1–µ2=0;

H1: µ1–µ2>0

由題中知,n1=n2=15是小樣本,總體服從正態分佈。因為σ1σ2未知,且是否相等不知,所以應使用的統計量為

2016100417275866.jpg

 

因為α0.05,是右側檢驗,統計量的t的自由度有下式算出

201610041727592.jpg

 

t分佈表,得到臨界值t0.05(27)1.703。因為t=2.137>1.703t0.05(27)落在拒絕域,所以拒絕原假設,接受備擇假設,即可以認為燈飾廠關於新型節能燈壽命更長的說法是可信的。

n1≥30n2≥30的任何總體

在大樣本情況下,根據中心極限定理可知,兩總體均值差的抽樣分佈是以正態分佈為極限的,所以可不考慮總體的分佈形態,構造統計量

006VeGrogy1ghgx5vmi8dj30g20613zv (1).jpg

 

在上式中,如果σ1σ2未知,可分別用樣本均值S1S2代替。

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()