close

統計筆記(57)方差分析:單因素方差分析

對多個總體均值進行檢驗,需要用到方差分析方法

基礎準備

在多樣本的參數估計與假設檢驗基礎中以單因素方差分析為例,介紹了方差分析原理和推導過程,本篇從分析步驟角度再次介紹單因素方差分析:

對多個總體均值進行檢驗,需要用到方差分析方法(ANalysis Of VAriance,簡稱ANOVA)。例如,某工廠有ABC三台軋製板材的設備,如果想知道這三台設備軋製板材的厚度是否一致,就可以轉化為檢驗來自三個總體的均值是否相同的問題。以上面所說軋製板材為例,檢驗ABC三台設備軋製的板材厚度是否一致,可以建立如下假設:

H0: μ12=…=μr

H1: μ1μ2μr不全相等。

三個總體均值是否相等無從知道,但是可以通過樣本均值是否有顯著差異來檢驗總體均值是否相等。

因為,如果H0為真時,則可以期望樣本均值很接近,如果樣本均值很接近,則推斷總體均值相等的證據很充分,就可以接受H0

否則,當樣本均值相距較遠,就認為總體均值相等的證據不充分,從而拒絕H0,接受H1

樣本均值之間距離的所謂遠近是相對的,是通過假定的共同方差的兩個點估計值比較得出的。第一個點估計是組內方差,用各個樣本方差估計得到的,只與每個樣本內部的方差有關,反映各個水準內部隨機性的變動。第二個點估計值是組間方差,在H0為真的前提下,由均值抽樣平均誤差計算得到,這樣得到的方差包含兩部分的變動:一是各個水準內部的隨機性變動,二是各個水準之間的變動。將組間方差與組內方差相比,可以得到一個F統計量(F=組間方差/組內方差),可以證明該統計量服從F分佈。

由推斷可知,如果三台設備軋製板材的厚度均值相差很小,即組間方差中的各個水準之間的變動很小,F比值會接近於1

反之,則F的比值會顯著地大於1,根據上面計算得到的F值,在顯著性水準α給定的情況下,就可以做出是否接受三台設備軋製板材厚度均值相等的假設。

單因素方差分析步驟

現在假定一個因素B具有c個水準的因變數進行方差分析檢驗,例如上面提到的工廠軋製設備是因素,分別試驗軋製了10塊板材是水準。

1、建立假設

H0: μ1=μ2=…=μc

H1: μ1μ2μc不全相等。

2、計算樣本均值和樣本方差

4070e17ccdf695f81743b3976d417e0e.png

 

3、計算組間方差

c5bdf518c49f0df2508341d3c47151de.png

 

4、組內方差的估計

25361f29e6121b8fcd5daaa5a14d8e11.png

 

5、構造F統計量進行檢驗

F=組間方差/組內方差=MSB/MSE~F(c-1, nT-1)

如果c個總體均值不相等,則組間方差(MSB)會大於組內方差(MSE)。當F值大到某一臨界值時,就可以拒絕H0。臨界值的大小由給定的α和自由度決定。所以,當給定顯著性水準為α時,F的拒絕域為F>Fα(c-1,nT-c)

6、方差分析表

 

a0b07ee391c0dc600abe5dcd79d8cee4.png

範例分析

例題:有8位食品專家對三種配方的食品隨機品嘗,然後給食品的口感分別打分(滿分10分),如下表。問三種配方的平均分數是否相同?(α=0.05)(假定打分服從標準相等的正態分佈)。

0540c467198ef5c58bb01df6d3c8bb4e.png


解:設μAμBμC分別代表配方123。已知因變數是分數,因素是配方,水準為3,具有相同的樣本容量8。根據題意建立假設:

H0: μA=μB=μC

H1: 總體均值不全相等。

首先,計算樣本均值及方差

 

8fbbc615ffd534d704f9ac85b4b574f1.jpg

其次,計算組間方差MSB

 

a7df2020db69ab24161e7b95dd0a2efb.png

第三,計算組內方差MSE

97da46a0adc211c0a09dfcfb2ffcd9d7.png

 

第四,計算F統計量

740569795601a78f3ae1401ed19903ad.png

 

最後,查表Fα(c-1,nT-c)= F0.05(2,21)=3.47。因為F=1.119<3.47= F0.05(2,21),落在接受域。所以接受H0,拒絕H1,即三種配方的口感分數沒有顯著的差異。

本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()