兩個因素相互影響,ANOVA結果該如何判讀?| 協和八
原創 田菊
說人話的統計學
在上一集《31.多因素ANOVA=好幾個單因素ANOVA?可沒這麼簡單!》裡面,我們進一步介紹了多因素 ANOVA 裡面交互效應的意義,以及怎樣用資料視覺化的方法直觀地判斷有沒有交互效應。
這一集今天我們就更進一步地看一下在不同情況下如何正確地解讀 ANOVA 的結果。
1
我們先從一個簡單的例子看起,假設我們在研究某種新型藥物在治療某種疾病時的作用,實驗組是服用了新型藥物,而對照組服用了安慰劑,每一組不同性別各占一半。我們想知道,這種新型藥物對疾病有沒有效果(用指標 y0 來衡量),效果是否與性別有關。
實驗結果如下圖所示:
圖1 性別和實驗條件都有主效應,沒有交互效應。y 軸表示測量值的在特定條件下的平均值,X 軸表示實驗條件,男性和女性分別用圓圈和三角表示。
我們做完多因素 ANOVA 之後,統計軟體會輸出一個表格來匯總結果,不同的統計軟體輸出結果的格式會有所不同,我們將其中關鍵的幾欄資訊列在下表中:
表1 多因素 ANOVA 分析結果(對應圖 1 中資料)
表格的每一列代表不同的統計量, 我們再複習一下這些統計量的含義:
自由度是每個因素分組的數量減去 1,比如性別共分男女兩組,所以性別自由度是 1;交互效應的自由度是每個因素自由度的乘積。最後一行 residuals(殘差) 指的是不能被所研究的因素解釋的那部分波動性,其自由度就是總樣本量 30 減去總分組數。各個因素排列組合共有 2*2=4 種情況,所以總分組數是 4,殘差的自由度是 26 。
我們再來看看 ANOVA 結果中不同統計量之間的關係:
殘差的總平方和就是我們之前提到的組內平方和,而其他行的總平方和就是組間平方和。平均平方和就是總平方和除以自由度,而 F 值就是某個因素的平均平方和除以殘差的平均平方和。也就是說知道了自由度和總平方和,可以計算出平均平方和以及 F 值。最後知道了 F 值還要自由度,就可以計算出 p 值。在自由度不變的情況下,F 值越大,P 值越小。
這下子 ANOVA 表格已經一目了然了吧。我們可以看到性別和是否服用藥物兩行 p 值都遠小於 0.05,說明兩者都對觀測值 y0 有顯著影響,而第三行 p 值遠大於 0.05,說明兩個因素之間並沒有顯著的相互作用作用。我們可以得出結論,該新型藥物對 y0 有顯著影響,這個影響並不依賴於性別。
與單因素 ANOVA 一樣,在描述結果的時候,通常要給出每個因素及其交互效應的自由度,F 值還有 p 值。如果研究的因素比較多,結果用文字描述起來比較長,也可以直接放上類似表 1 的表格來描述結果。
我們之前提到,交互效應是相對於主效應而言的,在沒有交互效應的時候,ANOVA 的結果就比較簡單,因為兩個(或多個)因素的共同效應就等於各自單獨的作用的簡單疊加,這時候解讀 ANOVA 的結果就只要看主效應。如果某個因素主效應呈顯著性,就說明該因素對觀測值有顯著影響,反之,則沒有顯著影響。
2
當我們做了多因素 ANOVA,併發現有顯著的交互效應的時候,情況就比較複雜了,不能只通過主效應判斷這個因素對觀測值有沒有影響。
假設我們還是研究某個新型藥物和性別兩個因素對某個疾病的影響(用測量值 y1 來衡量),而這一次我們得到的資料長這個樣子:
圖2 性別和實驗條件都沒有主效應,有交互效應。
根據上一集學到的知識,如果不同組輪廓裡的折線不平行,則很有可能存在交互效應,即使我們還沒有用統計軟體查看 ANOVA 結果,我們也應該能夠猜到上圖中的資料性別與實驗條件存在交互效應。
從圖中還可以看出,對於女性受試者,實驗組比對照組的 y1 值要高,而對於男性受試者,效果卻是相反。因為男女受試者在實驗組和對照組各占一半,且效果相反,所以總的效果是:實驗條件這一因素的主效應不顯著,而性別這一因素的主效應也是不顯著,只有交互效應有統計顯著性, 結果如下圖所示:
表2 多因素 ANOVA 分析結果(對應圖 2 資料)
在這種情況下,雖然主效應不顯著,我們並不能說新型藥物對這一疾病沒有效果,因為從輪廓圖可以看出它很有可能對女性受試者是有效的,而對男性受試者有相反的效果。這時我們再籠統地說該新型藥物對這一疾病有沒有效果已經不合適了,而且這樣做是有很強的誤導性的。
從上面這個例子可以看出,如果交互效應顯著,即使某個因素的主效應不顯著,也不能說這一因素對測量值沒有顯著影響。換句話說,交互效應有時會「遮蓋」主效應。
3
既然主效應顯著並不是一個因素能影響測量值的必要條件,那有沒有可能只要主效應有統計顯著性,就說明這個因素對測量值有顯著影響呢?
我們再看一個例子。
這次是新型藥物和性別對某疾病的指標 y2 的影響,資料長這樣子:
圖3 性別和實驗條件都有主效應,也有交互效應。
下面是又到了看圖作文的時間,首先我們可以看到,女性受試者並不是實驗條件影響,而男性受試者則不同,實驗組比對照組中男性受試者的 y2 指標要高出許多,這似乎又是一個有交互效應的例子(都被你們看穿了~~)。
下面是多因素 ANOVA 分析的結果,性別,實驗條件,還有兩者的相互作用都顯著。
表3 多因素 ANOVA 分析結果(對應圖 3 中資料)
吃瓜群眾如果只看 ANOVA 表,雖然能夠看出是性別和服用藥物都對結果有顯著影響,但並不能知道藥物原來只對男性患者有效,對女性患者無效。也就是說,由於有顯著的交互效應,多因素 ANOVA 的結果並不能完整地描述結果 ,這時進行事後檢驗來具體看哪些條件下資料有顯著性差異對於正確地解讀結果是必須的 。
4
與單因素 ANOVA 類似,在多因素的情況下可以運用 Tukey 事後檢驗將不同條件下的資料進行兩兩對比,來確定到底哪些情況下測量值有顯著不同。
在前面的例子裡面,性別和實驗條件的組合共有 4 個不同的實驗條件,再將其進行兩兩比較,就一共有 6 對兩兩比較需要做。我們將圖 3 中的資料做 Tukey 事後檢驗所得到的結果如下:
表4 Tukey事後檢驗結果(對應圖 3 中資料)
Tukey 事後檢驗的結果也印證了我們之前視覺化的結果,即男性患者實驗組和對照組有顯著區別,女性患者沒有顯著區別。
上面的兩個例子有一個共同點,那就是不僅存在顯著的交互效應,而且一個因素(性別)的不同組(男性或女性)隨著另一個因素(實驗條件)的變化對測量值的影響並不一致,比如圖 2 裡面男性實驗組比對照組低,而女性相反,我們可以將其稱之為無序的交互作用。
當資料出現無序的交互作用時,討論主效應是沒有意義的,必須要通過事後檢驗來進一步看哪兩組資料資料不同。
最後我們再總結一下做多因素 ANOVA 分析的方法:
首先,需要對資料進行視覺化,對可能出現的結果有一個預期,尤其要注意是否會有無序的交互作用;
然後對資料使用多因素 ANOVA 分析,如果沒有交互效應,可以通過主效應判斷因素是否對測量值有顯著影響,如果發現有無序的交互效應, 則必須還要做事後檢驗,對結果的討論也要圍繞事後檢驗兩兩比較的結果進行。
本系列文章
第 1 章 高屋建築看統計
1.你真的懂p值嗎?
2.做統計,多少資料才算夠?(上)
3.做統計,多少資料才算夠?(下)
4.提升統計功效,讓評審心服口服!
5.你的科研成果都是真的嗎?
6.見識資料分析的「獨孤九劍」
7.貝葉斯vs頻率派:武功到底哪家強?
第 2 章 算術平均數與正態分佈
8.數據到手了,第一件事先幹啥?
9.算術平均數:簡單背後有乾坤
10.正態分佈到底是怎麼來的?
第 3 章 t 檢驗:兩組平均數的比較
11.想玩轉t檢驗?你得從這一篇看起
12.就是要實用!t 檢驗的七十二變
13.不是正態分佈,t 檢驗還能用嗎?
14.只有15個標本,也能指望 t 檢驗嗎?
15.樣本分佈不正態?數據變換來救場!
16.數據變換的萬能鑰匙:Box-Cox變換
17. t 檢驗用不了?別慌,還有神奇的非參數檢驗
18.只講 p 值,不講效應大小,都是耍流氓!
19.找出 t 檢驗的效應大小,對耍流氓 say no!
20.用置信區間,就是這麼(不)自信!
21.如何確定 t 檢驗的置信區間
22.優雅秀出你的 t 檢驗,提升Paper!
23.要做 t 檢驗,這兩口毒奶可喝不得!
第 4 章 方差分析(ANOVA):多組平均數的比較
24.要比較三組資料,t 檢驗還能用嗎?
25.ANOVA在手,多組比較不犯愁
26.ANOVA的基本招式你掌握了嗎?
27.ANOVA做出了顯著性?事兒還沒完呢!
28.聽說,成對t檢驗還有ANOVA進階版?
29.重複測量ANOVA:你要知道的事兒都在這裡啦
30.沒聽說過多因素 ANOVA ?那你就可就 OUT 了!
31.多因素ANOVA=好幾個單因素ANOVA?可沒這麼簡單!
32.兩個因素相互影響,ANOVA結果該如何判讀?
作者:田菊
編輯:黑草烏葉
留言列表