多因素ANOVA=好幾個單因素ANOVA?可沒這麼簡單!| 協和八
原創 張之昊
說人話的統計學
在上一集《30.沒聽說過多因素 ANOVA ?那你就可就 OUT 了!》裡,我們為大家初步介紹了多因素 ANOVA(方差分析)的方法。
不知道你意識到沒有,相比起之前我們講過的 t 核對總和單因素 ANOVA,多因素 ANOVA 為我們打開了一片廣闊的新天地。
為什麼這麼說呢?
在 t 核對總和單因素 ANOVA 裡,不管我們是比較幾組資料的平均值,我們考慮的都只是一個因素:
✓ 如果我們用獨立樣本 t 檢驗比較男性和女性,這個因素就是「性別」;
✓ 又或者我們用成對樣本 t 檢驗比較藥物組和安慰劑組,這個因素則是「用藥」或者「實驗處理」;
✓ 如果我們用單因素 ANOVA 比較食堂裡三位師傅做出來的包子,這個因素就是「師傅」。
但是呢,一來,大千世界紛繁複雜,往往有不止一個因素影響某個結果;二來,在科研實踐裡,我們往往同時對不止一個因素感興趣,或者有些因素由於客觀條件所限我們無法完全控制住。這時,只能管一個因素的統計學檢驗就有點兒不夠用了。
你也許會問,那我把 t 檢驗或者單因素 ANOVA 分別對每個因素都用一遍不行嗎?
這個問題問得很好(先不要往下看,你知道這個問題的答案嗎?☻)。
而一旦我們同時考慮不止一個因素,這些因素之間就還會有相互影響的可能性——這就是多因素 ANOVA(以及我們以後會講到的其他用於分析多個因素的統計方法)中的「交互效應」的意義所在。要把多因素 ANOVA 用好,至關重要的一點就是得把交互效應的含義理解清楚。
在今天的文章裡,我們就來把這個問題仔細地挖一挖。
◆◆◆
交互效應到底是什麼?
上一集裡我們講到,交互效應是相對於主效應來說的。所謂主效應,就是各個因素自己在不考慮別的因素情況下對因變數 y 的影響。在此基礎上,交互效應可以有兩種解釋:
一種是說兩個因素的共同效應不等於各自單獨的作用(各自的主效應)的簡單相加,換言之,「一加一不等於二」;
第二種解釋則是,一個因素的效應取決於另一個因素,也就是說,前者起到什麼作用還要看後者的「眼色」。
聽起來好像有些複雜,其實我們在日常生活中這樣的情形實在是太多了。比如說,你的衣櫥裡有一身最新正版皇家馬德里球衣,還有一雙鋥亮的阿瑪尼皮鞋,它們各自都能讓你魅力值立增 50 點(我們姑且不考慮圍觀群眾是巴薩球迷的可能性),但是如果你把它們同時穿上走到街上,能獲得魅力值增加100點並且吸引來一群迷妹嗎?可能性顯然不大。這裡,球衣和皮鞋這兩個因素的共同效應就不等於它們各自作用之和。或者說,球衣對你形象是否起到正面作用還得取決於你有沒有一時腦子短路搭配了一雙皮鞋。
知道了怎樣算是有交互效應,我們把它翻個個兒就能知道什麼情況下沒有交互效應:兩者的共同效應等於各自單獨效應相加,或者一個因素的效應與另一個因素無關。
如果你還覺得上面的文字有些抽象,我們不妨用圖形的方式來更直觀地表現上面的討論。同時,我們也借助這個機會給大家講一講,怎樣在論文中用圖形表示用於兩因素 ANOVA 分析的資料。
別忘了,不管是什麼 ANOVA,本質是對資料不同分組的平均值進行比較。除了組數多一點以外,本質上和 t 檢驗比較兩組資料的平均值是沒有區別的。理論上來說,我們在《22.優雅秀出你的 t 檢驗,提升Paper!》裡講過的幾種用於表示平均值的常用統計圖形都可以用在這裡,上一集《30.沒聽說過多因素 ANOVA ?那你就可就 OUT 了!》中比較三位師傅做的兩種餡兒的包子的重量的例子裡,我們就用了散點圖。
但是,由於多因素 ANOVA 往往分組數量比較多, 還可能存在交互效應,如果用散點圖的話有時會使圖形變得十分繁雜,重點不突出,這時我們可以回到柱狀圖、箱線圖,畫出各組的平均值和展布(如標準差)。
另一種更簡單、也更常用的畫法,就是直接用單獨的點來表示各組的平均值,再加上誤差棒,然後再用合適的標記把不同因素區分開來(具體見圖 1 下邊的部分以及下面的介紹),被很多統計學書籍稱為「輪廓圖」或「剖面圖」(profile plot)。
我們認為,這兩個中文譯法並不是特別好。
英文 profile 有幾個不同的含義,在這裡的意思更多是「主要特徵」。
對於 ANOVA 來說,分組各組平均值是樣本最重要、最突出的特徵。
如果非要生搬硬湊的話,我們可以將其類比成描繪一個人面部輪廓的人像剪影 。
◆◆◆
假設因素 A 有三個分組(就好像上一集的例子中「師傅」這個因素有格格巫、康師傅和王師傅),而因素 B 有兩個分組(比如包子餡兒有肉、菜兩種)。
下圖用兩種方法畫出了一個假想的情形(資料的展布在下面的討論中不太重要,因此我們省略了誤差棒):
圖1 用柱狀圖(上)和輪廓圖(下)繪製兩因素 ANOVA 結果圖
在圖 1 的兩種畫法裡,縱軸都遵循一般習慣留給了因變數 y,而橫軸用來表示因素 A 的不同分組(或者叫級別或水準)。還剩一個因素 B 怎麼辦呢?由於是二維圖形,兩個坐標軸都已經用完了,因此我們就得玩一些別的小花樣,用顏色(上圖)或點的形狀(下圖)區分因素 B 的不同分組。
在下邊的輪廓圖裡,我們還用線把來自因素 B 相同分組的點連在一起,使分組更為清晰。順便說一句,因素 A 和 B 的位置是可以交換的,具體的選擇可以根據實際情況(如希望強調的因素、兩個因素效應的大小、分組個數多少)靈活選擇。
那麼現在我們來看一看,根據我們所說的交互效應的兩個定義,這個例子裡 A、B 兩因素之間是否有交互效應?
圖 2(同圖 1 下) 因素 A、B 有主效應、無交互效應
我們先來看第一條標準,兩個因素的共同效應是否為兩者單獨效應(也就是我們前面說過的「主效應」)的疊加。
我們可以從組別 A-1,B-1 中 y 的平均值(左上角藍色圓圈圈出的點)看起,如果兩因素的水準都從 1 變到 2,平均值會發生怎樣的變化?
因素 A 自己從水準 1 變為 2 會導致 y 的平均值大概降低 2 個單位左右,而因素 B 自己從水準 1 變為 2 也為導致 y 的平均值約降低 2 個單位,因此兩者相加就是降低 4 個單位。
那麼實際是否如此呢?
組別 A-2,B-2 中 y 的平均值是圖中紅色圓圈圈出的點,和 A-1,B-1 相比,平均值的確是大約降低了 4 個單位,也就是說,當兩因素從水準 1 向水準 2 移動時,兩者的共同效應的確是各自效應的疊加。
按照同樣的方法,我們可以檢查其他變化方式,在這個例子裡也會得到相似的結論。
因此,我們可以得出結論,兩個因素之間沒有交互效應。
使用第二條標準也可以得出相同的推斷,而且更加直觀一些。
如果一個因素的效應依賴另一個因素,那麼當這「另一個」因素處於不同的水準時,前一個因素的 y 平均值的效應將是不同的。
也就是說,我們只需要看看因素 A 的效應是否在不同的因素 B 水準下發生變化即可。
回到圖 2,上下兩根折線正好對應了因素 B 的兩個水準,而它們是幾乎平行的。
也就是說,不論因素 B 取哪個水準,因素 A 對 y 平均值的影響都差不多,這再一次表明,兩個因素之間沒有交互效應。
從這裡我們可以得到一個簡便的小竅門,要粗略判斷兩個因素是否有交互效應,在圖 2 這種輪廓圖中,只需要看一下不在坐標軸上的那個因素所對應的不同水準的折線是否大致平行——如果平行,那麼就很可能沒有交互效應,反之則表示可能有交互效應(實際資料中,交互效應究竟是否有顯著性還取決於各分組資料的發散情況以及樣本量)。
如果我們把圖 2 中的資料換一種畫法,把因素 B 放到橫軸上,而用不同的資料點形狀和連線來表示因素 A 的水準,也會同樣得到近乎平行的三條連線(之所以有三條是因為因素 A 有三個水準),如下面的圖 3。
因為這兩個圖是完全等價的,所以在實際應用中,我們只需要觀察其中一種畫法就可以了。
圖 3(資料同圖 2) 因素 A、B 有主效應、無交互效應
◆◆◆
我們已經知道了兩個因素都有主效應而沒有交互效應時輪廓圖的特徵是幾條折線大致平行,那麼在有交互效應時會長什麼樣子呢?
不錯,相信你已經猜到,如果幾條折線有明顯的不平行,這就往往暗示著交互效應的存在。下面的圖 4 就是一個典型的例子。
圖 4 因素 A、B 既有主效應、也有交互效應的一個例子
為什麼這裡會有交互效應呢?
簡單地來說,從圖 4 可以看到,當因素 B 處在水準 1 時,因素 A 從水準 1 到水準 2 會導致 y 的平均值稍有升高;而當因素 B 在水準 2 時,同樣的因素 A 的變化卻使 y 的平均值大幅降低。
這正符合了交互效應的「一個因素的效應依賴於另一個因素」的定義。
如果用之前的方法具體分析因素 A 和因素 B 不同水準間的效應大小,與圖 4 中的資料比較,我們同樣也會得到「兩個因素的共同效應不等於各自單獨作用的簡單相加」這個等價的結論。
需要注意的是,就和 ANOVA 的主效應一樣,交互效應只關心「有沒有」,但不關心「什麼樣」。也就是說,交互作用的存在只表明在「某個地方」出現了兩因素共同效應不等於各自效應的疊加,或者說一個因素的效應隨另一個因素變化而變化的情況。
至於究竟是在哪些分組裡存在,哪幾個分組之間 y 的平均值存在差異,都是可以變化的。表現在輪廓圖上,就是說只要不同的折線不平行(走向不一致),就都有可能有交互效應。下面的圖 5 給大家展現了某幾種其他的可能。
圖 5 因素 A、B 之間存在交互效應的幾個示例
因此,當我們發現了顯著的交互效應以後,還要使用事後檢驗(回顧《27.ANOVA做出了顯著性?事兒還沒完呢!》)並結合相關圖表,才能進一步確定交互效應的具體成因,並確定哪些組的平均值之間存在顯著差異,從而對實際問題給出明確的結論。
本系列文章
第 1 章 高屋建築看統計
1.你真的懂p值嗎?
2.做統計,多少資料才算夠?(上)
3.做統計,多少資料才算夠?(下)
4.提升統計功效,讓評審心服口服!
5.你的科研成果都是真的嗎?
6.見識資料分析的「獨孤九劍」
7.貝葉斯vs頻率派:武功到底哪家強?
第 2 章 算術平均數與正態分佈
8.數據到手了,第一件事先幹啥?
9.算術平均數:簡單背後有乾坤
10.正態分佈到底是怎麼來的?
第 3 章 t 檢驗:兩組平均數的比較
11.想玩轉t檢驗?你得從這一篇看起
12.就是要實用!t 檢驗的七十二變
13.不是正態分佈,t 檢驗還能用嗎?
14.只有15個標本,也能指望 t 檢驗嗎?
15.樣本分佈不正態?數據變換來救場!
16.數據變換的萬能鑰匙:Box-Cox變換
17. t 檢驗用不了?別慌,還有神奇的非參數檢驗
18.只講 p 值,不講效應大小,都是耍流氓!
19.找出 t 檢驗的效應大小,對耍流氓 say no!
20.用置信區間,就是這麼(不)自信!
21.如何確定 t 檢驗的置信區間
22.優雅秀出你的 t 檢驗,提升Paper!
23.要做 t 檢驗,這兩口毒奶可喝不得!
第 4 章 方差分析(ANOVA):多組平均數的比較
24.要比較三組資料,t 檢驗還能用嗎?
25.ANOVA在手,多組比較不犯愁
26.ANOVA的基本招式你掌握了嗎?
27.ANOVA做出了顯著性?事兒還沒完呢!
28.聽說,成對t檢驗還有ANOVA進階版?
29.重複測量ANOVA:你要知道的事兒都在這裡啦
30.沒聽說過多因素 ANOVA ?那你就可就 OUT 了!
31.多因素ANOVA=好幾個單因素ANOVA?可沒這麼簡單!
作者:張之昊
編輯:黑草烏葉
留言列表