只有15個標本,也能指望 t 檢驗嗎?| 協和八
原創 張之昊
從上一集《不是正態分佈,t 檢驗還能用嗎?》裡,大家應該已經學到了重要的一課:t 檢驗對於正態性的要求,其實是對於抽樣分佈(樣本均值的概率分佈)而言的。
那麼總體或者樣本的分佈是否需要是正態的呢?
由於中心極限定理,只要樣本量足夠大,即使總體分佈或樣本分佈有些偏離正態分佈,抽樣分佈仍會有較好的正態性,因此使用 t 檢驗還是沒有問題的(重溫上一集)。
聰明的你,一定會發現有一個很重要的問題還沒解決:「只要樣本量足夠大」,
多大才是足夠大?
要是沒有一個清晰的判斷標準,我們在實際的資料分析中還是會無所適從。今天,我們就來簡單討論一下這個問題。
在上一集裡頭,我們曾經用電腦類比的方法給大家舉過一個例子。從一個已知不太對稱(從而也就不正態)的分佈裡,分別按樣本量 n=3 和 n=15 來隨機抽取樣本。假如我們反復抽取許多個樣本量分別為 3 和 15 的樣本,算出每個樣本的平均值,再畫個樣本均值的頻率長條圖,我們就能粗略看到抽樣分佈的樣子。
如果你已經不太記得這個例子了,那麼不妨再看一眼當時的插圖:
在樣本量為 3 時,抽樣分佈還有明顯的不對稱,而當樣本量增大到 15 時,抽樣分佈已經和正態分佈相去不遠了。也許你讀過一些其他的統計學教材,有些書上恰恰是這麼寫的——當樣本量為 15 以上時就可以用 t 檢驗了。
事情有沒有這麼簡單呢?
我們之前說過,由於中心極限定理的存在,無論總體分佈是什麼,當樣本量 n 很大時樣本均值的抽樣分佈會服從正態分佈。因為這裡有「樣本量 n 很大」這個前提條件,理論上來說,抽樣分佈服從正態分佈是當 n 趨近于正無窮時才會發生的事情(用數學術語來說,這是抽樣分佈的「漸近性質」)。實際上,用不著正無窮那麼多,如果我們的樣本裡有成千上萬個資料,正態性幾乎就是板上釘釘的。
可是,通常情況下,我們很可能只有幾十個、甚至十幾個數據點。這時候,用 t 檢驗靠譜兒嗎?
這個問題的答案,取決於我們的抽樣分佈在從樣本量為 1 一路增長到正無窮時,逼近正態分佈的速度。
回憶一下高中數學,雖然 1/x 和 1/x2 在 x 趨向無窮時的極限值都是 0,但是後者趨近於 0 的速度要大大快於前者。同樣的道理,從不同的總體分佈中隨機抽取 n 個樣本取平均值,當 n 從 1 增長到正無窮時,抽樣分佈趨近於正態分佈的速度也是有快有慢的。
對於我們手頭上的資料,n 是既定的,也許是 12,是 30,或者 80。所以,現在我們關心的是,抽樣分佈從 n=1 到正無窮時趨向正態分佈的速度夠不夠快,是否會在達到我們的樣本量 n 時已經足夠正態。
那麼, 抽樣分佈趨向正態分佈的速度由什麼來決定呢?
我們先來想想一個最極端的例子:總體分佈本身就是一個正態分佈。從下圖中可以看到,不論樣本量是 3 還是 15,抽樣分佈都有很好的正態性,只是分佈變得越來越瘦了而已(想想看為什麼?如果想不起來,不妨回顧11.想玩轉t檢驗?你得從這一篇看起。事實上, 對於總體是正態分佈的情況,抽樣分佈一上來在樣本量 n=1 時就是正態的,n 更大時亦然——它一直都在那裡,不存在「趨近」的問題。
如果總體不是正態分佈,又會怎樣呢?
在本集開始時,我們回顧了上一集的一個例子,那正是一個總體不正態的情形。你應該還記得,那個總體分佈明顯不太對稱,但是勉強還是有個中間高、兩邊低的模樣。抽樣分佈趨近正態的速度如何?在那個例子裡,當樣本量 n=15 時,抽樣分佈看起來已經挺接近正態分佈了。我們也許可以得出結論,當總體分佈與正態分佈相差不多時,抽樣分佈趨近正態的速度還是挺快的。只要我們有 15(甚至更小一點)的樣本量,就已經能用 t 檢驗了。
要是總體和正態分佈的差別更大一些呢?我們再來試驗一下。這一回,我們用一個從 -3 到 3 之間的均勻分佈作為總體(也就是說,取到小於 -3 或大於 3 的可能性為 0,而取到 -3 和 3 之間任意一個數的可能性相同)。這麼一個方頭方腦的分佈,和正態分佈看著不太像,可是你也許會驚訝於抽樣分佈趨近正態分佈的速度:樣本量僅僅為 3 時,抽樣分佈已經有了正態分佈的雛形;而樣本量上升到 15 時,它的正態性更是已經毋庸置疑了。
一不做二不休,我們乾脆再把總體分佈弄得更扭曲一些。既然正態分佈中間高兩頭低,那麼咱們來個反其道而行之,看看一個中間低兩頭高的總體分佈怎麼樣?從下圖中可以看到,我們選取了一個在 0 到 1 之間的有點奇葩的分佈:這個分佈取到 0 或 1 的可能性最大,而越往0和1之間走,可能性就越小。以這一個分佈為總體的樣本均值的抽樣分佈趨近於正態分佈的速度會不會很慢?
答案是否定的。僅僅是樣本量 n=3,就能讓抽樣分佈的樣子來一個大逆轉,呈現了中間高兩邊低的形狀。但這時它還不夠正態,因為中間還有些太扁平。而當 n=15 時,我們再一次得到了漂亮的正態曲線。
是不是很神奇?
這正是中心極限定理的威力所在(10.正態分佈到底是怎麼來的?)。正態分佈就像一個黑洞一樣,管你總體分佈原本是什麼樣子,在樣本量從小變大的過程中,總有一天(這一天往往來得還挺快)抽樣分佈會被吸進正態的大坑。
回顧上面的幾個例子,都是在樣本量大概到了 15 的時候,抽樣分佈就已經很像正態分佈了。我們能不能說樣本量大於 15 便是能夠使用 t 檢驗的標準呢?
不一定!!
我們來看下圖這個反例。這裡,總體分佈是一個坐落在零點右側、拖著悠長尾巴的概率分佈。直接看看樣本量為 15 時的抽樣分佈,顯然之前幾個例子的「規律」在這裡失效了。即便是快進到 n=150,抽樣分佈還是有明顯的不對稱。
由於有中心極限定理,我們知道,抽樣分佈終究還是要回到正態分佈的。但對於這個例子而言,抽樣分佈邁向正態分佈的步伐實在有點慢——換言之,如果要對來自如此總體的樣本使用 t 檢驗,所需的樣本量將會十分巨大。
我們在《就是要實用!t 檢驗的七十二變》結尾處說過,如果我們感興趣的變數是離散變數(比如性別),t 檢驗一般不適用,也正是由於這個原因。比如,我們考慮一個僅能取 0 和 1 兩個值的總體分佈(這樣的分佈稱為伯努利分佈)。仍然用之前的方法,我們來看一看在不同樣本量的情況下這個總體分佈所產生的樣本均值的抽樣分佈。顯而易見,由於總體分佈自身的離散性,樣本分佈隨著樣本量的增大趨近於正態分佈的速度也很慢。
從純理論的角度來說,中心極限定理並不在乎隨機變數是連續還是離散的。也就是說,只要樣本量充分大,抽樣分佈也會服從正態分佈。這時,t 檢驗也就同樣有效了。之所以我們說 t 檢驗不適用於離散變數,是因為對於多數離散變數而言,要達到能使用 t 檢驗的樣本量太大了。也正是出於同樣的原因,統計學家發明了用於樣本量較小的離散變數的統計學檢驗,如卡方檢驗等,我們以後將會為大家詳細介紹。
讓我們回到正題。從上面的那麼多例子裡,我們能得到怎樣的結論?抽樣分佈趨向正態分佈的速度由什麼來決定?
相信你已經能夠得到答案——那就是總體分佈的形狀。感性地來說,總體分佈與正態分佈越相近(連續、對稱),抽樣分佈能近似為正態分佈所需的樣本量也就越小。
在實際科研中,我們不會確切知道總體分佈的形狀或參數。這時,我們可以考慮產生資料的物理過程及其對總體分佈的影響(如取值範圍等),並且可以通過考察樣本分佈的正態性來對總體分佈的形狀做推斷(還記得上集講過的 q-q 圖、夏皮羅-威爾克檢驗等方法嗎?)。
如果我們手上的樣本量不足以保證抽樣分佈的正態性該怎麼辦?
既然總體分佈越接近正態分佈,抽樣分佈趨近正態分佈的速度就越快,那麼一個解決方案便是對資料進行某種轉化,使總體分佈向正態分佈靠攏,從而加快抽樣分佈逼近正態分佈的速度。在下一集中,我們將為大家詳細介紹轉化非正態資料的方法。
注:文中圖片均為作者自繪
本系列全部文章
第 1 章 高屋建築看統計
你真的懂p值嗎?
做統計,多少資料才算夠?(上)
做統計,多少資料才算夠?(下)
提升統計功效,讓評審心服口服!
你的科研成果都是真的嗎?
見識資料分析的「獨孤九劍」
貝葉斯vs頻率派:武功到底哪家強?
第 2 章 算術平均數與正態分佈
數據到手了,第一件事先幹啥?
算術平均數:簡單背後有乾坤
正態分佈到底是怎麼來的?
第 3 章 t 檢驗:兩組平均數的比較
想玩轉t檢驗?你得從這一篇看起
就是要實用!t 檢驗的七十二變
不是正態分佈,t 檢驗還能用嗎?
只有15個標本,也能指望 t 檢驗嗎?
作者:張之昊
編輯:燈盞細辛