統計筆記(51)兩樣本估計和假設檢驗基礎
估計和假設檢驗根據樣本數的不同,分為:單樣本估計和假設檢驗;兩樣本估計和假設檢驗;多樣本估計和假設檢驗。
基礎準備
估計和假設檢驗根據樣本數的不同,分為:單樣本估計和假設檢驗;兩樣本估計和假設檢驗;多樣本估計和假設檢驗。
前面討論了單樣本參數推斷性統計:總體參數的估計和參數的假設檢驗。
通過前面的學習可以發現,推斷性統計的基礎是樣本的抽樣分佈。不同的總體分佈情況,總體均值、方差和標準差的情況,樣本容量的大小適用不同的抽樣分佈(統計量),然後才能得到準確或近似的總體參數的區間估計和假設檢驗結果。單樣本估計和假設檢驗如此,兩樣本和多樣本估計和假設檢驗也是如此。
兩樣本估計和假設檢驗的作用和統計量
單樣本估計和假設檢驗是用單個樣本的參數來估計總體的參數,用單個樣本的參數對總體參數進行檢驗。那麼兩樣本估計和假設檢驗的作用是什麼呢?作用就是通過從兩個總體中抽取樣本,然後用它們估計和檢驗兩個總體同個類型未知參數的差別(關係)。
為了達成上面的目的,需要選取合適的統計量。對於兩總體均值的差別,通過統計量兩總體均值差(μ1-μ2)來考量;對於兩總體方差的差別,通過方差比考量。
兩樣本類型
兩個樣本根據抽樣類型的不同可以分為:獨立樣本和成對樣本。獨立樣本:若從一個樣本中選取的觀測值,無論怎樣都不會影響從另一個樣本中選取的觀測值概率,則稱樣本為獨立樣本;成對樣本:若從一個樣本中選取的觀測值,以某種方式決定了另一個樣本中選取的觀測值,則稱樣本為成對樣本或配對樣本。
例如:某種新型眼藥水的檢驗問題,廠家聲稱它比傳統的眼藥水見效快,檢驗這個說法可以用獨立樣本或成對樣本。在獨立樣本情況中,隨機選取兩組不同的測試者,其中一組用傳統眼藥水,另一組用新型眼藥水;在成對樣本情況中,只選一組測試者,並讓每個人左眼使用傳統麻醉劑,有眼使用新型麻醉劑。
通常獨立樣本是唯一選擇,因為很多時候兩個樣本都是隨機確定的,所以獨立樣本是唯一可能的情況。而成對樣本能夠較好的控制外部變數,例如兩種藥水試驗,將兩種藥水用於同一人可以控制樣本間關於個體在年齡、健康狀況或其他可能影響眼藥水反映的外部變數間的隨機差別;此外成對樣本在兩樣本估計和假設檢驗問題上的置信區間更精確,檢驗功效更強(見後面推導)。
均值差
兩總體均值差的最優估計
樣本均值抽樣分佈的均值是總體均值的最優無偏估計,可以擴展到兩樣本情形:來自兩個總體的樣本均值抽樣分佈的均值差是兩個總體均值差的最優無偏估計,任何特定的兩樣本均值差是兩總體均值差的一個點估計。
均值差的理論抽樣分佈
一個離散的或連續的概率分佈,若它對兩樣本統計量:均值差的所有可能值指定了概率或密度,則稱這個概率分佈為均值差的理論抽樣分佈。該抽樣分佈有以下結論:
通過均值差的抽樣分佈(常態分配或t分佈)可以把樣本均值差和總體均值差聯繫起來,從而進行兩總體均值差的估計和假設檢驗,如下圖所示:
均值差的置信區間和假設檢驗類型
已知條件不同,估計和假設檢驗的方法也不同,有以下幾種類型:
均值差的置信區間:標準差已知的正態分佈總體的獨立樣本;
均值差的假設檢驗:標準差已知的正態分佈總體的獨立樣本;
均值差的置信區間:標準差未知,但假定相等的正態分佈總體的獨立小樣本(小於30)
均值差的假設檢驗:標準差未知,但假定相等的正態分佈總體的獨立小樣本(小於30)
均值差的置信區間:標準差未知的任何總體分佈的獨立大樣本(大於等於30)
均值差的假設檢驗:標準差未知的任何總體分佈的獨立大樣本(大於等於30)
均值差的置信區間:成對樣本
均值差的假設檢驗:成對樣本
方差比
兩總體方差比的最優估計
比較總體方差不能和總體均值一樣,用方差的差來進行統計推斷,而應該用方差比。由於樣本抽樣分佈的方差是總體方差的最優估計量,所以兩樣本抽樣分佈的方差比也是兩總體方差比的最優估計量,任何特定的樣本方差比是總體方差比的一個點估計。
為了對兩總體方差比進行估計和假設檢驗,需要將特定的點估計值與總體方差比聯繫起來的統計量(抽樣分佈),這時可以使用F統計量。
F統計量和F分佈
F分佈不是一個分佈,而是一個連續概率分佈族,每個正整數值自由度的組合都是一個F分佈。因為F統計量是兩個獨立的卡方統計量被本身各自的自由度相除後的比,所以F分佈很想卡方分佈,而且和卡方分佈隨著自由度增加越來越對稱一樣,F分佈也隨著兩個自由度的增加越來越對稱,如下圖所示:
F分佈的臨界值
當樣本來自正態分佈時,它有自由度為n-1的卡方分佈:
同樣的,當兩個樣本都來自正態分佈時,有由兩個自由度影響的F分佈:
如下面曲線所示:
方差比的置信區間和假設檢驗類型
由於卡方分佈的前提是正態分佈總體,所以F分佈也有正態分佈總體的假定條件:
方差比的置信區間:參數未知的正態分佈總體的獨立樣本;
方差比的假設檢驗:參數未知的正態分佈總體的獨立樣本;
不同類型均值差和方差比的估計和假設檢驗將會在下篇中用具體範例進行應用說明。
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。