統計筆記(28)抽樣分佈:t分佈
有正態總體(均值為μ),定義隨機變數T(見下方公式),它的值為t(變數用大寫字母表示,具體的值用小寫字母表示)。
定義隨機變數
有正態總體(均值為μ),定義隨機變數T(見下方公式),它的值為t(變數用大寫字母表示,具體的值用小寫字母表示)。從該正態總體取容量為n的樣本,並計算樣本均值和標準差。
t分佈
定義:如果容量為n的所有可能樣本均來自正態分佈總體(均值為μ),並且對每個樣本都計算出隨機變數T的值t,則t值有一個連續型概率分佈(抽樣分佈),稱為t分佈,函數如下:
t分佈是一個分佈族,每個整數自由度對應一個分佈,如下圖所示;可以看到,每個分佈都是鐘型且關於均值0對稱,並且分佈從負無窮到正無窮連續延伸。當自由度無限時,t分佈就是標準正態分佈。隨著自由度越來越小,曲線就越來越平坦,一般認為,自由度小於30時,分佈與標準分佈相差較大。
自由度
t分佈有一個參數叫做自由度,它的值等於樣本容量減去1。為什麼不等於樣本容量呢?可以從自由度的定義來解釋。
與一個統計量相聯繫的自由度個數可以看做是,在計算該統計量時用到的無限制的、自由變換的數值的個數。例如,如果統計量是樣本中n個值得和,並且沒有任何限制,可以從樣本選取任意n個值求和,因此,該統計量的自由度為n。
如果統計量時樣本標準差S,在計算中有1個限制:n個值必須有均值,所以先要用這n個值計算出均值,這樣就減少了一個自由度,於是樣本標準差(方差)的自由度是n-1。計算統計量T的時候,同樣要計算樣本均值,所以t統計量的自由度也是n-1。
本文採用「CC BY-SA 4.0 CN」協議轉載自互聯網、僅供學習交流,內容版權歸原作者所有。