統計筆記(72)一元(簡單線性)回歸方程的假設檢驗

相關程度的檢驗方法主要有三種

基礎準備

回歸與相關分析的歷史文章:

  • 相關與回歸分析基礎;
  • 一元(簡單線性)相關分析與回歸分析;
  • 回歸參數的區間估計;

上面文章介紹了簡單線性相關與回歸分析的兩個主要模組:回歸方程建立及回歸參數的區間估計,但是它們都是建立在假定因變數和引數線性相關的基礎上。因此,對相關程度進行檢驗也是重要的,相關程度的檢驗方法主要有三種:

  • 相關係數的檢驗
  • 回歸方程的檢驗
  • 回歸係數的檢驗

相關係數的檢驗

變差關係

先來一張圖:

 

d4a113ad927cd7531e777ee2aaa3e764.jpg

 

如上圖所示:當給定X0時,Y的實際值與均值的差值就是Y值隨X值的全部變化,稱之為總變差。在總變差中,一部分變差可以用設定的回歸方程解釋,稱之為回歸變差;另一部分變差是回歸方程不能解釋的,稱為剩餘變差,它們之間有下面等式:

f498382513b292b186c9c6714f92cbcb.jpg

如果在總變差Y中,回歸變差所占的比例越大,則說明Y值隨X值的變化越顯著,或者說X解釋Y的能力越強。反之,回歸變差在總變差中所占比例越小,則說明Y值隨X值的變化越不顯著,或者說X解釋Y的能力越差。

對於所有數據點,變差之間的關係可以用離差平方和表示:

3b1efe39341993802191534df7899bdd.jpg
它們從左到右分別稱為:總離差平方和、剩餘平方和和回歸平方和。

決定係數與相關係數

回歸變差所占的比例越大,則說明Y值隨X值的變化越顯著。利用回歸平方和與總離差平方和的比值來說明XY的相關性,稱為決定係數,即有:

6d7db6e8790f85aacb67455a270011be.jpg
決定係數的開方被稱為相關係數,前面介紹過相關係數rExcel資料分析工具:協方差與相關係數),計算公式為:

 

1ec2b13d2872c9bc3029e688c9689ea2.jpg

兩者的計算結果是完全一致的。

相關係數與決定係數都能表示變數之間的線性相關程度,但是相關係數計算更簡便且能表示相關關係的方向。

相關係數的檢驗

當已求得r值時,這個r值是真正刻畫了兩個變數之間的線性關係呢,還是僅僅由於樣本的偶然相關而引起的?僅憑相關係數的大小,不能直接說明變數之間是否存在線性相關,通過對r的檢驗,確定樣本是否抽自一個總體相關係數為0的總體,可以解答這個問題。可以證明rt統計量服從自由度為n-2t分佈:

d99ea741df52a3d73b12917e0b7bd3a8.jpg

範例分析

某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入下表中,根據這些資料對回歸方程相關係數r在顯著水準0.05做雙側檢驗。

90ae26a5784d1ccb254367d89185a6d6.jpg
解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;

7fa89ed7a690890928a7c712d4f446b0.jpg
決定係數為0.9149,相關係數r=0.9565;相關係數r的假設檢驗過程如下:

 

d0718e26c36c6a9c3c7eecede8448d78.jpg

 

回歸方程的檢驗

對回歸方程進行顯著性檢驗,就是看引數從總體上是否對因變數有明顯的影響。有回歸方程y=a+bx,如果b=0,則Y等於一個常數aXY沒有任何關係,故方程不存在。如果b不等於0,則Y隨著X的變化而變化,說明方程有意義。

為了對b=0進行檢驗,需要構造一個檢驗的統計量。可以證明:在一元線性回歸中,當b=0時,有以下結論:

 

c82ab953df04d9400e256338c00b0914.jpg

範例分析

某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入下表中,根據這些資料對回歸方程在顯著水準0.05做單側檢驗。

90ae26a5784d1ccb254367d89185a6d6 (1).jpg

解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;

 

7fa89ed7a690890928a7c712d4f446b0 (1).jpg

 

91d71824046ef2e89a9eace6d91bb1d2.jpg

回歸係數的檢驗

上面回歸方程的檢驗是利用b=0時,回歸方程的特性建立F統計量,進而進行假設檢驗。也可以構造另一個統計量t,如下:

9a8ad2600f5db897f49493c904e90649.jpg
利用上述t統計量即可對b進行假設檢驗。

範例分析

再次使用上面的例題:某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入表8-1中,根據這些資料對回歸係數b在顯著水準0.05做雙側檢驗。

 

90ae26a5784d1ccb254367d89185a6d6 (2).jpg

解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;

7fa89ed7a690890928a7c712d4f446b0 (2).jpg

 

 

b2f01c5cdeeb9b49285986c398e10b2b.jpg

三種檢驗方法雖然各有側重,但在一元線性回歸方程的檢驗中,三種檢驗的作用是相同的,因此對於一元線性回歸方程而言,只要選擇一種方法進行檢驗即可。

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()