統計筆記(72)一元(簡單線性)回歸方程的假設檢驗
相關程度的檢驗方法主要有三種
基礎準備
回歸與相關分析的歷史文章:
- 相關與回歸分析基礎;
- 一元(簡單線性)相關分析與回歸分析;
- 回歸參數的區間估計;
上面文章介紹了簡單線性相關與回歸分析的兩個主要模組:回歸方程建立及回歸參數的區間估計,但是它們都是建立在假定因變數和引數線性相關的基礎上。因此,對相關程度進行檢驗也是重要的,相關程度的檢驗方法主要有三種:
- 相關係數的檢驗
- 回歸方程的檢驗
- 回歸係數的檢驗
相關係數的檢驗
變差關係
先來一張圖:
如上圖所示:當給定X0時,Y的實際值與均值的差值就是Y值隨X值的全部變化,稱之為總變差。在總變差中,一部分變差可以用設定的回歸方程解釋,稱之為回歸變差;另一部分變差是回歸方程不能解釋的,稱為剩餘變差,它們之間有下面等式:
如果在總變差Y中,回歸變差所占的比例越大,則說明Y值隨X值的變化越顯著,或者說X解釋Y的能力越強。反之,回歸變差在總變差中所占比例越小,則說明Y值隨X值的變化越不顯著,或者說X解釋Y的能力越差。
對於所有數據點,變差之間的關係可以用離差平方和表示:
它們從左到右分別稱為:總離差平方和、剩餘平方和和回歸平方和。
決定係數與相關係數
回歸變差所占的比例越大,則說明Y值隨X值的變化越顯著。利用回歸平方和與總離差平方和的比值來說明X與Y的相關性,稱為決定係數,即有:
決定係數的開方被稱為相關係數,前面介紹過相關係數r(Excel資料分析工具:協方差與相關係數),計算公式為:
兩者的計算結果是完全一致的。
相關係數與決定係數都能表示變數之間的線性相關程度,但是相關係數計算更簡便且能表示相關關係的方向。
相關係數的檢驗
當已求得r值時,這個r值是真正刻畫了兩個變數之間的線性關係呢,還是僅僅由於樣本的偶然相關而引起的?僅憑相關係數的大小,不能直接說明變數之間是否存在線性相關,通過對r的檢驗,確定樣本是否抽自一個總體相關係數為0的總體,可以解答這個問題。可以證明r的t統計量服從自由度為n-2的t分佈:
範例分析
某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入下表中,根據這些資料對回歸方程相關係數r在顯著水準0.05做雙側檢驗。
解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;
決定係數為0.9149,相關係數r=0.9565;相關係數r的假設檢驗過程如下:
回歸方程的檢驗
對回歸方程進行顯著性檢驗,就是看引數從總體上是否對因變數有明顯的影響。有回歸方程y=a+bx,如果b=0,則Y等於一個常數a,X與Y沒有任何關係,故方程不存在。如果b不等於0,則Y隨著X的變化而變化,說明方程有意義。
為了對b=0進行檢驗,需要構造一個檢驗的統計量。可以證明:在一元線性回歸中,當b=0時,有以下結論:
範例分析
某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入下表中,根據這些資料對回歸方程在顯著水準0.05做單側檢驗。
解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;
回歸係數的檢驗
上面回歸方程的檢驗是利用b=0時,回歸方程的特性建立F統計量,進而進行假設檢驗。也可以構造另一個統計量t,如下:
利用上述t統計量即可對b進行假設檢驗。
範例分析
再次使用上面的例題:某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的資料,列入表8-1中,根據這些資料對回歸係數b在顯著水準0.05做雙側檢驗。
解:運用Excel對資料進行回歸分析,得到回歸方程和決定係數R平方;
三種檢驗方法雖然各有側重,但在一元線性回歸方程的檢驗中,三種檢驗的作用是相同的,因此對於一元線性回歸方程而言,只要選擇一種方法進行檢驗即可。
留言列表