統計筆記(71)回歸參數的區間估計
介紹線性關係的兩個變數,可以通過回歸分析(最小二乘法)得到帶有回歸參數的回歸方程,通過回歸方程,當已知引數的值時,預測相應的因變數的值。
基礎準備
- 文章:一元(簡單線性)相關分析與回歸分析;
介紹線性關係的兩個變數,可以通過回歸分析(最小二乘法)得到帶有回歸參數的回歸方程,通過回歸方程,當已知引數的值時,預測相應的因變數的值。假設得到的一元(簡單線性)回歸方程如下:
回歸分析結束了嗎?其實還沒有。因為計算得到的回歸係數是根據樣本資料計算的點估計值,如果收集的樣本資料不同,則求得的回歸係數的數值也會不同。因此,如果為避免樣本資料產生的誤差,可以對它們進行區間估計。(區間估計請回顧:估計理論:詳述總體均值的單樣本估計原理)
區間估計
總方差值
首先引入一個總方差值,它的計算公式及注釋如下:
回歸係數的均值與方差
回歸係數的方差推導過程略過不表。
回歸係數的置信區間
對回歸係數進行區間估計,需要知道它們服從什麼概率分佈。因為假設了所有的變數(X和Y)都服從正態分佈,而回歸係數與變數Y是線性關係,所以回歸係數也服從正態分佈。由於總體方差不得而知,此時t分佈適用,所以,回歸係數的置信區間為:
因變數Y的置信區間
範例分析
某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將近10年的資料列於下表。請根據資料建立回歸方程,計算回歸參數95%的置信區間。當工業總產值為500億元,置信度為0.95時,預測貨運總量的雙側置信區間。
解:1、回歸分析:應用Excel畫出散點圖、添加趨勢線,並得到回歸方程和相關係數,過程略。
2、回歸係數置信區間
3、貨運總量置信區間
將工業總產值500億元帶入回歸方程,得到貨運總量為4.3949;利用公式計算貨運總量的95%置信區間;
即當工業總產值為500億元時,預測該市貨運總量在3.9801億噸至4.8057億噸之間,概率為95%。
留言列表