統計筆記(71)回歸參數的區間估計

介紹線性關係的兩個變數,可以通過回歸分析(最小二乘法)得到帶有回歸參數的回歸方程,通過回歸方程,當已知引數的值時,預測相應的因變數的值。

基礎準備

  • 文章:一元(簡單線性)相關分析與回歸分析;

介紹線性關係的兩個變數,可以通過回歸分析(最小二乘法)得到帶有回歸參數的回歸方程,通過回歸方程,當已知引數的值時,預測相應的因變數的值。假設得到的一元(簡單線性)回歸方程如下:

1b7c2c1e438ab812cd9d8094f9b51b21.jpg

 

回歸分析結束了嗎?其實還沒有。因為計算得到的回歸係數是根據樣本資料計算的點估計值,如果收集的樣本資料不同,則求得的回歸係數的數值也會不同。因此,如果為避免樣本資料產生的誤差,可以對它們進行區間估計。(區間估計請回顧:估計理論:詳述總體均值的單樣本估計原理)

區間估計

總方差值

首先引入一個總方差值,它的計算公式及注釋如下:

94a454c17f6fccd32008709b444b0d8e.jpg

 

回歸係數的均值與方差

0c3b96c34b582c6149017b4c678e390e.jpg

 

回歸係數的方差推導過程略過不表。

回歸係數的置信區間

對回歸係數進行區間估計,需要知道它們服從什麼概率分佈。因為假設了所有的變數(XY)都服從正態分佈,而回歸係數與變數Y是線性關係,所以回歸係數也服從正態分佈。由於總體方差不得而知,此時t分佈適用,所以,回歸係數的置信區間為:

d6d607b6d5a8a40d8cf62ef9c0709d4f.jpg

因變數Y的置信區間

3e3e47a56af3454006012fced131a1a0.jpg

 

範例分析

某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將近10年的資料列於下表。請根據資料建立回歸方程,計算回歸參數95%的置信區間。當工業總產值為500億元,置信度為0.95時,預測貨運總量的雙側置信區間。

90ae26a5784d1ccb254367d89185a6d6.jpg
解:1、回歸分析:應用Excel畫出散點圖、添加趨勢線,並得到回歸方程和相關係數,過程略。

 

74dc79318edea2592b98e6300983dda3.jpg

2、回歸係數置信區間

cabf23163dc776ede4983cfac0087b2f.jpg

 

3、貨運總量置信區間

將工業總產值500億元帶入回歸方程,得到貨運總量為4.3949;利用公式計算貨運總量的95%置信區間;

4a4ca0bd2a52edcb65c9f4407da8f8a8.jpg
即當工業總產值為500億元時,預測該市貨運總量在3.9801億噸至4.8057億噸之間,概率為95%

 

 

 

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()