統計筆記(75)範例分析:多元線性回歸分析

範例分析

基礎回顧

簡單線性和多元線性回歸理論基礎請回顧:

  • 相關與回歸分析基礎;
  • 一元(簡單線性)相關分析與回歸分析;
  • 回歸參數的區間估計;
  • 一元(簡單線性)回歸方程的假設檢驗;
  • 範例分析:一元(簡單線性)相關與回歸分析;
  • 多元線性回歸分析;

線性回歸的步驟不論是一元還是多元相同,步驟如下:

  • 1、散點圖判斷變數關係(簡單線性);
  • 2、求相關係數及線性驗證;
  • 3、求回歸係數,建立回歸方程;
  • 4、回歸方程檢驗;
  • 5、參數的區間估計;
  • 6、預測;

範例分析

王某等人承包了某快遞公司在某地的快遞業務,一段時間後發現:有時候承接工作量大,完不成快遞任務;有時候工作量不足,員工等待。為了制定最佳的工作計畫表,王某希望估計快遞員每天的工作時間(工資計件,沒有偷懶現象),以便決定每天承接的快遞數量。王某分析,快遞員每天工作的時間與送貨距離和送貨次數相關。為此,他收集了由10項送貨任務組成的簡單隨機樣本資料,並根據這些資料建立二元線性回歸方程。資料如下表:

ZA.jpg

 

項目分析

研究的目的是預測快遞員運送任務所需要的時間,所以設時間為因變數;距離與次數為引數。本題直接使用Excel計算結果。

解:1、相關次數;由於是二元回歸分析,所以不做散點圖,直接用回歸係數判別因變數(時間)與引數總體(距離與次數)之間的相關關係。Excel計算結果:

QQ.jpg
複相關係數R0.9383,說明因變數時間與作為一個整體的所有引數(距離和次數)高度線性相關。

2、回歸係數及回歸方程

SS.jpg
通過Excel計算結果,可以得到回歸係數及回歸方程:

V.jpg
意義:回歸係數0.042表示在固定次數的條件下,送貨距離每增加1公里,行駛的時間平均增加0.042小時;同理,回歸係數0.573表示在送貨距離固定的條件下,送貨次數每增加1次,送貨的時間平均增加0.573小時。本例中,截距-0.01沒有實際意義,只起調節數值的作用。

3、回歸方程的檢驗

回歸方程的檢驗有三種方法(回歸方程顯著性檢驗,回歸係數顯著性核對總和相關係數顯著性檢驗),效果相同,選擇其一檢驗即可。Excel給出的是回歸方程的顯著性檢驗結果:

CA.jpg
Significance F=0.000591表示統計量F=25.77422的概率值,通過與顯著水準(設定為0.05)的比較,表示F值落在拒絕域,所以結論與上相同,即線性回歸方程式顯著的。

4、區間估計

VA.jpg
從上表可知,在95%置信度條件下,回歸係數b1的置信區間為(0.025,0.059)b2的置信區間為(0.069,1.077)

5、預測

某個快遞員某天的任務是快遞3件貨,最優送貨路線總長為120公里,預測送貨時間,並得到95%的時間區間。

通過回歸方程可得預測的送貨時間為6.749小時:

BG.jpg
95%置信度下,送貨時間的置信區間為:

22.jpg
Excei計算結果中有Se的值,但是沒有包含t統計量:

23.jpg
t統計量值用公式:=T.INV.2T(0.05,7)得到2.365,所以該題中送貨時間區間為:

(6.749-2.365*0.6396.749+2.365*0.639)

(5.24,8.26)

所以該條件下送貨時間區間為5.24小時~8.26小時。

 

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()