統計筆記(75)範例分析:多元線性回歸分析
範例分析
基礎回顧
簡單線性和多元線性回歸理論基礎請回顧:
- 相關與回歸分析基礎;
- 一元(簡單線性)相關分析與回歸分析;
- 回歸參數的區間估計;
- 一元(簡單線性)回歸方程的假設檢驗;
- 範例分析:一元(簡單線性)相關與回歸分析;
- 多元線性回歸分析;
線性回歸的步驟不論是一元還是多元相同,步驟如下:
- 1、散點圖判斷變數關係(簡單線性);
- 2、求相關係數及線性驗證;
- 3、求回歸係數,建立回歸方程;
- 4、回歸方程檢驗;
- 5、參數的區間估計;
- 6、預測;
範例分析
王某等人承包了某快遞公司在某地的快遞業務,一段時間後發現:有時候承接工作量大,完不成快遞任務;有時候工作量不足,員工等待。為了制定最佳的工作計畫表,王某希望估計快遞員每天的工作時間(工資計件,沒有偷懶現象),以便決定每天承接的快遞數量。王某分析,快遞員每天工作的時間與送貨距離和送貨次數相關。為此,他收集了由10項送貨任務組成的簡單隨機樣本資料,並根據這些資料建立二元線性回歸方程。資料如下表:
項目分析
研究的目的是預測快遞員運送任務所需要的時間,所以設時間為因變數;距離與次數為引數。本題直接使用Excel計算結果。
解:1、相關次數;由於是二元回歸分析,所以不做散點圖,直接用回歸係數判別因變數(時間)與引數總體(距離與次數)之間的相關關係。Excel計算結果:
複相關係數R為0.9383,說明因變數時間與作為一個整體的所有引數(距離和次數)高度線性相關。
2、回歸係數及回歸方程
通過Excel計算結果,可以得到回歸係數及回歸方程:
意義:回歸係數0.042表示在固定次數的條件下,送貨距離每增加1公里,行駛的時間平均增加0.042小時;同理,回歸係數0.573表示在送貨距離固定的條件下,送貨次數每增加1次,送貨的時間平均增加0.573小時。本例中,截距-0.01沒有實際意義,只起調節數值的作用。
3、回歸方程的檢驗
回歸方程的檢驗有三種方法(回歸方程顯著性檢驗,回歸係數顯著性核對總和相關係數顯著性檢驗),效果相同,選擇其一檢驗即可。Excel給出的是回歸方程的顯著性檢驗結果:
Significance F=0.000591表示統計量F=25.77422的概率值,通過與顯著水準(設定為0.05)的比較,表示F值落在拒絕域,所以結論與上相同,即線性回歸方程式顯著的。
4、區間估計
從上表可知,在95%置信度條件下,回歸係數b1的置信區間為(0.025,0.059),b2的置信區間為(0.069,1.077)。
5、預測
某個快遞員某天的任務是快遞3件貨,最優送貨路線總長為120公里,預測送貨時間,並得到95%的時間區間。
通過回歸方程可得預測的送貨時間為6.749小時:
95%置信度下,送貨時間的置信區間為:
Excei計算結果中有Se的值,但是沒有包含t統計量:
t統計量值用公式:=T.INV.2T(0.05,7)得到2.365,所以該題中送貨時間區間為:
(6.749-2.365*0.639,6.749+2.365*0.639)
(5.24,8.26)
所以該條件下送貨時間區間為5.24小時~8.26小時。
留言列表