統計筆記(73)範例分析:一元(簡單線性)相關與回歸分析

利用回歸方程進行預測,如果X的取值範圍在樣本範圍之內,則預測相對是準確的。如果超出這個範圍,預測則要小心,因為在樣本資料之外變數所形成的關係可能會發生變化,而不再是線性關係。

基礎準備

前面以兩變數的簡單線性相關與回歸分析為例,分篇幅介紹了以下內容:

  • 相關與回歸分析基礎;
  • 一元(簡單線性)相關分析與回歸分析;
  • 回歸參數的區間估計;
  • 一元(簡單線性)回歸方程的假設檢驗;

今篇用例題將上面的內容串聯起來,講述簡單線性(一元)相關與回歸分析的完整過程。

範例分析

某個工廠生產運營多年,生產與銷售情況比較穩定。老闆想建立產量與單位成本的數量關係模型。現在收集了之前12年的產量與單位成本資料(如下表),根據這些資料說明產量與單位成本的數量關係,並通過產量預測單位成本。

54f086d940baaa01bfde23f2d0c36092.jpg
立項分析

工廠運營一項很重要的工作就是成本控制。理論上,產品的產量與單位成本之間有內在聯繫。按照成本性質,產品成本由固定成本(折舊、人員工資等)和變動成本(包材、原輔料和水電氣等)構成,其中的固定成本總額在一定範圍內,與產量無關。當產量變動時,單位產品所負擔的固定費用也會變化,從而使單位成本發生變動。因此,產量變化與單位成本由相關關係,但還需要通過資料驗證。

1、散點圖。因為要分析的是產量對單位成本的影響,所以,將產量作為引數,單位成本作為因變數(回顧:一元(簡單線性)相關分析與回歸分析)。

c291f6f6a73efc5acfd12f2b49266311.jpg
從圖形上看,產量與單位成本呈負的線性關係,這與實際是相符的。

2、通過相關係數來驗證這種關係(回顧:一元(簡單線性)回歸方程的假設檢驗)。

bc3ae9b7a7acb7217d974a774416ad52.jpg
相關係數可以通過決定係數計算,也可以通過協方差計算,兩者計算結果一致(回顧:一元(簡單線性)回歸方程的假設檢驗):

4fe29b6ed378d069efca872ccd60a43f.jpg
從相關係數可見產量與單位成本具有負的高度線性關係,可以建立一元線性回歸方程。

3、建立一元線性回歸方程(回顧:一元(簡單線性)相關分析與回歸分析)

1b107d5d373094a3d3502c21054e3e8f.jpg
回歸方程表明隨著產量的增加單位產品成本降低。產量每增加100件,單位產品成本下降0.2元。當產量為0時,單位成本是16.45元,是固定成本發生的部分。

4、回歸方程的檢驗(一元(簡單線性)回歸方程的假設檢驗)

回歸方程的檢驗有三種方法(回顧:一元(簡單線性)回歸方程的假設檢驗),這裡用回歸係數檢驗方法,給定顯著水準0.05,進行檢驗。

92a40370fd75603c842bcd9f4c1c83be.jpg

 

5、區間估計(回顧:回歸參數的區間估計)

因為上面計算得到的回歸方程是一個點估計,可以在95%的置信水準下,根據樣本資料估計總體單位成本下降的置信區間。

b的雙側95%置信區間

0b4f7aa8d1513ee4e5eebcf22d767f83.jpg
資料說明,在95%的置信水準下,產量每增加100件,單位產品成本下降0.139~0.261元之間。

單位成本的預測

假設某年計算生產2800件產品,預測單位成本的95%置信區間。

X=28代入回歸方程,Y=10.85,置信區間為:

2f2c04f7b2d3ef873e2d1ef6b57a050b.jpg

 


計算結果說明,在95%的概率下,當產量為2800件時,產品的單位成本在8.85~12.85元之間。

利用回歸方程進行預測,如果X的取值範圍在樣本範圍之內,則預測相對是準確的。如果超出這個範圍,預測則要小心,因為在樣本資料之外變數所形成的關係可能會發生變化,而不再是線性關係。

 

arrow
arrow
    創作者介紹
    創作者 HCHUNGW 的頭像
    HCHUNGW

    HCHUNGW的部落格

    HCHUNGW 發表在 痞客邦 留言(0) 人氣()