統計筆記(74)多元線性回歸分析
在多元回歸分析中,如果因變數和多個引數的關係為線性時,就屬於多元線性回歸。
基礎回顧
在一元線性回歸分析中,只研究一個引數對因變數的影響:
- 相關與回歸分析基礎;
- 一元(簡單線性)相關分析與回歸分析;
- 回歸參數的區間估計;
- 一元(簡單線性)回歸方程的假設檢驗;
- 範例分析:一元(簡單線性)相關與回歸分析;
在實際中,對因變數的影響往往有兩個或兩個以上的引數。例如:影響產品單位成本的變數不僅有產量,還包括原材料價格、勞動力價格,勞動效率及廢品率等因素。對建立這種具有多變數模型的分析,就是多元回歸分析。
在多元回歸分析中,如果因變數和多個引數的關係為線性時,就屬於多元線性回歸。多元線性回歸是一元線性回歸的擴展,其基本原理及方法與一元線性回歸分析類似。變數越多,計算過程越是複雜,此篇著重原理介紹,計算可由統計軟體代為完成。
多元線性回歸
回歸模型
多元線性回歸模型與一元線性回歸模型類似,由幾部分組成:
回歸方程
回歸係數
代入樣本值,可以求得回歸係數a,b,…,g的點估計值(不同樣本求得的值不同),從而得到樣本多元線性回歸方程:
回歸模型方差
隨機變數的方差,也就是回歸模型的方差,由下圖的剩餘變差引起。該值可以通過樣本資料的離散程度來估計,回顧一元線性回歸分析,如下圖:
計算式如下:
回歸係數求取
與一元回歸係數的求取一樣,多元線性回歸係數的估計值仍然採用最小二乘法原理求得,即將觀察得到的樣本資料作為已知,帶入樣本回歸方程中,然後分別對a,b,…,g求偏導數(回顧:最小二乘法),從而得到它們的點估計值。其數值可以使用Excel、SPSS的統計軟體計算得到。
相關性檢驗
在一元(簡單線性)回歸方程的假設檢驗中介紹了,回歸方程的相關性檢驗有三種方式,它們的作用相同,只需選取其中一種檢驗即可(相關係數的檢驗、回歸方程的檢驗、回歸係數的檢驗)。三種檢驗使用的統計量與檢驗原則與一元線性回歸的相關性檢驗相同,這裡不在贅述。
需要著重介紹多元的相關係數的檢驗
在多元回歸中,決定係數(R平方)又稱為擬合優度或者多元決定係數(Multiple coefficient of determination),其計算公式與一元回歸相同,即
可參考上文變差圖。
R平方的數值大小可以說明所建立模型與實際資料的擬合程度好壞,其值越接近1,擬合程度越高。一元回歸中,決定係數的平方根即為相關係數,表示兩個變數的相關程度,可正可負(正相關或負相關);多元回歸中,關注正平方根,稱為複相關係數,表示因變數與作為一個整體的所有引數的相關程度。
決定係數(R平方)又稱為擬合優度,因為在樣本容量相同和引數個數相同時,能夠說明不同模型的擬合情況好壞。在樣本容量不同或者引數個數不同時,用決定係數比較擬合程度需要慎重,因為它們對決定係數有很大影響(影響原因回歸計算公式變化)。
為了對包含不同引數個數的方程進行擬合程度比較,需要對R平方進行修正(解除引數個數影響),稱為修正的多元決定係數(Adjusted multiple coefficient of determination),公式如下:
可回顧上文變差圖幫助理解。
區間估計與預測
與一元回歸分析一樣,作完上面的分析後,1、可以對回歸係數(a,b,…,g)進行區間估計;2、對特定引數通過回歸方程計算得到的因變數值進行區間估計。
隨著引數個數的增加,回歸分析的計算量也是非常大,所以需要借助分析軟體説明計算。下篇用具體案例,通過Excel分析工具計算,分析計算結果,以這樣的方式説明大家掌握一元(簡單線性)回歸分析和多元線性回歸分析。
本文為專欄文章,來自:生活統計學,內容觀點不代表本站立場,如若轉載請聯繫專欄作者,本文連結:https://www.afenxi.com/34323.html 。
留言列表