期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘要:加權回歸是如果回歸線上的各點的精度不同,對各點賦以不同的權值,用加權最小二乘法確定回歸系數,擬合回歸方程和回歸線。文章發表在《農業與技術》上,是農業工程師論文發表范文,供同行參考。
關鍵詞:加權回歸,建模,異方差,模型評價
林業數表模型是森林經營決策必不可少的計量、預測、評價依據,保證模型質量至關重要,而樣本組織、模型擬合方法和模型評價是保證質量的3個重要環節。實踐證明,林業數表模型所描述的問題普遍存在異方差性,在模型擬合中若不采取消除異方差影響的有效方法,必然導致模型有偏。
1 加權回歸的概念
確定變量之間的回歸關系,一般情況下是利用普通最小二乘法。假設隨機變量y~,其中,E(y)=f(x)。也就是說,隨機變量y與x滿足下列模型:
y=f(x)+ε (1)
式中的ε有3個基本假定,即“獨立、正態、等方差”,它們是采用普通最小二乘法建立回歸模型的先決條件。3個條件中的“獨立”與“正態”在一般情況下都是基本滿足的,而“等方差”這一條件,則在很多情況下都難以滿足。為解決誤差項ε的異方差性問題,應設法校正原有的模型,使校正后的模型其誤差項具有常數方差,而模型的校正取決于方差σ2εi與自變量xi之間的關系。假設εi的方差與xi的函數g(xi)呈比例關系,即:
2 權函數的選擇
2.1 異方差性的基本概念
根據回歸估計理論,當建立的回歸模型的誤差項存在異方差時,必須采用加權最小二乘法來消除異方差對參數估計的影響。在林業上所涉及的許多數學模型,如材積模型、生物量模型、生長率模型、削度模型等,其誤差項的方差都不為常數,而是隨解釋變量的變化而變化(駱期邦等,1992;曾偉生等,1992;曾偉生,1996)。一般而言,模型預估值隨解釋變量的增大而增大時,其誤差項的方差也隨解釋變量的增大而增大,如材積模型和生物量模型;模型預估值隨解釋變量的增大而減小時,其誤差項方差也隨解釋變量的增大而減小,如生長率模型。
2.2 權函數選擇的研究現狀
一般情況下,如果不具有異方差性形式的信息,可通過對剩余值|ei|=g(xi)進行試驗,以挑選出一種合適的擬合形式(俞大剛,1987)。另外,也有人提出直接尋找方差S2ei與自變量xi的關系式S2ei=g(xi),再以W=1/g(xi)為權函數進行加權回歸,新模型的誤差項方差S2ei就會近似為常數1。還進一步提出了較具通用性的拋物線形式的權函數,并取得了較好的效果(曾偉生,1996)。但是這樣來確定權函數,一方面比較繁瑣;另一方面也難保證拋物線形式能適合所有模型,尤其是含多個自變量的模型;再就是必須有比較大的建模樣本才可能得到誤差項方差與變量x之間的回歸關系。誠然,在此基礎上還可以作些改進,
2.3 最佳權函數的確定
前面已經提到,最佳權函數是針對某個模型而不是某類模型,即同類模型中不同的回歸方程式應有不同的最佳權函數?;谶@一認識,我們再來對一些經典模型及其合適權函數作進一步分析。
因此,新模型誤差項的期望值為0,其方差為常數,即對所有xi來說,每個ε′i的方差都相同;滿足等方差的條件。至此可以得出結論:以模型本身構造的權函數(3)式就是要尋找的最佳權函數。
3 模型評價與加權回歸,回歸模型評價指標
建立回歸模型,從一般的意義上講有以下3個目的(劉璋溫等,1983):
結構分析——對觀測數據進行分析,以便描述存在于解釋變量與目標變量之間的結構關系;
預測——以已知解釋變量的值來預測目標變量的未來值或期望值;
控制——為使目標變量的值保持在一個理想的水平上,而適當調整解釋變量中可調整的變量值。
農業論文投稿須知:《農業與技術》雜志是由吉林省科學技術信息研究所和中國科技期刊編輯學會聯合主辦的學術性期刊,創辦于1980年。國內外公開發行(月刊)(國內統一刊號:CN22-1159/S;國際標準刊號ISSN1671-962X)。