期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:教育學(xué)時(shí)間:瀏覽:次
摘要:為有效提高水文預(yù)測預(yù)報(bào)精度,提出了一種基于多組群教學(xué)優(yōu)化(MGTLO)的隨機(jī)森林(RF)預(yù)測方法,利用MGTLO算法對(duì)RF兩個(gè)關(guān)鍵參數(shù)進(jìn)行優(yōu)化,構(gòu)建MGTLO-RF預(yù)測模型,并與基于MGTLO算法優(yōu)化的支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)兩種常規(guī)預(yù)測模型作對(duì)比分析。以云南省龍?zhí)墩驹聫搅骱湍陱搅黝A(yù)測為例進(jìn)行實(shí)例研究,利用前44 a和后10 a資料對(duì)MGTLO-RF等3種模型進(jìn)行訓(xùn)練和預(yù)測。結(jié)果表明:所提出的MGTLO-RF模型具有更好的預(yù)測精度和泛化能力,可作為水文預(yù)測預(yù)報(bào)和相關(guān)預(yù)測研究的一種有效工具。
關(guān) 鍵 詞:徑流預(yù)測; 多組群教學(xué)優(yōu)化算法; 隨機(jī)森林; 參數(shù)優(yōu)化
《長江師范學(xué)院學(xué)報(bào)》是經(jīng)國家新聞總署批準(zhǔn),由重慶市教育委員會(huì)主管、長江師范學(xué)院主辦的綜合類學(xué)術(shù)期刊。
1 研究背景
提高徑流預(yù)測精度一直是水文預(yù)測預(yù)報(bào)中的熱點(diǎn)和難點(diǎn)。由于受自然條件、人類活動(dòng)等眾多確定性因素和隨機(jī)因素的影響,徑流的形成和變化過程非常復(fù)雜,致使常規(guī)的回歸分析、數(shù)理統(tǒng)計(jì)等方法用于徑流預(yù)測預(yù)報(bào)難以達(dá)到理想的應(yīng)用效果。近年來,一些非常規(guī)方法被嘗試用于徑流預(yù)測預(yù)報(bào),并獲得較好的預(yù)測效果,如BP、GRNN、RBF神經(jīng)網(wǎng)絡(luò)法[1-3]、支持向量機(jī)法[4-5]、集對(duì)分析法[6-7]、投影尋蹤回歸法[8]、小波分解混合法[9-10]、組合預(yù)測法[11]。隨機(jī)森林(random forest,RF)是由Leo Breiman提出的一種集成機(jī)器學(xué)習(xí)方法,可應(yīng)用于分類問題、回歸問題以及特征選擇問題,主要利用Bootstrap重抽樣方法從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)Bootstrap樣本進(jìn)行決策樹建模,然后組合多棵決策樹通過投票方式得出最終評(píng)價(jià)結(jié)果[12],可有效避免“過擬合”和“欠擬合”現(xiàn)象的發(fā)生,對(duì)解決多變量預(yù)測具有很好的效果,被譽(yù)為當(dāng)前最好的機(jī)器學(xué)習(xí)算法之一[13-14],已在各領(lǐng)域及徑流預(yù)測[15]中得到應(yīng)用。在實(shí)際應(yīng)用中,對(duì)于不同的預(yù)測對(duì)象,RF決策樹數(shù)量ntree和分裂屬性個(gè)數(shù)mtry是不同的,二者成為決定RF預(yù)測或分類性能的關(guān)鍵性因素。目前普遍采用試湊的方法[14-16]或網(wǎng)絡(luò)搜索的方法[12,17]確定決策樹數(shù)量、分裂屬性個(gè)數(shù),但取值效果往往不理想。此外,粒子群優(yōu)化算法[18]、蜜蜂交配優(yōu)化算法[19]和果蠅優(yōu)化算法[20]嘗試用于RF關(guān)鍵參數(shù)優(yōu)化,并獲得較好的優(yōu)化應(yīng)用效果。但基于智能算法優(yōu)化決策樹數(shù)量、分裂屬性個(gè)數(shù)的RF模型用于水文預(yù)測預(yù)報(bào)的文獻(xiàn)并不多見。
為進(jìn)一步拓展智能算法優(yōu)化RF兩個(gè)關(guān)鍵參數(shù)的應(yīng)用范疇,本文提出了一種基于多組群教學(xué)優(yōu)化(multi-group teaching-learning optimization,MGTLO)算法優(yōu)化的RF預(yù)測方法,利用MGTLO算法優(yōu)化RF決策樹數(shù)量和分裂屬性個(gè)數(shù)兩個(gè)關(guān)鍵參數(shù),構(gòu)建MGTLO-RF預(yù)測模型,并構(gòu)建基于MGTLO算法優(yōu)化的支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)兩種常規(guī)預(yù)測模型作對(duì)比分析,以云南省龍?zhí)墩究菟?2月徑流和年徑流預(yù)測為例進(jìn)行實(shí)例研究,旨在驗(yàn)證MGTLO-RF模型用于水文預(yù)測預(yù)報(bào)的可行性和有效性。
2 MGTLO-RF預(yù)測模型
2.1 多組群教學(xué)優(yōu)化算法
多組群教學(xué)優(yōu)化(MGTLO)算法是文獻(xiàn)[21]提出的一種基于多組群改進(jìn)的教學(xué)優(yōu)化算法,已被證明其尋優(yōu)精度和穩(wěn)定性優(yōu)于TLBO、粒子群優(yōu)化等算法。MGTLO算法利用分組策略定義學(xué)生(種群)數(shù)量、組數(shù)和每組學(xué)生數(shù)量,通過選擇每組學(xué)生中適應(yīng)值度最好的學(xué)生作為該教師并對(duì)各組教師適應(yīng)度值進(jìn)行比較,最終確定所有組學(xué)生中適應(yīng)度值最好的學(xué)生作為教師,即待優(yōu)化問題最優(yōu)解。參考文獻(xiàn)[21],MGTLO算法簡述如下:
(1) 定義學(xué)生數(shù)量N和組數(shù)G,確定每組學(xué)生數(shù)量S=N/G;隨機(jī)將S個(gè)學(xué)生分配給每個(gè)組(G-1),將剩下學(xué)生分配給最后一個(gè)小組。
4 結(jié) 語
本文鑒于水文預(yù)測預(yù)報(bào)的復(fù)雜性和不確定性,基于多組群教學(xué)優(yōu)化(MGTLO)算法良好的全局搜索能力和隨機(jī)森林(RF)強(qiáng)分類集成器二者的優(yōu)點(diǎn),提出MGTLO-RF水文預(yù)測模型,以云南省龍?zhí)墩究菟谠聫搅?、年徑流預(yù)測為例進(jìn)行實(shí)例驗(yàn)證,并與MGTLO-SVM、MGTLO-BP兩種常規(guī)預(yù)測模型作對(duì)比分析。結(jié)果表明,無論是訓(xùn)練樣本還是預(yù)測樣本,MGTLO-RF模型均表現(xiàn)出更高的預(yù)測精度和泛化能力,不但可作為水文預(yù)測預(yù)報(bào)的有效工具,而且可為相關(guān)預(yù)測研究提供參考。
參考文獻(xiàn):
[1] 崔東文,金波.花授粉算法-BP神經(jīng)網(wǎng)絡(luò)模型及其在月徑流預(yù)測中的應(yīng)用[J].人民珠江, 2016, 37(4): 36-40.
[2] 覃光華,宋克超,周澤江,等.基于WA-GRNN模型的年徑流預(yù)測[J].工程科學(xué)與技術(shù),2013,45(6):39-46.
[3] 黃劍竹. 改進(jìn)RBF-Adaboost模型及其在年徑流預(yù)測中的應(yīng)用[J]. 人民珠江, 2015, 36(1): 32-36.
[4] 崔東文,金波.基于改進(jìn)的回歸支持向量機(jī)模型及其在年徑流預(yù)測中的應(yīng)用[J].水力發(fā)電學(xué)報(bào), 2015, 34(2): 7-14.
[5] 崔東文.幾種智能算法與支持向量機(jī)融合模型在中長期月徑流預(yù)測中的應(yīng)用[J].華北水利水電大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,37(5):51-57.
[6] 歐源,張瓊,王文圣,等.基于秩次集對(duì)分析的年徑流預(yù)測模型[J]. 人民長江, 2009, 40(3): 63-65.
[7] 王延亭,王建群,張玉杰.基于加權(quán)秩次集對(duì)分析法的年徑流預(yù)報(bào)模型[J]. 水電能源科學(xué), 2012 (3): 17-19,67.
[8] 崔東文,金波.鳥群算法-投影尋蹤回歸模型在多元變量年徑流預(yù)測中的應(yīng)用[J]. 人民珠江, 2016, 37(11): 26-30.
[9] 周婷,金菊良,李榮波,等. 基于小波支持向量機(jī)的徑流預(yù)測性能優(yōu)化分析[J]. 水力發(fā)電學(xué)報(bào), 2017, 36(10): 45-55.