期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來(lái)源:期刊VIP網(wǎng)所屬分類:軟件開發(fā)時(shí)間:瀏覽:次
摘 要:預(yù)測(cè)性維護(hù)是工業(yè)互聯(lián)網(wǎng)應(yīng)用的重點(diǎn),實(shí)現(xiàn)預(yù)測(cè)性維護(hù)的關(guān)鍵是對(duì)設(shè)備系統(tǒng)或核心部件的壽命進(jìn)行有效預(yù)測(cè)。隨著近年來(lái)機(jī)器學(xué)習(xí)的發(fā)展,機(jī)械設(shè)備海量數(shù)據(jù)已成為工業(yè)互聯(lián)網(wǎng)分析核心部件剩余壽命的關(guān)鍵指標(biāo),也成為設(shè)備健康管理決策性數(shù)據(jù)?;诠こ虣C(jī)械設(shè)備大數(shù)據(jù),結(jié)合XGBoost、隨機(jī)森林、LightGBM等多種機(jī)器學(xué)習(xí)模型,多維度探究影響機(jī)械核心部件壽命的機(jī)器學(xué)習(xí)模型效果,建立Stacking算法模型融合的部件壽命預(yù)測(cè)模型,并在核心部件數(shù)據(jù)上驗(yàn)證模型預(yù)測(cè)有效性,從而減少設(shè)備非計(jì)劃停機(jī)時(shí)間,推進(jìn)智能制造和預(yù)測(cè)性維護(hù)的進(jìn)步。
關(guān)鍵詞:工程機(jī)械;壽命預(yù)測(cè);機(jī)器學(xué)習(xí);Stacking
《軟件工程師》為中國(guó)軟件行業(yè)協(xié)會(huì)會(huì)刊,被中國(guó)期刊全文數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)、龍?jiān)雌诳W(wǎng)、萬(wàn)方數(shù)字——數(shù)據(jù)期刊群以及中國(guó)核心期刊(遴選)數(shù)據(jù)庫(kù)等全文收錄。
1 引言(Introduction)
在工業(yè)4.0的環(huán)境下,工程機(jī)械設(shè)備自動(dòng)化發(fā)展高速,設(shè)備部件在傳統(tǒng)機(jī)械行業(yè)運(yùn)行通信環(huán)境惡劣,為工程機(jī)械設(shè)備監(jiān)控管理帶來(lái)了新的挑戰(zhàn)。設(shè)備部件長(zhǎng)期運(yùn)行,零部件壽命減少,可靠性降低將大大影響工程設(shè)備使用,甚至威脅人類生命財(cái)產(chǎn)安全。那么及時(shí)維護(hù)更換工程設(shè)備核心部件成為設(shè)備健康管理的關(guān)鍵。壽命預(yù)測(cè)是工程機(jī)械設(shè)備安全運(yùn)行的重要基礎(chǔ)[1]。早期部件壽命研究指的是基于理論物理學(xué)和統(tǒng)計(jì)學(xué),計(jì)算部件壽命,探索其電壓、電流、轉(zhuǎn)速、工作時(shí)長(zhǎng)、溫度等數(shù)據(jù)挖掘出指標(biāo)之間的規(guī)律[2]。統(tǒng)計(jì)學(xué)模型則選擇合適的壽命分布模型,建立統(tǒng)計(jì)學(xué)可靠性高的概率性公式研究零部件特征分布,如正態(tài)分布、指數(shù)分布等[3]。物理學(xué)壽命預(yù)測(cè)模型則是根據(jù)零部件運(yùn)行過(guò)程物理感應(yīng)失效模型,損傷力學(xué),能量等方法對(duì)零部件失效類型進(jìn)行了定義分析,對(duì)各類零部件退化機(jī)能對(duì)應(yīng)物理模型定義,均偏重理論研究[4,5]。目前已經(jīng)廣泛運(yùn)用在汽車零部件等制造業(yè)中,但是在工程機(jī)械使用過(guò)程中,存在著數(shù)據(jù)非線性、不等長(zhǎng)、維度多等波動(dòng),眾多參數(shù)甚至是傳感器無(wú)法及時(shí)傳播的,導(dǎo)致理論壽命計(jì)算出現(xiàn)較大誤差。
本文運(yùn)用大數(shù)據(jù)分析機(jī)器學(xué)習(xí)的方法評(píng)估零部件運(yùn)行中晚期健康狀態(tài),數(shù)據(jù)挖掘分析核心部件電動(dòng)機(jī)在相同情況下歷史數(shù)據(jù),探究影響機(jī)械核心部件壽命指標(biāo)關(guān)聯(lián)關(guān)系,如電流電壓、振動(dòng)、噪聲、轉(zhuǎn)速、溫度等,結(jié)合機(jī)器學(xué)習(xí)K-means聚類分析、線性回歸算法、隨機(jī)森林、LightGBM和XGBoost等方法,構(gòu)建與壽命相關(guān)的高質(zhì)量特征Stacking集成算法預(yù)測(cè)模型,可預(yù)先知曉設(shè)備零部件結(jié)果,及時(shí)檢測(cè)更換,有利于在機(jī)械設(shè)備使用中期發(fā)現(xiàn)設(shè)備零部件異常狀態(tài),增強(qiáng)零部件健康質(zhì)量把控。
2 工程機(jī)械核心部件壽命預(yù)測(cè)數(shù)據(jù)處理(Processing of life prediction data for core components of construction machinery)
中期壽命預(yù)測(cè)是工程設(shè)備監(jiān)控管理的重要內(nèi)容,主要針對(duì)機(jī)械設(shè)備運(yùn)行過(guò)程中出現(xiàn)的狀態(tài)把控,防止運(yùn)行過(guò)程中發(fā)生意外[6]。很多設(shè)備零部件在未充分使用到設(shè)計(jì)壽命規(guī)定年限時(shí),就已經(jīng)損耗嚴(yán)重需要報(bào)廢。如果不能及時(shí)發(fā)現(xiàn),將會(huì)造成很大的影響,設(shè)備不合理使用也將會(huì)造成極大的浪費(fèi)[7]。通常在實(shí)際使用環(huán)境中預(yù)測(cè)存在較大偏差。因?yàn)楝F(xiàn)實(shí)采集到的數(shù)據(jù)數(shù)量龐大,復(fù)雜多變,基礎(chǔ)數(shù)據(jù)質(zhì)量差,能都對(duì)大量數(shù)據(jù)探索性分析研究,從中挖掘出與壽命相關(guān)隱藏的信息非常重要。
針對(duì)工程機(jī)械設(shè)備耗損性部件電動(dòng)機(jī),獲取到數(shù)據(jù)集包含訓(xùn)練集和測(cè)試集兩部分。訓(xùn)練集中涵蓋電動(dòng)機(jī)全壽命物聯(lián)網(wǎng)采樣數(shù)據(jù),即從安裝后一直到更換之間的對(duì)應(yīng)數(shù)據(jù),形式為多維時(shí)間序列[8]。字段“部件工作時(shí)長(zhǎng)”的最大值,即為該部件實(shí)例的實(shí)際壽命。測(cè)試集中包含部件一段時(shí)間內(nèi)的電動(dòng)機(jī)物聯(lián)網(wǎng)采樣數(shù)據(jù),基于該段數(shù)據(jù),預(yù)測(cè)電動(dòng)機(jī)此后的剩余壽命。數(shù)據(jù)集中樣本EDA后特征數(shù)據(jù)字段如表1所示。
數(shù)據(jù)標(biāo)準(zhǔn)化(歸一化)處理,將消除指標(biāo)之間的量綱影響,解決數(shù)據(jù)指標(biāo)之間的可比性,使各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)[9]。采用Min-Max Normalization如公式(1),對(duì)數(shù)據(jù)進(jìn)行歸一化構(gòu)造量化[0,1]區(qū)間,特征縮放后梯度下降過(guò)程會(huì)更加筆直,收斂可以得到更快的提升,得到數(shù)據(jù)歸一化處理結(jié)果如表2所示。
3 工程機(jī)械核心部件壽命預(yù)測(cè)模型構(gòu)造(Construction of life prediction model for core components of construction machinery)
3.1 K-Means聚類
使用K-Means聚類無(wú)須進(jìn)行模型的訓(xùn)練,無(wú)監(jiān)督學(xué)習(xí)效率高,處理大數(shù)據(jù)集,算法保持可伸縮性和高效性當(dāng)簇接近高斯分布時(shí),效果較好[10]。本文利用優(yōu)秀的特征進(jìn)行聚類,使用最小距離分類器MDC進(jìn)行測(cè)試獲得最佳K均值聚類k值為5,結(jié)果得分如表所示。
3.2 Stacking模型融合
Stacking堆疊(元組合)是指組合多個(gè)預(yù)測(cè)模型信息生成新模型的一種模型組合技術(shù)。堆疊模型(也稱為二級(jí)模型),可以組合每個(gè)基本模型優(yōu)秀的能力,忽略其他模型缺點(diǎn),組合起來(lái)將優(yōu)于單個(gè)模型[11]。因此,當(dāng)基本模型模擬效果不同各有優(yōu)缺點(diǎn)時(shí),選擇模型堆疊是最有效地。本研究選擇了八個(gè)單模型進(jìn)行預(yù)測(cè),有Lasso回歸、ElasticNet彈性網(wǎng)絡(luò)、核嶺回歸Kernel Ridge Regression、決策樹DecisionTree、隨機(jī)森林RandomForest、GBDT、XGBoost、LightGBM。
各個(gè)模型預(yù)測(cè)效果精度得分如表4和圖1所示,可以觀察到?jīng)Q策樹、XGBoost和LightGBM模型效果較好平均精度得分可以達(dá)到0.03左右,三種模型入選第二層學(xué)習(xí)器,為了防止過(guò)擬合現(xiàn)象發(fā)生,將隨機(jī)森林模型也加入第二層學(xué)習(xí)器中。
使用Stacking(堆疊)模型對(duì)多個(gè)單一模型進(jìn)行組合。以初級(jí)訓(xùn)練集八種模型訓(xùn)練出初級(jí)訓(xùn)練器,生成一個(gè)新數(shù)據(jù)集訓(xùn)練刺激第二層學(xué)習(xí)器,結(jié)合四個(gè)LR頂層模型進(jìn)行次級(jí)訓(xùn)練[12],多模型融合過(guò)程如圖2所示。
n=8個(gè)初級(jí)學(xué)習(xí)器,對(duì)初級(jí)學(xué)習(xí)器Mn,利用測(cè)試集數(shù)據(jù)D進(jìn)行訓(xùn)練,將訓(xùn)練完成的Mn預(yù)測(cè)訓(xùn)練集D和測(cè)試集T的標(biāo)簽列,得到結(jié)果為Pn和Tn[13]。隨后將n個(gè)學(xué)習(xí)模型結(jié)果合并,得到次級(jí)學(xué)習(xí)器的訓(xùn)練集和測(cè)試集。利用訓(xùn)練次級(jí)學(xué)習(xí)器,并預(yù)測(cè)得到最終的預(yù)測(cè)結(jié)果。
3.3 模型融合交叉驗(yàn)證
交叉驗(yàn)證指的是通過(guò)估計(jì)模型的泛化誤差,選擇模型的方法。優(yōu)點(diǎn)在于不做任何假定前提,具有應(yīng)用的普遍性,操作簡(jiǎn)便,是一種行之有效地模型選擇方法[14]。通過(guò)將數(shù)據(jù)集均分成K個(gè)子集,并依次將其中的K-1個(gè)子集作為訓(xùn)練集,剩下的1個(gè)子集用作測(cè)試集。在K折交叉驗(yàn)證的過(guò)程中,每個(gè)子集均會(huì)被驗(yàn)證一次。本研究使用四折交叉驗(yàn)證方法構(gòu)造,穩(wěn)健性強(qiáng),交叉驗(yàn)證過(guò)程如圖3所示,對(duì)每一折進(jìn)行預(yù)測(cè),采用兩層循環(huán),第一層循環(huán)控制基模型的數(shù)目,第二層循環(huán)控制交叉驗(yàn)證四次,則對(duì)每一個(gè)基模型會(huì)訓(xùn)練四次,最后求均方根拼接得到預(yù)測(cè)結(jié)果。
4 模型預(yù)測(cè)結(jié)果(Model prediction results)
使用Stacking模型融合方法對(duì)所有測(cè)試集進(jìn)行預(yù)測(cè),使用時(shí)間為四天以內(nèi)的電動(dòng)機(jī)生命周期在8000—12000天,預(yù)測(cè)壽命和實(shí)際壽命相對(duì)均方根誤差在0.1以內(nèi)。使用時(shí)間為30天以內(nèi)的電動(dòng)機(jī)生命周期在2000—6000天,預(yù)測(cè)壽命和實(shí)際壽命相對(duì)均方根誤差在0.4以內(nèi)。使用1600天以內(nèi)的電動(dòng)機(jī)生命周期在4000天以內(nèi),相對(duì)預(yù)測(cè)壽命和實(shí)際壽命相對(duì)均方根誤差在0.75以內(nèi)。由此可見,基于Stacking算法的工程機(jī)械核心部件壽命預(yù)測(cè)模型預(yù)測(cè)效果良好。
5 結(jié)論(Conclusion)
本文將大數(shù)據(jù)分析機(jī)器學(xué)習(xí)的方法運(yùn)用到工程機(jī)械自動(dòng)化領(lǐng)域,提出了一種基于Stacking模型融合的工程機(jī)械核心部件壽命預(yù)測(cè)算法。從原始電動(dòng)機(jī)傳感數(shù)據(jù)入手,經(jīng)過(guò)數(shù)據(jù)準(zhǔn)備和預(yù)處理,K-means聚類生成訓(xùn)練樣本,選擇Lasso回歸、ElasticNet彈性網(wǎng)絡(luò)、核嶺回歸Kernel Ridge Regression、決策樹DecisionTree、隨機(jī)森林RandomForest、GBDT、XGBoost、LightGBM。八種子模型作為Stacking模型融合的基分類器,隨機(jī)森林、GBDT、XGBoost和LightGBM作為Stacking模型融合的次級(jí)分類器進(jìn)行識(shí)別,最終證明本算法具有良好的壽命預(yù)測(cè)效果,均方根誤差小,精度高。有助于改變機(jī)械自動(dòng)化領(lǐng)域傳統(tǒng)被動(dòng)的維修模式,轉(zhuǎn)向預(yù)測(cè)維修自動(dòng)化方面,從而降低核心部件使用風(fēng)險(xiǎn),提高設(shè)備使用效能。
參考文獻(xiàn)(References)
[1] Sbarufatti,M. Corbetta,A.Manes,et al.Monte-Carlo sampling based on a committee of artificial neural networks for posterior state estimation and residual lifetime prediction[J].International Journal of Fatigue,2016:35-38.
[2] Xiang Wan,Dong Wang,Peter W.Tse,et al.A critical study of different dimensionality reduction methods for gear crack degradation assessment under different operating conditions[J]. Measurement,2016(02):22-24.
[3] 杜黨波,司小勝,胡昌華,等.基于隨機(jī)退化建模的共載系統(tǒng)壽命預(yù)測(cè)方法[J].儀器儀表學(xué)報(bào),2018(08):61-62.
[4] 牛乾.機(jī)械旋轉(zhuǎn)部件的性能退化及其壽命預(yù)測(cè)方法研究[D].浙江大學(xué),2018:6-8.
[5] 封楊,黃筱調(diào),陳捷,等.基于小樣本試驗(yàn)的大型回轉(zhuǎn)支承剩余壽命預(yù)測(cè)[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(09):12-13.
[6] 尤明懿.基于狀態(tài)監(jiān)測(cè)數(shù)據(jù)的產(chǎn)品壽命預(yù)測(cè)與預(yù)測(cè)維護(hù)規(guī)劃方法研究[D].上海交通大學(xué),2012:43-46.
[7] ChunLin Zhang,Bing Li,BinQiang Chen,et al.Weak fault signature extraction of rotating machinery using flexible analytic wavelet transform[J].Mechanical Systems and Signal Processing,2015(06):89-90.
[8] 周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016:67-69.
[9] Audi Ahmad,Pierrot-Deseilligny Marc,Meynard Christophe,et al. Implementation of an IMU Aided Image Stacking Algorithm in a Digital Camera for Unmanned Aerial Vehicles.[J].Sensors (Basel, Switzerland),2017(7):11-13.
[10] Truong Giang Nguyen,Muller Jean-Micha?l,Rupnik Ewelina,et al.Second Iteration of Photogrammetric Processing to Refine Image Orientation with Improved Tie-Points[J].Sensors (Basel, Switzerland),2018(7):21-22.
[11] YiJun Chen,Man-Leung Wong,Haibing Li.Applying Ant Colony Optimization to configuring stacking ensembles for data mining[J].Expert Systems With Applications,2014(6):46-47.
[12] 沈長(zhǎng)青.旋轉(zhuǎn)機(jī)械設(shè)備關(guān)鍵部件故障診斷與預(yù)測(cè)方法研究[D].中國(guó)科學(xué)技術(shù)大學(xué),2014:67-68.
[13] 肖婷,湯寶平,秦毅,等.基于流形學(xué)習(xí)和最小二乘支持向量機(jī)的滾動(dòng)軸承退化趨勢(shì)預(yù)測(cè)[J].振動(dòng)與沖擊,2015(09):11-13.
[14] 孫闖,何正嘉,張周鎖,等.基于狀態(tài)信息的航空發(fā)動(dòng)機(jī)運(yùn)行可靠性評(píng)估[J].機(jī)械工程學(xué)報(bào),2013(06):90-92.