期刊VIP學術指導 符合學術規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:綜合論文時間:瀏覽:次
摘 要:圖像處理與分析課程具有很強的理論性與實踐性,非常適合采用案例教學。基于該課程特點及工程碩士培養(yǎng)要求,融合圖像處理經(jīng)典方法與人工智能最新技術,以圖像信息處理的典型應用開發(fā)為基礎設計教學案例庫。闡述案例庫設計意義、要求與成果形式,聚焦成像質(zhì)量增強、日常生活與工業(yè)應用、醫(yī)學圖像分析等方面設計若干案例。
關鍵詞:圖像處理與分析;工程碩士培養(yǎng);教學案例庫
0 引言
圖像處理研究與應用在航天、軍事、工業(yè)、醫(yī)療、安防等諸多領域一直是熱點 [1]。近幾年,以深度學習為代表的人工智能技術直接催生與圖像處理相關的眾多應用。
高校電子信息、計算機、遙感、自動化、生物醫(yī)學等專業(yè)均開設圖像處理相關課程。鑒于學校層次、專業(yè)及學生基礎差別,圖像處理課程在內(nèi)容上各有側重。圖像處理、圖像分析和圖像理解代表圖像信息處理由低到高的不同層次。以改善圖像質(zhì)量和存儲效率進行目標檢測、測量與描述,實現(xiàn)對圖像內(nèi)容的辨別、理解和場景解釋,用來指導和規(guī)劃行動。圖像處理與分析研究生課程核心內(nèi)容是利用各種處理手段改善圖像質(zhì)量,提取圖像信息用于目標識別、場景分析及控制決策等,包含以圖像為輸入、解決復雜工程問題的基礎性關鍵技術。
工程碩士專業(yè)學位與工程領域任職資格相聯(lián)系的學位處于同一層次,但類型不同,工程碩士專業(yè)學位側重于工程應用[2]。從工程碩士教學角度,圖像處理與分析課程既有堅實的理論基礎,又與實際應用緊密結合,通過課程的有效學習,啟迪科學思維、提高專業(yè)實踐能力。基于課程特點及工程碩士培養(yǎng)要求,融合圖像處理經(jīng)典方法與人工智能最新發(fā)展,針對圖像信息處理的典型應用開發(fā)建設教學案例庫并在教學中應用,引導學生進行相應的研究與開發(fā),能夠更好地提高課程教學實效性,強化工程碩士的實踐應用能力,培養(yǎng)創(chuàng)新創(chuàng)業(yè)能力,帶動教學內(nèi)容與教學方法改革,提高工程碩士教育教學質(zhì)量[3]。
1 圖像處理案例庫發(fā)展現(xiàn)狀
目前國家級和部分省級精品課程、精品資源共享課、精品在線開放課程中的圖像處理課程[4-5],主要來自上海交通大學、武漢大學、北京交通大學、西安電子科技大學、天津理工大學等;國外高校有美國斯坦福大學(EE368/CS232)[6]、內(nèi)華達大學(CS474/674)[7]等圖像處理教學網(wǎng)站。在圖像處理教學方面,相關院校普遍采用理論與實踐相結合方式。理論部分一般是課堂教學,教學內(nèi)容主要是圖像概念及成像基本原理,圖像變換、增強、復原、分割、描述及基本的分類識別原理與算法。實踐教學部分包括圖像處理算法原理的鞏固、融合與應用,教學形式包括實驗、上機作業(yè)和期末課程項目等。
盡管在高校圖像處理教學網(wǎng)站上能夠找到教學大綱、課件、實驗指導書、項目報告以及部分圖像處理的源代碼,但包括出版物在內(nèi)目前還沒找到系統(tǒng)完整的圖像處理教學案例庫。梳理現(xiàn)有教學資源,與教學案例庫最為接近的是各種實驗與課程項目。從面向?qū)I(yè)學位研究生教學角度看,圖像處理實驗在綜合性和實踐性方面還有差距;課程項目一般是學生自由選題,項目質(zhì)量與難易程度不一。文獻中有關圖像處理案例教學討論主要集中于案例教學優(yōu)勢特點、組織方式、實施范例等[8-15],部分文獻設計了少量基礎性案例,但從層次上看難以滿足研究生教學要求[16-17]。
近年來人工智能在圖像處理方面成功應用,圍繞智能交通、智慧醫(yī)療、機器人、工業(yè)自動化、智能安防、購物、娛樂等方面的案例和產(chǎn)品層出不窮,谷歌、亞馬遜、騰訊、百度等高科技公司也開放了若干與圖像處理開發(fā)相關的資源,以GitHub為代表的開源網(wǎng)站提供了豐富的學習與應用資源。本文面向工程碩士研究生教育需求,對圖像處理與分析課程教學內(nèi)容進行總體籌劃,體現(xiàn)圖像處理最新發(fā)展成果,形成覆蓋面廣、可用性強、基礎性與高層次并重的教學案例庫。
2 案例庫設計要求與形式
2.1 設計要求
建設面向工程碩士的圖像處理與分析課程教學案例庫,要注重“科學研究與教學案例相結合,理論與實踐相結合”,突出課程教學重點,基于圖像處理實際應用場景,開發(fā)符合案例教學要求、與國際接軌的高質(zhì)量教學案例庫。
案例庫設計要體現(xiàn)以下特點:
(1)服務對象明確,適應專業(yè)學位教學要求。教學團隊專門針對工程碩士開發(fā)教學案例,通過解決實際問題培養(yǎng)學生知識運用與實踐創(chuàng)新能力。
(2)緊密聯(lián)系課程內(nèi)容,強化知識融合與拓展。開發(fā)的教學案例覆蓋圖像處理與圖像分析重點內(nèi)容,不是過往知識的簡單再現(xiàn),而是包含多個新知識點,集運用、擴展與提高于一體。
(3)可操作性強。每個案例都以編程實現(xiàn),在常規(guī)計算機或微處理器硬件平臺上運行,實現(xiàn)過程清晰明了,方便學生進行程序調(diào)試、修改處理、對比處理結果等。
(4)覆蓋面廣、處理方法先進。教學案例開發(fā)融合了圖像處理與人工智能的最新發(fā)展成果,涉及復雜場景成像、醫(yī)學、工業(yè)及日常應用等多個場景,通過經(jīng)典方法與最新成果對比啟迪創(chuàng)新思維。
2.2 案例庫成果形式
每個案例設計成一個獨立的教學內(nèi)容,依托具體圖像處理問題或?qū)嶋H應用,融合圖像處理理論、方法和技術,鞏固課程學習內(nèi)容,強化應用能力培養(yǎng),包括以下內(nèi)容:
(1)案例開發(fā)報告與使用說明。編寫文檔,闡明案例設計基本原理、實現(xiàn)方法和運行結果,提供教學案例使用指導書。
(2)源代碼。通過高級語言編程實現(xiàn)圖像處理與分析案例,依據(jù)案例不同的實現(xiàn)要求選擇Matlab、Python或C/C++編程語言。
3 案例庫內(nèi)容設計
圖像處理與分析課程教學案例庫設計要盡可能多地覆蓋課程核心內(nèi)容,突出圖像處理典型應用,結合研究熱點確定案例庫應包含以下方面。
3.1 成像質(zhì)量增強
(1)惡劣氣象條件下的清晰成像(霧、沙塵、雨、雪等)。室外圖像采集質(zhì)量會受到氣象條件影響。針對霧和沙塵場景,利用暗通道先驗建立霧和沙塵天氣的大氣散射模型,進而利用圖像復原法去除霧和沙塵影響;對雨、雪圖像的處理包括雨雪檢測和去除兩個步驟,需要綜合利用各種濾波方法。
(2)水下圖像增強。水下成像主要問題是顏色失真及清晰度下降。顏色失真采用白平衡、直方圖均衡化與Retinex方法校正;水下圖像模糊原因是水下光線散射或相機鏡頭未達到理想對焦造成散焦模糊、水下湍流造成高斯模糊、水體或魚群運動造成運動模糊,針對不同情形建立圖像退化模型,利用維納濾波恢復。
(3)交通實景下運動目標恢復。運動圖像恢復的前提是已知運動參數(shù),但并不適用于真實場景。對交通監(jiān)控探頭拍下的車輛行駛圖像進行處理,根據(jù)局部模糊性質(zhì)分割出運動區(qū)域,利用Radon變換估計運動參數(shù),通過維納濾波實現(xiàn)運動區(qū)域復原。
(4)個人定制“美顏”成像。模擬手機拍攝美顏效果。主要步驟包括:①用具有保邊效果的濾波算法對圖像進行模糊處理;②用膚色檢測算法保護非皮膚區(qū)域;③將模糊后的圖像及原圖進行圖像融合;④對融合后的圖像進行銳化處理。綜合利用空域濾波、區(qū)域分割與圖像融合算法。
(5)高動態(tài)范圍圖像(High-Dynamic Range,HDR)合成。相比普通圖像,HDR可提供更多的動態(tài)范圍與圖像細節(jié)。實現(xiàn)原理:根據(jù)多幅不同曝光時間得到的低動態(tài)范圍圖像(Low-Dynamic Range,LDR),利用每個曝光時間相對應的最佳LDR圖像合成最終HDR圖像。主要步驟包括:①圖像配準,在有運動的情況下精確配準輸入圖像;②恢復不同曝光圖像的輻射度;③計算各圖像權重值,實現(xiàn)圖像合成。
(6)全景拼接。將多幅圖像拼接成一幅寬幅圖像,處理步驟如下:①利用尺度不變特征變換(Scale-invariant feature transform,SIFT)算子檢測并提取圖像特征點;②使用隨機一致性采樣(RANdom SAmple Consensus,RANSAC)算法進行圖像匹配,找出圖像間重疊部分;③通過透視變換,將圖像投影到一個新的視平面,將圖像間的重疊部分進行拼接。
3.2 生活與工業(yè)應用
(1)活體指紋識別。指紋識別系統(tǒng)需要具有活體指紋檢測能力以排除指模欺騙。獲取的原始指紋圖像往往具有噪聲且包含大量空白前景,要設計指紋圖像分割算子裁剪指紋,利用導向濾波去噪;為利用噪聲分量等尖銳信息,在得到去噪圖像的同時還要綜合使用原始裁剪后的圖像,采用相鄰局部二值模式(Local binary patterns,LBP)方圖提取圖像特征,結合支持向量機(Support Vector Machine,SVM)分類器實現(xiàn)活體指紋識別。
(2)人臉表情識別。基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)進行局部特征融合的人臉表情識別。處理步驟包括:①構建CNN模型學習眼睛、眉毛、嘴巴3個局部區(qū)域特征;②將局部特征輸入SVM多分類器獲取各類特征的后驗概率;③通過粒子群尋優(yōu)算法優(yōu)化各特征的最優(yōu)融合權值,實現(xiàn)正確率最優(yōu)的決策級融合,完成表情分類。利用JAFFE人臉數(shù)據(jù)庫[18],對生氣、厭煩、恐懼、開心、平常、傷心、驚訝等7種表情進行分類。
(3)停車場車牌識別。停車場車牌識別技術已經(jīng)比較成熟并得到廣泛應用。作為教學案例,處理步驟包括:①采集圖像并進行預處理,進行圖像亮度歸一化以去除光照變化的影響;②根據(jù)車牌顏色特征進行圖像分割、利用投影法實現(xiàn)車牌定位;③在車牌區(qū)域進行字符分割,訓練卷積神經(jīng)網(wǎng)絡CNN分類器實現(xiàn)字符識別。
(4)基于圖像處理的煤矸石篩選。利用圖像處理方法對監(jiān)控視頻中的原煤圖像進行分類。處理步驟包含:①采用背景差分法將原煤從視頻中分離出來,在幀圖像中截選窗口圖像用于識別;②選取HSV(色調(diào)Hue,飽和度Saturation,明度Value)顏色空間、灰度值的低階矩作為顏色特征,灰度共生矩陣的能量、對比度、相關性、熵以及Tamura紋理的粗糙度、對比度、方向度作為紋理特征;③提取描述圖像顏色和紋理信息的28個特征參數(shù),利用Relief算法計算權重,表征特征在分類中的貢獻度,進行特征選擇;④利用K近鄰與支持向量機SVM進行煤矸石篩選,比較這兩種分類器性能。
推薦閱讀:圖像處理新科技技術發(fā)展