期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘要:從高校普遍實際使用的演講型課件特點出發,設計了一套全新的網上教學系統,用可以人工動態控制的PowerPoint文檔來取代MPEG-1的視頻格式,并將教師的講解聲音用G.723.1算法來壓縮從而得到一種新的流媒體格式課件,滿足了在窄帶網絡上的實時傳輸。
關鍵詞:網絡課件;壓縮;PowerPoint;G.723.1算法
1 應用背景
隨著教育事業的不斷發展以及網絡的不斷普及,網上教育應運而生。但是,網上教育也面臨著巨大的挑戰,課件制作是其中的一個關鍵所在。網上教育是多媒體結合的一種教育,多媒體意味著文件數據量大、要求帶寬高,盡管高速寬帶網絡可以從根本上解決這個問題,但其由于各種原因,短期內還不能大范圍普及。現有的公眾網只能提供33.3Kbps~56Kbps的窄帶。所以,在現有的條件下,以保持多媒體質量盡量少的降低為前提,減小多媒體文件數據量的大小, 實現多媒體技術,是比較現實的方法。
本系統設計了一套全新的網上教學系統用來滿足在窄帶網絡上進行網絡實時教學的需求。這種課件格式為流媒體格式,可以滿足在窄帶網絡上實時傳輸,并且在本地播放時可以保留快進,快退等基本的媒體播放屬性。
2 系統原理簡介
一般網絡課件的制作是將教師講課實況信息錄制后作為視頻保存。實際上,教師授課時每堂課一般只需30個左右的PowerPoint幻燈片,屏幕上的畫面變化非常小。基于此,我們設計了一個新的方案:將課件中的各種信息分開來傳輸,而不是象現在的課件那樣,將很多的信息合在一起傳輸。經過分析,可以將課件的內容分為如下幾部分: PowerPoint文件(PPT);鼠標信息;鍵盤信息;聲音信息。PPT文件是一個比較小的文件,一般在幾百K左右。所以可以設計一個客戶機-服務器模式的系統,在服務器端實現對PowerPoint文件的控制,捕獲鼠標,鍵盤及聲音信息,將它們封裝并傳輸到客戶端;客戶端系統接收還原這些信息來控制PPT文件的播放。其中PPT文件是在鼠標,鍵盤和聲音信息之前傳輸的,實時傳輸的實際上只有鼠標信息,鍵盤的翻頁信息和語音信息。這些信息的量和視頻信息比起來就少得多了,僅過這樣的設計和處理,可以實現在窄帶上的實時傳輸。
3 系統的具體實現
為了實現上述的目標,服務器軟件需要在服務器端捕獲鼠標,鍵盤及聲音信息并將以上三者相同步,而且還可以將這些的信息向網絡發送或者將這些信息在本地上保存為一種特定格式的包封文件,其結構如圖一所示。同樣,客戶端程序需要解析從網絡傳來的服務器信息或播放本地這種特定格式文件。
接下來詳細討論各部分的實現。
3.1 音頻的處理
3.1.1 聲音的錄制與播放
人耳能聽到的聲音,最高頻率是20000Hz,而語音頻率一般在4000Hz以下,教師講課的課件,其音頻部分主要是語音。為提高壓縮比,本系統只處理了語音信息。
微軟公司提供的Direct中的DirectSound組件性能與兼容性比較好。因此,我們選用了DirectX作為開發包,來實現PCM聲音的錄制與播放。
3.1.2 G.723.1語音壓縮
本系統研究的一個重要方面就是高壓縮比傳輸,所以主要工作之一便是選取一個合適的語音壓縮算法來壓縮教師的講解聲音。
目前語音壓縮的算法非常多,本系統選用G.723.1算法,主要是從通用性和效率兩方面綜合考慮的結果。G.723.1是ITU的一個標準,所以選用G.723.1作為語音的壓縮算法,其通用性是可以保證。另一方面,G.723.1的壓縮效率可以滿足本系統的要求,最終的碼率是6.3Kbit/s或5.3Kbit/s。
我們把由ITU組織提供的標準G.723.1算法的源程序改寫為一個標準的Win32動態連接庫。該庫向外導出CG7231Coder和CG7231Decoder 兩個C++庫,分別實現了G.723.1的編碼與解碼。實現CG7231Coder類的對象時,只需調用Coder成員函數來進行語音編碼。該函數的第一個參數是,指向被編碼的PCM數據。該數據是8KHz,16位單聲道的30ms的PCM數據,共480個字節。該函數的第二個參數是,用于接受當前被編碼后的壓縮數據,因為我們固定采用了6.3Kbit/s的比特率,所以該參數所指的緩沖區應為24個字節。經過我們改寫后的G.723.1的編碼算法具有以下特征:低通濾波,噪聲平滑,恒定的6.3Kbit/s比特率。我們可以通過相關參數變量來改變上述特征。解碼器也具備同編碼器一樣的功能
ITU組織提供了G.723.1的算法有兩種實現形式:整點和浮點。整點算法比較簡單,易于實現,但是整點算法對計算機的硬件要求極高。而浮點算法的速度遠遠高于整點算法,所以在本系統中使用了浮點算法,這樣,服務器軟件可以在配置較低的機器也可以正常運行。