2019亚洲日韩新视频_97精品在线观看_国产成人精品一区二区_91精品网站在线观看

分析分布式網(wǎng)絡信息資源重構系統(tǒng)實現(xiàn)模式

來源:期刊VIP網(wǎng)所屬分類:土木工程時間:瀏覽:

  【內(nèi)容提要】網(wǎng)絡信息資源在數(shù)量和復雜程度上的同步增長使機械遍歷式的信息搜集和檢索技術越來越難以滿足大部分用戶的信息需求。這些信息的最終用戶需要對信息個體的準確定位,對信息源的權威導航和評估,個性化的主動信息提供服務以及基于信息內(nèi)容的跨平臺鏈接,而且實現(xiàn)這一切是以一個繁復、無序和龐大的信息世界為基礎和前提的。任何純粹基于人工智能的軟件或算法都難以提供一個完美的解決,本文試圖提出一個由分布式人機交互環(huán)境組成的網(wǎng)絡信息資源收集、組織和發(fā)布機制,通過這個機制,人的知識和智慧在被用來使紛繁復雜的網(wǎng)絡信息資源有序化的同時,又成為其中不可或缺的組成部分。

  一、網(wǎng)絡信息資源重構的概念和方法

  網(wǎng)絡信息資源是由信息組織或個人建立的以網(wǎng)絡為傳播媒體的數(shù)字信息生成、管理和發(fā)布系統(tǒng),是微觀有序化和宏觀無序化的有機統(tǒng)一體。每一個網(wǎng)絡信息資源個體都是有序的,其所含信息內(nèi)容是有組織和可訪問的;而作為一個整體,網(wǎng)絡信息資源又具有高度的系統(tǒng)復雜性,難以從整體上加以充分的利用。這就是要對網(wǎng)絡信息資源進行重新組織的主要原因。

  所謂網(wǎng)絡信息資源的重構就是針對網(wǎng)絡信息源及其內(nèi)容,按照特定的線索化方式,由人工或計算機軟件實施的信息收集、組織、整理和傳播工作的總和。經(jīng)過重構后,網(wǎng)絡信息資源整體(或某個局部)上成為有序化結構,并且為訪問者提供獲得其所需信息的充分檢索手段,同時,在一定程度上,不同信息源之間的物理界限在邏輯上被屏蔽。

  如果說網(wǎng)絡信息資源宏觀的無序化是實施其重構的主要原因的話,網(wǎng)絡信息資源微觀的有序化則是實施其重構的必要條件。換句話說,網(wǎng)絡信息資源個體有序化程度和水平,盡管不能直接導致網(wǎng)絡信息資源整體的有序化,但卻可以影響通過重構以實現(xiàn)其有序化的方式和難易。例如,一個信息源如果在信息描述、數(shù)據(jù)庫定義和訪問方式等方面遵守一定的國際標準,它就更容易成為一個網(wǎng)絡信息資源集合的有機組成部分。

  一個網(wǎng)絡信息資源集合是由若干信息源組成(如數(shù)據(jù)庫),而一個信息源又是由若干同序的信息實體組成(如數(shù)據(jù)庫記錄)。[1]因此,對于網(wǎng)絡信息資源的重構可以分為兩個層次:針對信息源的重構和針對信息實體的重構。針對信息源的重構將導致一種導引性的信息組織及相應的服務方式,其功能是滿足用戶對于獲知信息存放位置或信息來源的需求。針對信息實體的重構將導致一種實體性的組織方式和推送式的服務方式,其功能是直接滿足用戶對獲得信息本身的需求。前者的實例包括一些網(wǎng)絡資源導航、資源鏈接目錄和信息源數(shù)據(jù)庫等。而后者則正是我們正在或將要實現(xiàn)的。在本系統(tǒng)中,邏輯上信息源和信息實體被統(tǒng)一視為某個信息對象來加以描述、整序和管理。

  利用人工和計算機是實現(xiàn)網(wǎng)絡信息資源重構的主要手段,尤其是后者,由于其高效率和全面的信息覆蓋能力而在近幾年逐漸成為主流。[2]大型的信息導航網(wǎng)站(如Yahoo等)和檢索引擎(如Google等)都是利用軟件自動搜索網(wǎng)上的信息資源并加以組織和整理,然后供用戶檢索和使用的。人工的手段由于成本、規(guī)模和效率的限制被迫處于輔助性地位,只能應用在一些局部性的系統(tǒng)中。然而,由于人工智能技術的局限,計算機軟件在對信息形式和內(nèi)容(尤其是內(nèi)容)進行辨別、理解、描述和分析時所能達到的質(zhì)量還遠遠不能和人的智力相提并論[3],特別是計算機軟件無法對信息內(nèi)容的學術質(zhì)量加以權威性的鑒定和評估(顯然,只有人,而且是具有一定學術背景的人才能完成這個工作)。[4]

  于是,問題被歸結為:如何在網(wǎng)絡信息資源的重構過程中使人的智力與計算機技術有效的結合起來。這里的“有效”應該包含三個方面的意義:可以接受的成本;足夠大的規(guī)模;充分滿足特定用戶群的信息需求。而本文提出的解決方案則可以歸結為:通過建立具有分布式網(wǎng)絡信息資源組織和管理功能的技術平臺,為專業(yè)學術研究人員收集、整理、組織和發(fā)布其相關學科的信息資源提供方便、科學和高效的技術手段,從而實現(xiàn)人的智力和計算機技術在網(wǎng)絡信息資源重構過程中的有機結合。

  二、分布式信息收集、組織和管理模式的實現(xiàn)

  分布式的網(wǎng)絡信息資源重構模式由三個層次組成:(1)第一層次是按學科分類組織和發(fā)布信息資源內(nèi)容的學科信息服務網(wǎng)站群平臺,它是由信息服務中介機構(如圖書館)實施組織和管理的集中式網(wǎng)絡學科信息資源目錄體系和系統(tǒng)技術支持機制。(2)第二層次是實施分布式信息收集、組織和管理的內(nèi)容管理員群體及其工具平臺,它是由具有較高學術背景和網(wǎng)絡信息資源獲取能力的專業(yè)研究人員,如高校教師或在讀博士生組成內(nèi)容管理員群體,利用相關工具平臺建設各自專業(yè)的學科信息服務網(wǎng)站。(3)第三層次是提供信息交互和反饋功能的信息用戶應用平臺,它是用戶獲得由內(nèi)容管理員收集、組織和發(fā)布的信息的渠道,同時用戶可以通過該平臺向相應內(nèi)容管理員推薦信息資源、進行學術咨詢和其他信息交互。

  其中支持分布式內(nèi)容管理的內(nèi)容管理員工作平臺,即網(wǎng)絡資源管理系統(tǒng)是實現(xiàn)該模式主要功能的關鍵。

  網(wǎng)絡資源管理系統(tǒng)是由圖書館實施建設和管理的一個通過Web發(fā)布和展示信息資源的服務體系,由圖書館所屬高校相關教學科研人員負責收集、整理、組織和管理Internet上相應學科、專業(yè)領域的信息資源,加以評估、介紹和研究并通過圖書館的信息服務系統(tǒng)在網(wǎng)上發(fā)布,從而共同構成具有學科特點的專業(yè)信息服務網(wǎng)站群。

  內(nèi)容管理員是在網(wǎng)絡資源管理系統(tǒng)中具有學科背景的信息收集者、組織者和發(fā)布者,對某個學科領域具有一定學術背景和興趣(最好在該領域正在從事相關教學或科研工作),具有一定的圖書館學和信息處理的學術水平,熟練掌握網(wǎng)絡信息搜索和獲取的技術,具有一定的協(xié)調(diào)和管理能力,并且能夠隨時監(jiān)測相關信息源的信息更新情況。內(nèi)容管理員是分布式內(nèi)容管理機制的核心。他們把信息收集、組織和整理作為其教學科研工作的一個部分來完成,這決定了他們與一般的圖書館學科館員的主要區(qū)別。

  信息資源重構的質(zhì)量很大程度上取決于對構成它的諸信息源內(nèi)容的理解深度,或者使用程度。學科信息資源服務不必刻意去追求所選信息源的數(shù)量的眾多和種類的齊全,而更看重這些信息源是否最適合相關學術領域的使用需要,并具有足夠的權威性。而能夠對信息源的質(zhì)量進行可靠的判斷的人,必須具有足夠的學術背景,并且在相關學科的研究前沿具有一定的活躍程度。這就對選擇和組織內(nèi)容管理員隊伍提出了較高的要求。

  內(nèi)容管理員介入信息收集、組織和整理工作的方式是把它作為其教學科研工作的一個部分(盡管很可能是一個從屬的部分)來完成。之所以要實現(xiàn)分布式的內(nèi)容管理模式的主要原因也正在于此,不如此就無法充分而有效地利用高校學科專業(yè)人員從事信息服務工作的潛力。在教學科研工作過程中,信息的收集和組織本來就是一項必不可少的工作,對于本學科相關網(wǎng)絡信息資源的了解和使用水平也越來越成為高校教師研究能力的重要標志之一。利用分布式的內(nèi)容管理機制,把分散于學校各個角落的學科信息服務力量組織起來,無疑是高校圖書館建設網(wǎng)絡信息資源的有效途徑。

  傳統(tǒng)圖書館(包括高校圖書館)在信息服務過程中主要起到信息資源指引中介的作用,而較少起到信息咨詢中介作用,尤其是當這種咨詢具有較強的學科特點和學術深度時。而在本文所構建的模式中,內(nèi)容管理員利用其優(yōu)越的學術背景和分布式、交互式的信息組織和發(fā)布工具,可以最大限度地將其智力和學科知識體現(xiàn)在相關學科的信息服務中。這種體現(xiàn)既表現(xiàn)為對靜態(tài)的和外部的信息資源收集、組織和評價的質(zhì)量與深度,還表現(xiàn)為內(nèi)容管理員可以通過系統(tǒng)的信息交互平臺直接解答讀者的學術問題,也就是將其大腦中的智力和知識動態(tài)化地提供給讀者。這也就是前文中提到過的通過這個機制,人的知識和智慧在被用來使紛繁復雜的網(wǎng)絡信息資源有序化的同時,又成為其中不可或缺的組成部分。在這里,內(nèi)容管理員既是學科信息的收集者和組織者,很可能同時又是某些信息的生成者。

  網(wǎng)絡應用的日益普及為分布式內(nèi)容管理提供了技術上的可行性,而網(wǎng)絡資源管理系統(tǒng)則為它的實施提供了管理上的可行性。[5]同時,隨著電子文獻在數(shù)量和質(zhì)量上的迅速增長,人們在教學科研過程中對電子信息資源的依賴程度和掌握能力也同步地增長,這就為內(nèi)容管理員群體提供了越來越充分的人力資源背景。

  三、網(wǎng)絡資源管理系統(tǒng)的設計和開發(fā)網(wǎng)絡信息資源重構的工具平臺

  設計和開發(fā)網(wǎng)絡資源管理系統(tǒng)是實現(xiàn)分布式網(wǎng)絡信息資源重構模式的核心任務,一個功能完善的網(wǎng)絡資源管理系統(tǒng)能夠起到以下作用:

  ·向讀者提供網(wǎng)絡信息資源的宏觀和微觀視圖以及相應的訪問方式;

  ·向內(nèi)容管理員提供便利、高效的信息收集、組織和發(fā)布工具平臺;

  ·向系統(tǒng)管理員提供用戶管理、資源監(jiān)測、資源評估等系統(tǒng)管理功能。

  以下筆者將根據(jù)在主持清華大學圖書館“985”電子圖書館建設項目的課題“網(wǎng)絡資源管理系統(tǒng)的開發(fā)和應用”過程中的思路和經(jīng)驗,對網(wǎng)絡資源管理系統(tǒng)的結構和功能加以概括。如圖1所示:

  附圖

  圖1 網(wǎng)絡資源導航系統(tǒng)總體結構

  網(wǎng)絡資源管理系統(tǒng)包括5個方面的內(nèi)容:

  (一)網(wǎng)絡資源的描述。網(wǎng)絡資源的描述是通過對相關元數(shù)據(jù)的制訂來實施的,經(jīng)過調(diào)研,確定以專門用來組織網(wǎng)絡資源并且易于操作的都柏林元數(shù)據(jù)核心元素集(Dublin Metadata Core Element Set,簡稱DC)為基本集合,結合用戶的檢索要求、網(wǎng)絡資源的特點以及系統(tǒng)的信息挖掘、資源監(jiān)測和評估等高級功能,增加了相應的屬性,制定出一套用以幫助識別、描述、定位、組織和管理網(wǎng)絡資源的元數(shù)據(jù)集合:網(wǎng)絡資源管理元數(shù)據(jù)(Network Resource Management Metadata,簡稱NRMM)。

  (二)網(wǎng)絡資源收集、整理、組織和發(fā)布工具。工具平臺包括各級用戶注冊模塊、內(nèi)容管理員資源添加、管理和維護模塊、內(nèi)容管理員站務管理模塊和普通用戶推薦資源模塊。在網(wǎng)絡信息導航系統(tǒng)平臺上,系統(tǒng)的功能分為兩種:

  第一種是需要人工參與的,包括面向系統(tǒng)管理員、內(nèi)容管理員和普通用戶等三種參與者的相應功能。其中,系統(tǒng)管理員具有最高權限,包括管理內(nèi)容管理員和用戶的屬性信息、設置學科等;內(nèi)容管理員負責分布式地收集、標引、組織和發(fā)布網(wǎng)絡信息資源,以及審查由用戶推薦的資源;普通用戶可以瀏覽系統(tǒng)內(nèi)現(xiàn)有資源和推薦新資源供內(nèi)容管理員審查,同時還可進行信息反饋和交互。

  另一種系統(tǒng)功能是由系統(tǒng)自動執(zhí)行的,具體包括網(wǎng)絡信息源的自動監(jiān)測和質(zhì)量評估、網(wǎng)絡信息挖掘和提供。

  (三)網(wǎng)絡信息源的自動監(jiān)測和質(zhì)量評估。網(wǎng)絡信息導航庫的資源質(zhì)量控制是通過人工審核和自動監(jiān)測相結合來實現(xiàn)的,網(wǎng)絡資源管理系統(tǒng)主要提供自動監(jiān)測和基于自動獲取指標數(shù)據(jù)的質(zhì)量評估機制。[6][7]由于網(wǎng)上資源的變動性很大,因此,為了保證系統(tǒng)中資源的可用性和新穎性,這種定期監(jiān)測評估是必需的。

  針對學術性資源,主要著眼于網(wǎng)站的內(nèi)容和它的結構與系統(tǒng)機能進行評估。由于本系統(tǒng)所收集的網(wǎng)站信息資源已經(jīng)十分龐雜,采取人工方式進行評估耗時耗力,因此,采取軟件實時測試的自動評估方式。目前,將測試指標定為網(wǎng)站的鏈接狀態(tài)和特征頁面信息提取等幾項,同時會記錄每一個被監(jiān)測對象的監(jiān)測時間和監(jiān)測周期,通過系統(tǒng)定時執(zhí)行監(jiān)測程序并保存監(jiān)測結果。監(jiān)測結果最終會向系統(tǒng)的內(nèi)容管理員發(fā)出監(jiān)測報告的通知,從而起到保持和維護信息資源系統(tǒng)的監(jiān)督作用。

  (四)網(wǎng)絡信息挖掘和提供。采用內(nèi)容管理員模式來收集專業(yè)網(wǎng)絡資源,提高了資源的精度和深度,但是,網(wǎng)絡資源浩如煙海,光靠內(nèi)容管理員人工查找是無法達到廣度要求的。因此,采用自動抓取和人工過濾相結合的方式,即用非結構化的數(shù)據(jù)挖掘技術獲取更有價值的信息。

  數(shù)據(jù)挖掘一般包含如下幾個步驟:(1)理解相應的問題領域;(2)準備相關數(shù)據(jù)子集;(3)發(fā)現(xiàn)模式(數(shù)據(jù)挖掘);(4)所發(fā)現(xiàn)模式的后處理;(5)應用發(fā)現(xiàn)結果。本系統(tǒng)中數(shù)據(jù)挖掘部分的工作流程主要分以下幾步:建立關鍵詞表、源文檔采集、信息過濾、用戶瀏覽信息。[8]

  數(shù)據(jù)挖掘部分是一個人機結合的部分,它通過分工使人和計算機的特長都得到了充分的發(fā)揮。數(shù)據(jù)挖掘功能大大減輕了內(nèi)容管理員的工作負擔,增加了系統(tǒng)中網(wǎng)絡資源的深度和廣度,并且有一定智能性,可以對搜索到的數(shù)據(jù)進行剔重、加權等處理。

  (五)讀者信息反饋和交互。網(wǎng)絡信息資源導航的最終目的是幫助網(wǎng)絡信息用戶更充分,更有效地利用各種網(wǎng)絡信息資源,服務于用戶的學術研究、教學和學習。用戶與系統(tǒng)之間、用戶與用戶之間的信息交互會在達成上述目的的過程中起到重要的作用。網(wǎng)絡資源管理系統(tǒng)主要提供以下5種信息交互模式:用戶網(wǎng)上調(diào)查、用戶留言、電子公告版、網(wǎng)上傳呼和在線討論區(qū)。除了上述用戶主動信息提供方式外,系統(tǒng)還會在用戶使用系統(tǒng)各種功能和資源的過程中自動收集、整理和分析用戶的操作信息,如點擊頁面、鏈接選擇、輸入檢索詞等,從中了解用戶的需求和學科興趣,為向用戶提供個性化服務收集相關信息。

  用戶信息反饋和交互是網(wǎng)絡資源管理系統(tǒng)的重要功能,它的實現(xiàn)被分散在系統(tǒng)的各種模塊中,使系統(tǒng)更加友好和智能化。

主站蜘蛛池模板: 黔东| 吴忠市| 额济纳旗| 谢通门县| 象州县| 岳池县| 鄂托克旗| 江永县| 新丰县| 卓资县| 宕昌县| 柏乡县| 天等县| 错那县| 富川| 常宁市| 武胜县| 高陵县| 芒康县| 措美县| 仁化县| 百色市| 沈丘县| 酒泉市| 长沙县| 延边| 丁青县| 嘉善县| 黑水县| 屯留县| 鲁山县| 阳江市| 南华县| 凤阳县| 塔河县| 台湾省| 尤溪县| 孟村| 九龙坡区| 金堂县| 胶南市|