2019亚洲日韩新视频_97精品在线观看_国产成人精品一区二区_91精品网站在线观看

網絡信息分類系統的詞匯控制

來源:期刊VIP網所屬分類:計算機信息管理時間:瀏覽:

  所謂詞匯控制,是指依據信息資源標引和檢索的須要,對天然言語中的詞匯進行抉擇、標準并提醒其相干性的歷程。天然言語作為一種人際交換和思想的工具,其詞匯具備運用靈巧、表白性強等特征,但絕對檢索請求來說,含意不夠正確,缺乏明白的構造,詞匯量也過大。因而,必需依據檢索體系請求,對詞匯進行抉擇和處理。過度的詞匯控制關于樹立一個高效的信息組織和檢索體系是非常必要的。

  分類體系對詞匯的控制重要包含:同義控制、詞義控制和詞間關系控制三個方面【1】,本文重要繚繞這三個方面進行探討鉆研。

  1 傳統分類法詞匯控制

  傳統分類法的形成原理中,詞匯控制是一個重要的方面。

  1。1 同義控制

  即對字面情勢不同、涵義雷同的詞進行控制,使一個概念只用一個語詞表白,目標是戰勝天然言語中的一義多詞景象。

  分類法對詞匯的同義控制重要表如今類名的抉擇上。類名即類目標稱號,規矩著類目標含意和內容規模。當碰到一義多詞狀況時,傳統分類法的選詞準則個別是:采取能正確反應其含意且對照通行的科學名詞,而不抉擇其俗稱、舊稱、不能正確表白全稱原義的簡稱、不通行的譯名或近義詞等【2】。如有必要,也可將這些落選的同義詞、近義詞用括號加注于類名后,或設置交替類目、用代參照。

  1。2 詞義控制

  即對同形異義詞和語義隱約的詞進行控制,使得詞義明白,一個詞語只示意一個概念,戰勝天然言語中的一詞多義景象。

  傳統分類法重要通過類目注釋來對詞義進行控制。類目注釋有多品種型,包含內容注釋、關系注釋、編列方法注釋、分類方法注釋、沿革注釋等。個別在類目內容注釋中作詞義控制,對類目標涵義加以解釋,或對類目標內容規模加以辨別,指導某類蘊含與不蘊含的內容。如中圖法第四版類目“TB47工業設計”的注釋:“工業設計是工程技巧與美學藝術相聯合的新學科”。

  1。3 詞間關系控制

  指提醒詞匯之間的各種聯絡使其成為一個語義相干的體系,目標是用以滿意擴檢、縮檢、轉變檢索方向等的須要。詞匯之間的聯絡,重要包含同等、等級、相干三種基本類型。

  因為傳統分類法以分類標志作為概念標識,將體系開展的類目體系作為重要檢索門路,因而,詞間關系控制成為其詞匯控制的中央。分類體系重要采取體系方法開展,通過層層劃分,形成其具備附屬、并列關系的秩序井然的概念等級體系。將主題之間附屬、并列、相干等聯絡加以體系展現,同時將類目之間的參照作為提醒類目之間橫向聯絡的一種彌補手腕。類目參照個別用于內容聯絡具備提醒價值、但在分類體系中被疏散了的類目之間,通常采取互逆的方法在相干門類下注明。

  2 網絡分類體系詞匯控制現狀

  以下從同義控制、詞義控制及詞間關系控制三個方面來對網絡分類體系詞匯控制的現狀與傳統分類法進行對照剖析。

  2。1 同義控制

  在類目稱號上,傳統分類法的類名力圖科學、正確、標準,而網絡分類法在類名抉擇上更注重面向各類網絡用戶,力圖艱深易懂、時新,類名也更為精練。因而,招致類名不標準的景象在各網絡分類體系尤其是在其三級及以下類目中廣泛存在,成為詞匯控制中一個突出的問題【3】。如雅虎中國的一個三級類目名“親子”,搜狐的一個三級類目名“拓展”。

  至于落選的同義詞,個別不樹立用代參照或設置交替類目,但可作為入口詞。如在供給類目索引的雅虎中國中,在檢索框中輸出“腳踏車”,檢索后果會將你指引向“自行車”【4】。

  2。2 詞義控制

  網絡分類體系中,也廣泛存在類名用語隱約招致難以判定其內涵的景象。傳統分類法中的詞義控制手腕如含意注釋和規模注釋也很少采取,個別只在一級大類下有抉擇地羅列重點或熱門下位類來贊助明白其類名含意。如Yahoo!中,在一級大類“Business & Economy”下列出局部一級類“B2B,Finance,Shopping,Jobs”【5】;在Open Directory中,一級大類“Business”下列出局部二級類“Jobs,Real Estate,Investinn”【6】。

  2。3 詞間關系控制

  與傳統分類法一樣,等級式類目體系也是網絡分類法進行詞間關系控制的重要手腕。傳統分類法基本上是采取線性情勢提醒類目之間聯絡的,這是文獻組織的須要和傳統檢索環境的特征所抉擇的。盤算機的運用,特殊是超文本技巧的運用轉變了這一狀況。超文本技巧的特征是,可以通過節點之間的鏈接,以非線性的方法充足提醒和表白信息之間的聯絡。這一特征極大地改良了網絡分類法中類目之間各種關系的提醒,尤其是多維關系的提醒。這是超文本技巧的強項,也是傳統分類法中的一個軟弱環節。目前,網絡分類體系中對多維關系的提醒對照充足,個別均通過鏈接的方法,在相應類下反復反應。但如在處理歷程中缺乏一致性及對運用規模的過度控制,也會形成類目關系的雜亂。此外,繁多的反復反應并不能簡樸替代相干關系的提醒【7】。

  在附屬、并列關系的提醒上,網絡分類體系目前也存在一些問題,如類目歸屬存在著不合理景象,同位類排列不能提醒類間關系等。

  3 網絡分類體系詞匯控制改良戰略

  網絡分類目錄是因特網上用戶罕用的兩種信息檢索工具之一,對網上海量的混淆無序的信息起偏重要的導航作用。網絡分類體系詞匯控制的基本目標是進步檢索效力,因而,筆者以為網絡分類體系的一切詞匯控制改良戰略都應以進步檢索效力為前提。

  3。1 繼承維持天然言語的主體檢索言語位置

  目前,在大多數信息存儲與檢索體系中,天然言語和人工受控言語處于并存狀況,互相揚長避短。隨著Internet的遍及開展,信息檢索最終用戶日趨強大,天然言語檢索浮現敏捷開展趨勢。如前所述,網絡分類檢索體系中詞匯控制具備與傳統分類體系不同的特征,天然言語在體系中完整占領了主體位置。從基本上看,這是由天然言語檢索的特征和網絡用戶的檢索需求特征所抉擇的。

  傳統分類法的編制重要針對印刷型文獻的特征用以編制分類目錄和組織分類排架,而網絡信息分類體系旨在為網上信息供給指引,樹立與宗旨信息的疾速有效的鏈接。網絡信息分類體系面向的是寬廣網絡用戶而不是圖書情報專業人員。與本來的專業檢索人員相比,網絡用戶的規模非常廣泛,他們的教導水平、常識構造、專業技巧、興致興致各不雷同,對同一事物、同一律念的了解也不盡雷同。因而,為了增添網絡分類體系對個別用戶的易用性,現有的網絡分類體系都盡量采取天然言語,而防止學術性、專業性過強的詞匯,從而向群眾供給易于控制、運用的分類查問體系。

  天然言語因為其與生俱來的詞義隱約、詞間關系不清等特征形成不少的漏檢和誤檢,與人工言語相比,檢索效力較低。但從用戶角度來說,天然言語具備奇特的優勝性,如天然言語時新性強,一旦網頁中涌現某個新概念詞語,即可間接運用這一新詞作為檢索入口,而不用要轉換成另一標準詞用于檢索。而且天然言語檢索不便,它解除了受控言語的種種限制,不須要龐雜的檢索規矩,運用者可以較快適應、易用性突出。

  當然,要想取得滿意的檢索后果,對天然言語的過度控制是不可缺乏的,這包含樹立機內癥結詞詞典、類主題詞典和后控制詞表等。有理由信任隨著相干技巧的日益進步,天然言語的優勝性將越來越明顯,網絡分類檢索體系也將日臻完美,取得人們的廣泛歡送。

  綜上所述,為了匆匆進網絡分類體系的廣泛運用,天然言語在其中作為主體檢索言語的位置須要繼承維持上來。

  3。2 過度借鑒傳統分類法和主題法的詞匯控制手腕

  傳統分類法重要通過其層層開展的周密的類目體系來進行詞匯控制。其體系的類目體系使得體系地控制和運用一個學科或專業規模的常識和信息很不便,關于從學科或專業起程的泛指性檢索能到達較高的檢全率,而且能不便地進行擴檢和縮檢。傳統主題法體系,個別以詞匯為單元進行控制,重要通過參照體系和各種輔佐索引來展現詞間關系,在主題詞的抉擇、詞義控制方面比分類法更為嚴厲。主題法的特征是以主題為中央集中信息資源,能正確、專指地標引和提醒各種主題內容,檢索的間接性、通用性好,適宜于進行專指性檢索,而且可通過靈巧組配方法進行多門路檢索,到達較好的運用后果。

  現有網絡分類法因為運用超文本技巧提醒詞間關系,采取多重列類的方法,從不同的屬性、角度設置類目,從而供給從多個方面提醒信息資源的方法,增添了檢索入口,不便用戶從不同角度查找。這是其在檢索上相干于傳統分類法和主題法檢索體系最大的劣勢。但從目前檢索實際來說,其檢索效力遠不及后者,究其起因,詞匯控制是其中一個很重要的因素。因而,要改良網絡分類體系的檢索效力,借鑒傳統分類法和主題法成熟的詞匯控制手腕是一個可行的方法【8】。

  首先,在類目體系設計上,網絡分類體系廣泛存在著類目設置缺乏法則性、類目歸屬不合理、同位類排列雜亂、橫向關系提醒不一致等問題,而這些問題在傳統分類法中都相應地有很成熟的技巧或商定俗成的做法可借鑒。

  其次,在類名抉擇上可借鑒傳統主題法詞匯抉擇的準則和方法或間接選用其主題詞。類目稱號不標準是目前各種網絡分類體系的一大通病。作為面向最終用戶的檢索體系來說,采取寬廣網民所膾炙人口的稱呼是無可非議的,但關于類目命名還是要進行恰當的標準化處理。現有的網絡分類體系大多屬于等級式主題分類法體系,以主題充任類目。因而,借鑒傳統主題法詞匯抉擇的準則和方法或間接選用其主題詞不失為改良詞匯控制的一個捷徑。

  另外,在詞義控制上,可采取傳統分類法和主題法所罕用的手腕,包含加限義詞、增設含意注釋和規模注釋等,以進一步明白類目標內涵和內涵。這有助于用戶在查問體系時疾速、正確抉擇類目,加強體系的用戶友愛性,從而到達改良檢索后果的目標。

  3。3 樹立一致的詞匯控制機制

  許多海內外著名的綜合性門戶網站如Yahoo、Excite、Infoseek、搜狐、網易等都研制有本人的網絡分類檢索工具,供給分類閱讀式查問。這些各具特征的網絡分類體系給網上信息檢索帶來了極大的不便。這些分類體系的大類設置與劃分、類名的表述與內涵、類目標排列等各不雷同,檢索性能也有較大的差別。而用戶在查問網絡信息時通常會運用多種分類檢索工具,這就形成了用戶了解和運用的艱難,更不利于網上信息資源的共建和共享。

  傳統分類法也曾是多種多樣的,但目前在海內上占主導位置的只要DDC、UDC和LCC,在我國則是《中圖法》和《科圖法》。綜合性的分類法趨勢對立是信息資源共享趨勢的后果。互聯網上信息資源的最大特征之一就是它的共享性。常識組織體系的絕對對立將為基于網絡的資源共享供給不便。因而,編制適應網上信息組織和檢索的對立分類體系已成為急切須要處理的問題。樹立一致的詞匯控制機制是對立分類體系的非常重要的一環,關于推進網絡分類法的進一步開展具備重要的意義。

  樹立一致的網絡信息分類體系詞匯控制機制,應當由圖書情報專業人員參加,以現有的傳統分類體系主題法詞匯控制機制為基本,排匯已有的網絡分類體系的詞匯控制經歷和后果,遵照面向網絡信息資源、面向網絡技巧環境、面向網絡用戶的準則。其詞匯控制機制重要包含同義控制、詞義控制、詞間關系控制方面的原理、準則、方法和技巧等,此外,還包含詞量控制、詞組抉擇和運用的控制、專指度的控制等方面的內容。

  最后,在詞匯控制機制一致的基本上,構建絕對對立的網絡信息分類法。所謂絕對對立,是指在對立網絡分類體系基本原理包含詞匯控制機制的基本上,保存并改良現有的多樣的網絡分類體系,許可多種有特征有實力的分類體系共存開展。因為不同的網絡分類體系在類目體系和資源抉擇上往往都有本人的特征,在滿意不同用戶需求或檢索特定資源時有其獨到之處【7】。此外,多樣性必定招致網絡分類體系之間的競爭,為了爭奪用戶,開發者不得不針對用戶的需務實時地改良,這就使得全部網絡分類體系的性能得到天然的晉升,從而推進網絡分類法逐漸走向成熟和完美【9】。

  【參考文獻】

  1 馬張華。信息組織(第二版)【M】。北京:清華大學出版社,2003。14-15。

  2 張琪玉。情報言語學基本(第二版)【M】。武漢:武漢大學出版社,1997。44-47。

  3 黃如花。網絡信息組織:情勢與評估【M】。北京:北京圖書館出版社,2003。89-91。

  4 http:÷÷cn。yahoo。com,2004-10-11。

  5 http:÷÷www。yaboo。com,2004-10-11。

  6  http:÷÷dmoz。org÷,2004-10-11。

  7 劉穎。試論網絡信息分類的現狀與將來——構建對立的網絡信息分類法【J】。晉圖學刊,2003,(1):21-23。

  8 周寧,黃曉梅,等。信息組織【M】。武漢:武漢大學出版社,2001。74-77。

  9 杜安平。網絡分類體系基本原理鉆研【J】。圖書館學鉆研,2004,(4):60-62。

主站蜘蛛池模板: 宁晋县| 礼泉县| 手机| 平利县| 肇源县| 贺兰县| 内乡县| 鹤岗市| 江西省| 榕江县| 双城市| 克什克腾旗| 蒲江县| 昆明市| 高密市| 乐平市| 石柱| 苏尼特右旗| 昭觉县| 永城市| 保山市| 湘阴县| 徐州市| 慈溪市| 崇信县| 蚌埠市| 临海市| 涡阳县| 榆中县| 青铜峡市| 晋宁县| 高唐县| 沁源县| 奉贤区| 沁水县| 布尔津县| 伊通| 枞阳县| 武定县| 连江县| 鲁山县|