2019亚洲日韩新视频_97精品在线观看_国产成人精品一区二区_91精品网站在线观看

解析全媒體內容庫的內容挖掘與可視化

來源:期刊VIP網所屬分類:新聞傳播時間:瀏覽:

  摘要:為了實現全媒體內容庫中資源有效利用及用戶服務的提升,本文首先對其內容服務的需求進行分析,著重介紹了相關內容挖掘及可視化技術,并對全媒體內容庫核心模塊的功能設置進行介紹,希望對全媒體數據庫建設發展有借鑒作用。

  關鍵詞:全媒體內容;智能化;內容挖掘;可視化

多媒體論文

  《中國多媒體與網絡教學學報(電子版)》(月刊),創刊于2002年,是經國家新聞出版總署批準的中央級電子期刊,是國內很久以前以多媒體形式發表中小學信息化教學改革前沿成果的學術期刊群,是教育部重點成果的發表平臺之一,由教育部主管、清華大學主辦、清華同方光盤電子出版社出版。

  一、全媒體內容服務需求分析

  如今,媒體融合已成為趨勢,媒體融合平臺的搭建為媒體內容管理和服務提供了新的渠道和思路,而全媒體內容庫是其關鍵部分,有利于全媒體資源的統籌管理。全媒體內容庫的作用主要體現在全媒體信息的共享、檢索和調用方面,使平臺所有媒體資源獲得更深層次的開發利用,還能對全媒體運營、策劃以及生產等起到有力支撐作用。如今,各類新媒體發展迅速,網絡環境更加復雜,如何幫助用戶獲取有價值的媒體內容,優化媒體內容服務流程,搭建行業可視化模型庫成為需要解決的問題。

  面對龐大的全媒體內容,用戶僅依靠傳統分類、搜索等功能很難得到有用信息,需要借助更加智能化的工具提高檢索效率,挖掘價值內容。要依據用戶需求,提供精準服務,在確定用戶目標的情況下應借助搜索工具幫助其快速、準確的得到目標內容,若用戶對自身需求也不確定時,應體現全媒體內容智能服務特點,主動智能分析客戶需求,幫助客戶逐步明確并得到所需內容。全媒體內容庫的開發利用要兼具數據分析和可視化功能,特別是諸多可視化分析工具的應用,實現了更加便利、直觀、高效的內容庫分析功能,優化了用戶體驗。

  二、內容挖掘及可視化技術

  (一)全媒體內容的特征提取

  從多媒體類型上劃分全媒體內容有視頻、音頻、圖像以及文本等形式,對于不同的內容對象其特征往往需要從多個角度分析,如何準確的提取出內容特征是了解和利用全媒體內容的關鍵。

  1.文本特征提取

  對于多媒體中的文本信息來說,其特征主要為詞性、詞義、關鍵詞以及包含的情感等,為了更準確、快速的提取文本特征,這里需要用到自然語言處理技術。

  2.圖像特征提取

  對于圖像來說,既包含圖片中文本信息的提取,又包含圖像特有的背景、人物、物體等信息的特征描述,將人工智能應用于內容庫中圖像特征分析,可對圖像特征以文字的形式予以描述。為了挖掘圖像的更深層的特征,更好理解圖像表達的內容,應從不同維度生成圖像相關的不同特征向量,并通過特征向量的對比、分析以及計算,可準確把握圖像內容。

  3.音頻特征提取

  在全媒體內容庫中,音頻媒體的分析處理也需要借助人工智能技術,為了獲取音頻特征,可有兩條途徑:一是進行音頻語音的智能識別,并將其轉化為文本形式,然后再利用文本特征提取方法挖掘音頻內容,該方法局限于人類語言內容的音頻;二是從聲樂特征的角度進行分析,提取音頻中所包含的聲紋特征、音調、音色等。音頻特征提取之后的分析計算有助于音頻媒體中內容的把握。

  4.視頻特征提取

  對視頻來說,可以概括為以上三類媒體類別的綜合體,需借助智能處理技術意義分析,所包含內容層次更多如場景、人物、聲音以及文字等。為獲取視頻特征,需要對視頻中出現的所有信息進行分類識別,可采用分幀處理或者單獨提取音頻和文本的方式處理,視頻特征的分析計算也是必須的。

  (二)基于標簽的內容分析

  由于全媒體內容特征數量龐大,若對特征信息準確分類和快速提取,需要利用好“標簽”的概念,對于多媒體內容的特征以標簽的形式進行描述,可描述的內容不固定可以是選題、報道等。標簽與分類不屬同一概念,以某個全媒體內容來說,所屬分類的維度有限,通常只能簡單分為幾類,相對來說比較固定,而對于標簽來說,則不存在數量限制,可從各個維度進行表述并自由添加。鑒于標簽的特征,面對日益龐大的全媒體內容,可將標簽用于內容管理中去,通過多維度管理更能提高多媒體數據利用效率。要針對多媒體內容進行特征分析,選取有代表性的、明顯的內容特點并將其設定為標簽,多重維度的標簽有助于媒體內容的準確定義以及海量內容的有效挖掘。內容標簽的設置大大提高了目標內容的快速提取,對全媒體內容挖掘帶來極大便利,而且標簽的作用還體現在多媒體內容的管理方面,可以更加高效的進行組織和整理。面對未知的全媒體內容,若要發掘其中有價值的內容,在人工智能技術支持下,標簽為客戶提供了探索發現的鑰匙。借助于內容標簽,全媒體內容特征更直觀的展現在用戶面前,更易發現用戶所需求的內容,這體現了標簽的使用價值。

  (三)多種媒體的可視化技術

  為了將全媒體內容庫中的不同媒體形式的內容進行可視化展示,常用方法有:2D/3D圖表、數據列表、地圖分布、數據模型等,當采用多維數據分析時,若要達到可視化效果則要求掌握信息不同維度數據間的內在聯系,并對其分布情況以曲線圖、柱狀圖或者雷達圖等形式表達出來。這里著重對標簽云技術進行分析,其主要用于文本媒體內容的可視化應用。其整體形式就是預先對某文本信息所包含的關鍵詞進行提取,然后將其以特定順序進行排列,最終呈現在我們面前。還要對這些關鍵詞予以區別,區分標準主要是出現頻次和重要程度,并對關鍵詞的字體大小、顏色進行調整,給予高頻次和高重要性的標簽更加醒目的標記。

  (四)可視化內容的探索工具

  探索工具的應用對于發掘全媒體中有價值內容有很好的輔助效果,而且工具的應用降低了內容挖掘的難度,只需掌握簡單的操作方法,就能更直接的發掘全媒體內容潛在的關聯,發現更多內容價值。下面對各類探索分析工具進行介紹:

  1.內容分布分析工具,能夠利用全媒體內容的標簽和屬性等信息自動完成相關內容的分布分析工作,并具有可視化功能設計,方便使用者對內容分布有更清晰的認識;

  2.熱點內容挖掘工具,對于各類社會熱點問題,工具可在熱點的基礎上深入發掘其他相關信息,并且還具有領域分類功能,可依據客戶對時政、體育、娛樂等不同喜好有選擇性的挖掘熱點信息;

  3.內容關聯性挖掘工具,能夠在大量媒體信息中心發現其潛在的關聯并以不同專題的形式將其融合成,如人物專題。利用可視化功能對內容關聯性挖掘結果進行直觀展示,有利于提高選題、決策等有效性;

  4.詞云分析工具,主要用于標簽數據的可視化展示,幫助使用者更好掌握各關鍵詞間的聯系,提高標簽數據的利用價值;

  5.情感分析工具,主要針對的是網絡推文的評論信息及其他輿情相關信息,在智能識別技術支持下可更精確的發掘媒體內容中所表達的情感信息,并進行智能判斷,實現更高價值的應用;

  6.數據分析與仿真工具,通過對多維數據交互關聯分析,利用統一的關系/空間/時間/統計等數據分析模式,同時嵌入各種自定義業務仿真計算模型,支持對閾值模型/評估模型/預測模型等,再利用大量分析算法,還可擴充開發新的分析模型,適應行業業務需求。

主站蜘蛛池模板: 修文县| 名山县| 南陵县| 镇远县| 驻马店市| 揭阳市| 钦州市| 江源县| 来宾市| 冀州市| 灵寿县| 汝州市| 莱芜市| 英超| 明星| 山阳县| 巴马| 兴业县| 体育| 泾阳县| 荆门市| 陈巴尔虎旗| 兰考县| 石泉县| 潮安县| 克山县| 忻城县| 泊头市| 共和县| 柘城县| 攀枝花市| 玉环县| 鹤岗市| 苍山县| 宿迁市| 安化县| 临澧县| 沭阳县| 应用必备| 宣汉县| 迭部县|