大數(shù)據(jù)框架下公共政策實施評估研究

來源：期刊VIP網(wǎng)所屬分類：計算機信息管理時間：瀏覽：次

　　摘要：公共政策涉及到對社會資源的分配和協(xié)調，與社會大眾的利益密切相關。對公共政策實施進行科學評估有利于提升政府施政能力。傳統(tǒng)評估方式存在一定局限，利益相關方參與度不夠。本文基于互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施評估進行了研究。通過對論壇、微博等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如半年)的海量數(shù)據(jù)，以及部分用戶行為數(shù)據(jù)，進行聚類分析，建立公共政策實施評估指數(shù)模型。

　　關鍵詞：公共政策; 互聯(lián)網(wǎng)數(shù)據(jù); 聚類分析; 指數(shù)模型

大數(shù)據(jù)論文

　　0 引言

　　公共政策從某種意義上說是公共權力機關經(jīng)由某個法定的程序所制定的為解決公共問題、達成公共目標、實現(xiàn)公共利益，以協(xié)調經(jīng)濟社會活動及相互關系的實施方案。公共政策的評估主要從兩個方面著力，一是在公共政策出臺之前，對政策的可行性進行評估;二是在政策出臺之后，對政策的實時效果進行評估，找出與公共政策設計目標的差距。傳統(tǒng)的評估方法有兩類，一類是現(xiàn)場調研考察。選取與公共政策相關的不同層次的利益相關方，通過深入座談、問卷調查、文檔查看、實地考察、專家打分等方式，形成評估報告。另一類是建立統(tǒng)計分析模型。運用數(shù)理經(jīng)濟學、計量經(jīng)濟學和統(tǒng)計學等多種數(shù)理經(jīng)濟模型和計量經(jīng)濟模型，對公共政策進行量化評估，通過數(shù)據(jù)分析對政策實施進行量化評估。

　　近年來，互聯(lián)網(wǎng)技術發(fā)展迅速，產(chǎn)生了海量的數(shù)據(jù)，為大數(shù)據(jù)的應用打下了堅實的基礎。據(jù)有關文獻報道[1，4]，國內、外利用互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施進行評估取得了較好的應用效果。

　　本文對基于互聯(lián)網(wǎng)大數(shù)據(jù)的公共政策實施評估進行了研究，通過對論壇、微博、微信、貼吧、博客、手機APP、平媒、政府網(wǎng)站互動欄目等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如政策出臺后半年內)的海量數(shù)據(jù)，以及部分用戶行為數(shù)據(jù)，進行建模分析，將互聯(lián)網(wǎng)上的公眾意見引入到公共政策的實施效果評估中。

　　1 公共政策實施評估方法簡述[2]

　　公共政策評估，從評估的范圍看，有對公共政策實施效果及價值進行判斷的專項評估，也有只對公共政策實施整個過程的分析和評判。從評估的過程看也有廣義和狹義之分。廣義的政策評估包含事前評估、執(zhí)行評估和事后評估三種類型，而狹義的政策評估常常指事后評估。從評估的方法看，有定性分析評估和定量分析評估，定性評估在國內現(xiàn)有的評價模式中應用較為廣泛。

　　1.1 定性評估方式

　　定性評估是基于經(jīng)驗的實證研究，常常采用訪問法、觀察法、案例研究法等非數(shù)字技術方法，依賴于評估方對公共政策實施的了解、調查和感性認識。如通過相關會議上的匯報交流、實地調研座談、上報材料、媒體報道、內參反映、相關利益方來信/來訪等，歸納總結為政策實施評估報告。定性評估方式相對簡單，容易實施，速度快、方便、直接，比較受到各級政府的推崇。但定性評估方式易受各類條件的約束，其科學性、客觀性難有保障，評估人員的直覺和經(jīng)驗作用明顯，評估對象面較窄，利益相關方參與度不夠。

　　1.2 定量評估方式

　　定量評估是相對定性評估的另一種評估方法，通過數(shù)據(jù)歸集建立統(tǒng)計分析模型，把理論性概念量化成具體數(shù)據(jù)，通過科學計算，對公共政策實施進行定量評估。定量研究在某些方面相比定性研究方法有優(yōu)勢，能夠用數(shù)據(jù)直觀表達評估結果，但也存在不可靠的風險，過多地強調客觀性和普遍性，忽略了人的主觀性和特殊性。定量分析的方法對于解決常規(guī)性問題效果很好，對于非常規(guī)性的復雜問題，往往效果不佳。

　　1.3 互聯(lián)網(wǎng)大數(shù)據(jù)評估

　　隨著互聯(lián)網(wǎng)和自媒體的高速發(fā)展，互聯(lián)網(wǎng)本身的海量數(shù)據(jù)為基于大數(shù)據(jù)的公共政策評估帶來便利。盡管在數(shù)據(jù)處理方式上，大數(shù)據(jù)的分析方法與傳統(tǒng)定量分析的建模分析有相通之處，但存在較大差異。大數(shù)據(jù)評估由于數(shù)據(jù)采集方式、處理方式的變革，將會帶來評估模式革命性的變化。一是數(shù)據(jù)采集從樣本數(shù)據(jù)轉向全數(shù)據(jù)，使評估更加接近事實本身;二是分析方法上由重視變量之間的因果性轉向更加關注相關性，通過分析、揭示公共政策制定、實施與效果之間的相關性，使政策評價更趨于科學、民主和客觀;三是參與對象更加廣泛，通過大量收集互聯(lián)網(wǎng)上利益相關者的情感、意愿、評價等信息，更多的了解公共政策實施對象參與的積極性和對公共政策實施效果的看法和評價。

　　2 互聯(lián)網(wǎng)大數(shù)據(jù)評估基礎準備

　　2.1 數(shù)據(jù)準備

　　2.1.1 數(shù)據(jù)采集

　　根據(jù)行政區(qū)劃和政策評估有效時間和區(qū)間進行限定，采用互聯(lián)網(wǎng)爬蟲技術或以購買服務的方式從互聯(lián)網(wǎng)爬蟲公司采集數(shù)據(jù)，包括新聞、論壇、微博、微信、貼吧、博客、手機APP、平媒、政府網(wǎng)站互動欄目、綜合網(wǎng)站互動欄目等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如出臺后半年內的數(shù)據(jù))的數(shù)據(jù)，構建基于輿情內容的熱度、重點、焦點、敏感度、高頻詞、粘度等用戶關注的行為數(shù)據(jù)，為多維度的輿情分析打基礎。

　　2.1.2 數(shù)據(jù)預處理

　　互聯(lián)網(wǎng)采集的數(shù)據(jù)與實際建模分析的要求相差甚遠，極易受噪聲、重復數(shù)據(jù)、缺失值和不一致數(shù)據(jù)的侵擾，必須進行預處理，數(shù)據(jù)預處理主要完成采集數(shù)據(jù)中的噪聲清洗，糾正不一致性。一是檢測、剔除重復數(shù)據(jù)。主要是記錄去重和特征去重。考慮到中文處理的復雜性，可以采用特征去重、哈希去重等技術消除重復記錄。二是異常數(shù)據(jù)處理。可以采用統(tǒng)計方法、關聯(lián)分析、聚類方法進行異常數(shù)據(jù)處理，如缺失值處理、異常值(離群點)處理、噪音數(shù)據(jù)處理等。三是特定領域的數(shù)據(jù)清洗。這種數(shù)據(jù)清洗方案和算法都是針對特定領域，通過聚集、刪除冗余、特征聚類來減少無關數(shù)據(jù)，實現(xiàn)數(shù)據(jù)的規(guī)范化。在公共政策評估中，可以根據(jù)公共政策的關鍵描述，建立關鍵詞知識庫和清洗模型，進行定向采集或定向清洗。四是數(shù)據(jù)集成入庫。完成數(shù)據(jù)清洗后，通過規(guī)范、轉換和規(guī)整處理，把采集數(shù)據(jù)規(guī)范到可以進行比較分析的某一度量空間，進行數(shù)據(jù)入庫。

　　2.1.3 評估模型算法

　　由于互聯(lián)網(wǎng)漢字文本信息的特點，只能通過語義分析找到文本數(shù)據(jù)內在的固有屬性。基于互聯(lián)網(wǎng)輿情對公共政策實施效果評估是一種常見的聚類分析評估，通過對海量數(shù)據(jù)的采集分析，按照輿情特點對公共政策評估進行聚類分析，通過關鍵詞頻度和特征表述并進行適度的加權值，實現(xiàn)類似滿意、比較滿意、一般、不滿意的聚類分析。聚類算法是一種典型的無監(jiān)督學習算法，根據(jù)樣本之間的相似程度，將樣本劃分到不同的類別中。聚類分析的主要算法有劃分聚類、層次聚類、基于密度的聚類、基于模型的聚類、基于網(wǎng)格的聚類和基于模糊的聚類。

　　3 基于聚類分析的公共政策模型結構研究

　　3.1 研究準備

　　一是建立大數(shù)據(jù)評估的相關知識庫。對已發(fā)布的公共政策建立關鍵詞知識庫，如公共政策主題(政府文件名稱、文號、會議名稱、政策主題)，關鍵詞，主要內容描述，利益相關對象描述等。二是數(shù)據(jù)抽取和基本清洗。選取公共政策出臺后一段時間(如出臺后半年內的數(shù)據(jù))，選取特定的互聯(lián)網(wǎng)渠道作為數(shù)據(jù)采集來源，采用爬蟲技術或向第三方數(shù)據(jù)爬蟲公司購買相關數(shù)據(jù)，經(jīng)去重、去噪、數(shù)據(jù)歸一化后集成入庫。三是數(shù)據(jù)定向抽取和建模清洗。按照評價模型體系評價指標的要求和聚類分析的數(shù)據(jù)規(guī)范，對單個指數(shù)進行數(shù)據(jù)抽取和規(guī)范化建模清洗，形成每個指數(shù)聚類分析所需的數(shù)據(jù)集市。

　　3.2 評價模型指標體系

　　采用傳統(tǒng)指數(shù)分析與大數(shù)據(jù)聚類分析相結合的方式建立評價模型指標體系。評價模型為三級指標模型，建立層次化結構的公共政策評估指標體系。一級指標從政策關注度(A)、政策輿情評價(B)、利益相關者評價(C)、網(wǎng)上調查問卷(D)等四個層面反映互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施評估的主題評價，二級指標是對上一級影響因素的進一步細分，第三級指標通過數(shù)據(jù)處理和聚類分析，采用可量化的數(shù)據(jù)對前一級指標的每個方面進行描述。三級指標的數(shù)據(jù)處理，主要是在對定向數(shù)據(jù)集進行分詞處理、語義分析的基礎上，通過聚類分析算法，得出量化評分。

　　計算公式：P=k1*A+k2*B+k3*C+k4*D;

　　K1-k4為權重，取值范圍為0-1，且k1+k2+k3+k4=1;

　　A-D為一級指標取值，通過二級指標加權計算得出，取值范圍0-100之間，如A=k11*A1+k12*A2，K11-k12為權重，取值范圍為0-1，且k11+k12=1。

　　二級指標取值通過三級指標加權計算得出，取值范圍0-100之間，如A1=k111*a11+k112*a12+k113*a13+k114*a14，K111-k114為權重，取值范圍為0-1，且k111+k112+k113+k114=1。

　　推薦閱讀：大數(shù)據(jù)挖掘的論文投刊指導

上一篇：高職院校計算機應用技術專業(yè)群建構與特色發(fā)展研究

下一篇：5G技術在“智慧煤礦”場景化應用研究

2019亚洲日韩新视频_97精品在线观看_国产成人精品一区二区_91精品网站在线观看

大數(shù)據(jù)框架下公共政策實施評估研究

查看北核目錄大全及期刊首頁

更多計算機信息管理文章推薦

專題專項服務