摘要:大數據時代的政府信息服務開始向個性化、智慧化、泛在化方向發(fā)展,政府信息服務創(chuàng)新面臨新的機遇和挑戰(zhàn)。在梳理歸納大數據環(huán)境下國內外政府信息服務創(chuàng)新研究現狀的基礎上,從數據資源角度,指出數據開放與共享、大數據分析技術、數據隱私與安全等是中國基于大數據的政府信息服務創(chuàng)新應注意的關鍵問題,并從體制機制、技術框架、政策扶持等方面提出大數據環(huán)境下政府信息服務創(chuàng)新的對策建議。

 
  一、引言
 
  大數據、“互聯網+”等浪潮的興起,表明了過去十年間信息技術在中國社會生態(tài)系統(tǒng)中的飛速發(fā)展與迅速普及。信息技術的進步,使得數據的生成和獲取日益普遍,而互聯網不僅是一種能夠讓信息快速傳播、實時互動、高度共享的傳播媒介,還深深影響了社會的組織形態(tài)和運行模式。作為網絡社會生態(tài)的一部分,政府信息服務模式在不斷演化。同時,得益于政府自身公信力所賦予的權威性、可信性等天然優(yōu)勢,政府信息服務成為公眾在網絡上獲取信息的重要來源。為適應互聯網時代的特殊規(guī)律,充分發(fā)揮政府網上信息資源的影響力,全球各國和地區(qū)已紛紛制定相關政策和措施來促進提升政府信息服務的能力和水平,其中迅速發(fā)展的大數據技術,為政府信息服務創(chuàng)新提供了全新的技術渠道。
 
  從近年來歐美等發(fā)達國家關于互聯網信息服務的實踐可以看出,大數據技術已普遍被應用到政府在網絡空間的信息引導工作中,國外政府較為注重應用大數據技術實時感知網民需求,以做到更加精準的信息服務推送。以美國2012年8月23日大規(guī)模爆發(fā)的西尼羅河病毒事件為例,在事件發(fā)生后,美國相關部門通過精準的互聯網數據監(jiān)測分析,及時了解網民的需求和關切,并確保美國疾控中心和食品藥品監(jiān)督管理局網站上發(fā)布的信息第一時間出現在谷歌搜索結果首頁的醒目位置上,為澄清事件真相、引導社會輿論發(fā)揮了重要作用。從本質上說,大數據是隨著人類數據量的劇增而產生的一種新技術,不僅強調數據量之大、類型之多,更強調通過對海量數據的深度挖掘和多維剖析,發(fā)現數據背后所蘊含的有價值信息。當下,如何利用大數據技術和理念,確保網民能夠獲取到更多、更好的政府信息服務,已成為信息化條件下建設服務型政府,實現國家治理體系和治理能力現代化的重要內容。
 
  然而,作為一種公共物品,政府信息服務存在供給缺乏彈性、需求無法有效得到表達的特點,導致了政府信息服務供需脫節(jié),妨礙了政府信息服務的健康發(fā)展。大數據技術為政府信息服務的供需平衡提供了技術手段,本研究在調查梳理大數據環(huán)境下政府信息服務創(chuàng)新研究現狀的基礎上,主要關注如何發(fā)揮大數據技術優(yōu)勢,促進重構政府在線服務的供求均衡和政府信息服務創(chuàng)新的實現,以逐步提升政府在線服務資源配置的效率和服務水平。
 
  二、國內外研究現狀
 
  2012年,美國政府發(fā)布了《大數據研究和發(fā)展計劃》,在全球掀起大數據產業(yè)發(fā)展浪潮。在政府信息服務領域,大數據應用也成為各國政府關注的焦點問題。如美國政府成立了美國聯邦政府網站管理者委員會網站量化分析分會,專門從事政府在線服務數據分析與優(yōu)化工作。2013年,澳大利亞政府發(fā)布了《公共服務大數據戰(zhàn)略》。中國則于2012年組建了國家信息中心網絡政府研究中心,建設“中國政府網站智能分析大數據中心”,面向各級各類政府網站開展用戶行為分析工作。在各國政府的高度重視下,學術界對大數據環(huán)境下的政府信息服務創(chuàng)新問題開展了很多研究,具體分述如下。
 
  (一)大數據在政府信息服務創(chuàng)新中的應用價值和潛在問題
 
  大部分研究者認為,大數據對于政府信息服務創(chuàng)新具有積極促進作用。首先,表現在大數據所強調的對海量數據的挖掘分析,有助于政府把握信息服務用戶需求。如M.R. Rajagopalan等認為,大數據分析能夠幫助政府更加精細化地理解公民需求、行為和態(tài)度,指導調整公共政策與公共服務改進,重構政府行政過程,促進以用戶為中心的下一代在線公共服務的發(fā)展。[1]其次,數據是大數據應用推進的前提,數據開放、共享與政府透明度息息相關,大數據技術在政府信息服務創(chuàng)新中的應用,可以讓政府公共信息更加透明化,促進其進一步演化為透明政府,促進電子政府最終演化階段的到來。[2]再次,促進政府信息服務的決策科學化。A. Clarke等則認為,大數據極大提升了政府在線服務決策制定的科學性,從人們使用社交媒體、實時交易等行為中采集的大數據信息,能夠反映人們在特定環(huán)境中的真實行為[3],其代表了整個人群而不是樣本人群的信息,這就使得相關領域的公共管理研究更加接近于物理或生命科學的研究范式。同時,在大數據時代,公眾可以更好地參與到政府工作之中,與政府分享信息,形成政府和公眾共同參與的政務決策機制。[4]社會公眾可以通過社交媒體、公開出版物、博客等渠道分享他們的意見。大數據分析可以處理這些非結構化數據,并將更好的服務和方案傳遞給所需的客戶群體。因此,在大數據背景下,任何政府都可以藉由政務大數據的采集、分析和利用,不斷推動優(yōu)化政府自身運作流程和服務效能。
 
  在看到大數據應用積極作用的同時,很多研究者也對大數據應用可能對政府信息服務帶來的負面作用做了分析。首先,大數據可能造成政府信息服務公平性的損害。如以基于大數據技術識別犯罪“熱點”區(qū)域的信息服務為例,這類服務雖然大大提高了人們預測預防犯罪的能力,但對生活在這些區(qū)域的人而言,則因此會面臨很多不便,甚至導致執(zhí)法中不公平現象。[3]P. Henman則認為,基于大數據的個性化信息服務,將政府信息服務用戶從原來的單一社會群體劃分為若干個具有不同風險水平的子群體,從而破壞了政府信息服務的均等化原則,有可能導致對社會凝聚力造成潛在損害。[5]其次,是對大數據分析中意識形態(tài)傾向性問題的討論。大數據本身沒有傾向性,但在政策制定過程中,數據采集、解讀和發(fā)布方式總是會受到操作者意識形態(tài)傾向性的影響,進而影響政府信息服務運轉。[2]此外,政府信息服務中所應用的大數據分析還有可能導致侵害公民隱私權等問題。
 
  (二)探索基于不同數據源的政府信息服務創(chuàng)新模式
 
  數據是大數據應用的前提和基礎。目前,政府信息服務研究者較為關注基于不同數據源的政府信息服務創(chuàng)新模式。從大數據的類型看,政府信息服務創(chuàng)新主要基于三種大數據展開:
 
  一是基于政府內部業(yè)務大數據的信息服務創(chuàng)新研究,這類研究最為常見。如G-H. Kim等對歐美發(fā)達國家的24項政府信息服務大數據應用進行了案例介紹,并歸納總結其存在的問題。[6]M.R.Rajagopalan等歸納了基于跨部門大數據集成創(chuàng)新政府信息服務的9種基本模式。[1]
 
  二是基于政府在線服務平臺自身用戶行為大數據的服務創(chuàng)新研究。Stacey Shindelar指出,以用戶為中心的服務方式需要基于對用戶需求的充分挖掘,建立用戶和政府之間服務效果反饋的有效通道,以用戶熟悉的方式將服務內容推送給用戶。[7]近年來,很多發(fā)達國家在線服務平臺均采用了類似的用戶需求和行為大數據挖掘技術。于施洋等對聯合國和12個主要發(fā)達國家政府網站的調研發(fā)現,這些網站均部署有用戶行為數據分析系統(tǒng),通過對用戶訪問規(guī)律的動態(tài)監(jiān)測,指導改進政府網上信息服務。[8]部分研究者基于類似數據開展了實證研究,如R.C. Joseph等對美國聯邦政府15個執(zhí)行部門的在線信息服務數據進行了分析。[9]于施洋和王建冬對中國82家政府網站的用戶訪問數據進行了分析。[10]
 
  三是基于外部互聯網用戶輿情大數據分析創(chuàng)新政府信息服務模式的研究。T.M. Harrison認為,通過分析互聯網公眾在社交媒體等渠道的觀點訴求信息,可以判斷網民對政府服務的需求和滿意度,識別最重要的用戶群體,從而有效改進政府信息服務。[11]在實證分析方面,較有代表性的如A. Clarke等對英國政府[3],Z.P. Liao對中國臺灣地區(qū)網站[4],以及于施洋等對中國中央政府門戶網站應用互聯網全網數據分析改進服務做法的介紹[12]。
 
 ?。ㄈ┱畔⒎罩袘么髷祿夹g的實踐
 
  除了對具體應用模式的介紹外,部分研究者還關注了在政府信息服務創(chuàng)新中應用大數據的實踐模式問題。首先,是政府信息服務大數據應用技術框架的構建。如R.C. Joseph等提出政府信息服務大數據應用的四層模型,即數據透明層、數據細分層、過程重構層和自動化分析層。[9]S. Shindelar提出大規(guī)模政務大數據建設的四層模型,即數據采集層、平臺應用層、數據展現層和安全與隱私保護層。[7]M.R. Rajagopalan等提出了一個政務大數據應用框架,分為四個主要組成部分,即資源管理器、數據組織與管理、數據分析與知識發(fā)現,以及決策支持和可視化報告。[1]其次,則是對政府信息服務大數據應用障礙的分析,如A. Clarke對人才瓶頸問題的分析[3],G-H. Kim等對政府大數據應用決策機制復雜性的分析[6],M. Milakovich對政府部門數據孤島問題的分析[2],T.M. Harrison和J.Hrdinova對政務大數據技術落后性的分析等[11]。
 
  三、大數據環(huán)境下政府信息服務創(chuàng)新的關鍵
 
  大數據時代的到來,為政府信息服務創(chuàng)新提供了新的機遇。從國內外研究現狀來看,中國在大數據環(huán)境下的政府信息服務創(chuàng)新探索實踐起步較晚,對于這一問題的關注還較多地停留在理論探討層面,且由于應用數據源規(guī)模偏小,研究應用往往不夠深入,分析結論也多流于寬泛和表面化。大數據是全球數據自發(fā)式、爆發(fā)式增長以及數據處理高效率要求的綜合體現[13],如何有效識別和積極應對因數據資源爆發(fā)式增長帶來的各項挑戰(zhàn),是大數據環(huán)境下政府信息服務實現創(chuàng)新的當務之急。基于國內外研究現狀,從數據資源角度看,在大數據環(huán)境下政府信息服務創(chuàng)新應著手解決數據開放與共享、大數據分析技術、數據安全和隱私保護等問題。
 
 ?。ㄒ唬祿_放與共享
 
  政府部門所擁有的信息資源狀況決定了政府信息服務水平的高低。政務信息資源在數量上的豐富程度直接影響到政府信息服務的廣度,而在質量上的優(yōu)化程度則直接影響到政府信息服務的深度。對于政府信息服務的數據獲取,主要包括政府外部的數據開放、政府內部的數據共享等方式。近年來,西方發(fā)達國家陸續(xù)頒布國家大數據戰(zhàn)略,并將數據開放作為國家發(fā)展戰(zhàn)略。據統(tǒng)計,截至2014年4月,已有63個國家制定了開放政府數據計劃。如美國奧巴馬總統(tǒng)簽署了《政府信息公開和機器可讀行政命令》;歐盟頒布了對《公共部門信息再利用》的修訂指令;八國集團簽署了《開放數據憲章》等。而從目前全球參與開放數據運動的國家來看,中國政府數據開放的步伐還比較落后,須盡快制定法律法規(guī)界定政府數據開放工作邊界,明確數據開放政府部門、研究機構、應用廠商、個人用戶、平臺方等各方的權利和責任,制定數據開放目錄,說明數據開放領域和清單,加快推進政府數據開放。同時,在保證數據安全的前提下,可運用多種方式開放數據,以將原本由政府全部承擔的公共服務職能通過市場化方式分散到全社會各個層面。
 
  此外,大數據環(huán)境下的政府信息服務創(chuàng)新還要面對很多政府部門特有的挑戰(zhàn)和問題,首當其沖的就是政府內部的數據收集。[6]受政府職能部門自身權力意志的影響,多數政府機構將所掌握的信息資源視為“個人資產”,阻礙信息共享實現,使得政府信息資源開發(fā)利用程度極低,能供公眾訪問和使用的數據只是“冰山一角”。此外,“信息孤島”現象普遍存在,距離體系化、標準化、可進行綜合比對和融合分析的政府服務供給“大數據”尚有較大差距。
 
 ?。ǘ┐髷祿治黾夹g
 
  大數據的概念,不僅僅是指數據總量很大,更重要的是要從中所獲取的價值很大[6],這離不開大數據分析技術的運用。T. H. Davenport將大數據分析從內容層面歸為三類,分別是描述性分析、預測性分析和定題性分析。其中,描述性分析指形成一些標準報告、應急性報告和報警性報告等;預測性分析主要圍繞預測和統(tǒng)計建模展開;定題性分析主要關注優(yōu)化和隨機性測試研究。[14]與商業(yè)領域的大數據分析應用相比,政府領域的大數據分析還較多地停留在描述性分析層面,對于大數據分析技術的深層次應用還遠遠不夠。M. R. Rajagopalan等指出,目前大部分電子政務服務都只接受結構化數據,政府收集數據的目的僅僅是為了基本的統(tǒng)計分析,并不能滿足對政府服務質量優(yōu)化的支撐需求。[1]可見,推動大數據分析技術在政府信息服務中的深入應用,是實現大數據環(huán)境下政府信息服務創(chuàng)新的當務之急。
 
  江信昱等從面向數據的視角,將大數據分析方法分為統(tǒng)計、挖掘、發(fā)現、預測及集成五個層次,并初步歸納出17種相關方法。[15]這些大數據分析技術的應用,如遺傳算法、回歸分析、情感分析等,有助于重構政府行政過程[16],幫助政府工作人員更好地理解公眾對政府的服務需求,形成更好的定制化服務。例如,美國國稅局曾經重新設計其納稅申報流程,并應用大數據技術手段來提高對納稅欺詐和納稅不遵從行為的自動監(jiān)測。[17]隨著聯邦政府各個機構對于大數據分析的應用,政府就可以在處理自身事務時花費越來越少的精力。政府信息服務應當以滿足公眾需求為導向,大數據分析技術能夠實現對海量數據的細分和分析,并用來創(chuàng)建基于人口統(tǒng)計學或地域特征等指標的用戶群體,從而幫助政府部門工作人員從不同視角解讀數據,形成更好的定制化服務,更好地滿足用戶需求??梢?,大數據環(huán)境下政府信息服務創(chuàng)新實現的關鍵還在于大數據分析技術的優(yōu)化與完善,加強大數據分析技術的基礎研究,構建完善的大數據分析技術框架是實現大數據分析在政府信息服務創(chuàng)新中應用的前提條件。
 
 ?。ㄈ祿[私與安全
 
  數據隱私、數據安全與大數據發(fā)展并存,也是大數據發(fā)展面臨的重要挑戰(zhàn)。R.C.Joseph等認為數據隱私保護是未來政府大數據應用的主要障礙之一。[9]A. Clarke等也提出數據隱私是政府信息服務中大數據應用的重要問題。[3]2006年,AOL曾經公布了一批三個月左右的65萬名用戶的搜索日志數據。盡管是去除了用戶名和IP地址的匿名數據,但僅僅過了幾天,《紐約時報》就從這批被處理過的數據中人工識別出了一批精確的個人用戶。[18]這一事件發(fā)生之后,搜索引擎、論壇等公司再也不向研究者公布匿名的日志數據。很多評價者都在質疑大數據對公眾隱私的威脅,認為聚合和分發(fā)數據容易造成對公眾隱私的破壞。大數據并不是任意的數據,它基于人們的社會行為產生,與人們的日常生活息息相關,對這些數據的分享、使用和發(fā)布有可能造成對人們隱私的破壞。大數據在采集、存儲、分析、傳輸、運用等過程中,面臨著嚴峻的安全和隱私風險。這是因為,一些看似無害、與隱私無關的數據被大量收集、整合后,也有可能會暴露個人隱私?;诖耍鞣絿移毡橥ㄟ^法規(guī)政策強化大數據應用中對數據安全和隱私的保護,除沿用多年前的法規(guī)文件外,個別國家已經開始針對大數據特點制定專門的隱私和數據安全政策。[19]在大數據應用中,如何在中國現有的政策環(huán)境下有效規(guī)避大數據應用可能帶來的一系列隱私、安全、倫理等問題,是政府信息服務創(chuàng)新得以成功的關鍵。
 
  四、大數據環(huán)境下政府信息服務創(chuàng)新的對策建議
 
  大數據環(huán)境下政府信息服務創(chuàng)新并不是單純的理論問題,需要從體制機制上轉變現有政府信息服務模式;并要不斷發(fā)展技術框架,提供以用戶需求為中心的政府信息服務;同時,還應在政策、法規(guī)等方面,注重大數據發(fā)展中的數據隱私與安全問題,構建良好的政府信息服務大數據環(huán)境。
 
 ?。ㄒ唬├眄橌w制機制,轉變現有政府信息服務模式
 
  隨著大數據的發(fā)展,數據開始被視為有價值的資源,誰掌握了數據,誰就擁有了主動權;并且,數據的價值可以被挖掘,并不會因為使用而減少。對于大數據環(huán)境下中國政府信息服務創(chuàng)新而言,首先應從數據著手。在這個過程中,政府部門應不斷改進信息服務流程和機制,探索適宜大數據發(fā)展潮流的政府信息服務模式。由于長期以來政府內部的條塊分割,每一個政府部門都傾向于建設自己的數據倉庫,而不愿與其他機構分享信息,且每一個系統(tǒng)中的數據都獨立于其他系統(tǒng),這樣一個“通天塔”式架構,進一步增加了跨部門數據整合、共享的難度。[8]這歸根結底還是體制機制問題。如何破除部門壁壘,促進數據共享集成,改變以部門為導向的政府信息服務運行機制,是大數據環(huán)境下政府信息服務創(chuàng)新順利進行的必要條件。為此,國家層面應明確一個牽頭部門,組織各部門積極參與大數據環(huán)境下政府信息服務創(chuàng)新工作,做好大數據環(huán)境下政府信息服務創(chuàng)新的頂層設計,推進相關基礎數據庫及數據中心建設,完善政府信息資源共享的標準規(guī)范,加強相關保障機制建設。
 
  (二)發(fā)展技術框架,提供以用戶為中心的信息服務
 
  在大數據環(huán)境下,對用戶行為數據的分析挖掘有助于捕捉用戶的行為特征,大數據分析技術的應用能夠做到準確把握用戶需求,根據不同用戶的特點和需要,提供有針對性的、個性化的信息服務。S. Shindelar指出,以用戶為中心的服務方式是基于對用戶需求和訴求的充分挖掘。[7]只有將大數據應用建立在用戶需求挖掘的牢固基礎之上,并以用戶所熟悉的方式提供給用戶,政府信息服務才會真正有效。當前,中國政府在大數據采集與存儲維護、數據采集接口管理和大數據分析技術等方面普遍遇到瓶頸,構建適應大數據時代的政府信息服務技術框架則顯得十分必要。
 
  大數據環(huán)境下政府信息服務創(chuàng)新的技術框架主要分為三層:一是基于政府業(yè)務數據的政府信息服務集成創(chuàng)新技術,包括在跨部門數據資源創(chuàng)新服務的整合集成基礎上歸納共性數據源(如人口庫、地理信息庫等),以及基于所獲取的核心業(yè)務數據集進行數據集成和融合分析,探索將不同業(yè)務領域數據按照同一粒度進行橫向集成并提供服務的方法與模型。二是基于用戶行為數據的政府信息服務界面創(chuàng)新方法。通過構建政府在線服務用戶需求時空分布模型、需求滿足度模型、頁面點擊行為模型、頁面跳轉行為模型、欄目關聯度模型等Web挖掘分析模型,構建基于用戶需求改進服務內容、基于用戶行為改進服務界面的方法體系。三是基于全網輿情數據的政府信息服務傳遞創(chuàng)新技術。采取中文信息處理、社會網絡分析、新事件探測、情感分析等輿情分析方法,識別政府信息傳播中的關鍵節(jié)點和傳播時點,精準投放政府在線服務信息,提升政府信息的互聯網影響力。
 
  (三)完善政策法規(guī),構建政府信息服務大數據環(huán)境
 
  基于大數據的政府信息服務創(chuàng)新,首先應營造良好的大數據環(huán)境,制定符合目的的制度安排和支持政策。從西方大數據產業(yè)的發(fā)展來看,自2012年以來,美、英、日、澳等國已密集出臺多項大數據發(fā)展扶持政策。從各國舉措來看,政策扶持的著力點主要是在以下三個方面:增加大數據前沿及共性基礎技術或關鍵核心技術的研發(fā)投入;部署大數據人才教育與培養(yǎng)專項;通過包括資金支持在內的多種途徑培育大數據產業(yè)。與國外相比,中國大數據產業(yè)剛剛興起,公共部門應用大數據技術提供公共服務的意識尚不健全,國家層面大數據發(fā)展戰(zhàn)略剛剛出臺。為穩(wěn)步推進中國大數據技術應用,尤其是在政府信息服務創(chuàng)新方面,應在政策構建上重點規(guī)劃相關領域的大數據研究計劃,布局前沿及共性基礎技術的研究專項,強化大數據人才培養(yǎng),完善大數據基礎設施,在財稅政策、采購政策等方面做好對大數據產業(yè)的扶持和保障等,以推動實現大數據環(huán)境下政府信息服務創(chuàng)新。
 
  此外,在推動大數據應用逐步發(fā)展時,應加強對數據隱私和數據安全的重視。首先,應進一步完善現有法規(guī)政策,通過法規(guī)政策強化大數據應用過程中對個人隱私的保護和數據安全的保障,必要時可針對大數據特點和應用需求制定專項的數據隱私與安全政策。其次,應加強對數據隱私和安全的保障技術研究和應用,如通過數據清洗、數據脫敏等,去除數據中的敏感信息;應用數據發(fā)布匿名保護技術等,保護隱私數據;采用自主可控的國產設備,防控重要數據流失、被竊等的發(fā)生。
 
  五、結語
 
  綜上所述,大數據在政府領域的應用,已成為政府信息服務創(chuàng)新研究的主要熱點。雖然大數據環(huán)境下政府信息服務創(chuàng)新還面臨較多有待解決的問題,但大數據技術為政府信息服務創(chuàng)新帶來了更多的發(fā)展機遇,對于用戶需求的挖掘和掌握,將直接有助于政府信息服務中個性化信息服務的實現,為以用戶為中心的政府信息服務提供了可靠的實現路徑。本文在此方面的研究,希望可以為后續(xù)研究者提供一些幫助。
 
 ?。▉碓矗弘娮诱?,作者:于施洋,國家信息中心信息化研究部副主任,國家發(fā)改委互聯網大數據分析中心執(zhí)行副主任;王建冬,國家信息中心信息化研究部大數據分析處副處長,國家發(fā)改委互聯網大數據分析中心主任助理;童楠楠,國家信息中心信息化研究部助理研究員,國家發(fā)改委互聯網大數據分析中心合作交流部主任)
責任編輯:admin