摘要:政府數(shù)據(jù)開放對于提高政府信息化效益、確保社會公眾知情權、推動國家經濟增長具有重要意義;而政府數(shù)據(jù)開放平臺建設則是其中的關鍵環(huán)節(jié)。國內外學者針對政府數(shù)據(jù)開放及開放平臺構建開展了較為廣泛的研究,文章對目前研究現(xiàn)狀(以圖書情報領域刊文為例)予以簡介并評析。接著選取國內外政府數(shù)據(jù)開放較為先進、完善的國家(美、英、澳、日)和城市(上海、北京、深圳)為研究對象,對其政府數(shù)據(jù)開放平臺進行了調查,并對調查結果加以對比分析,找出相同和差異之處。結論認為,我國政府數(shù)據(jù)開放與國外相比尚存在一定的差距,應該進一步加強政府數(shù)據(jù)開放及開放平臺的理論研究和實踐探索。
1 引言暨目前國內研究現(xiàn)狀簡介———基于2017年圖書情報領域刊文的分析
政府是大量信息資源和數(shù)據(jù)的擁有者;而要挖掘和實現(xiàn)這些原始數(shù)據(jù)集的價值則需要政府向社會公眾開放數(shù)據(jù)資源,推動整個國家資源的優(yōu)化配置。政府數(shù)據(jù)開放在政治上可以提高政府的透明度和滿意度,增強民眾對政府的公信力;在經濟上可以促進社會創(chuàng)新和新興產業(yè)發(fā)展,實現(xiàn)產業(yè)升級,推動經濟增長。因而,政府數(shù)據(jù)開放關系到國計民生,對于確保社會公眾的知情權、助推國家經濟的騰飛具有重要意義。
國際上(以美、英為代表)積極開展政府數(shù)據(jù)開放的相關理論研究和開放平臺的實踐探討,并取得了較大成就。國外政府數(shù)據(jù)開放的相關研究側重點在于解決具體的實際問題,研究主題主要集中在:開放政府數(shù)據(jù)的功能與利用、評價;政府數(shù)據(jù)開放的基礎設施建設;政府數(shù)據(jù)開放項目的實踐等。我國的政府數(shù)據(jù)開放行動也是勢在必行。從實踐上來看,2015年“數(shù)據(jù)開放共享”被確立為我國大數(shù)據(jù)戰(zhàn)略的核心,我國也將于2018年底建立國家級政府數(shù)據(jù)開放平臺;如何更好地建設數(shù)據(jù)開放平臺成為我國政府數(shù)據(jù)開放的關鍵環(huán)節(jié)。令人感到欣慰的是,貴陽市采取措施推動政府數(shù)據(jù)的開放、共享和利用,確保政府數(shù)據(jù)優(yōu)先向社會公眾開放;制訂的《貴陽市政府數(shù)據(jù)共享開放條例》也已于今年5月1日起施行。河北省政府提出,要推進政府數(shù)據(jù)的開放共享,到2018年底前建設政府統(tǒng)一數(shù)據(jù)開放平臺。從理論上來看,我國學者圍繞“政府數(shù)據(jù)開放”這一主題積極開展相關研究,取得了較為豐碩的研究成果。圖書情報界也不例外,筆者特選取2017年圖情刊物發(fā)表的最新文獻加以描述。首先值得一提的是,我國圖書館學核心期刊、CSSCI來源刊(核心版)《圖書與情報》2017年第1期開辟專題“國外政府數(shù)據(jù)開放的政策保障與啟示”,分別介紹了美國、英國、澳大利亞、巴西、丹麥這5個國家政府數(shù)據(jù)開放的有關政策和法規(guī)保障,并從多個方面分析其對我國的有益啟示;接著又在第2期載文探討政府數(shù)據(jù)開放的評估指標特征及其模式。筆者對其他非專題發(fā)表的文獻進行初步歸類,其主要內容涉及:政府數(shù)據(jù)開放平臺模型和框架構建;國內外開放政府數(shù)據(jù)平臺元數(shù)據(jù)標準研究;政府數(shù)據(jù)開放保障和運行機制;政府數(shù)據(jù)開放與個人隱私權保護及網絡輿情監(jiān)督;國外政府數(shù)據(jù)開放相關政策及對我國的啟示;其他問題,如政府數(shù)據(jù)開放的障礙、對策、檢索方法及變革等。
由上可以看出,我國圖書情報界積極開展“政府數(shù)據(jù)開放”的理論研究和實踐探索,取得了一定的研究成果;這些研究對于推進我國的政府數(shù)據(jù)開放、探討數(shù)據(jù)開放平臺的實現(xiàn)具有較大的理論參考價值和現(xiàn)實指導意義。筆者并不盲目跟隨,而是運用比較研究方法,從“國內外政府數(shù)據(jù)開放平臺的調查”入手,并對結果加以分析(目前研究文獻暫無該方面的直接報道)。研究的目的在于拋磚引玉,引發(fā)更多學者對“政府數(shù)據(jù)開放”問題的關注,為我國的政府數(shù)據(jù)開放平臺建設提供參考借鑒;同時,增強圖書情報界與政府之間的關聯(lián)度,擴大圖書館的影響力,提升其社會價值。
2 國內外政府數(shù)據(jù)開放平臺調查
2.1 調查要素
數(shù)據(jù)開放平臺作為政府數(shù)據(jù)開放的重要內容,對其調查分析是研究各國政府數(shù)據(jù)開放現(xiàn)狀不可缺少的部分。本文對于國外平臺的調查以美國、英國、澳大利亞、日本這4個處于數(shù)據(jù)開放先進水平的國家政府數(shù)據(jù)網為例,國內則以上海、北京、深圳這3個國內較為完善的數(shù)據(jù)開放平臺為例。
政府數(shù)據(jù)開放平臺的調查基于以下幾個基本要素而進行:1)數(shù)據(jù)對象與組織:包括開放數(shù)據(jù)的數(shù)量、類型、來源、下載格式。2)開放平臺的網站結構與分布:包括數(shù)據(jù)檢索、網站模塊分布、數(shù)據(jù)分享互動與用戶反饋、網站數(shù)據(jù)更新頻率、數(shù)據(jù)使用授權信息。3)是否提供API接口:API做為網站應用程序編程接口,它的開放使應用程序與開發(fā)人員無需訪問源碼或理解網站內部工作機制,就可以調用和開發(fā)網站的數(shù)據(jù)資源。因此開放API的站點能為第三方的開發(fā)者提供良好的社區(qū)支持,吸引更多的技術開發(fā)人員參與到數(shù)據(jù)開發(fā)與再利用之中。4)是否支持RSS訂閱:RSS可以作為數(shù)據(jù)開放平臺與其他站點之間共享數(shù)據(jù)信息的一種簡易方式。同時作為簡易信息聚合技術,RSS訂閱會收集和組織平臺用戶定制的數(shù)據(jù)信息,按照用戶希望的格式、地點、時間和方式,直接傳送到用戶的計算機上。這將大大促進數(shù)據(jù)開發(fā)者的工作效率,保證用戶對數(shù)據(jù)更新的關注,提高用戶獲取數(shù)據(jù)信息的時效性和準確性。
2.2 國外政府數(shù)據(jù)開放平臺調查
2.2.1 美國政府數(shù)據(jù)開放網
從美國的政府數(shù)據(jù)開放平臺(www.data.gov)網站搜集相關信息得知(注:為了節(jié)省文章篇幅,網站主頁圖省略,以下同):該平臺截至2017年5月開放數(shù)據(jù)集195206個,數(shù)據(jù)基本上都來源于政府公共部門,提供的數(shù)據(jù)下載格式為CSV、HTML、XML、RDF等可機讀格式。
在網站布局上:“數(shù)據(jù)搜索”框下方提供了農業(yè)、氣候、消費者、生態(tài)系統(tǒng)、教育等14項數(shù)據(jù)主題分類,總體包含了數(shù)據(jù)、分類、影響、應用軟件展示、擴展、互動6個主要類目。在擴展類目下提供使用開放數(shù)據(jù)的應用程序的展示區(qū),公眾可以通過IOS平臺或Andriod平臺下載這些應用程序,了解政府數(shù)據(jù)開放所能提供的服務和相應的功能,推動對政府開放數(shù)據(jù)創(chuàng)新應用的開發(fā)。該網站基本每日保持著開放數(shù)據(jù)的更新。并有官方的博客和Twitter,其中官方Twitter擁有2.51萬的關注量;在互動類目下提供用戶提問與twitter互動,保持與數(shù)據(jù)用戶的互動聯(lián)系。
網站下方About類目下提供4項授權信息聲明:①政府網站原始數(shù)據(jù)日志不能用于其他目的,并按照國家檔案和記錄管理指南進行定期銷毀。②嚴格禁止未經授權的上傳信息或更改本政府網站服務信息,如果違反將可能受到懲罰。③通過www.data.gov提供的美國聯(lián)邦數(shù)據(jù)是免費且無限制的。政府雇員在其雇用范圍內創(chuàng)造的數(shù)據(jù)和內容不受美國的國內版權保護。④通過www.data.gov訪問的數(shù)據(jù)沒有、也不應該包含對其最終用途的控制。一旦數(shù)據(jù)從機構的網站下載,政府就不能保證其質量和及時性。此外,美國政府不能對www.data.gov通過檢索的數(shù)據(jù)進行任何分析。數(shù)據(jù)檢索方式以關鍵詞檢索、基于地圖位置的檢索為主;數(shù)據(jù)檢索內容以相關性、名稱的升序或降序、最后修改日期等進行檢索排序,檢索結果以主題、主題分類、數(shù)據(jù)集類型、標簽等進行分類分面。
在API的開放上,網站目錄由CKAN(強大的開源數(shù)據(jù)平臺之一)提供支持,CKANAPI包含有關數(shù)據(jù)集的元數(shù)據(jù)。通過CKAN的支持為用戶提供所有數(shù)據(jù)的API接口,允許所用用戶通過API對調取的數(shù)據(jù)進行開發(fā)利用。同時Data.gov為API利用提供了GitHub托管平臺的支持,該平臺擁有超過900萬的開發(fā)用戶,可以隨時為www.data.gov用戶在API的使用上提供幫助。RSS訂閱上,美國的政府數(shù)據(jù)開放平臺支持RSS技術以及數(shù)據(jù)信息的訂閱,并提供相應的網站代碼以供不同種類RSS閱讀器的使用。
2.2.2 英國政府數(shù)據(jù)開放網
從英國的政府數(shù)據(jù)開放平臺(data.gov.uk)網站搜集相關信息得知:該平臺截至2017年5月提供開放數(shù)據(jù)集43021個,提供下載格式包括CSV、RDF、XLSM、XML、NII等可機讀格式。數(shù)據(jù)來源于公共部門、私企和部分高等教育機構。
網站布局和結構上,主頁提供了包括商業(yè)和經濟、環(huán)境、地圖等12個數(shù)據(jù)主題,網站包括數(shù)據(jù)、APP應用、互動、登錄4項主要類目;APP應用下提供了412個關于政府數(shù)據(jù)APP的應用。在互動上設置了官方博客,同時在博客互動、網站論壇和評論等功能上采用Drupal系統(tǒng)運行,從而為用戶提供完善的站點分析工具和協(xié)同共享平臺,實現(xiàn)用戶與網站之間的雙向互動。該平臺數(shù)據(jù)每周進行更新。
在網站FAQ附錄下提供了兩項明確數(shù)據(jù)授權聲明:①網站上的信息是開放的且可再利用,允許私人和其他第三方網站向平臺提供數(shù)據(jù)信息。②通過data.gov.uk提供的數(shù)據(jù)和信息的授權可以在單個數(shù)據(jù)集記錄(元數(shù)據(jù))的“許可”或“約束”字段中描述的條件下獲得,除非另有說明;在data.gov.uk上發(fā)布的所有數(shù)據(jù)集記錄(元數(shù)據(jù))都是根據(jù)開放式政府許可進行許可的。
數(shù)據(jù)檢索上,data.gov.uk采用短語檢索和字段檢索,采取以名稱升降為標準的排序方式,以NII數(shù)據(jù)集、API、執(zhí)照、主題、資源格式等這些項目進行結果分類分面。da?ta.gov.uk也是基于CKAN數(shù)據(jù)管理系統(tǒng)進行搭建的,網站API開放只面向注冊用戶,API的開放還屬于試用期,只提供健康與交通兩項主題的開放數(shù)據(jù)。提供GitHub平臺的服務功能。同時該網站支持RSS訂閱。
2.2.3 澳大利亞政府開放數(shù)據(jù)網
從澳大利亞的政府數(shù)據(jù)開放平臺(www.data.gov.au)
網站搜集相關信息得知:截至2017年5月提供開放數(shù)據(jù)集49904個,提供下載格式包括SHP、SLD、WMS、WFS、GeoJSON等可機讀格式,數(shù)據(jù)來源都是本國政府部門。
網站結構上,主頁未提供數(shù)據(jù)主題分類,在數(shù)據(jù)類目下只提供了商業(yè)、經濟、環(huán)境、科學等8項數(shù)據(jù)分類,總體上包括數(shù)據(jù)集、組織、網站統(tǒng)計等8個主要類目,在應用類目下提供了42個關于開放數(shù)據(jù)的運用軟件。其中工具包類目中為用戶提供了相應的技術與法律政策上的應用支持,以協(xié)助用戶對開放數(shù)據(jù)的開發(fā)使用;www.data.gov.au還通過統(tǒng)計模塊向用戶開放了網站整體運行情況。
但www.data.gov.au沒有社交媒體的選項設置,僅提供了用戶反饋調查和用戶提問的網站模塊,在數(shù)據(jù)的互動共享上略顯欠缺。平臺數(shù)據(jù)保持每周更新,該平臺準許用戶在瀏覽器上禁用cookie。使用授權上,www.data.gov.au的About類目下提供了兩點聲明:①對于其所提供的第三方鏈接數(shù)據(jù)沒有相應的下載授權。②尊重和保護用戶的隱私,網站上的所有開放數(shù)據(jù)依照開放許可協(xié)定授予所用用戶下載和使用的權力。
www.data.gov.au同樣是基于CKAN數(shù)據(jù)管理系統(tǒng)進行網站搭建,對用戶開放所有數(shù)據(jù)的API,無其他API支持服務;但提供RSS訂閱服務。
2.2.4 日本政府開放數(shù)據(jù)網
從日本政府數(shù)據(jù)開放平臺(www.data.go.jp)網站搜集相關信息得知:截至2017年5月提供開放數(shù)據(jù)集18717個,數(shù)據(jù)來源除政府部門外還包括科研機構和大型企業(yè),提供XLMS、CSV、PDF、HTML等可機讀下載格式,網站還同時提供日語和英語兩種語言服務。
網站結構分布上,首頁未對數(shù)據(jù)種類進行主題分類,在數(shù)據(jù)類目下將數(shù)據(jù)分為商業(yè)、安全、運輸教育等9項主題。網站總體劃分為注意事項、數(shù)據(jù)、數(shù)據(jù)庫列表等6個主要類目。數(shù)據(jù)檢索data.go.jp采用關鍵詞檢索和基于地圖位置的檢索,按照數(shù)據(jù)的相關性和搜索量進行排序,按照數(shù)據(jù)集、組織、格式、主題分類進行搜索結果分面?;由咸峁┝擞脩魯?shù)據(jù)報告以收集數(shù)據(jù)用戶的相應反饋,并提供了用戶數(shù)據(jù)信息上傳通道,允許用戶向網站提供數(shù)據(jù)信息。但沒有社交媒體的互動,官方開設的twitter賬戶沒有實時的更新動態(tài),并處于休停狀態(tài)。
數(shù)據(jù)使用授權上,在網站的注意事項類目下提供的授權信息聲明上顯示:data.go.jp根據(jù)日本“行政機關保護個人信息法”,網站對部分收集的數(shù)據(jù)不予授權。其他不在信息法保護內的數(shù)據(jù)以開放協(xié)定為標準,任何用戶都可基于data.go.jp的授權進行自由下載和使用。data.go.jp以CKAN數(shù)據(jù)管理系統(tǒng)搭建,并提供多種類型API,例如組織、數(shù)據(jù)重置、資源和標簽API。使用API以JSON、RDF格式獲取元數(shù)據(jù),提供所有開放數(shù)據(jù)的API接口。支持RSS訂閱服務。
