編者按:近兩年,被稱(chēng)為“21世紀石油”的大數據成為熱點(diǎn)話(huà)題,并已在生產(chǎn)生活和科研等諸多領(lǐng)域發(fā)揮作用,受到發(fā)達國家的普遍重視。反觀(guān)我國大數據產(chǎn)業(yè)的發(fā)展現狀,由于各種行政因素和市場(chǎng)因素,存在數據打通難、數據開(kāi)放嚴重不足、數據話(huà)語(yǔ)權堪憂(yōu)等問(wèn)題。為揭示大數據產(chǎn)業(yè)發(fā)展受阻背后原因,并提出具有針對性的意見(jiàn)和建議,本報即日起推出“大數據:壟斷與割裂”系列報道,敬請關(guān)注。
橫亙在大數據版圖上的一道道部門(mén)壁壘,讓大數據企業(yè)步履維艱。
百度地圖是目前廣泛使用的電子地圖,但由于政府的地圖資料信息不公開(kāi),企業(yè)只能被迫自己采集信息進(jìn)行標注。
“地圖上的公交服務(wù)信息應由政府免費提供,但實(shí)際上這些信息都沒(méi)有公開(kāi),我們只能挨個(gè)跟公交公司談,不僅資源浪費嚴重,而且效率非常低下!卑俣劝l(fā)展研究中心副主任黃林莉說(shuō),政府層面的信息公開(kāi)距離企業(yè)實(shí)際需求差得很遠。
《經(jīng)濟參考報》記者近日在北京、天津、浙江、貴州等地采訪(fǎng)發(fā)現,政府運用大數據助力政府治理正進(jìn)入數據積累和分析的初級階段,但由于動(dòng)力不足,部門(mén)壁壘森嚴,存在數據打通難、數據開(kāi)放嚴重不足等問(wèn)題。業(yè)內人士呼吁加速公共數據資源的開(kāi)放,為大數據產(chǎn)業(yè)進(jìn)一步縱深發(fā)展營(yíng)造健康環(huán)境。
公共數據壟斷加重企業(yè)負擔
隨著(zhù)大數據浪潮風(fēng)起云涌,一些政府部門(mén)和壟斷機構掌握的豐富數據資源成為香餑餑和聚寶盆。然而,大數據企業(yè)很難獲得這些公共數據,企業(yè)日常運營(yíng)中信息審核成本巨大。
“如果政府掌握的個(gè)人征信大數據庫對企業(yè)和社會(huì )開(kāi)放,將意義重大!眹鴥却笮蜕罘诸(lèi)信息網(wǎng)站、58同城政府事務(wù)部總監曲子恒對《經(jīng)濟參考報》記者說(shuō),58同城有5500多名員工,其中3000多名銷(xiāo)售人員的主要任務(wù)就是審核用戶(hù)信息。由于誠信機制不足,對于用戶(hù)信息了解程度有限,銷(xiāo)售人員必須耗費大量精力接觸商戶(hù)以保證安全,比如開(kāi)鎖公司、搬家公司在公司網(wǎng)站上發(fā)帖,銷(xiāo)售人員就要上門(mén)進(jìn)行人工審核。
曲子恒說(shuō),目前查詢(xún)身份信息,每驗證一個(gè)身份證要交3元錢(qián),增加了企業(yè)審核成本;查詢(xún)企業(yè)信息,登錄北京工商局網(wǎng)站可以獲得一些企業(yè)的基本信息,但很多地方信息仍然不公開(kāi),不拿著(zhù)律師證跑到當地工商局大廳就查不到,而且查詢(xún)還要收費。如果工商注冊、身份證查詢(xún)的大數據系統對企業(yè)和社會(huì )開(kāi)放,一些信用記錄不良的人一旦發(fā)帖,網(wǎng)站就可以根據記錄獲得風(fēng)險提示,從而告知商戶(hù)謹慎交易,企業(yè)也不需要花費這么多人力和時(shí)間上門(mén)驗證,能夠節省巨大成本。
大數據管理解決方案提供商、龍信數據(北京)有限公司研究中心副主任祁鳴說(shuō),政府大數據應用的理念亟待創(chuàng )新,大數據不是人民幣,在缺乏挖掘能力的人手里一點(diǎn)用處都沒(méi)有,但在具有行業(yè)經(jīng)驗的人眼里就是一份寶藏。
開(kāi)放公共數據,既可以提升政府治理能力、推動(dòng)政務(wù)公開(kāi),也可以方便百姓生活。騰訊互聯(lián)網(wǎng)與社會(huì )研究院副秘書(shū)長(cháng)譚濤說(shuō):“政府開(kāi)放數據就像向小河注水,會(huì )保持河流生態(tài)的健康,開(kāi)放后能帶動(dòng)數據挖掘分析產(chǎn)業(yè)的蓬勃發(fā)展,F在百度、阿里巴巴、騰訊等大型互聯(lián)網(wǎng)企業(yè)搜集的數據再大也有片面性,如果能與政府數據進(jìn)行交叉驗證,前景將無(wú)限光明!
“現在的問(wèn)題在于,政府沒(méi)有動(dòng)力深入挖掘大數據的價(jià)值,而企業(yè)又拿不到有用的大數據!逼铠Q說(shuō),在我國,一些政府部門(mén)拿到其他部門(mén)的數據后不對社會(huì )開(kāi)放,先在政府內部共融共通,但事實(shí)是政府內部的信息共享都無(wú)法實(shí)現,更別提對社會(huì )和企業(yè)開(kāi)放了。
數據雜亂“放開(kāi)了也拿不走”
目前數據開(kāi)放共享主要面臨三個(gè)方面的問(wèn)題:一是數據條塊分割嚴重,服務(wù)推行困難;二是數據平臺缺乏統一標準,“一個(gè)部門(mén)一個(gè)樣,放開(kāi)了也拿不走”;三是一些數據資源豐富的部門(mén)不愿共享。
在采訪(fǎng)中,多家企業(yè)負責人向《經(jīng)濟參考報》記者反映,即使拿到公共大數據,但由于政府部門(mén)條線(xiàn)分割嚴重、缺乏數據存儲規范標準,這些數據十分雜亂,分析并加以利用的成本很高。
“很多記錄下來(lái)的數據沒(méi)有規范化,也沒(méi)有對數據存儲進(jìn)行設計,即使在同一個(gè)行業(yè),數據也是‘一人一個(gè)模樣’!卑俣却髷祿扛笨偛锰蘸A琳f(shuō),存儲語(yǔ)言不一樣很難融會(huì )貫通。例如醫療行業(yè)很多信息系統廠(chǎng)商記錄下來(lái)的數據根本沒(méi)有統一標準,要想合作,必須先弄清數據含義是什么,這樣做成本很高。
對此,龍信數據(北京)有限公司董事長(cháng)兼總裁李鈺說(shuō):“擁有者不一定覺(jué)得有用,看得懂、用得著(zhù)的不一定能擁有。政府開(kāi)放數據需要勇氣和決心,并落實(shí)到行動(dòng)上!
記者調查發(fā)現,目前,公共數據條塊分割嚴重,干擾數據匯聚。杭州市經(jīng)濟和信息化委員會(huì )副主任楊福頌說(shuō),杭州有20多個(gè)歸屬不同部門(mén)的信息中心,這些信息中心人為地形成一個(gè)個(gè)互不連通的“信息孤島”。天津開(kāi)發(fā)區城市管理局數字城管科科長(cháng)陳松說(shuō),天津政府部門(mén)的社區公益服務(wù)已在技術(shù)上實(shí)現了突破,通過(guò)智能手機和客戶(hù)端幾乎可以實(shí)現零成本的公益活動(dòng),但綜合管理體系需要工商、稅務(wù)、社區服務(wù)部門(mén)的聯(lián)合,難度較大。
同時(shí),各系統數據標準不統一,開(kāi)放共享成本大。寧波市智慧城市建設協(xié)調處處長(cháng)聶聰迪說(shuō),政府大數據目前沒(méi)有統一標準,地方和各個(gè)系統都在制定自己的數據標準!暗胤絽^域有塊上的標準,衛生系統等有條上的標準,條塊標準遇到一起需要數據共享,再修改標準將耗費巨大成本”。
此外,部門(mén)利益至上,制約大數據開(kāi)放與應用。天津開(kāi)發(fā)區華納社區是中央政法委“全國綜治信息系統”試點(diǎn)單位,目前全區的殘疾人、吸毒人員、重點(diǎn)關(guān)愛(ài)人群、獨生子女等的數據均實(shí)現共享,但諸如流動(dòng)人口、房管信息等數據較難獲得。
武漢市信息產(chǎn)業(yè)辦公室主任黃長(cháng)清說(shuō),武漢市政府機構網(wǎng)站可歸為520個(gè)數據集,數量已超北京、上海公布的數量,但有些數據資源豐富的單位公開(kāi)和共享動(dòng)力不足,給跨行業(yè)數據匯聚整合造成困難。
政府公開(kāi)數據須算經(jīng)濟賬
專(zhuān)家認為,開(kāi)放大數據的作用就像當年實(shí)行的“耕者有其田”,這將是生產(chǎn)關(guān)系的一次大變革,會(huì )促進(jìn)生產(chǎn)力的大解放。
“作為公共財產(chǎn)的政府數據,本質(zhì)上屬于人民,應該在保障國家安全、個(gè)人隱私和企業(yè)商業(yè)秘密的前提下,讓這些數據回到人民群眾中去!敝袊こ淘涸菏、中國計算機學(xué)會(huì )大數據專(zhuān)家委員會(huì )主任李國杰說(shuō)。
《經(jīng)濟參考報》記者了解到,美國、英國、日本等發(fā)達國家在發(fā)展大數據產(chǎn)業(yè)之初,便不遺余力地開(kāi)放公共大數據。美國數據開(kāi)放網(wǎng)站目前已有超過(guò)37萬(wàn)個(gè)數據集、1200多個(gè)數據工具,這些數據來(lái)自170多個(gè)機構。英國政府專(zhuān)門(mén)建立“數據英國”網(wǎng)站,已將政府開(kāi)支、政府部門(mén)財務(wù)報告等數據公開(kāi)。
李國杰認為,政府應當公開(kāi)的數據主要分為三類(lèi):一是操作業(yè)務(wù)信息,主要指政府各部門(mén)間辦公流程所需的數據,如辦理銀行貸款時(shí)所需查詢(xún)的信用數據等;二是管理信息,主要面向各類(lèi)業(yè)務(wù)的管理者;三是研究和決策信息,主要面向政策研究人員、企業(yè)管理人員等,主要從數據中發(fā)現新規律、新問(wèn)題,進(jìn)而制定新政策。
李國杰還提出,政府公開(kāi)共享大數據,不是單純登記政府現有數據,而應以公眾需求為導向,以促進(jìn)國家治理變革為目的。同時(shí),要算經(jīng)濟賬,不是越多越好,而要能帶來(lái)信息化成本的節約。英國政府通過(guò)高效運用大數據技術(shù),每年約節省政府支出330億英鎊。
提升大數據治理“有所為有所不為”
業(yè)內人士建議,在開(kāi)放公共數據方面,處理好“政府的手”和“市場(chǎng)的手”可以事半功倍。
金蝶國際軟件集團有限公司高級副總裁張良杰說(shuō),政府開(kāi)放數據相當于鋪路修橋,方便所有人的通行,但不能借此插手大數據企業(yè)的經(jīng)營(yíng)。政府需要做的是增值服務(wù),比如建設大數據運營(yíng)服務(wù)中心,幫助企業(yè)進(jìn)行人才培訓等,其他的則可以放手讓企業(yè)去做,推動(dòng)大數據良性生態(tài)鏈的建設,自然形成集聚效應。
李鈺說(shuō),政府在應用大數據提升治理能力方面要“有所為有所不為”,沒(méi)必要什么事情都由政府做,可以通過(guò)購買(mǎi)服務(wù)等形式培育相關(guān)產(chǎn)業(yè),發(fā)展專(zhuān)業(yè)服務(wù)。例如,可以推動(dòng)產(chǎn)學(xué)研結合,委托企業(yè)、院校研究一些重要課題,圍繞著(zhù)政府公開(kāi)的大數據做出有意義的成果?紤]制定合理的產(chǎn)業(yè)振興政策,對擁有核心技術(shù)和應用方案的企業(yè)給予鼓勵等。
針對政府各部門(mén)和企業(yè)普遍反映的政府數據共享和開(kāi)放問(wèn)題,《經(jīng)濟參考報》記者在多地采訪(fǎng)發(fā)現,一些地方政府已經(jīng)出臺法律法規,明確共享邊界。杭州市經(jīng)濟和信息化委員會(huì )副主任楊福頌認為,數據共享不是無(wú)條件的,數據開(kāi)放共享不應由某個(gè)部門(mén)說(shuō)了算,而是由多個(gè)部門(mén)組成的專(zhuān)門(mén)機構調研決定。為打破部門(mén)利益藩籬,《杭州市政務(wù)數據共享開(kāi)放指導意見(jiàn)》明確提出,原則上部門(mén)不能以涉密為由拒絕數據共享和業(yè)務(wù)協(xié)同,各部門(mén)數據是否涉密,由市信息化辦提請保密部門(mén)予以確認。
一些地方狠抓數據質(zhì)量,整合信息孤島。數據質(zhì)量參差不齊是很多地方政府整合數據時(shí)遭遇的突出問(wèn)題。對此,河南省2009年開(kāi)展“企業(yè)登記數據核查清理”專(zhuān)項行動(dòng),對164萬(wàn)戶(hù)企業(yè)、684萬(wàn)卷檔案、1.5億項數據進(jìn)行補錄和更新,建設了統一的大數據庫。2010年以來(lái),又核查251.9萬(wàn)戶(hù)市場(chǎng)主體,清理309.7萬(wàn)卷書(shū)式紙質(zhì)檔案,核對1305.5萬(wàn)個(gè)數據項。
有些地方新增了數據統一標準。寧波市智慧城市建設協(xié)調處處長(cháng)聶聰迪說(shuō),寧波新的體系建設都要求按照新標準進(jìn)行,舊標準數據能夠云化就云化,在協(xié)調統一試點(diǎn)個(gè)案的同時(shí),注重標準的研究設立。
對于數據開(kāi)放共享的推進(jìn)監督,九三學(xué)社中央科技委員鄔玉良建議,將政府部門(mén)間的信息共享納入績(jì)效考核,建立數據質(zhì)量評估機制;加強政府與大數據企業(yè)的溝通,設計數據采集標準、數據更新頻率等;鼓勵對政府公開(kāi)數據的分析應用,吸引相關(guān)企業(yè)從開(kāi)放數據中挖掘更多有價(jià)值的信息。
|
專(zhuān)家:應走出中國特色大數據治國之路 |
|
須加強核心技術(shù)和產(chǎn)品創(chuàng )新,避免重蹈國產(chǎn)操作系統研發(fā)覆轍 |
接受《經(jīng)濟參考報》記者采訪(fǎng)的多位專(zhuān)家認為,大數據既是資源,也是技術(shù),更是思維方式。大數據最主要的功能特征是預測、比較和實(shí)時(shí)監控。盡管目前國內外對大數據的定義、內涵和外延尚未統一認識,但普遍對大數據充滿(mǎn)期待。
據悉,大數據最簡(jiǎn)單的定義為大規模數據,基于互聯(lián)網(wǎng)技術(shù)大發(fā)展帶來(lái)的數據大規模增加,以及云計算所形成的強大存儲能力和分析能力而產(chǎn)生。美國白宮去年5月公布的《大數據:抓住機遇,保護核心價(jià)值》報告顯示,2011年全球總數據量為1.8億億字節,2013年達到4億億字節。
業(yè)內對大數據形成的共識是4v特征,即volume容量大、variety數據種類(lèi)多、velocity產(chǎn)生和更新速度快以及value價(jià)值高。
百度大數據部副總裁陶海亮認為,大數據是信息化發(fā)展到一定階段的體現,更多的生活生產(chǎn)以數據形式記錄下來(lái)。隨著(zhù)信息分析和數據挖掘技術(shù)的使用,這些生活數據有了用武之地。
地方官員和業(yè)內專(zhuān)家建議,做好頂層設計,轉變思維,推動(dòng)政府部門(mén)間數據共享和開(kāi)放,自主掌握大數據核心技術(shù),走出中國特色的大數據治國之路。
首先,要充分重視大數據發(fā)展戰略,做好頂層規劃設計。目前,全球發(fā)達國家多已充分認識到大數據時(shí)代的發(fā)展趨勢,美、英、日、澳等國都提出了國家大數據戰略。聯(lián)合國秘書(shū)長(cháng)執行辦公室早在2009年也啟動(dòng)了“全球脈動(dòng)”(Global Pulse)倡議項目,旨在推動(dòng)數字數據和快速數據收集和分析方式的創(chuàng )新。對此,九三學(xué)社中央科技委員鄔玉良建議將發(fā)展大數據上升為我國國家戰略,制定國家層面的大數據發(fā)展計劃,通過(guò)體制機制創(chuàng )新,盤(pán)活政府和社會(huì )資源,將數據資源轉化為生產(chǎn)力。
國家信息中心研究員寧家駿說(shuō),應從國家層面深入研究制定我國大數據資源采集、存儲、處理、分析、開(kāi)發(fā)、應用、服務(wù)等全鏈條發(fā)展戰略和發(fā)展路線(xiàn),從市場(chǎng)環(huán)境、技術(shù)裝備、標準體系、人才培養、政策法規等多方面統籌謀劃、綜合施策、超前部署,引導和推動(dòng)政府、企業(yè)和社會(huì )各界在大數據應用上形成合力、協(xié)調發(fā)展。
第二,轉變大而全思維,鼓勵企業(yè)單點(diǎn)突破。有專(zhuān)家認為,大數據治國在路徑選擇上應該轉變工業(yè)化大而全的思維,按照互聯(lián)網(wǎng)和大數據發(fā)展的內在規律,在發(fā)展初級階段單點(diǎn)突破,追求小而美。
2013年,“杭州政務(wù)云”項目建設探索外圍助推政府改革的方式,由中標的華數集團承擔政務(wù)云建設,各部門(mén)不再獨立購買(mǎi)軟、硬件設施,由杭州市經(jīng)信委整合全市需求統一購買(mǎi)云計算、存儲、數據庫和應用等基礎資源服務(wù),相關(guān)的系統開(kāi)發(fā)仍由各部門(mén)負責建設。目前,華數集團已完成政務(wù)云平臺階段性建設,向杭州22家單位45個(gè)項目提供云主機和RDS數據庫服務(wù)。
第三,完善政策環(huán)境,鼓勵大數據產(chǎn)業(yè)創(chuàng )新。數據交易市場(chǎng)是未來(lái)大數據產(chǎn)業(yè)發(fā)展不可或缺的重要環(huán)節,目前全球尚沒(méi)有成熟的數據交易市場(chǎng)。寧家駿建議,可在全國試點(diǎn)1至2個(gè)數據交易市場(chǎng),形成多級并存的大數據交易市場(chǎng)體系;探索開(kāi)展大數據的衍生產(chǎn)品交易,建立大數據投融資體系;鼓勵社會(huì )資本進(jìn)入大數據投資領(lǐng)域,同時(shí)完善大數據投資政策環(huán)境和退出機制;抓緊制定出臺政府數據開(kāi)放法規,保證政府數據在風(fēng)險可控原則下最大程度開(kāi)放等。
借助大數據治國必須加強核心技術(shù)和產(chǎn)品研發(fā),但專(zhuān)家提醒,要避免走國產(chǎn)操作系統研發(fā)的老路。事實(shí)證明,PC時(shí)代依靠政府資金研發(fā)的國產(chǎn)操作系統至今無(wú)法撼動(dòng)微軟的壟斷地位,如今的移動(dòng)互聯(lián)時(shí)代,要挑戰安卓的地位也非常困難。在國內外差距巨大的現實(shí)情況下,我國基礎軟件實(shí)現趕超,必須走合作開(kāi)源之路。
寧家駿認為,政府不應再定向支持某些企業(yè),應變“相馬為賽馬”、變資金扶持為市場(chǎng)引導,鼓勵有創(chuàng )新能力的企業(yè)都參與進(jìn)來(lái),積極利用開(kāi)源模式和開(kāi)放社區資源,形成我國大數據產(chǎn)業(yè)發(fā)展的開(kāi)源生態(tài)系統,盡快實(shí)現我國大數據技術(shù)的自主自控。