大數據開(kāi)放的價(jià)值與隱憂(yōu)
2012-07-10   作者:石劍峰  來(lái)源:東方早報
 
【字號

  涂子沛,知名專(zhuān)欄作家、信息管理專(zhuān)家,畢業(yè)于華中科技大學(xué)。赴美留學(xué)前,曾做過(guò)職業(yè)程序員,擔任過(guò)公安邊防巡邏艇的指揮官,也從事過(guò)政府統計工作,現居美國匹茲堡,是美國某軟件公司數據中心的主任。

    ■ 《大數據》作者涂子沛談不可阻擋的大數據浪潮
  小數據時(shí)代,可以研究個(gè)體但不能研究群體,因為只有關(guān)于個(gè)人的數據。而在大數據時(shí)代,人的行為都以數據形式存在,這里面就有很多商機。

  從中國的邊防警到美國的軟件公司數據中心主任,20年來(lái),涂子沛的工作一直跟數據處理有關(guān)。他在最近由廣西師范大學(xué)出版的《大數據:正在到來(lái)的數據革命》(下稱(chēng)《大數據》)一書(shū)中,以美國半個(gè)多世紀以來(lái)的信息開(kāi)放、技術(shù)創(chuàng )新歷史為例,談在這個(gè)大數據時(shí)代,政府該如何推動(dòng)信息公開(kāi),企業(yè)在其中有何商機,數據創(chuàng )新給民眾、政府、社會(huì )帶來(lái)的種種挑戰和變革。昨晚,涂子沛在上海以“不可阻擋的大數據浪潮”為題與讀者見(jiàn)面,并接受了專(zhuān)訪(fǎng)。
  大數據是與云計算同時(shí)興起的一個(gè)商業(yè)概念,從谷歌到騰訊,過(guò)去一年他們都在談大數據能帶來(lái)的商機。何為大數據?涂子沛有過(guò)一個(gè)簡(jiǎn)單的描述:“什么叫大數據,簡(jiǎn)單理解就是超大量的數據。到底多大才算大呢?我們一般認為按π為單位的數據就是大數據。π下面的單位就是G,一部電影大約一個(gè)G,一π就等于1024個(gè)G。你乘上π,1000多部電影那就算大數據了。我們再舉個(gè)形象的例子,現在美國國會(huì )圖書(shū)館是比較大的圖書(shū)館,所有的印刷品如果輸入電腦的話(huà),它才是幾十個(gè)π,基本上人類(lèi)的知識要是全部放在電腦里,也就是按π為單位!
  在這本《大數據》里,涂子沛要討論的是,大數據時(shí)代能夠幫助我們走向更自由的社會(huì )。因為信息社會(huì )最重要的資產(chǎn)是信息,信息的產(chǎn)生、信息的使用、信息的整合,這都是信息社會(huì )最重要的生產(chǎn)活動(dòng)。

    用數據說(shuō)話(huà),別用數據說(shuō)謊

  問(wèn):在全世界,哪個(gè)公司或哪個(gè)機構擁有最多的數據?
  涂子沛:
我在書(shū)中有一個(gè)圖表,是2009年美國各行業(yè)數據存儲量對比,其中排在第一位的是制造業(yè)企業(yè),第二位的就是政府。我們說(shuō)數據帝國的興起,美國聯(lián)邦政府首先就是一個(gè)數據帝國,它擁有前所未有的數據。當然Google、Facebook也有大量數據,但只是其中一個(gè)公司。我們有一個(gè)錯覺(jué),僅僅把互聯(lián)網(wǎng)數據當作數據,這是不全的。

  問(wèn):所以這本書(shū)最重要的主題是,推動(dòng)政府開(kāi)放數據?
  涂子沛:
數據開(kāi)放運動(dòng)為什么在政府部門(mén)開(kāi)啟?技術(shù)的開(kāi)放是一步步的,最早的開(kāi)放是代碼開(kāi)放,形成了1990年代的開(kāi)源運動(dòng)。這在當時(shí)有很大的爭議,比爾·蓋茨就曾反對代碼開(kāi)放,但最后代碼開(kāi)放都被接受了,大家也都在用開(kāi)源軟件。軟件由兩部分組成,一部分是代碼,一部分是數據,開(kāi)放完了代碼,接下來(lái)就是開(kāi)放數據。開(kāi)放代碼發(fā)生在私營(yíng)企業(yè)中,開(kāi)放數據則要看誰(shuí)擁有最多數據,當然是政府。那么政府開(kāi)放數據,首先開(kāi)放什么?當然是公共財政支出的數據。這種情況已經(jīng)在英、美出現。
  相比商業(yè)企業(yè),為什么政府要推動(dòng)大數據開(kāi)放,因為企業(yè)的數據是零散的、案例性質(zhì)的。大數據從三個(gè)層面發(fā)生影響:商業(yè)、政府和個(gè)人生活。因為政府擁有最多數據,應該首先開(kāi)放。奧巴馬在美國推行數據開(kāi)放運動(dòng),在全世界掀起一個(gè)數據開(kāi)放浪潮。大數據要發(fā)揮作用,不僅是收集、挖掘,目前最重要的是開(kāi)放。大數據可以從很多角度去談,我也談到了大數據怎么起源的,但我最關(guān)注的是,大數據真正要發(fā)揮作用是要開(kāi)放,否則就不會(huì )產(chǎn)生價(jià)值。開(kāi)放誰(shuí)來(lái)推動(dòng)?那就是政府。

  問(wèn):政府擁有那么多數據,但很多是不能開(kāi)放的。如何界定哪些數據可以開(kāi)放?
  涂子沛:
這里有兩條標準,首先是這些數據不能侵犯國家安全,其次是不能侵犯個(gè)人隱私。比如最先開(kāi)放的內容之一,有政府福利項目支出數據,但開(kāi)放時(shí)上面的名字都會(huì )抹掉。

  問(wèn):如何讓我們相信數據?
  涂子沛:
我之前有個(gè)講演,就是用數據說(shuō)話(huà),別用數據說(shuō)謊。很多報告里都有數據,但通常的情況是,這些數據常常成為說(shuō)謊的工具,成為任人打扮的小姑娘,F在經(jīng)常會(huì )出現的情況是,孤立地解釋數據。合理地來(lái)說(shuō),我們不僅僅是要公布一個(gè)數據,還要公布數據的來(lái)龍去脈,一個(gè)數據可以復制才是站得住腳的。只公布一個(gè)數據是不夠的,還要求數據背后的數據公布。一個(gè)公布的數據是很難判對錯的,數據之間要互證才可以避免偽造。這就是數據開(kāi)放的價(jià)值。不只是要公布一個(gè)孤立的GDP,更要開(kāi)放整個(gè)數據,可以讓所有人自己去算這個(gè)GDP數據怎么來(lái)的。

    用數據提高生產(chǎn)力

  問(wèn):大數據開(kāi)放的商機在哪里?
  涂子沛:
我們講到數據開(kāi)放,首先想到的是知情權和政府透明,但這只是一方面,F在推進(jìn)數據開(kāi)放,不再只是政府監督方面,而是要看是否有商業(yè)價(jià)值,如何用這些數據推進(jìn)生產(chǎn)?大數據時(shí)代標志著(zhù)人類(lèi)向知識時(shí)代的邁進(jìn)。美國的數據開(kāi)放運動(dòng),從數據中整合、發(fā)現新的知識,成為經(jīng)濟發(fā)展的動(dòng)力。比如沃爾瑪,在數據挖掘中發(fā)現,一來(lái)颶風(fēng)某些產(chǎn)品就會(huì )脫銷(xiāo),那么他們就去看颶風(fēng)按照哪些線(xiàn)路走,沿著(zhù)颶風(fēng)路線(xiàn)的那些沃爾瑪超市,就會(huì )把相應的商品調高倉儲量。
  在這個(gè)時(shí)代,因為大數據的存在,人的行為是可以研究的。以前,小數據時(shí)代,可以研究個(gè)體但不能研究群體,因為只有關(guān)于個(gè)人的數據。而在大數據時(shí)代,人的行為都以數據形式存在。這里面就有很多商機。通過(guò)研究消費者習慣,可以找到很多市場(chǎng)商機。就算在企業(yè)運營(yíng)中,優(yōu)化才能提高效率,減少成本,優(yōu)化就要基于數據。產(chǎn)品也離不開(kāi)數據,產(chǎn)品質(zhì)量控制就是以數據為支持的。大數據最根本的,就是促進(jìn)經(jīng)濟的發(fā)展,知識時(shí)代的特點(diǎn)就是信息和數據的整合產(chǎn)生新的價(jià)值。

  問(wèn):為什么直到現在,大家才開(kāi)始談數據的商機?
  涂子沛:
因為直到現在才有那么多數據可供研究。以前,保存數據很貴,現在很便宜;第二,以前收集不到那么多數據,現在每個(gè)人在互聯(lián)網(wǎng)上的行為都可以記錄下來(lái),F在數據庫就是資產(chǎn),如果有數據,就能掌握我的用戶(hù)。所以麥肯錫說(shuō),大數據是下一個(gè)創(chuàng )新、競爭、生產(chǎn)力提高的前沿。數據就是一種生產(chǎn)資料。

  問(wèn):我們在互聯(lián)網(wǎng)上留下那么多蹤跡和數據,誰(shuí)是數據的擁有者呢?
  涂子沛:
在數據開(kāi)放運動(dòng)中,英國提出了一個(gè)數據權問(wèn)題。個(gè)人的數據該由個(gè)人做主。你在超市購物,你會(huì )在那里留下大量消費記錄。英國的做法是,每個(gè)消費者登錄網(wǎng)站是可以看到自己的消費記錄的。谷歌在英國也簽了協(xié)議,要開(kāi)放相關(guān)的數據。谷歌已經(jīng)開(kāi)放了一部分。你的數據是你的,你是有權利看的。那政府的數據更有義務(wù)去看了,因為你的數據是拿著(zhù)納稅人的錢(qián)去收集的。這些是公共數據,本來(lái)就是公共資產(chǎn)。
  數據開(kāi)放之后,是面向社會(huì )大眾的開(kāi)放。任何人都可以使用,只要有能力都能創(chuàng )造新的商機。產(chǎn)生的新知識都是由精英壟斷,但現在每個(gè)人都可以接觸這些數據,誰(shuí)都可以做這些事情。

  問(wèn):但這只是一種理想,你的消費記錄,你的互聯(lián)網(wǎng)記錄,其實(shí)已經(jīng)隨意泄露。
  涂子沛:
信息時(shí)代,我個(gè)人能不能決定怎么發(fā)布數據,什么時(shí)候開(kāi)放,什么時(shí)候修改,但現在已經(jīng)失控了。無(wú)論是在美國還是中國,尤其是在中國,隱私權非常薄弱,個(gè)人信息被隨意買(mǎi)賣(mài)。

  問(wèn):個(gè)人留下的數據越多,它對你的掌握就越容易。大數據會(huì )成為老大哥嗎?
  涂子沛:
大數據是老大哥,這是不可避免的。美國想建中央數據銀行,把每個(gè)人從出生到墳墓的記錄整合起來(lái),后來(lái)很多組織反對。經(jīng)過(guò)許多博弈,美國政府還是放棄了,但對政府來(lái)說(shuō),他們很想建立這樣一個(gè)“銀行”。

  凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬經(jīng)濟參考報社,未經(jīng)經(jīng)濟參考報社書(shū)面授權,不得以任何形式刊載、播放。
 
相關(guān)新聞:
· 新華讀書(shū)“六月十大好書(shū)”揭榜 2012-07-09
· 《讀書(shū)很好》 2012-07-09
· 牽手"三秦書(shū)月青年讀書(shū)節" 2012-05-14
· “2012讀書(shū)盛典”電視晚會(huì )舉辦 2012-05-08
· 世界讀書(shū)日 讓讀書(shū)成為干部第一愛(ài)好 2012-04-23
 
頻道精選:
·[財智]誠信缺失 家樂(lè )福超市多種違法手段遭曝光·[財智]歸真堂創(chuàng )業(yè)板上市 “活熊取膽”引各界爭議
·[思想]夏斌:人民幣匯率不能一浮了之·[思想]劉宇:轉型,還須變革戶(hù)籍制度
·[讀書(shū)]《歷史大變局下的中國戰略定位》·[讀書(shū)]秦厲:從迷思到真相
 
關(guān)于我們 | 版權聲明 | 聯(lián)系我們 | 媒體刊例 | 友情鏈接
經(jīng)濟參考報社版權所有 本站所有新聞內容未經(jīng)經(jīng)濟參考報協(xié)議授權,禁止轉載使用
新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號
Copyright 2000-2010 XINHUANET.com All Rights Reserved.京ICP證010042號
在线精品自偷自拍无码琪琪|国产普通话对白视频二区|巨爆乳肉感一区二区三区|久久精品无码专区免费东京热|亚洲中文色欧另类欧美