大數據時(shí)代的小反思
2012-07-06   作者:俞京平  來(lái)源:中國經(jīng)濟時(shí)報
 
【字號
  近來(lái),無(wú)數專(zhuān)家和媒體頻繁提到“大數據”時(shí)代已經(jīng)來(lái)臨,那么到底什么是大數據,僅從字面來(lái)理解,大數據的主要特點(diǎn)就是“大”:除了以往傳統方法獲取的數據外,新的數據來(lái)源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數據流。這股數據流摧毀了當前的數據監測和研究行業(yè),也徹底顛覆了人們的理解和想象。
  大數據何以如此之“大”?其“大”到底從何而來(lái)?要回答這個(gè)問(wèn)題,首先需要了解數據的來(lái)源,這里所提到的數據,出于企業(yè)營(yíng)銷(xiāo)的角度,我們暫且狹義地理解為消費者的行為數據。以往此類(lèi)數據的獲取大致有以下幾種途徑:一是根據產(chǎn)品的銷(xiāo)量及其分布特征來(lái)了解;二是采用問(wèn)卷調查的方法去獲取消費者的行為及態(tài)度意見(jiàn)等;三是通過(guò)觀(guān)察或訪(fǎng)談去獲取消費者行為數據?偠灾,在以往獲取數據的方法中,研究者占據主動(dòng)位置,消費者比較被動(dòng)。
  然而在大數據時(shí)代,消費者已經(jīng)主動(dòng)或者不自覺(jué)地把自己的行為信息以數據方式留在某處,新媒體技術(shù)無(wú)時(shí)無(wú)刻不在悄悄記錄我們的行為信息,這些信息所形成的數據只等待有心人來(lái)收集、分析和研判。所以在一定程度上,大數據時(shí)代最主要的數據獲取方法是通過(guò)新技術(shù)手段進(jìn)行的悄無(wú)聲息的觀(guān)察和記錄,而通過(guò)這種方式獲取的信息總量,要遠大于傳統方法收集的消費者數據。同時(shí)在此過(guò)程中,消費者更加主動(dòng)(雖然自己可能并未察覺(jué)),而研究者則被動(dòng)接收。
  大數據時(shí)代得以形成,有賴(lài)于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數據內容,就遠遠大于以往研究產(chǎn)生的數據。我們可以通過(guò)某個(gè)人的微博內容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀(guān)、消費觀(guān)等,甚至可以在其個(gè)人微博中發(fā)現此人關(guān)注的各類(lèi)品牌信息,以及對各品牌所持有的態(tài)度,所以大數據的價(jià)值是顯而易見(jiàn)的。
  上述內容還僅僅是橫向數據總量的不斷豐富和擴大,除此之外,數據的縱向拓展也成就了大數據時(shí)代。我們可以把以往的調查或觀(guān)察數據看作是一個(gè)橫截面的研究,每個(gè)消費者對應一系列數據點(diǎn),這樣兩個(gè)坐標軸共同構筑了一幅二維平面圖。但是在新媒體時(shí)代,消費者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標軸,把原來(lái)的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數據總量肯定遠遠大于原來(lái)的二維空間,這也是新媒體導致大數據時(shí)代到來(lái)的證明。
  中國古時(shí)以“羊大”為美,今天以數據量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內經(jīng)過(guò)測算再去撈針顯然更靠譜,它遠比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數據時(shí)代也是如此,我們真正需要的其實(shí)并不是大數據本身,而是這個(gè)大數據背后隱藏的我們想要獲取的情報性信息,而這樣的信息可能只占總體的萬(wàn)分之一,我們需要的只是這萬(wàn)分之一,其他大量信息對我們而言都是垃圾。從這個(gè)角度出發(fā),數據量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數據洪流之中。
  這就是今天輿情監測行業(yè)面臨的困境,筆者見(jiàn)過(guò)無(wú)數的輿情監測服務(wù)商,得意洋洋地夸口自己可以監測海量的信息來(lái)源,以及每天或每分鐘可以抓取無(wú)比龐大的信息內容,更有一些輿情監測機構開(kāi)始競爭誰(shuí)的監測覆蓋面更廣等。而這恰恰是輿情監測的誤區之一,在對以往輿情信息來(lái)源毫無(wú)了解的情況下,未經(jīng)前期調研規劃的輿情監測,獲取的信息量越大,得到的垃圾信息就越多。
  所以輿情監測并不是想當然的那么簡(jiǎn)單,它需要經(jīng)歷監測源的調研規劃、監測源的管理及權重賦值、監測信息及其屬性的抓取、輿情數據的分析挖掘和研判、輿情應對策略建議及應對效果評估這樣一個(gè)系列的流程環(huán)節,而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監測源的前期調研規劃作為第一環(huán)節顯得尤其重要,它直接決定著(zhù)數據獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監測項目,其監測范圍應該有所不同。
    大數據時(shí)代的到來(lái)帶給我們的另一個(gè)啟示是,輿情監測業(yè)務(wù)之間的合作應該大于競爭。假設企業(yè)A在做輿情監測,企業(yè)B也在做輿情監測,如果兩家監測能夠按上述所言做好前期調研規劃,那么兩者所獲取的監測內容重合度應該比較低,所以?xún)烧咧g并不存在激烈的競爭關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監測獲取的信息內容數據庫聯(lián)合起來(lái),則形成了一個(gè)比較完整的行業(yè)數據庫。換一種思路來(lái)理解,也就是說(shuō)如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監測內容數據庫,每家企業(yè)從中篩選過(guò)濾出自己所需內容即可,這樣既降低了成本,又提高了精確性,其多方共贏(yíng)的優(yōu)勢就能顯現出來(lái)。
  大數據時(shí)代顯然給我們帶來(lái)不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認真反思如何正確挖掘出大數據的最大效用,以便我們在大數據的海洋里游刃有余,而不是被大數據洪流沖擊得迷失了方向。    近來(lái),無(wú)數專(zhuān)家和媒體頻繁提到“大數據”時(shí)代已經(jīng)來(lái)臨,那么到底什么是大數據,僅從字面來(lái)理解,大數據的主要特點(diǎn)就是“大”:除了以往傳統方法獲取的數據外,新的數據來(lái)源層出不窮源源不斷,形成一個(gè)隨時(shí)間變化的巨大數據流。這股數據流摧毀了當前的數據監測和研究行業(yè),也徹底顛覆了人們的理解和想象。
    大數據何以如此之“大”?其“大”到底從何而來(lái)?要回答這個(gè)問(wèn)題,首先需要了解數據的來(lái)源,這里所提到的數據,出于企業(yè)營(yíng)銷(xiāo)的角度,我們暫且狹義地理解為消費者的行為數據。以往此類(lèi)數據的獲取大致有以下幾種途徑:一是根據產(chǎn)品的銷(xiāo)量及其分布特征來(lái)了解;二是采用問(wèn)卷調查的方法去獲取消費者的行為及態(tài)度意見(jiàn)等;三是通過(guò)觀(guān)察或訪(fǎng)談去獲取消費者行為數據?偠灾,在以往獲取數據的方法中,研究者占據主動(dòng)位置,消費者比較被動(dòng)。
    然而在大數據時(shí)代,消費者已經(jīng)主動(dòng)或者不自覺(jué)地把自己的行為信息以數據方式留在某處,新媒體技術(shù)無(wú)時(shí)無(wú)刻不在悄悄記錄我們的行為信息,這些信息所形成的數據只等待有心人來(lái)收集、分析和研判。所以在一定程度上,大數據時(shí)代最主要的數據獲取方法是通過(guò)新技術(shù)手段進(jìn)行的悄無(wú)聲息的觀(guān)察和記錄,而通過(guò)這種方式獲取的信息總量,要遠大于傳統方法收集的消費者數據。同時(shí)在此過(guò)程中,消費者更加主動(dòng)(雖然自己可能并未察覺(jué)),而研究者則被動(dòng)接收。
    大數據時(shí)代得以形成,有賴(lài)于新媒體的飛速發(fā)展,比如微博每天產(chǎn)生的數據內容,就遠遠大于以往研究產(chǎn)生的數據。我們可以通過(guò)某個(gè)人的微博內容分析,去嘗試了解這個(gè)人的基本人口特征,以及其價(jià)值觀(guān)、消費觀(guān)等,甚至可以在其個(gè)人微博中發(fā)現此人關(guān)注的各類(lèi)品牌信息,以及對各品牌所持有的態(tài)度,所以大數據的價(jià)值是顯而易見(jiàn)的。
    上述內容還僅僅是橫向數據總量的不斷豐富和擴大,除此之外,數據的縱向拓展也成就了大數據時(shí)代。我們可以把以往的調查或觀(guān)察數據看作是一個(gè)橫截面的研究,每個(gè)消費者對應一系列數據點(diǎn),這樣兩個(gè)坐標軸共同構筑了一幅二維平面圖。但是在新媒體時(shí)代,消費者每時(shí)每刻的行為信息均加上了一個(gè)新的時(shí)間坐標軸,把原來(lái)的二維平面變成了一個(gè)三維空間,這個(gè)三維空間的數據總量肯定遠遠大于原來(lái)的二維空間,這也是新媒體導致大數據時(shí)代到來(lái)的證明。
    中國古時(shí)以“羊大”為美,今天以數據量“大”就是“好”嗎?恐怕事實(shí)并非如此。這就好比大海撈針,如果你知道針掉下去的位置以及海水的流動(dòng)方向,那么在這個(gè)范圍內經(jīng)過(guò)測算再去撈針顯然更靠譜,它遠比從整個(gè)大海中一點(diǎn)點(diǎn)搜索要更高效。大數據時(shí)代也是如此,我們真正需要的其實(shí)并不是大數據本身,而是這個(gè)大數據背后隱藏的我們想要獲取的情報性信息,而這樣的信息可能只占總體的萬(wàn)分之一,我們需要的只是這萬(wàn)分之一,其他大量信息對我們而言都是垃圾。從這個(gè)角度出發(fā),數據量越大,其中垃圾信息也就越多,這些令人眼花繚亂的垃圾信息,把我們真正想要的信息給深深地埋在數據洪流之中。
    這就是今天輿情監測行業(yè)面臨的困境,筆者見(jiàn)過(guò)無(wú)數的輿情監測服務(wù)商,得意洋洋地夸口自己可以監測海量的信息來(lái)源,以及每天或每分鐘可以抓取無(wú)比龐大的信息內容,更有一些輿情監測機構開(kāi)始競爭誰(shuí)的監測覆蓋面更廣等。而這恰恰是輿情監測的誤區之一,在對以往輿情信息來(lái)源毫無(wú)了解的情況下,未經(jīng)前期調研規劃的輿情監測,獲取的信息量越大,得到的垃圾信息就越多。
    所以輿情監測并不是想當然的那么簡(jiǎn)單,它需要經(jīng)歷監測源的調研規劃、監測源的管理及權重賦值、監測信息及其屬性的抓取、輿情數據的分析挖掘和研判、輿情應對策略建議及應對效果評估這樣一個(gè)系列的流程環(huán)節,而不僅僅是要求抓取的信息量越大越好。在這樣的流程體系中,輿情監測源的前期調研規劃作為第一環(huán)節顯得尤其重要,它直接決定著(zhù)數據獲取的速率以及抓取信息的有效性、可用性。所以不同的輿情監測項目,其監測范圍應該有所不同。
    大數據時(shí)代的到來(lái)帶給我們的另一個(gè)啟示是,輿情監測業(yè)務(wù)之間的合作應該大于競爭。假設企業(yè)A在做輿情監測,企業(yè)B也在做輿情監測,如果兩家監測能夠按上述所言做好前期調研規劃,那么兩者所獲取的監測內容重合度應該比較低,所以?xún)烧咧g并不存在激烈的競爭關(guān)系。相反,如果企業(yè)A、企業(yè)B、企業(yè)C……多家企業(yè)把監測獲取的信息內容數據庫聯(lián)合起來(lái),則形成了一個(gè)比較完整的行業(yè)數據庫。換一種思路來(lái)理解,也就是說(shuō)如果多家企業(yè)可以聯(lián)合建立一個(gè)共享的輿情監測內容數據庫,每家企業(yè)從中篩選過(guò)濾出自己所需內容即可,這樣既降低了成本,又提高了精確性,其多方共贏(yíng)的優(yōu)勢就能顯現出來(lái)。
    大數據時(shí)代顯然給我們帶來(lái)不少便利之處,但是在盲目的歡呼和一時(shí)的激動(dòng)之后,我們更需要認真反思如何正確挖掘出大數據的最大效用,以便我們在大數據的海洋里游刃有余,而不是被大數據洪流沖擊得迷失了方向。
  凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬經(jīng)濟參考報社,未經(jīng)經(jīng)濟參考報社書(shū)面授權,不得以任何形式刊載、播放。
 
相關(guān)新聞:
· 大數據時(shí)代的結構和解構 2012-06-27
· “大數據”蘊藏“大財富” 2012-06-15
· 樂(lè )視網(wǎng)三大數據遭質(zhì)疑 釋疑乏力股價(jià)跌停 2012-04-28
· 大數據時(shí)代微博商業(yè)模式變革 2012-04-23
· 五大數據看走勢 解讀政府工作報告關(guān)鍵數據 2011-03-06
 
頻道精選:
·[財智]誠信缺失 家樂(lè )福超市多種違法手段遭曝光·[財智]歸真堂創(chuàng )業(yè)板上市 “活熊取膽”引各界爭議
·[思想]夏斌:人民幣匯率不能一浮了之·[思想]劉宇:轉型,還須變革戶(hù)籍制度
·[讀書(shū)]《歷史大變局下的中國戰略定位》·[讀書(shū)]秦厲:從迷思到真相
 
關(guān)于我們 | 版權聲明 | 聯(lián)系我們 | 媒體刊例 | 友情鏈接
經(jīng)濟參考報社版權所有 本站所有新聞內容未經(jīng)經(jīng)濟參考報協(xié)議授權,禁止轉載使用
新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號
Copyright 2000-2010 XINHUANET.com All Rights Reserved.京ICP證010042號
在线精品自偷自拍无码琪琪|国产普通话对白视频二区|巨爆乳肉感一区二区三区|久久精品无码专区免费东京热|亚洲中文色欧另类欧美