因為關(guān)注大數據,也寫(xiě)過(guò)若干關(guān)于大數據的文章,做過(guò)若干關(guān)于大數據的演講,所以對有關(guān)這一主題的論文和書(shū)籍非常有興趣。過(guò)去幾年,在這方面讀過(guò)十幾本書(shū),上百篇論文和文章。相對而言,舍恩伯格的《大數據時(shí)代》是迄今為止我讀過(guò)的最好的一本專(zhuān)著(zhù),中英文都算上。
此書(shū)的一大貢獻是在大數據方興未艾,眾說(shuō)紛紜的時(shí)刻,進(jìn)一步闡述和厘清了大數據的基本概念和特點(diǎn),這對許多以為大數據就是數據大的人來(lái)說(shuō)很有幫助。
在人類(lèi)歷史長(cháng)河中,即使是現代社會(huì )日新月異的發(fā)展中,人們還主要是依賴(lài)抽樣數據,局部數據,片面數據,甚至是在無(wú)法獲得實(shí)證數據的時(shí)候純粹依賴(lài)經(jīng)驗,理論,假設和價(jià)值觀(guān)去發(fā)現未知領(lǐng)域的規律。所以,人們對世界的認識往往是表面的,膚淺的,簡(jiǎn)單的,扭曲的或者是無(wú)知的。舍恩伯格指出,大數據時(shí)代的來(lái)臨使人類(lèi)第一次有機會(huì )和條件在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數據,完整數據和系統數據,深入探索現實(shí)世界的規律,獲取過(guò)去不可能獲取的知識,得到過(guò)去無(wú)法企及的商機。
由于大數據的出現,使得通過(guò)數據分析獲得知識,商機和社會(huì )服務(wù)能力從以往局限于少數象牙塔之中的學(xué)術(shù)精英圈子擴大到普通的機構,企業(yè)和政府部門(mén)。門(mén)檻的降低直接導致了數據的容錯率提高,成本的降低,但正如舍恩伯格所強調的,最重要的是人們可以從對于因果關(guān)系的追求中在很大程度上解脫出來(lái),轉而將注意力放在相關(guān)關(guān)系的發(fā)現和使用上。只要發(fā)現兩個(gè)現象之間存在顯著(zhù)相關(guān)性就可以創(chuàng )造巨大的經(jīng)濟或社會(huì )效益,而弄清二者為什么相關(guān)可以留待學(xué)者們慢慢研究。大數據之所以可能成為一個(gè)“時(shí)代”,在很大程度上是因為這是一個(gè)可以由社會(huì )各界廣泛參與,八面出擊,處處結果的社會(huì )運動(dòng),而不僅僅是少數專(zhuān)家學(xué)者的研究對象。
大數據將逐漸成為現代社會(huì )的基礎設施的一部分,和公路、鐵路、港口、水電和通訊網(wǎng)絡(luò )一樣不可或缺。但就其價(jià)值特性而言,大數據卻和這些物理化的基礎設施不同,不會(huì )因為人們的使用而折舊和貶值。例如,一組DNA可能會(huì )死亡或毀滅,但數據化的DNA卻永存。所以,舍恩伯格贊同許多物理學(xué)家的看法,世界的本質(zhì)就是數據。因此,大數據時(shí)代的經(jīng)濟學(xué),政治學(xué),社會(huì )學(xué)和許多科學(xué)門(mén)類(lèi)會(huì )發(fā)生巨大的甚至是本質(zhì)上的變化和發(fā)展,進(jìn)而影響人類(lèi)的價(jià)值體系,知識體系和生活方式。哲學(xué)史上爭論不休的世界可知論和不可知論將會(huì )轉變?yōu)閷?shí)證科學(xué)中的具體問(wèn)題?芍允墙^對的,無(wú)事無(wú)物不可知;不可知性是相對的,是尚未知道的意思。
對于不是網(wǎng)絡(luò )業(yè),IT業(yè)和從事數據分析和使用的讀者,本書(shū)的一大好處是通俗易懂,通過(guò)具體實(shí)例說(shuō)明問(wèn)題,有助于人們的理解和聯(lián)想。在時(shí)限上,作者概括了直到2012年7月大數據方向上的最新發(fā)展,避免了許多同類(lèi)作品中存在的例證過(guò)于陳舊,視野相對狹窄的毛病。
作為一位生活在歐美現代社會(huì )中的學(xué)者,舍恩伯格是把民主,開(kāi)放和理性作為已知前提討論大數據革命的。這對生活在發(fā)展中國家,社會(huì )現代化程度有限的讀者來(lái)說(shuō),也許是個(gè)遺憾,因為書(shū)中描述的許多已經(jīng)發(fā)生的事例可能更像是神話(huà)。沒(méi)有市場(chǎng)經(jīng)濟制度和法治體系作為基礎支撐,大數據很可能成為發(fā)達國家在下一輪全球化競爭中的利器,而發(fā)展中國家依然處于被動(dòng)依附的狀態(tài)之中。整個(gè)世界可能被割裂為大數據時(shí)代,小數據時(shí)代和無(wú)數據時(shí)代。
處于發(fā)展中國家前列的中國,目前正面臨著(zhù)一個(gè)重大的歷史抉擇關(guān)口。應該說(shuō),在過(guò)去三十余年的時(shí)間里,中國在快速走向工業(yè)化,信息化,網(wǎng)絡(luò )化方面交出了一份不錯的成績(jì)單。適逢世界走向數據化,邁入大數據時(shí)代的時(shí)刻,無(wú)論對個(gè)人,企業(yè),還是對社會(huì )和國家,都有認真理解,嚴肅決策的必要性和緊迫性。哪怕僅從這一點(diǎn)考慮,讀讀這本書(shū)是很值得的。