大數據:在路上•晃晃悠悠
2012-12-12   作者:周濤  來(lái)源:經(jīng)濟參考網(wǎng)
分享到:
【字號
    接下這本翻譯的時(shí)候,我的目標是做到110%的好。因為作者畢竟不如我們每天在一線(xiàn)與數據廝殺搏斗,其愛(ài)其恨都更深刻。特別地,我們可以為中文的讀者補充很多中國的例子和參考資料。很遺憾,我們最終只做到了90%,應該補充的一些材料還沒(méi)有整理好,遣詞造句也多有生硬疏忽之處。如果再給我一個(gè)月的時(shí)間,就可以有我預想的110%甚至120%。為什么現在把這個(gè)版本呈現給諸位呢?一是因為我們的努力使得本書(shū)中譯本的出版和英文原版完全同步,單從獲取知識的角度講,我們一點(diǎn)不比美國的讀者慢!二是我相信作者在書(shū)中的一個(gè)重要觀(guān)點(diǎn),就是大數據時(shí)代,要允許一點(diǎn)點(diǎn)的錯誤和不完美,因為效率可能更加重要!留下一些可供提高的地方,也使得我們的每一次印刷,都能夠與以前有所不同。
    這本書(shū)是200%的好,因此90%的譯本也絕對值得一讀。作者首先拋出了大數據時(shí)代處理數據理念上的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果;接著(zhù)從萬(wàn)事萬(wàn)物數據化和數據交叉復用的巨大價(jià)值兩個(gè)方面講述驅動(dòng)大數據戰車(chē)向前滾動(dòng)在材質(zhì)和智力方面的最根本動(dòng)力;最后,作者冷靜描繪了大數據帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數據安全隱私、信息公正公開(kāi)等等問(wèn)題。
    國內最近也出版了一些大數據方面的著(zhù)作,可以和本書(shū)互為補充。鄭毅的《證析》對于數據通過(guò)交叉復用體現的新價(jià)值、大數據戰略在企業(yè)和政府執行層面的流程以及大數據科學(xué)家這一新職位和圍繞這個(gè)職位的能力和責任給出了最深刻最具體的描述;子沛的《大數據》對于數據的公正性、公平性以及信息和數據管理等方面理念、政策和執行的變化,特別是美國在這方面的進(jìn)展,給出了完整的介紹;蘇萌、林森和我合著(zhù)的《個(gè)性化:商業(yè)的未來(lái)》則對大數據時(shí)代最重要的技術(shù),個(gè)性化技術(shù),以及與之相關(guān)的新商業(yè)模式給出了從理念到技術(shù)細節的全景工筆?偟膩(lái)說(shuō),這三本書(shū)都針對本書(shū)的某一局部給出了更深刻的介紹和洞見(jiàn),也各有明顯超出本書(shū)的優(yōu)點(diǎn),但三本之和也無(wú)法囊括本書(shū)的菁華,亦缺乏本書(shū)的宏大視野。
    簡(jiǎn)單地說(shuō),這本書(shū)好在三個(gè)地方。一是觀(guān)點(diǎn)擲地有聲,絕非主流媒體上若干討論的簡(jiǎn)單匯總和平均,更不是一個(gè)宏大概念面前曖昧的叫好聲。讀者可能對其中一些觀(guān)點(diǎn)不認同,但是讀完之后不可能一個(gè)都記不住。二是觀(guān)念高屋建瓴,作者試圖從很多實(shí)例和經(jīng)驗,包括歷史事件中萃取出普適性的觀(guān)念,而不僅僅是適用于幾個(gè)特定情況下的案例分析。三是例子豐富翔實(shí),不大的篇幅包括了上百個(gè)學(xué)術(shù)和商業(yè)的實(shí)例。三點(diǎn)近乎完美地結合起來(lái),體現了作者駕馭大問(wèn)題的能力和豐富的知識,以及,可能更重要地,作者渴求立言立說(shuō)的野心!所以說(shuō),這本書(shū)絕對不是一堆枯燥的綱要,更不是一本巨厚的雜志。
    我在這里拼命叫好,是為了更多賣(mài)這本書(shū),不代表作者的所有觀(guān)點(diǎn)都是絕對真理。舉個(gè)例子,我本人對于大數據時(shí)代“相關(guān)關(guān)系比因果關(guān)系更重要”這個(gè)觀(guān)點(diǎn)就不認同。有了機器學(xué)習,特別是集成學(xué)習,我們解決問(wèn)題的方式變成了訓練所有可能的模型和擬合所有可能的參數——問(wèn)題從一個(gè)端口進(jìn)去,答案從另一個(gè)端口出來(lái),中間則是一個(gè)黑匣子,因為沒(méi)有人能夠從成千上萬(wàn)的參數擬合值里面讀到“科學(xué)”,我們讀到的只是“計算機工程”。與其說(shuō)大數據讓我們重視相關(guān)勝于因果,不如說(shuō)機器學(xué)習和以結果為導向的研究思路讓我們變得這樣。那么大數據是不是都這樣了,其實(shí)很多時(shí)候恰恰相反。想想瑞士日內瓦的強子對撞機,我們在上面捕獲了人類(lèi)有史以來(lái)最大規模的單位時(shí)間數據。我們是希望找到或者驗證某種相關(guān)關(guān)系嗎?不是!我們試圖回答地,正是人類(lèi)所能問(wèn)出的最偉大的關(guān)于因果聯(lián)系的問(wèn)題:希格斯玻色子是否存在,我們的宇宙是否有可能用標準模型刻畫(huà)?這個(gè)問(wèn)題的最終答案,將打破人和神的界限!認為相關(guān)重于因果,是某些有代表性的大數據分析手段(譬如機器學(xué)習)里面內稟的實(shí)用主義的魅影,絕非大數據自身的訴求。從小處講,作者試圖避免的“數據的獨裁”和“錯誤的前提導致錯誤的結論”,其解決之道恰在于挖掘因果邏輯而非相關(guān)性;從大處講,放棄對因果性的追求,就是放棄了人類(lèi)凌駕于計算機之上的智力優(yōu)勢,是人類(lèi)自身的放縱和墮落。如果未來(lái)某一天機器和計算完全接管了這個(gè)世界,那么這種放棄就是末日之始。
    蘇珊·朗格在《哲學(xué)新視野》一書(shū)中說(shuō):“某些觀(guān)念有時(shí)會(huì )以驚人的力量給知識狀況帶來(lái)巨大的沖擊。由于這些觀(guān)念能一下子解決許多問(wèn)題,所以,它們似乎將有希望解決所有基本問(wèn)題,澄清所有不明了的疑點(diǎn)。每個(gè)人都迅速抓住它們,作為進(jìn)入某種新實(shí)證科學(xué)的法寶,作為可以用來(lái)建構一個(gè)綜合分析體系的概念軸心。這種‘宏大概念’突然流行起來(lái),一時(shí)間把幾乎所有的東西都擠到一邊!边@段話(huà)通常被認為是對當時(shí)“存在主義”和“精神分析法”這類(lèi)萬(wàn)能概念的善意批評,而如今特別適合作為一盆冷水潑在那些沒(méi)有任何深刻理解,卻月月日日分分秒秒穿行于各種“大數據嘉年華”的投資人、媒體人和創(chuàng )業(yè)者。希望本書(shū)給予各位的是一些實(shí)實(shí)在在的知識和思考,并且喚起各位安靜思索相關(guān)問(wèn)題的心境。大數據是一個(gè)很重要的概念,代表了很重要的趨勢,但我不希望它成為一種放之四海皆準的萬(wàn)能概念——因為越是萬(wàn)能的,就越是空洞的!人類(lèi)學(xué)家吉爾茲在其著(zhù)作《文化的解釋》中曾給出了一個(gè)樸素而冷靜的勸說(shuō):“試圖在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來(lái)!蔽蚁,這應該是所有人面對一個(gè)新領(lǐng)域或新概念時(shí)應有的態(tài)度。
    大數據的道路上沒(méi)有戈多,我們已經(jīng)在路上,晃晃悠悠。人類(lèi)的自由意志和諸神之下的尊嚴,會(huì )在這條道路上異化甚至消逝嗎?極目遠眺,不知道世界的盡頭,是否是一個(gè)冷酷的仙境!諸位為之奮斗吧,而我只想,做一個(gè),麥田里的守望者。
    以為序。
  凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬經(jīng)濟參考報社,未經(jīng)經(jīng)濟參考報社書(shū)面授權,不得以任何形式刊載、播放。
 
相關(guān)新聞:
· 外國人是這樣讀書(shū)的…… 2012-12-11
· 《毛澤東晚年讀書(shū)紀實(shí)》 2012-11-23
· 國外名校:從“教讀書(shū)”到“幫創(chuàng )業(yè)” 2012-11-22
· 馬蔚華巴曙松談金融與讀書(shū) 2012-08-21
· 【讀書(shū)】貴金屬的價(jià)值 2012-08-08
 
頻道精選:
·[財智]誠信缺失 家樂(lè )福超市多種違法手段遭曝光·[財智]歸真堂創(chuàng )業(yè)板上市 “活熊取膽”引各界爭議
·[思想]投資回升速度取決于融資進(jìn)展·[思想]全球債務(wù)危機 中國如何自處
·[讀書(shū)]《歷史大變局下的中國戰略定位》·[讀書(shū)]秦厲:從迷思到真相
 
關(guān)于我們 | 版權聲明 | 聯(lián)系我們 | 媒體刊例 | 友情鏈接
經(jīng)濟參考報社版權所有 本站所有新聞內容未經(jīng)經(jīng)濟參考報協(xié)議授權,禁止轉載使用
新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號
JJCKB.CN 京ICP備12028708號
在线精品自偷自拍无码琪琪|国产普通话对白视频二区|巨爆乳肉感一区二区三区|久久精品无码专区免费东京热|亚洲中文色欧另类欧美