|
 |
|
新華社/路透 |
對于大多數人來(lái)說(shuō),“大數據”是一個(gè)陌生術(shù)語(yǔ),但它的威力已無(wú)所不在:信用卡公司追蹤客戶(hù)信息,能迅速發(fā)現資金異動(dòng),并向持卡人發(fā)出警示;能源公司利用氣象數據分析,可以輕松選定安裝風(fēng)輪機的理想地點(diǎn)……
牛津大學(xué)教授維克多·梅耶-舍恩伯格在其新書(shū)《大數據》中說(shuō),這是一場(chǎng)“革命”,將對各行各業(yè)帶來(lái)深刻影響,甚至改變人們的思維方式,但這同時(shí)也引發(fā)“數據暴政”的擔憂(yōu)。
商業(yè):提供“精準預測”
在一些公司、實(shí)驗室和政府機構,“數據”被捧為21世紀新型“石油”或“黃金”。一些統計學(xué)家、物理學(xué)家和所謂的數據科學(xué)家從中獲利豐厚,他們服務(wù)于大數據應用程序開(kāi)發(fā)公司,“藍色彼岸”便是其中之一。
“藍色彼岸”成立于5年前,目前有85名員工。經(jīng)理尤韋·魏斯介紹,公司利用自行開(kāi)發(fā)的軟件,分析超市刷卡記錄、天氣資訊、學(xué)校放假信息和交通報告等數據,為客戶(hù)提供“精準預測”。
例如,“藍色彼岸”發(fā)現,某些日子里,一家超市的牛奶、巧克力棒和蘋(píng)果的銷(xiāo)量大幅上升,而這一時(shí)間恰好與附近一家青年旅社里一群學(xué)生的到來(lái)相吻合。于是,公司搜集鄰近各州學(xué)校放假安排等資訊,利用軟件計算出某一特定時(shí)間可能到來(lái)的學(xué)生人數。
再如,“藍色彼岸”發(fā)現,如果遇到周三為節假日,其前后幾天小孩不用上學(xué),因此對面包片的需求量減少,“藍色彼岸”的存貨預訂系統會(huì )自動(dòng)做出相應調節。
此外,“藍色彼岸”幫助dm連鎖藥店計算最合理的員工人數,并為每家分店提供銷(xiāo)售預測報告。
德國郵購業(yè)巨頭奧托集團說(shuō),自從使用“藍色彼岸”的軟件,銷(xiāo)售預測準確度提高20%到40%。集團準備把該軟件應用推廣到旗下運動(dòng)品牌SportScheck,并收購“藍色彼岸”50%股權。
“大數據正在重塑整個(gè)經(jīng)濟,我們只是處于起步階段!蔽核拐f(shuō)。
醫療:開(kāi)啟個(gè)性化治療
位于柏林巴伯爾斯貝格地區的哈索·普拉特納研究所(HPI)可能成為數以百萬(wàn)計癌癥患者的希望。研究所二樓的計算機房常年保持低溫,以免價(jià)值150萬(wàn)歐元的處理器過(guò)熱。普通計算機只有1個(gè)處理器,但那里的每臺計算機有40個(gè)處理器,運算速度是傳統計算機的1000倍,甚至更快。
普拉特納是全球最大的企業(yè)管理和系統化商務(wù)解決方案供應商“思愛(ài)普”(SAP)的創(chuàng )始人,也是HPI的贊助人。他介紹說(shuō),HPI的漢娜數據庫技術(shù)始于一個(gè)名叫“SanssouciDB”的項目,由8個(gè)大學(xué)生創(chuàng )立,曾獲得創(chuàng )新大獎,如今已成為“內存儲處理”的代名詞。
HPI負責人、數學(xué)家克里斯托弗·邁內爾認為,該技術(shù)不僅有廣泛的商業(yè)前景,而且為癌癥治療提供機遇,“我們正站在個(gè)性化醫療的門(mén)檻上”。
邁內爾說(shuō),每一種腫瘤都不盡相同,這意味著(zhù)同樣的治療方法對不同人會(huì )產(chǎn)生不同效果。目前,為了給患者制定有針對性的治療方案,需花費數月破譯其基因組。但在HPI“超級大腦”的幫助下,破譯基因組只需要短短數秒。
此外,HPI的電腦可以從公共基因庫中精選所有信息,為每一個(gè)患者尋找到最合適他癥狀的治療方案!澳壳,這種搜索配對過(guò)程還需花費數月時(shí)間!边~內爾說(shuō)。
安全:抓賊反恐斗黑客
在美國加州圣克魯斯市一個(gè)地下車(chē)庫,一名小偷正在撬車(chē),卻被幾米開(kāi)外正在一輛車(chē)里吃午餐的警察逮了個(gè)正著(zhù)。這名警察并非碰巧出現在那里,而是根據一個(gè)計算機軟件的推薦在此守株待兔。
過(guò)去兩年里,這座城市的警察換班時(shí),都會(huì )根據長(cháng)官和軟件發(fā)出的指示外出巡邏。該軟件輸入了警方所有數據,不斷更新,用于計算何時(shí)何地可能發(fā)生夜盜、搶劫、偷車(chē)等犯罪行為,其中2/3切實(shí)發(fā)生了。
這一軟件由計算機專(zhuān)家喬治·莫勒和人類(lèi)學(xué)家杰弗里·布蘭廷漢姆聯(lián)合編寫(xiě),參照了預測地震余震的程序模式。圣克魯斯警察局副局長(cháng)史蒂夫·克拉克2011年得知這一創(chuàng )意,三人共同開(kāi)展測試。他們把圣克魯斯市8年來(lái)的犯罪記錄輸入程序,再加上其他潛在相關(guān)數據,比如天氣狀況、公園資訊和公交線(xiàn)路等。
“起初,很多人持懷疑態(tài)度,包括我自己,”克拉克說(shuō),“但數據本身證明其確實(shí)有效!睋榻B,使用犯罪預測系統一年后,夜盜案件減少11%,盜車(chē)案件減少8%,破案率大幅提升56%。
軍隊和情報機構也非常重視數據分析。比如,在搜尋本·拉丹的過(guò)程中,“大數據”就發(fā)揮了重要作用,正是數據庫分析讓調查人員把目光聚焦在巴基斯坦的阿伯塔巴德。
Splunk是情報界和軍方炙手可熱的軟件供應商。不久前,在科技記者評出的全球最具創(chuàng )意的公司中,Splunk名列第5,而谷歌僅列第11位。全球超過(guò)90個(gè)國家的政府、機構、企業(yè)在使用Splunk的應用軟件,包括美國五角大樓和國土安全部。
Splunk產(chǎn)品部高級副總裁圭多·施羅德說(shuō):“安全領(lǐng)域是‘大數據’應用增長(cháng)最快的領(lǐng)域之一!背龑Ω斗缸锖涂植乐髁x外,Splunk的軟件還能查明黑客攻擊等網(wǎng)絡(luò )犯罪。
警惕“數據暴政”
個(gè)性化服務(wù)是“大數據”應用程序魅力所在。比如,如果有人在“臉譜”上表示“喜歡”某款牛仔褲,當他下次進(jìn)入該店鋪時(shí),就可能收到店主給他發(fā)送的同品牌牛仔褲的打折信息。這看起來(lái)對零售商和消費者都有好處,但主張保護數據隱私的人卻認為,“大數據”理念其實(shí)與“專(zhuān)制獨裁”沒(méi)有區別。
為消除人們顧慮,許多公司強調他們收集、儲存、分析數據都是“匿名”的,但事實(shí)上可能并非如此。在線(xiàn)期刊《科學(xué)報道》近期一項研究顯示,每個(gè)人有自己的行動(dòng)模式,95%的人可能被識別。普林斯頓計算機科學(xué)家阿爾溫德·納拉亞南在其博客上說(shuō),可供分析的數據越多,就越不可能保持“匿名”,識別一個(gè)人只要33個(gè)字節的信息量。
紐約廣告商奧美的調查顯示,75%受訪(fǎng)者表示不希望企業(yè)存儲個(gè)人數據,90%反對企業(yè)追蹤自己的上網(wǎng)記錄。
在現代社會(huì ),一個(gè)更加迫切的問(wèn)題是:人們是否真的愿意接受一個(gè)“數字驅動(dòng)經(jīng)濟”的世界?在這個(gè)世界里,數據分析能預測你的孩子在學(xué)校表現如何,他將來(lái)適合怎樣的工作,誰(shuí)有多大幾率犯罪或得癌癥,電視臺和唱片公司能根據預測迎合觀(guān)眾或聽(tīng)眾的口味……但在這個(gè)一切都計算好的世界里,創(chuàng )意、靈感和驚喜在哪里?
互聯(lián)網(wǎng)哲學(xué)家葉夫根尼·莫羅佐夫對許多“大數據”應用程序背后的意識形態(tài)提出尖銳批評,警告即將發(fā)生“數據暴政”。他提出,那些“大數據”應用程序應當接受獨立審計人定期審查,以防權力濫用。