近幾年,圍繞信息采集和處理的大數據技術(shù)逐漸成為發(fā)達國家一大科研熱點(diǎn)。英國從政府、研究機構到企業(yè)都已經(jīng)行動(dòng)起來(lái),以期搶占“數據革命”先機。但是,大數據技術(shù)仍不成熟,其面臨的信息收集不足、網(wǎng)絡(luò )容量有限、個(gè)人信息安全等問(wèn)題亟待解決。
政府大力支持技術(shù)研發(fā)
雖然經(jīng)濟不景氣,財政被迫收緊,但英國政府依然在大數據技術(shù)研發(fā)上投入大筆資金。今年年初,英國商業(yè)、創(chuàng )新和技能部宣布,將注資6億英鎊(1英鎊約合1.52美元)發(fā)展8類(lèi)高新技術(shù),其中大數據技術(shù)的研發(fā)與應用將獲得1.89億英鎊的資金支持。
負責科技事務(wù)的大臣戴維·威利茨說(shuō),政府將在基礎設施方面投入巨資,加強數據采集和分析,從而讓英國在“數據革命”中占得先機。
英國政府公布的一份報告稱(chēng),借助合理的投資,英國將為“數據革命”做充分準備。雖然從單純計算能力來(lái)看,英國并不具有突出優(yōu)勢,但報告認為,英國擅長(cháng)處理不同大數據集,強勢在數學(xué)和計算機科學(xué)領(lǐng)域。此外,英國在醫療保健、人口統計、農業(yè)和環(huán)境領(lǐng)域有著(zhù)世界上最好、最完整的數據集。
威利茨說(shuō),政府要利用好這些獨特優(yōu)勢,需要加大對關(guān)鍵研究領(lǐng)域的支持力度;成功的高新技術(shù)戰略不僅要著(zhù)眼于科研本身,更應該著(zhù)力于推動(dòng)新技術(shù)從實(shí)驗室到商業(yè)應用的轉化。
大數據已應用于多個(gè)領(lǐng)域
大數據技術(shù)創(chuàng )造價(jià)值的能力已經(jīng)顯現出來(lái)。一份行業(yè)報告顯示,英國政府通過(guò)高效使用公共大數據技術(shù),每年可節省約330億英鎊,相當于英國每人每年節省約500英鎊。
大數據之所以能創(chuàng )造巨大的價(jià)值是因為在商業(yè)、經(jīng)濟、政府管理等領(lǐng)域中,決策行為越來(lái)越取決于數據和分析,而不再是經(jīng)驗和直覺(jué)。大數據技術(shù)可以為決策提供一定的“預見(jiàn)參考”,成功的分析和預見(jiàn)能產(chǎn)生商業(yè)和經(jīng)濟價(jià)值。
英國最大的連鎖超市特易購已經(jīng)開(kāi)始運用大數據技術(shù)來(lái)采集并分析其客戶(hù)行為信息數據集,以此來(lái)制定有針對性的促銷(xiāo)計劃,并調整商品價(jià)格。這種“有的放矢”的營(yíng)銷(xiāo)和定價(jià)模式讓特易購找到了更加高效的盈利方法。
具體說(shuō)來(lái),特易購首先在大數據系統內給每個(gè)顧客確定一個(gè)編號,然后通過(guò)每位顧客的刷卡消費、填寫(xiě)調查問(wèn)卷、打客服電話(huà)等行為采集他們的相關(guān)數據,再用計算機系統建立特定模型,對每位顧客的海量數據進(jìn)行分析,得出特定顧客的消費習慣、近期可能的消費需求等結論。
對于特易購來(lái)說(shuō),這些技術(shù)的運用不僅提高了營(yíng)銷(xiāo)效率,還有助于整個(gè)集團其他業(yè)務(wù)的發(fā)展,并創(chuàng )造全新的商業(yè)模式。比如,在對每位顧客信用程度和相關(guān)風(fēng)險進(jìn)行準確評估的基礎上,特易購推出了自己的信用卡等金融服務(wù),擴展了自己的盈利鏈條。
5月初,英國首個(gè)綜合運用大數據技術(shù)的醫藥衛生科研中心在牛津大學(xué)成立。據介紹,這個(gè)研究中心總投資9000萬(wàn)英鎊,可容納600名科研人員,旨在通過(guò)搜集、存儲和分析大量醫療信息,確定新藥物的研發(fā)方向,從而減少藥物開(kāi)發(fā)成本,同時(shí)為發(fā)現新的治療手段提供線(xiàn)索。
英國首相卡梅倫在揭牌儀式上說(shuō),醫學(xué)研究新突破離不開(kāi)信息獲取與共享,而這一中心的成立有望給英國醫學(xué)研究和醫療服務(wù)帶來(lái)革命性變化,它將促進(jìn)醫療數據分析方面的新進(jìn)展,從而幫助科學(xué)家更好地理解人類(lèi)疾病并掌握其治療方法!
潛在問(wèn)題尚需解決
牛津大學(xué)統計學(xué)教授彼得·多納利對記者說(shuō),目前大數據技術(shù)的第一個(gè)瓶頸就是信息采集不足。
以牛津大學(xué)新成立的醫藥衛生科研中心為例,首先要有足夠的病人、藥物等相關(guān)信息,這是數據分析的基礎,然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業(yè)也有可能因為商業(yè)利益不愿共享藥物成分等敏感信息。
其次,要從海量信息中得出有用的結論,專(zhuān)業(yè)的數據分析必不可少。牛津大學(xué)教授羅里·柯林斯認為,采集到足夠信息后,需要由相關(guān)領(lǐng)域的專(zhuān)業(yè)人士與信息技術(shù)專(zhuān)家一起對數據進(jìn)行有針對性地歸納和分析,而這種跨學(xué)科、跨領(lǐng)域合作能否順利實(shí)現,是大數據技術(shù)實(shí)際應用中的重要問(wèn)題。
第三,在技術(shù)層面存在網(wǎng)絡(luò )容量有限的問(wèn)題,現有基礎設施無(wú)法滿(mǎn)足海量信息分析和處理的需求。因此,如何降低存儲成本以及提升應用價(jià)值就成為大數據所面臨的關(guān)鍵技術(shù)難題。
第四,人們的大量信息在無(wú)意識中被采集、分析,可能帶來(lái)社會(huì )問(wèn)題。英國劍橋大學(xué)心理測量學(xué)中心研究員米哈烏·科辛斯基指出,所有的技術(shù)使用者都應注意,大數據也意味著(zhù)大責任。
科辛斯基舉例說(shuō),僅從社交網(wǎng)絡(luò )上得到的個(gè)人統計信息,就可以建立起能夠自動(dòng)更新的模型,將這些成千上萬(wàn)看似不重要的數據聚合在一起,就能有效地推斷出個(gè)人特征。與任何偉大的技術(shù)一樣,這種推測功能既可以為善,也可以作惡。比如商家可能會(huì )把顧客玩弄于股掌之中,而圖謀不軌者掌握這些信息后甚至可能威脅到人們的安全。
科辛斯基建議,未來(lái)大數據的信息采集應遵循兩項原則:透明度和控制權。使用者首先要幫助用戶(hù)了解他們的哪些個(gè)人數據是公開(kāi)的,這些數據目前和潛在的用途是什么。對可用于推斷的數據,用戶(hù)應享有完全的控制權。