大數據:為華文世界提出一個(gè)重要話(huà)題
|
|
|
2012-07-10 作者:許倬云 來(lái)源:經(jīng)濟參考網(wǎng)
|
|
|
【字號
大
中
小】 |
涂子沛先生的新著(zhù)《大數據》,已經(jīng)完成,是一部300多頁(yè)的大作。最近他將這本書(shū)的打樣稿送來(lái)給我看,并且要求我作序文?上У氖,我將要遠行,而他索序甚急,我只能在瀏覽一遍之后,發(fā)抒自己一些感想。至于細細咀嚼和消化這本有趣作品的內容,必須要在一兩個(gè)月以后,也就趕不上涂先生大作的出版時(shí)間。我事先聲明,這些只是我瀏覽他大作以后的一些感想,非常立即的直覺(jué),也一時(shí)談不上深刻的見(jiàn)解。 這本書(shū)的內容,強調今天是一個(gè)大量數據公開(kāi)于大眾的時(shí)代。自從資訊革命以來(lái),資訊工具、硬件、軟件,平行發(fā)展、與時(shí)俱進(jìn)。數據在我們生活之中,日常接觸,已是處處可見(jiàn)的現象。收集數據,當然是靠電腦的快速分類(lèi)和記錄,然而更重要的是搜索引擎的進(jìn)步,與網(wǎng)絡(luò )之間網(wǎng)際的交流。到今天,一個(gè)一個(gè)網(wǎng),不但可以串聯(lián)在一起,互相溝通,而且“云端”(云計算)的設計,可以將每一個(gè)地區個(gè)別數據,儲成一個(gè)大的數據庫,有助于我們更迅速廣泛地搜索。 這些現象,20世紀最后四分之一以來(lái),已經(jīng)呈現加速度發(fā)展的新事物,在21世紀進(jìn)展速度之快,更是鋪天蓋地、無(wú)所不在。涂先生在這本書(shū)里強調:不僅數據經(jīng)過(guò)管理而大量地存在,而且,在現代的國家,開(kāi)放的社會(huì )與政府之間,經(jīng)由數據,彼此一目了然、無(wú)所隱瞞。一個(gè)掌握公權力的政府,跟任何其他政府一樣,有壓倒社會(huì )的龐大力量,因為他們手上掌握了人生需要的許多數據。不過(guò),這些數據,公民也可以一樣取得,使政府所作所為,可以攤開(kāi)在天地之間,讓我們檢驗。過(guò)去封建專(zhuān)制和一些集權政體,其執政者能壓迫老百姓,而老百姓沒(méi)有辦法回制公權力的壓迫。涂先生特別標榜,美國奧巴馬接任以后,盡力將數據開(kāi)放于大眾,固然奧巴馬是一個(gè)有開(kāi)放心胸的政治人物,如此將政府掌握的數據,大量地開(kāi)放于群眾,也是拜時(shí)代之賜,有如此的機緣,才能將數據公開(kāi)。 涂先生引用胡適之先生與黃仁宇先生的話(huà)。胡先生說(shuō)中國人習慣于“差不多先生”,凡事馬馬虎虎、不求精確。黃仁宇先生認為,中國不懂得用數字來(lái)管理國家。涂先生引用這兩位先生的名言,當然是要彰顯傳統中國和今天美國之間的巨大差異。不過(guò)我必須有所說(shuō)明:胡先生和黃先生的話(huà)語(yǔ),都是“愛(ài)之深而責之切”的心態(tài),他們身經(jīng)當時(shí)中國的混亂,激憤而出此感言。 從歷史上看,不論中國和西方,任何國家發(fā)展到可以有一個(gè)復雜文官系統管理以后,沒(méi)有不依照數據來(lái)治國的。人口、資源、土地、財產(chǎn)種種的統計數字,在中國歷史上,自從戰國時(shí)代形成列國的國家體制以后,沒(méi)有一個(gè)朝代不具有一定的數據庫;只是以今天的標準來(lái)講,粗糙和細密之間,古今有很多的差別而已。以漢代為例,漢簡(jiǎn)所顯示的家戶(hù)統計,每一戶(hù)中的人口,男女老小,以及擁有的資產(chǎn)數目字,都詳細統計,而且不論是居延邊塞,或是荊州內郡,格式一致。漢簡(jiǎn)各種家戶(hù)統計,與唐代西域州府的記錄對比,其內容格式也是相當一致。這種基本的數據,在列朝的會(huì )典中,都見(jiàn)到其大概。當然,各個(gè)朝代的數據,有做得好的,也有做得差的。大致講起來(lái),外族侵犯中國建立的朝代,以武裝力量強制建立政權,也往往依靠暴力的掠奪,取得他們所需要的資源。一個(gè)上軌道的朝代,其數據還是相當完整。 再看西方歷史。希臘時(shí)代,我們了解的資料不夠。羅馬帝國時(shí)代,全帝國包含各種不同的政治單位,并沒(méi)有一個(gè)大一統的文官政府;因此,全國性的資料庫似乎不存在。等到中古黑暗時(shí)期,國不成國,地方不過(guò)是大小封建領(lǐng)主占有領(lǐng)土而已,他們并沒(méi)有建立詳細的資料庫。近代以來(lái),列國各自組成完整的主權國家,這些數據也紛紛出現了。 這是以歷史上政權掌握數字而言。一家大型的企業(yè),例如,中國清代的票號,如果他們手上沒(méi)有復雜的數據庫,就不能進(jìn)行匯兌、放款、存款等活動(dòng)。英國的東印度公司,手上握有豐富的資源,他們也不能不具有一個(gè)相當完整的數據庫,否則無(wú)以經(jīng)營(yíng)這么復雜的開(kāi)拓業(yè)務(wù)。 今天的數據時(shí)代,我已經(jīng)在前面提過(guò),不僅公司單位都有搜集數據的能力,而且更重要的,有搜尋引擎可以將資料迅速檢索,從其中歸納出條理,有助于了解情況。舉一個(gè)例說(shuō),最近我們才看到,數據資料顯示,美國1%的人口,擁有全國財富40%以上,99%的人口,擁有全國財富才過(guò)半而已。對于許多長(cháng)期習慣于美國是開(kāi)放社會(huì )的一般人民,這一組數據顯示的現象,幾乎可說(shuō)是理想的破滅,使大家必須檢討:
美國真是如此開(kāi)放嗎?還是相對地在逐漸關(guān)閉?是不是財富與權力,已經(jīng)逐漸集中到社會(huì )頂端一小撮的人手中?他們以財富作為魔法師的指揮棒,安排了我們的生活、決定了我們的未來(lái)。這種現象能夠暴露于眾,當然就因為在美國究竟資訊是公開(kāi)的。 相對而言,在極權的國家,他們手上擁有足夠的資訊,足以利用這資訊,掌握每一個(gè)人的日常生活。資訊管理、資訊控制,是無(wú)影無(wú)蹤,又是無(wú)所不在。說(shuō)到這里,我們不能不更多警惕。 作為一個(gè)史學(xué)工作者,看慣了世間的災難和創(chuàng )傷,不能不提出警告:這個(gè)中性工具,也只有在了解到資訊工具陰暗面—雙刃劍的特性,在權勢獨占這一工具時(shí),可能出現的危險。有此認識,我們才能善于利用這了不起的工具,開(kāi)創(chuàng )更好的未來(lái),也防治不虞的災害。 涂子沛先生《大數據》這部書(shū),清楚地敘述了資訊時(shí)代對我們生活的影響與社會(huì )的控御力。他討論的范圍方方面面、極為廣泛。我盼望有了這本書(shū)作為起頭,還有很多對資訊工具有研究、也有心得的人,參加討論,讓我們更清楚地了解,這個(gè)21世紀新的知識工具。為此,我們要對涂子沛先生致敬與致謝,因為他為華文世界提出一個(gè)重要的話(huà)題。
|
|
凡標注來(lái)源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產(chǎn)品,版權均屬經(jīng)濟參考報社,未經(jīng)經(jīng)濟參考報社書(shū)面授權,不得以任何形式刊載、播放。 |
|
|
|