正文

《大數據時代》大數據,開啟重大的時代轉型(1)

大數據時代 作者:(英)維克托·邁爾-舍恩伯格


大數據開啟了一次重大的時代轉型。與其他新技術一樣,大數據也必然要經歷硅谷臭名昭著的技術成熟度曲線:經過新聞媒體和學術會議的大肆宣傳之后,新技術趨勢一下子跌到谷底,許多數據創(chuàng)業(yè)公司變得岌岌可危。當然,不管是過熱期還是幻想破滅期,都非常不利于我們正確理解正在發(fā)生的變革的重要性。

就像望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,這種能夠收集和分析海量數據的新技術將幫助我們更好地理解世界——這種理解世界的新方法我們現在才意識到。本書旨在如實表達出大數據的內涵,而不會過分熱捧它。當然,真正的革命并不在于分析數據的機器,而在于數據本身和我們如何運用數據。

大數據先鋒

天文學,信息爆炸的起源

只有考慮到社會各個方面的變化趨勢,我們才能真正意識到信息爆炸已經到來。我們的數字世界一直在擴張。以天文學為例,2000年斯隆數字巡天(Sloan Digital Sky Survey)項目啟動的時候,位于新墨西哥州的望遠鏡在短短幾周內收集到的數據,已經比天文學歷史上總共收集的數據還要多。到了2010年,信息檔案已經高達1.4×242字節(jié)。不過,預計2016年在智利投入使用的大型視場全景巡天望遠鏡(Large Synoptic Survey Telescope)能在五天之內就獲得同樣多的信息。天文學領域的變化在各個領域都在發(fā)生。2003年,人類第一次破譯人體基因密碼的時候,辛苦工作了十年才完成了三十億對堿基對的排序。大約十年之后,世界范圍內的基因儀每15分鐘就可以完成同樣的工作。在金融領域,美國股市每天的成交量高達70億股。而其中三分之二的交易都是由建立在算法公式上的計算機程序完成的。這些程序運用海量數據來預測利益和降低風險。

互聯網公司更是要被數據淹沒了。谷歌公司每天要處理超過24拍字節(jié)的數據,這意味著其每天的數據處理量是美國國家圖書館所有紙質出版物所含數據量的上千倍。facebook這個創(chuàng)立時間不足十年的公司,每天更新的照片量超過1 000萬張,每天人們在網站上點擊 “喜歡”(Like)按鈕或者寫評論次數大約有三十億次,這就為facebook公司挖掘用戶喜好提供了大量的數據線索。與此同時,谷歌子公司YouTube每月接待多達8億的訪客,平均每一秒鐘就會有一段長度在一小時以上的視頻上傳。twitter上的信息量幾乎每年翻一倍,截至2012年,每天都會發(fā)布超過4億條微博。


上一章目錄下一章

Copyright ? 讀書網 www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號