人們不再認為數據是靜止和陳舊的。但在以前,一旦完成了收集數據的目的之后,數據就會被認為已經沒有用處了。比方說,在飛機降落之后,票價數據就沒有用了(對谷歌而言,則是一個檢索命令完成之后)。
大數據洞察
如今,數據已經成為了一種商業(yè)資本,一項重要的經濟投入,可以創(chuàng)造新的經濟利益。事實上,一旦思維轉變過來,數據就能被巧妙地用來激發(fā)新產品和新型服務。數據的奧妙只為謙遜、愿意聆聽且掌握了聆聽手段的人所知。信息社會所帶來的好處是顯而易見的:每個人口袋里都揣有一部手機,每臺辦公桌上都放有一臺電腦,每間辦公室內都擁有一個大型局域網。但是,信息本身的用處卻并沒有如此引人注目。半個世紀以來,隨著計算機技術全面融入社會生活,信息爆炸已經積累到了一個開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息總量的變化還導致了信息形態(tài)的變化——量變引發(fā)了質變。最先經歷信息爆炸的學科,如天文學和基因學,創(chuàng)造出了“大數據”這個概念。如今,這個概念幾乎應用到了所有人類致力于發(fā)展的領域中。
大數據并非一個確切的概念。最初,這個概念是指需要處理的信息量過大,已經超出了一般電腦在處理數據時所能使用的內存量,因此工程師們必須改進處理數據的工具。這導致了新的處理技術的誕生,例如谷歌的MapReduce和開源Hadoop平臺(最初源于雅虎)。這些技術使得人們可以處理的數據量大大增加。更重要的是,這些數據不再需要用傳統(tǒng)的數據庫表格來整齊地排列——一些可以消除僵化的層次結構和一致性的技術也出現了。
同時,因為互聯網公司可以收集大量有價值的數據,而且有利用這些數據的強烈的利益驅動力,所以互聯網公司就順理成章地成為最新處理技術的領頭實踐者。它們甚至超過了很多有幾十年經驗的線下公司,成為新技術的領銜使用者。
今天,一種可能的方式是,亦是本書采取的方式,認為大數據是人們在大規(guī)模數據的基礎上可以做到的事情,而這些事情在小規(guī)模數據的基礎上是無法完成的。大數據是人們獲得新的認知,創(chuàng)造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關系的方法。
這僅僅只是一個開始,大數據時代對我們的生活,以及與世界交流的方式都提出了挑戰(zhàn)。最驚人的是,社會需要放棄它對因果關系的渴求,而僅需關注相關關系。也就是說只需要知道是什么,而不需要知道為什么。這就推翻了自古以來的慣例,而我們做決定和理解現實的最基本方式也將受到挑戰(zhàn)。