數(shù)據(jù)分析的過(guò)程,實(shí)際上就是一個(gè)不斷探索的過(guò)程。需要分析的數(shù)據(jù)越復(fù)雜就越是如此,隨著分析的不斷深入,發(fā)現(xiàn)的問(wèn)題就會(huì)越多,甚至?xí)霈F(xiàn)與實(shí)際情況完全相反的結(jié)果,為此就要嘗試不同的分析方法,而在分析中使用的數(shù)據(jù)如果發(fā)現(xiàn)有什么問(wèn)題也要及時(shí)地進(jìn)行修正,上述這些問(wèn)題即便是經(jīng)驗(yàn)非常豐富的統(tǒng)計(jì)學(xué)家也無(wú)法避免。實(shí)際上為了避免出現(xiàn)錯(cuò)誤,越是經(jīng)驗(yàn)豐富的統(tǒng)計(jì)學(xué)家,在分析的準(zhǔn)備上所花費(fèi)的時(shí)間就越多。
在對(duì)參考結(jié)果選擇各種各樣的方法與數(shù)據(jù)作為突破口的探索分析之中,嘗試的次數(shù)是非常重要的。因此,那些必須使用特殊工具或者奇妙程序的情況,以及必須長(zhǎng)時(shí)間等待分析結(jié)果的情況都應(yīng)該盡可能地避免。這樣的話,就算最后必須以全部數(shù)據(jù)為對(duì)象進(jìn)行分析和驗(yàn)證,也可以事先獲取一定量的抽樣數(shù)據(jù),并且通過(guò)探索分析找到建立假設(shè)的依據(jù)。
雖然為了建立假設(shè)尋找一定量抽樣數(shù)據(jù)的方法,需要相當(dāng)專業(yè)的統(tǒng)計(jì)學(xué)知識(shí),但如果只是為了掌握數(shù)據(jù)概況的話,有上萬(wàn)條數(shù)據(jù)就夠了,這種程度的統(tǒng)計(jì)工作僅靠一個(gè)熟練應(yīng)用Excel的人就可以搞定。
當(dāng)然,對(duì)龐大的數(shù)據(jù)進(jìn)行高速且符合一定條件的隨機(jī)抽樣調(diào)查,以及對(duì)最終的分析結(jié)果是否準(zhǔn)確進(jìn)行驗(yàn)證的時(shí)候,還是需要大數(shù)據(jù)技術(shù)發(fā)揮實(shí)力。但是,這種速度和準(zhǔn)確度究竟有多大的價(jià)值呢?這個(gè)問(wèn)題的答案,就要取決于分析結(jié)果能夠產(chǎn)生多大的價(jià)值了。
實(shí)際上分析本身并沒(méi)有價(jià)值,如何活用分析的結(jié)果,最終得到的價(jià)值也是不同的。