海量分析平台六要件:
(1)資料倉儲技術(處理Volume:「大」)
(2)Hadoop(處理Variety:「雜」)
(3)江河運算(處理Velocity:「快」)
(4)資料治理(處理Veracity:「疑」)
(5)文本分析
(6)視覺化和搜尋介面
另外Hadoop計劃下的兩個主要項目:分散式檔案系統(Hadoop Distributed File System,HDFS)和分散性處理程式框架(MapReduce)。
這是我對雲端時代的殺手級應用:Big Data海量資料分析最感興趣,也是點到最多技術的一個章節,先列出這樣的架構,後續有興趣再繼續學習。