推薦一些Hadoop家族系列文章,主要介紹Hadoop家族產品,常用的專案包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的專案包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
一、學習路線圖
Hadoop家族學習路線圖 開篇必讀
Hive學習路線圖
Mahout學習路線圖
二、編程實踐
Hadoop歷史版本安裝
用Maven構建Hadoop專案
Hadoop編程呼叫HDFS
用Maven構建Mahout專案
Mahout推薦演算法API詳解
用MapReduce實作矩陣乘法
從原始碼剖析Mahout推薦引擎
Mahout分步式程式開發 基於物品的協同過濾ItemCF
Mahout分步式程式開發 聚類Kmeans
PageRank演算法並列實作
三、案例分析
海量Web日誌分析 用Hadoop提取KPI統計指標
用Hadoop構建電影推薦系統
用Mahout構建職位推薦引擎
Mahout構建圖書推薦系統
PeopleRank從社交網絡中發現個體價值
-----------2017年1月更新-----
專業在專欄:預見未來