當前位置: 華文問答 > 數碼

零基礎學習 Hadoop 該如何下手?

2011-08-26數碼

推薦一些Hadoop家族系列文章,主要介紹Hadoop家族產品,常用的專案包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的專案包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

一、學習路線圖

  • Hadoop家族學習路線圖 開篇必讀
  • Hive學習路線圖
  • Mahout學習路線圖
  • 二、編程實踐

  • Hadoop歷史版本安裝
  • 用Maven構建Hadoop專案
  • Hadoop編程呼叫HDFS
  • 用Maven構建Mahout專案
  • Mahout推薦演算法API詳解
  • 用MapReduce實作矩陣乘法
  • 從原始碼剖析Mahout推薦引擎
  • Mahout分步式程式開發 基於物品的協同過濾ItemCF
  • Mahout分步式程式開發 聚類Kmeans
  • PageRank演算法並列實作
  • 三、案例分析

  • 海量Web日誌分析 用Hadoop提取KPI統計指標
  • 用Hadoop構建電影推薦系統
  • 用Mahout構建職位推薦引擎
  • Mahout構建圖書推薦系統
  • PeopleRank從社交網絡中發現個體價值
  • -----------2017年1月更新-----

    專業在專欄:預見未來