Hadoop学习路线图-白红宇

Hadoop学习路线图

阅读量：3718 次

发布时间：2019-05-22

本文共 867 字，大约阅读时间需要 2 分钟。

按照这个路线图来学习即可。

1、M. Tim Jones的三篇文章：

用Hadoop进行分布式数据处理第1部分（入门）：

用Hadoop进行分布式数据处理第2部分（进阶）：

用Hadoop进行分布式数据处理第3部分（应用程序开发）：

2、“银河里的星星”的博客，其中的Google论文系列（就包括开创性论文“MapReduce:简化大集群上的数据处理”）、搜索与分布式方面的介绍

[google论文三]MapReduce简化大集群上的数据处理：

词频统计的Map/Reduce程序可以从这里找到：

Google论文系列：

按照Hadoop各组件来串联：

3、IBM developerWorks上的其他Hadoop文章，在dw上用Hadoop关键字进行搜索，可以找到大量Hadoop的文章

下面一些需要看：

Hadoop Distributed File System简介：

使用Apache Pig处理数据：

4、《开源软件架构》中的介绍

（卷1第8章）HDFS--Hadoop分布式文件系统：

英文原文：

（其中的卷1第8章）

5、阿里集团数据平台的官方博客，包含大量Hadoop研究和应用经验

6、百度搜索研发部的官方博客，主要包含分布式系统（Hadoop）、搜索技术、数据挖掘、大型网站架构等方面的经验

7、董的博客，关于Hadoop、分布式系统的研究

8、官方文档当然更不能少了，主要包括Hadoop集群的搭建，MapReduce的使用，HDFS架构方面的介绍

优先看稳定版：

最新版（包括下一代MapReduce即YARN的介绍）：

9、caibinbupt的博客，Hadoop源代码分析系列

千与的专栏，Hadoop-0.20.0源码分析

10、spork的博客，其中关于Hadoop的系列

11、chinacloud的博客，其中的Hadoop架构、分布式系统设计方面的一些经验

12、beanmoon的博客，其中的Hadoop系列

13、伯乐在线

http://blog.jobbole.com/tag/hadoop/

转载地址：http://weynn.baihongyu.com/

你可能感兴趣的文章