博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop学习路线图
阅读量:3718 次
发布时间:2019-05-22

本文共 867 字,大约阅读时间需要 2 分钟。

按照这个路线图来学习即可。

1、M. Tim Jones的三篇文章:

用Hadoop进行分布式数据处理第1部分(入门):

用Hadoop进行分布式数据处理第2部分(进阶):

用Hadoop进行分布式数据处理第3部分(应用程序开发):


2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍

[google论文三]MapReduce简化大集群上的数据处理:

词频统计的Map/Reduce程序可以从这里找到:

Google论文系列:

按照Hadoop各组件来串联:


3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章

下面一些需要看:

Hadoop Distributed File System简介:

使用Apache Pig处理数据:


4、《开源软件架构》中的介绍

(卷1第8章)HDFS--Hadoop分布式文件系统:

英文原文:
(其中的卷1第8章)


5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验



6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验

7、董的博客,关于Hadoop、分布式系统的研究


8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍

优先看稳定版:

最新版(包括下一代MapReduce即YARN的介绍):


9、caibinbupt的博客,Hadoop源代码分析系列


千与的专栏,Hadoop-0.20.0源码分析



10、spork的博客,其中关于Hadoop的系列



11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验



12、beanmoon的博客,其中的Hadoop系列

13、伯乐在线

http://blog.jobbole.com/tag/hadoop/

转载地址:http://weynn.baihongyu.com/

你可能感兴趣的文章
Flink生产环境参数配置清单
查看>>
Flink反序列化之JsonDeserializationSchema和JSONKeyValueDeserializationSchema
查看>>
数据结构之稀疏数组
查看>>
数据结构之链表及常见题
查看>>
数据结构之单向环形链表(约瑟夫问题)
查看>>
数据结构之栈(前、中、后缀表达式)
查看>>
递归应用场景和调用机制
查看>>
四种方法带你解析xml文件和xml字符串
查看>>
启动Hadoop没有dataNode进程的解决办法
查看>>
听说redis集群没有pipeLine,看这里,博主带你重构redisCluter pipeLine
查看>>
flink高性能写入关系型数据库Oracle或者MySql
查看>>
关于时序数据流经Kafka之后可能产生乱序的原因和解决方法
查看>>
flink以gz格式写入hdfs
查看>>
解决Mysql连接8小时空闲失效问题
查看>>
flink配合druid连接池的使用
查看>>
博主带你深入理解JVM
查看>>
23种设计模式前言
查看>>
设计模式之单例模式和工厂模式
查看>>
flink state TTL(Time To Live) 如何应对飞速增长的状态?checkpoint机制原理?
查看>>
那些年,我们一起使用过的case...when
查看>>