本文共 867 字,大约阅读时间需要 2 分钟。
按照这个路线图来学习即可。 1、M. Tim Jones的三篇文章: 用Hadoop进行分布式数据处理第1部分(入门): 用Hadoop进行分布式数据处理第2部分(进阶): 用Hadoop进行分布式数据处理第3部分(应用程序开发): 2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍 [google论文三]MapReduce简化大集群上的数据处理: 词频统计的Map/Reduce程序可以从这里找到: Google论文系列: 按照Hadoop各组件来串联: 3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章 下面一些需要看: Hadoop Distributed File System简介: 使用Apache Pig处理数据: 4、《开源软件架构》中的介绍 (卷1第8章)HDFS--Hadoop分布式文件系统: 英文原文: (其中的卷1第8章) 5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验 6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验
7、董的博客,关于Hadoop、分布式系统的研究
8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍 优先看稳定版: 最新版(包括下一代MapReduce即YARN的介绍): 9、caibinbupt的博客,Hadoop源代码分析系列 千与的专栏,Hadoop-0.20.0源码分析 10、spork的博客,其中关于Hadoop的系列 11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验 12、beanmoon的博客,其中的Hadoop系列
13、伯乐在线
http://blog.jobbole.com/tag/hadoop/
转载地址:http://weynn.baihongyu.com/