Hadoop技术讲解:http://wenku.baidu.com/view/7df877bbfd0a79563c1e7239.html Hadoop源码分析:http://caibinbupt.javaeye.com/blog/281281 Hadoop框架:http://wenku.baidu.com/view/020b93fdc8d376eeaeaa313b.html Hadoop分布式文件系统:架构和设计要点:http://www.javaeye.com/topic/200508 Map/Reduce用户接口:http://blog.sina.com.cn/s/blog_62a9902f0100goxs.html
官方中文资料:http://hadoop.apache.org/common/docs/r0.20.2/cn/
Hadoop技术论坛:http://www.hadoopor.com/
中国科学院计算技术研究所:http://www.hadoopchina.org/
第一手资源 hadoop官方网站 hadoop.apache.org 最权威的官方资源之一 dev.yahoo.hadoop hadoop.cn(偶尔有一些有用信息) www.hadoop.org.cn hadoopchina 手册 hdfs命令行指南 http://hadoop.apache.org/core/docs/current/commands_manual.html#fsck 官方文档 http://hadoop.apache.org/core/docs/r0.20.0/cn/ 相关Blog facebook工程师blog http://www.facebook.com/note.php?note_id=76191543919&ref=mf hadoop一个核心开发者的blog http://www.lexemetech.com/2007/09/java-servlet-for-thrift.html hadoop0.19特性归纳 http://solomons.javaeye.com/blog/277784 这个家伙很有意思,并且是研究hadoop的 http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html http://blog.csdn.net/ww_great/archive/2008/11/14/3296724.aspx hadoop源码分析 http://blog.csdn.net/xymyeah/archive/2008/08/20/2802572.aspx hadoop源码分析比较好的一篇文章 http://caibinbupt.javaeye.com/?show_full=true 源码分析,给了张package功能分析表 http://caibinbupt.javaeye.com/blog/270378 http://www.cnblogs.com/bjzhanghao/archive/2008/11/12/1325113.html hadoop架构设计和要点 http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html 讲述cascading http://www.javaeye.com/news/3507-cascading-a-simple-application-of-hadoop-mapreduce http://blog.rapleaf.com/dev/?p=33 淘宝数据仓库团队 http://rdc.taobao.com/blog/dw/archives/category/dw架构 http://hi.baidu.com/shirdrn/blog/category/Hadoop hadoop初记,部分代码剖析 http://blog.csdn.net/kauu/archive/2006/12/10/1437207.aspx hadoop源码剖析不错的 http://caibinbupt.javaeye.com/blog/292073 也研究MapReduce的家伙 http://coderplay.javaeye.com/blog/259880 相关主题和文档 hadoop部署 http://www.slideshare.net/steve_l/dynamic-hadoop-clusters hadoop升级 http://zkl-1987.javaeye.com/blog/365172 http://www.javaeye.com/topic/365172 SequenceFile的demo hadoop公平调度器的介绍ppt DBInputFormat和DBOutputFormat的介绍 特殊应用WebDav, 这个家伙实现的hdfs-webdav http://www.blogjava.net/badqiu/archive/2008/11/24/242225.html http://markmail.org/search/?q=mapred.job.classpath.files hadoop namenode 高可用性(容灾)(Redundant Network Architecture, 相关软件有: Linux bonding, heartbeat , DRBD Disk ) http://www.hadoop.org.cn/document/Hadoop%20Namenode%20High%20Availability.pdf 磁盘空间过满时启动失败的处理 http://blog.csdn.net/ww_great/archive/2008/11/14/3296724.aspx 写SequenceFile格式的输出 http://www.umiacs.umd.edu/~jimmylin/cloud9/umd-hadoop-dist/cloud9-docs/content/staging-records.html Hadoop中的集群配置和使用技巧 http://www.infoq.com/cn/news/2008/08/hadoop-config-tip MapReduce tips http://www.javaeye.com/topic/351026 比较好的MR管道实例 http://www.cnblogs.com/phinecos/archive/2008/11/11/1331599.html hadoop调试调优 http://business.rapleaf.com/pdfs/hadoop_part_3.pdf hadoop in facebook(facebook的hadoop配置) http://www.hadoop.org.cn/document/Anatomy%20of%20the%20Facebook%20Cluster.pdf
Practical MapReduce http://www.cloudera.com/blog/2009/05/18/10-mapreduce-tips/ MISC 清华大学的分布式相关课程 http://hpc.cs.tsinghua.edu.cn/dpcourse/readings.htm
Hadoop是一个海量数据处理平台,
以下是非常高质量的学习Hadoop的入门文章 :
1. InfoQ上的分布式计算开源框架Hadoop介绍 分为三章,系统性的介绍了
Hadoop , HDFS结构、集群配置方法和编程。
2. IBM DeveloperWorks上的教程:用 Hadoop 进行分布式并行编程 ,也
Hadoop Eclipse Plugin.
是分为三部分(如果你找不到其他两部分,试着修改链接),讲述编程、集群配
置和
3.如果对Hbase感兴趣,可以看Hbase架构的中译文。
这个网站http://www.hadoop.org.cn/ 翻译了很多Hadoop相关的文章
from : http://hi.baidu.com/cqhwp/blog/item/0420aad2222f2a369b5027be.html