2008年加入阿里巴巴云梯管理员2011年加入SDO负责搭建并维护hadoop集群2012年加入ebay自我介绍hadoop集群搭建监控集群性能调优Hadoop如何被搞垮的概要Master memory 磁盘 sas+raid10 active-backup bondingIP aliasHadoop集群搭建Editlog本地一份,NFS一份NameQuota&SpaceQuota权限控制/tmp Trash Rack awarenessNamenode控制内存pleteuserjobs.maximummapreduce.job.counters.limitJobTracker内存不能少于Namenode控制做checkpoint的次数及时间fs.checkpoint.periodfs.checkpoint.sizeSecondaryNamenodeDisk2T*12ext4noatime定期更换坏磁盘,一次一台网络如果条件允许,做汇聚绑定(mode 4 bonding)内存 24Gslave内存:map+reduce+tasktracker+datanode 网络磁盘注意wio确定m