大规模分布式计算MapReduce 和HadoopAgenda分布式计算 需求:大规模数据为什么使用分布式?分布式计算 需求:成本?为什么使用分布式?分布式计算 并行化的尝试 在硬件工艺/ 技术不变的前提下,提升计算能力 更强大的硬件 对称多处理器SMP 分布式共享内存DSM 分布式系统 Share disk Share nothingA brief history分布式计算 互联网应用的特殊性 I/O 操作强于计算操作 复杂异构的机器环境 变化的业务逻辑新需求分布式计算 MapReduce 分布式编程模型 互联网应用的大规模数据计算解决方案MapReduce分布式计算 MapReduce 的优势 简单一致性模型 本地I/O 优化 扩展性Why MapReduce wins?分布式计算 应用现状 数据分析、报表 索引 商业智能服务 规模 淘宝现状分布式计算 总结总结分布式计算 BREAKMapReduce 编程模型l 游戏l 什么是MapReduce ?l 分布式编程模型What is MapReduce?MapReduce 编程模型l MapReducel 语义l Map :映射,空