精选优质文档-倾情为你奉上基于hadoop作品推荐系统设计说明书1.引言1.1编写目的 Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算,同时它也是当前最流行的云计算平台,作为IT界的开发人员,我们也要跟上节奏,抓住机遇。本文通过Hadoop云计算平台实现一个推荐系统,希望通过编写本文,能够对Hadoop有一个基本的了解。1.2背景随着互联网技术的兴起,视频网站、社交网站、微博等广泛应用,用户在上网体验的过程中,产生了大量的用户信息移动互联网的迅速发展,使得用户随时随地的产生海量数据。面对海量数据,单机运行处理的模式不论从效率或处理能力上来讲,都已经满足不了如今数据挖掘的需求。在信息过载的大背景下,本文研究内容应运而生。我们选取 Apache Hadoop 作为本应用系统的分布式计算平台。Hadoop 主要由两大核心模块组成:分布式文件系统 HDFS 和分布式批处理框架 MapReduce 两部分组成。HDFS 为我们提供了包括大规模文