1、北京易霖博信息技术有限公司 易霖博云计算大数据实验室建设解决方案北京易霖博信息技术有限公司 北京易霖博信息技术有限公司2016年 5月北京易霖博信息技术有限公司 目录概述 .4第一章、 云计算与大数据的发展趋势 .41.1. 云计算与大数据 .41.2. 云计算与大数据的关系 .51.2.1. 当大数据遭遇云计算 .51.2.2. 云计算环境作为大数据处理平台 .61.3. 发展趋势:大数据逐步“云”化 .7第二章、 云计算大数据人才现状分析 .92.1. 我国云计算大数据人才紧缺 .92.2. 云计算大数据人才培养情况 .102.3. 云计算大数据人才培养面临的问题 .102.3.1. 高职
2、实验室设备落后,教学资源无法合理分配 .112.3.2. 教学资源分散,共享程度低 .112.3.3. 对云计算大数据技术认识不够,无法有效运用 .11第三章、 云计算大数据人才培养需求分析 .123.1. 云计算大数据岗位需求 .123.2. 云计算大数据人才培养策略 .133.2.1. 根据就业前景,加大人才培养力度 .133.2.2. 德才兼修,开拓新型教学方式 .133.2.3. 选择以工作过程为向导的教材 .13北京易霖博信息技术有限公司 3.3. 云计算大数据带给高职实验室建设的前景 .143.3.1. 建立统一信息平台来管理海量教学资源 .143.3.2. 云计算降低维护和运营成
3、本 .143.3.3. 整合教学资源,加强资源共享,提高教学质量 .153.3.4. 促进教师和学生的信息交互,进一步促进教学相长 .153.3.5. 借助云计算大数据技术可以提升科研实力 .15第四章、 云计算大数据实验室建设原则 .164.1. 方便扩展 .164.2. 自身安全 .164.3. 业务高可用 .164.4. 统一管理与自动化 .174.5. 开放接口 .174.6. 丰富、清晰的培训教材 .174.7. 师资培训 新技术交流 .174.8. 技术服务保障 .18第五章、 云计算大数据实验室建设目标 .195.1. 建设目标 .195.1.1. 培养学生云计算大数据职业技能
4、.195.1.2. 提供独立的用户实验环境 .195.1.3. 提高系统资源的利用率 .195.1.4. 系统具有良好扩展性 .20北京易霖博信息技术有限公司 5.2. 建设内容 .205.2.1. 云计算大数据实验平台部署 .205.2.2. 云计算大数据实验环境学习及搭建 .20第六章、 云计算大数据实验室解决方案 .226.1. 云计算大数据实验室整体架构 .226.2. 云计算大数据实验室物理布局 .236.3. 云计算大数据实验平台部署 .246.3.1. 实验平台基础设施 .256.4. 云计算大数据实验环境学习及搭建 .286.4.1. 云计算基本架构安装和部署 .286.4.2
5、. 云计算中间件环境部署 .296.4.3. 基于分布式文件系统的大数据部署、挖掘和分析 .306.4.4. 云计算应用层安装及使用 .316.4.5. 云安全加固和防护 .31第七章、 云计算大数据实验室课程体系 .33第八章、 云计算大数据实验室方案优势 .358.1. Web 形式开展实验,实现无所不在的网络访问 .358.2. 基于资源的负载均衡,实现实验资源弹性分配 .358.3. 增量存储技术,实现用户实验环境的独立性和延续性 .368.4. 项目驱动式实验设计,培养学生的综合云能力 .368.5. 资源的开放性及复用性,可支持科研等其他用途 .36北京易霖博信息技术有限公司 8.
6、6. 完善的课程体系 丰富的教学内容 .36第九章、 云计算大数据实验室校企合作 .389.1. 课程与教材服务 .389.2. 师资培训服务 .399.2.1. 双师型教师培养 .399.2.2. 企业讲师计划 .399.3. 学生实习就业服务 .39第十章、 云计算大数据实验室配置清单 .41第十一章、 北京易霖博信息技术有限公司 .42北京易霖博信息技术有限公司 概述云计算大数据技术是当今信息技术发展的一个主要方向,云计算大数据技术一经提出就得到人们的追捧,其应用领域也得到了快速的发展,已经在商业、政府、金融、教育等领域得到广泛应用。我国高职院校需要建设专业的云计算大数据实验室,尤其是要
7、满足当下学生需求的实训系统,是一个比较重要和紧迫的工作。根据云计算与大数据行业对人才培养的需要,易霖博推出了一套面向高职院校的云计算大数据实验室建设解决方案,实验内容的设计来源于社会需求调研以及云计算业界专业人士的建议,实验内容涵盖的技术知识点能够与目前云计算大数据人才的技能需求贴合,实验设计以真实的工作场景为背景,培养学生的综合能力,增强学生对真实工作环境的体验感,适应社会人才发展的需要。第一章、 云计算与大数据的发展趋势1.1. 云计算与大数据云计算和大数据是一个硬币的两面,云计算是大数据的 IT基础,而大数据是云计算的一个杀手级应用,云计算是大数据成长的驱动力,而另一方面,由于数据越来越
8、多、越来越复杂、越来越实时,这就更加需要云计算去处理,所以二者之间是相辅相成的。30年前,存储 1TB也就是约 1000GB数据的成本大约是 16亿美元,如今存储到云上只需不到 100美元。但存储下来的数据,如果不以云计算进行挖掘和分析,就只是僵死的数据,没有太大价值。目前,云计算已经普及并成为 IT行业主流技术,其实质是在计算量越来越大、数据越来越多、越来越动态、越来越实时的需求背景下被催生出来的一种基础架构和商业模式。个人用户将文档、照片、视频、游戏存档记录上传至“云”中永久保存,企业客户根据自身需求,可以搭建自己的“私有云” ,或托管、或租用“公有云”上的 IT资源与服务,这些都已不是新
9、鲜事。可以说,云是一棵挂满了大数据的苹果树。大数据的出现,正在引发全球范围内深刻的技术与商业变革。在技术上,大数据使从数据当中提取信息的常规方式发生了变化。在技术领域,以往更多是依靠模型的方法,现北京易霖博信息技术有限公司 在我们可以借用规模庞大的数据,用基于统计的方法,有望使语音识别、机器翻译这些技术领域在大数据时代取得新的进展。在搜索引擎和在线广告中发挥重要作用的机器学习,被认为是大数据发挥真正价值的领域在海量的数据中统计分析出人的行为、习惯等方式,计算机可以更好地学习模拟人类智能。随着包括语音、视觉、手势和多点触控等在内的自然用户界面越来越普及,计算系统正在具备与人类相仿的感知能力,其看
10、见、听懂和理解人类用户的能力不断提高。这种计算系统不断增强的感知能力,与大数据以及机器学习领域的进展相结合,已使得目前的计算系统开始能够理解人类用户的意图和语境。 “这使得计算机能够真正帮助我们,甚至代表我们去工作” 。以往,移动运营商和互联网服务运营商等拥有着大量的用户行为习惯的各种数据,在IT产业链中具有举足轻重的地位。而在大数据时代,移动运营商如果不能挖掘出数据的价值,可能彻彻底底被管道化。运营商和更懂用户需求的第三方开发者互利共赢的模式,已取得一定共识。1.2. 云计算与大数据的关系本质上,云计算与大数据的关系是静与动的关系;云计算强调的是计算,这是动的概念;而数据则是计算的对象,是静
11、的概念。如果结合实际的应用,前者强调的是计算能力,或者看重的存储能力;但是这样说,并不意味着两个概念就如此泾渭分明。大数据需要处理大数据的能力(数据获取、清洁、转换、统计等能力) ,其实就是强大的计算能力;另一方面,云计算的动也是相对而言,比如基础设施即服务中的存储设备提供的主要是数据存储能力,所以可谓是动中有静。如果数据是财富,那么大数据就是宝藏,而云计算就是挖掘和利用宝藏的利器!北京易霖博信息技术有限公司 1.2.1. 当大数据遭遇云计算从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖
12、掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。云计算为什么能盛行呢?在互联网领域应用系统的构建:客户群体是不确定的、系统规模不确定、系统投资不固定、业务应用有很清晰的并行分割特征、数据仓库系统的构建、数据仓库规模可估算、数据仓库的系统投资与业务分析的价值和回报相关、商业智能应用属于整体应用、Saas 模式构建数据仓库系统。大数据管理,分布式进行文件系统,如 Hadoop、Mapreduce 数据分割与访问执行;同时SQL支持,以 Hive+HADOOP为代表的 SQL界面支持,在大数据技术上用云计算构建下一代数据仓库成为热门话题。从系统需求来看,大数据的架构对系统提出了
13、新的挑战:1、集成度更高。一个标准机箱最大限度完成特定任务。2、配置更合理、速度更快。存储、控制器、I/O 通道、内存、CPU、网络均衡设计,针对数据仓库访问最优设计,比传统类似平台高出一个数量级以上。3、整体能耗更低。同等计算任务,能耗最低。4、系统更加稳定可靠。能够消除各种单点故障环节,统一一个部件、器件的品质和标准。5、管理维护费用低。数据藏的常规管理全部集成。6、可规划和预见的系统扩容、升级路线图。1.2.2. 云计算环境作为大数据处理平台1.2.2.1. 云计算环境中基本计算单元的分化企业云计算平台上虽然有多个并行计算的 CPU,但并没有创造出具有超强数据处理能力的超级 CPU,因此
14、云计算平台需要的是有并行运算能力的软件系统。同时,当所有用户的数据全部放在云端时,虽然存储容量可以很方便地扩充,但面对大量用户同时发起的海量数据处理请求,简单的数据处理逻辑已经无法满足需要。北京易霖博信息技术有限公司 可以看到,国内有相当多的电商企业,用小型机和 Oracle扛了好几年,并请了全国最牛的 Oracle的专家不停优化他的 Oracle和小型机,初期发展可能很快,但是后来由于数据量激增,业务开始受到严重影响,最典型的例子无疑是京东商城前段时间发生的大规模访问请求宕机事件,因此他们开始逐渐放弃了 Oracle或者 MS-SQL,并逐渐转向 MySQL+X86的分布式架构。目前的基本计
15、算单元常常是普通的 X86服务器,它们组成了一个大的云,而未来的云计算单元里有可能有存储单元、计算单元、协调单元,总体的效率会更高。1.2.2.2. 对系统稳定性的需求在应对大规模访问的时候有一些系统稳定性的追求,来自很多方面,来自网络稳定性、数据库稳定性。对系统而言,需要把握一个大原则,需要消除任何单点故障。不光是网络上单点故障,还有来自你呼叫中心里的单点故障,只要有单点故障一定要消除掉。因为对于电商行业而言,每一秒都是钱,电子商务业务如果宕机一个小时,损失多少是可以算出来的,电商行业需要非常全面的技术系统监控报警系统。有时候你会发现你如果通过技术系统的监控去推导出你的技术发生问题已经晚了。
16、1.3. 发展趋势:大数据逐步“云”化纵观历史,过去的数据中心无论应用层次还是规模大小,都仅仅是停留在过去有限的基础架构之上,采用的是传统精简指令集计算机和传统大型机,各个基础架构之间都相互孤立,没有形成一个统一的有机整体。在过去的数据中心里面,各种资源都没有得到有效充分地利用。而且传统数据中心资源配置和部署大多采用人工方式,没有相应的平台支持,使大量人力资源耗费在繁重的重复性工作上,缺少自助服务和自动部署能力,既耗费时间和成本,又严重影响工作效率。而当今越来越流行的云计算、虚拟化和云存储等新 IT模式的出现,又再一次说明了过去那种孤立、缺乏有机整合的数据中心资源并没有得到有效利用,并不能满足当前多样、高效和海量的业务应用需求。在云计算时代背景下,数据中心需要向集中大规模共享平台推进,并且,数据中心要能实现实时动态扩容,实现自助和自动部署服务。