1、高校大数据实验室建设方案一、 建设目标章鱼大数据实验室的建设目的是作为大数据教学实验及科研平台,包括数据挖掘与大数据分析平台。实验室的设计全面落实“产、学、研、用”一体化的思想和模式,从教学、实践、科研和使用多方面注重专业人才和特色人才的培养。利用虚拟化教学资源,搭建教学系统和集群平台,将理论学习、实践教学和大数据项目实战融为一体,由难而易、循序渐进,逐步提升学生的学习技能和实践水平, 提高“学”的质量和成效。利用大数据分析主流软件框架,搭建与业界主要用户一致的实验与科研环境,将理论课程中学到的数据挖掘算法运用到实际的数据分析过程中,提升学生的动手操作和项目实践能力。使得学生所学与企业项目人才
2、需求无缝衔接,与教师的科研工作紧密配合。 通过专业的大数据分析计算资源搭建的开放式大数据分析平台,可以充分的融合教师的科研需求,教师可以在开放的平台环境下开展大数据科研工作,提升教师的科研创新能力,充分提高“研”的成效。二、 产品优势 交互式学习模式提供体系完整、简单易用的在线教学课堂;以基础知识学习、在线视频教学、习题、线上测试、评估等为主线的一系列方法,确保学生在短时间内掌握大数据虚拟仿真实验、分析部署技能。 真机实验训练实验训练体系设计成各模块相对独立的形式,各模块交互式的实验任务、大数据实验机、实际项目上机操作,通过多方位的训练,最终灵活的、渐进式地掌握大数据生态体系。 大数据实战及案
3、例分析提供实验数据,包括网站流量数据、租房及二手房数据、电商商品交易数据、搜索引擎访问等多种行业数据,数据内容超过 20TB,同时周期更新数据内容。 充分支撑科研工作提供行业数据及案例解剖用于基础研究,提供数据分析方案及流程,提供数据更新接口,可以对行业数据进行分析统计,按需求生成数据报表,为科研工作提供数据支撑。例如某地区经济数据分析、股市数据分析、全国地震数据分析、食品价格行业数据分析等。三、 建设规模按照 60 台大数据实验机容量进行同时在线使用进行建设为基础,整体系统提供快速扩容升级服务。四、 硬件配置采用十六台高性能品牌服务器作为大数据节点进行建设,采用企业级全千兆三层交换机进行网络
4、数据交换。每台节点的配置如下:处理器 每节点支持 2 个英特尔 至强 处理器 E5-2650 CPU高速缓存 15MBQPI 总线速率 7.2GT/s内存 提供 12 个内存插槽,标配 192G 内存,支持高级内存纠错,内存镜像,内存热备等高级功能磁盘 标配 4 块 3TB SATA 硬盘标配 2 块 120G SSD 硬盘300G 10000 转 SAS 系统盘网络控制器 集成 1 个高性能千兆以太网控制器(双口) ,支持虚拟化加速,网络加速,负载均衡,冗余等高级功能电源 标配大功率高效白金级电源,1+1 冗余虚拟化技术 支持 VMware vSphere、Docker、OpenStack
5、等五、 软件平台介绍1、大数据教学管理系统1.1 专业管理提供对专业信息的增加、删除、修改、查询功能。1.2 班级管理提供对专业下属班级的增加、删除、修改、查询功能。1.3 学生管理提供对班级内学生的管理,学生内容包含姓名、学号、所属班级、所属专业、联系手机、登录次数等内容。1.4 交流日志查阅对实验机分享交流的内容进行查询,包含交流 IP、相关学员、相关老师、实验机编号、交流内容等内容。1.5 成绩管理对于学习中心在线学习的学习考核成绩进行管理,包含查询及删除等功能。1.6 学习记录提供每个学生在学习中心平台内学习课程的学习记录,包含日期、计划、课程、章节、学习 IP 等。1.7 学习行为报
6、表对所有学生的课程学习记录进行统计,包含个体统计、班级统计、全体统计等。1.8 课程管理对学习课程进行查询、修改、删除等操作。1.9 开通课程计划对于学习开课计划的字段内容包含计划名称、授课讲师、授课时间段、开通状态、允许申请周期,允许申请人数等,功能提供绑定课程计划相关实训平台课程、授课助教、云实验机绑定、实验任务绑定等功能。1.10 课程测验习题管理提供对课程相关的习题管理,题型包含单选、多选、判断题等类型,对习题进行增、册、改、查操作。1.11 分级权限功能系统分为总管理员、助教等二级管理角色,总管理员进行管理所有的功能点,助教可以进行班级管理、学生管理、开课计划制作、实验机远程协助等。
7、1.12 学生实训系统提供学生根据姓名、学号、密码登录系统进行实训操作,学生只需安装浏览即可进行实验任务操作;提供实训课程在线学习功能、实验机在线操作、实验报告提交、实验机界面截图、记录课程学习时长等。1.13 实验机桌面分享提供实验机桌面分享功能,如学生在学习、操作云实验机的过程中,有问题可以向老师发起协助请求,助教在收到请求时,可以远程访问学生的实验机,并指导如何操作。2、云实验机及实验任务2.1 云实验机提供基于 Web 浏览器的实验机可视化操作,操作终端无需安装其它开发软件即可进行实验操作;云实验机可以根据学生编号、实验任务和环境要求自动创建,无需管理人员参与实验机创建操作过程。管理平
8、台对云实验机可以进行停止、销毁操作。2.2 云实验机集群管理功能提供云实验机集群管理,对实验机所属服务器进行新增、删除等操作。2.3 云实验机类型包含 Hadoop 实验机、Hive 实验机、HBase 实验机、 R 语言实验机、Scala 实验机、Spark实验机、Kafka 实验机、Sqoop 实验机、Flume 实验机、数据可视化实验机等。2.4 实验机运行监控系统系统提供对实验集群运行的所有实验机进行监控,可以查询编号、所属服务器、创建时间、运行状态、开放端口等内容。2.5 实验任务管理提供对实验任务内容的管理,包含任务课程、绑定实验机、设定任务成绩总分,排序值等,提供多种实验任务内容
9、,例如 Hadoop 实验任务、Hive 实验任务、HBase 实验任务、Flume 与 kafka 实验任务等。2.6 实验报告审阅功能在实验任务过程中学生上交的任务报告进行审阅评分,提供按照学生、实验任务等字段进行检索功能。2.7 云实验机桌面分享系统提供实验机桌面基于浏览器的分享功能,允许学生与学生、学生与老师同步操作实验机桌面系统,提供基于浏览器的交流功能。3、大数据实战平台系统3.1 大数据集群管理系统基于分布式集群管理系统,提供大数据集群管理系统,功能包含Hadoop、Hive、HBase、Sqoop、Flume、Spark 等节点部属及管理,提供实时监控集群的CPU、内存、硬盘等
10、使用率及相关信息,可以对管理节点、计算节点进行启动、停止等操作管理。3.2 大数据作业工作流系统提供大数据相关作业的上传、部属、流程管理等功能,基于 Web 的任务调度、兼容Hadoop、Spark 主流版本、失败任务的、运行状态监控等。六、 大数据课程及行业案例实验平台提供 100 个课时的 Hadoop、Spark 等大数据主流课程,课程与大数据实验机完美结合,学员在教学管理系统学习课程,随时进行实训操作,包含项目设计、数据采集、清洗、建模、技术实现等,快速提升实操技能,最终掌握大数据开发、数据分析与数据挖掘等大数据能力。部分案例图片:【电商大数据分析案例】【电商大数据分析架构】【房产大数据分析架构】【房产大数据分析可视化】【搜索大数据分析架构】【网站日志大数据分析架构】