精选优质文档-倾情为你奉上数据治理能力提升第一章 综述1.1数据治理能力提升项目介绍数据能力治理提升致力打造一个将非结构数据通过计算模型转换成结构化数据,用于可视化图表展示的云服务,将隐藏在数据中的信息直观展现于用户面前。使用该平台可以使用户或者技术人员通过可视化配置的方式快速制作模型、图表,节省人员工作量、减少人员数量投入,在无需修改底层代码的情况下,能完成数据计算、分析及展示。极大的提升开发效率、数据的价值应用和管理。1.2 Spark算法平台介绍数据能力治理提升中,对数据中心的原始数据进行算法计算的部分成为Spark算法平台,通过Spark集群的处理,将不同的算法运行到集群上,通过增加机器的方式,可以横向扩展算法的性能。动态的调整算法使用的资源大小,并通过集群监控软件对各任务的处理情况进行查看。1.3 Spark算法平台组成spark集群由4台机器组成,其中三台为计算节点,master节点为HA高可用节点,并搭建了一系列系统监控及管理应用。第二章 Spark算法平台的优势2.1集群扩展性1. 算法平台是完