基于大数据系统和分析技术的研讨.docx

上传人:h**** 文档编号:1364296 上传时间:2019-02-12 格式:DOCX 页数:3 大小:18.48KB
下载 相关 举报
基于大数据系统和分析技术的研讨.docx_第1页
第1页 / 共3页
基于大数据系统和分析技术的研讨.docx_第2页
第2页 / 共3页
基于大数据系统和分析技术的研讨.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、基于大数据系统和分析技术的研讨 摘要:随着科技的发展,先后出现了大数据系统和分析技术,并且在逐渐进步与成熟。现根据每种数据不同的处理形式、自身特点、运用场景以及各自典型的处理系统,特别地介绍了大数据系统未来发展的主要方向,并对大数据分析技术和应用做出了详细评述,以及概括了在大数据分析技术中占主导位置的多种技术。另外,本文还总结出大数据系统处理和分析技术方面存在的问题、机遇和挑战,并根据问题提出一些切实可行的方案和措施。 下载 关键词:大数据系统;分析技术;研讨 中图分类号: TP391 文献识别码: A 文章编号: 1001-828X( 2016)021-000-01 一、前言 最近几年,大数

2、据在迅猛发展,成为社会各界关注的焦点。那究竟何为大数据,人们仍莫衷一是。若站在微观世界的角度来看,大数据是连接物理世界、信息空间、人类社会的纽带;若站在信息产业的角度来看,大数据是新型信息技术产业高效的催化剂;站在社会经济角度来看,大数据是第二经济的关键产业和核心支持,是推动第二经济快速发展的永久动力。另外,美国政府称大数据是 “ 未来的新石油 ” ,一个国家所能拥有大数据的规模和对大数据处理的能力是衡量国家综合国力的重要 指标之一,预计大数据将成为各个国家相互争夺的对象。显然,大数据的时代到来了。 面对大数据处理和分析技术方面的机遇和挑战, Google、 Facebook 等各大互联网企业

3、不断努力和研究,现已开发出多种新型的大数据处理系统,并广泛运用于社会多个领域。本文主要介绍了多种大数据处理方法以及讲述一些具有代表性的处理系统,再指出深入探索、热爱学习、善于计算等对大数据分析技术的重要性,最后总结在大数据处理和分析中所遇到的重大挑战,并对此提出有效的解决措施。 二、大数据处理与系统 目前,对海量数 据处理的要求是我们面对的重大挑战之一。处理形式包括 3中,分别为批量处理静态数据、实时处理在线数据。以下,将对其分别分析和介绍。 (一)批量数据处理系统 大数据的批量处理对实时性的要求还不算太高,适用于先储存后计算,但是对数据的准确性和完整性要求非常严格。 1.批量处理的特征与典型

4、运用 批量数据特征。批量数据主要有三个特征。一是数据量庞大,数据很少更新,储存时间长,不容易备份和转移。二是数据精确度高,这是由于数据是人们长期归纳总结下来的宝贵经验,是无形的财富。三是数据价 值密度低,处理时间耗时长。对视频批量处理的过程中,需要处理大量的监控,但有价值的视频只有一两秒,这样就降低了效率。另外,如果处理后没有达到或偏离了预期的效果,这就会浪费更多的时间。综上所述,批量处理数据适用于有能力的、成熟的各大企业。 典型运用。数据处理广泛运用于各行各业,物联网、互联网、车联网等无一例外,以下主要介绍三个领域。在互联网领域,批量数据处理的典型应用是社交网络、电子商务、搜索引擎。其中,社

5、交网络的数据主要是以新浪微博、微信等下载的图片、文字、音频等;电子商务在历史记录、商品描述、商品 评论方面产生了较多的数据。在公共服务领域中,批量数据处理的典型运用主要是能源和医疗保健。其中,能源可以是地震时来自地球深处的能源,再进行收集整理,就可以知道地下的储煤量。 2.代表性的处理系统 2006 年,基于前人的经验, Hadoop 完成了两个引起超大反响的产品:HDFS和 MapReduce。这也使它们一跃成为大数据批量处理的代表性处理系统。Hadoop 是随着 IT 主流发展应运而生的产品,后来把 HDFS 和 MapRed 当作其基础,加以发展并建立多个项目,形成了自己稳定的 Hado

6、op 生态体系。 最受欢迎的系统莫过于 MapReduce 编程系统了,其主要原因有:MapReduce 系统是大规模集群系统,并且 MapReduce 系统结构简单、便于操作、容易理解。另外,最主要的一点是它有良好的数据护理性能。 (二)流式数据处理系统 流式数据处理起源于服务器的实时采集,是 Google2011年在实时处理数据时开发的系统,引领人们向数据实时处理迈进。 1.流式数据的特征及典型运用 流式数据的特征。流式数据最主要的特征就是元组带有时间标签,且同一个流式数据在处理的 时候有先后顺序。另外,流式数据的产生是实时的、无法预测的,因此数据往往是处于动态变化之中。 典型应用。同样,

7、流式数据广泛地运用于社会多个领域,但典型的应用主要有一下两个:数据采集运用、金融银行业的运用。其中,银行在工作中会产生大量数据,这些数据时效性短,因此需要采用流式数据处理,以便银行进行实时决策。 2.代表性的处理系统 随着流式数据处理的不断发展,极具代表性的系统主要是: Twitter 的Storm、 Linkedin 的 Samza、 Apache 的 Spark 以及 Facebook 的 Scribe。 三、大数据处理和分析面临的机遇与应对措施 虽然大数据是人们关注的热点话题,但其中也存在不少漏洞。正确地解决这些漏洞,正是时下面临的机遇之一。 (一)数据复杂性带来的挑战 数据复杂主要表现

8、在形式多样、关系复杂、质量差异较大等,这使得数据的收集整理、计算理解难度加大。但是,目前人们还不了解大数据复杂性的内在原因,且对大数据的分布与联系也认识不到位,这就使设计大数据计算模型受到限制。由此可见,能更深层次地研究大数据是首要解决的问题,可以通过掌握大 数据复杂性规律,简化大数据以便更好地进行大数据计算模型的设计。 (二)系统复杂性带来的挑战 系统复杂主要表现在计算复杂度高、任务周期较长、实时性要求高等,这些给大数据系统带来了结构、计算框架、处理方法等的挑战,另外对系统的计算效率、单位效能提出了更严格的要求。因此,要把握好因系统复杂带来的挑战,最终设计一个数据获取速度快、数据存储耗能低和

9、数据计算效率高的优秀系统。 四、总结 在互联网、物联网飞速发展的时代,大数据不断吸引人们的眼球,成为人们所关注的焦点。大数据的时代已 经到来,我们应紧跟时代的步伐,不断学习探索、勇于计算创新、积极应对挑战、完善数据处理系统以及提高数据分析技术,努力开创大数据处理和分析的新纪元。 参考文献: 李有为 .大数据系统和分析技术的开发 J.计算机技术, 2013( 21):56-58. 陈浩 .中国大数据技术研发进展 J.科技前沿, 2014( 33): 87-89. 刘欣如 .基于阿里巴巴大数据技术的分析 J.大数据技术与商业化,2013( 54): 12-14. 作者简介:张 磊( 1984-),男,汉族,河 北石家庄人,研究生,石家庄邮电职业技术学院,助理工程师,研究方向:大数据。 杜冬梅( 1969-),女,汉族,河北石家庄人,工程硕士,石家庄邮电职业技术学院,高级工程师,研究方向:数据库。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。