大数据介绍.docx

上传人:乾*** 文档编号:12632679 上传时间:2022-05-29 格式:DOCX 页数:17 大小:31.97KB
下载 相关 举报
大数据介绍.docx_第1页
第1页 / 共17页
大数据介绍.docx_第2页
第2页 / 共17页
大数据介绍.docx_第3页
第3页 / 共17页
大数据介绍.docx_第4页
第4页 / 共17页
大数据介绍.docx_第5页
第5页 / 共17页
点击查看更多>>
资源描述

大数据BigData是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。大数据的预处理主要完成对已接收数据的辨析、抽取、清洗等操作。(1)抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。(2)清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项,因此要对数据通过过滤“去噪”从而提取出有效数据。大数据带来的数学问题在数学上来看,计算机中存在不断变大的数据集,不存在绝对的大数据,计算机中的所有数据集都是有限集合。大数据采样一一把大数据变小、找到与算法相适应的极小样本集、采样对算法误差的影响大数据表示表示决定存储、表示影响算法效率大数据不一致问题一一导致算法失效和无解、如何消解不一致 大数据中的超高维问题一一超高维导致数据稀疏、算法复杂度增加 大数据中的不确定维问题一一多维

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 商业租赁

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。