1、地质数据处理功能介绍,2007/03/16,李丰丹,内容:,第一部分 多元统计第二部分 地球化学图制作,地、物、化、遥多源地学信息的处理、分析是进行物化探数据综合处理、矿产资源评价的重要手段多元统计分析是地球化学数据广泛使用的统计分析及数据处理方法填图系统中集成了几种常用的多元统计分析方法,包括:因子分析、聚类分析、多元判别分析、BP神经网络系统可以方便地对图层的定量数据进行处理,免去了数据准备的繁琐过程,同时提供了聚类谱系图,第一部分:多元统计,因子分析:,因子分析是帮助我们对大量地质观测资料进行分析和作出较为合理解释的一种多变量统计方法。它能够从大量的观测资料中,在关系复杂的情况下,寻找影
2、响它们的共同因素和特征因素。并以原始数据间的相关关系为基础,通过数据方法将许多彼此间具有错综复杂关系,它往往指示出某种地质上的共生组合和成因联系。用因子代替原始变量,不仅对原始变量的相关信息损失无几,而且更能反映出地质现象的内在联系。,聚类分析 :,聚类分析是一种多元统计的方法,最早被运用在分类学中,形成了数值分类学这个学科。以后,随着统计软件的发展,聚类分析被引进到统计分析中来,形成了聚类分析这样一种多元统计方法。 聚类分析主要用于辨认具有相似性的事物,并根据彼此不同的特性加以“聚类”,使同一类的事物具有高度的相似性。简单点,就是按照一定标准来鉴别地理区域或实体、现象之间的接近程度,并将相接
3、近的归为一类的数学方法。 选择刻划对象间两两接近程度的要素和具体标定方法,是聚类分析的关键性基础工作。它主要依靠地理专业知识,具体标定方法很多,常用的有相关系数法、欧式距离法、海明距离法、夹角余弦法及数量积法等。把彼此接近的归为一类的聚类方法也有多种,如一次性完成的系统聚类和逐步完成的动态聚类;基于分明(硬)划分的聚类和基于模糊(软)划分的聚类;具体实施上有通过矩阵运算实现的,也有应用图论方法实施的。,判别分析:,判别分析的前提是已经存在几种已知的分组类型,需要对未知样品判别其归属于哪一类。,BP神经网络:,可用于离散数据变量间的非线性关系拟合(1对多,多对1,多对多),达到预测的作用;用于离
4、散数据的模式识别,即先建立样本属性与模式之间的关系,通过回判达到识别样本模式的功能,属于有监督的模式识别。,(1) 数据分布特征:离散点 网格化数据(2) 文件格式系统中集成的数据:图幅PRB库中加入的点图层文件用户打开文件夹选择不同格式数据wt/mdb/dbf/txt/xsl,原始数据的要求,实验数据,投影文件(MDB、XSL、TXT)L44E023020图幅,因子分析,聚类分析,多元判别分析,BP神经网络,用户选择数据源进行数理统计,TXT文件:文本的第一行:“GEOSTDATA1.0”;第二行:第一个数为坐标点个数,第二个数据为变量个数(包括坐标点的X/Y变量),第三个数为观测点数;第三
5、行:变量名称(包括坐标点的X/Y变量);第四行开始:变量值。,用户选择数据源进行数理统计,(2)EXCEL文件:第一行:变量名称(包括坐标点的X/Y变量);第二行开始:变量值。,用户选择数据源进行数理统计,第二部分:地球化学图制作,1 原始数据的准备与数据格式转换2 数字特征计算3 等值线图制作,统计:离散点或网格化点可以分为三种方式计算数字特征:计算数值特征、计算log10对数数字特征、计算自然对数ln数字特征。用户可以通过“小于此值剔除”和“高值替代值”处理高低异常值,计算出得到这三种方式下的数字特征:最大值、最小值、标准方差等。在进行数字特征计算时,将通过数字特征图把数据划分成不同的级别
6、,形成专题图,包括饼图和直方图。若需要定制详细的专题图,可使用用户指定子区进行统计、按子区划分进行统计 可对图件标题修改:包括图件的标题、字体、颜色的设置。可针对当前统计图的特殊参数设置:如可设置直方图的方块的颜色、大小;如果是曲线图,可设置曲线的颜色、线宽等 将图件保存为MAPGIS格式,等值线方法:TIN方法、GRID方法、KRG方法可对等值线极值点参数设置可根据“标注格式参数”,选择输出标注:使用“固定小数位数”还是“科学计数法”;小数部分是几位若计算数字特征时选择了对数计算方式(数据已对数),可还原显示具有“等值线套区”、“绘制色阶”、“保留边界线”;等多参数控制绘图可对空白区域进行裸
7、空处理,数据分布特征:离散点 或 网格化数据文件格式:图幅PRB库中加入的点图层文件(*.WT)实验数据:L44E023020图幅,一、原始数据准备与转换,EXCEL文件转换成MAPGIS所需的TXT文本文件 将TXT文本投影成MAPGIS WT点文件,一、原始数据准备与转换,1.数字特征:通过最大值、最小值、方差等基本统计量以及分级统计频数,以专题图件(直方图、饼图)形式表现 2.方式:统计整个图层的数字特征、按照某个指定区域的数字特征、多个不同子区的数字特征3.专题图件的编辑,二、数字特征计算,数字特征等值线方法选择,及其相关参数的设置(搜索方法、网格数等)极值点参数设置:子图、标注字体、标注格式等值线追踪,三、地球化学图制作,注意点:数字特征 对数计算方式时,是否已经选对数,自动计算数值特征:三种方式,TIN:绘制的等值线经过点GRID:绘制的等值线可能不经过点,注意:若计算数字特征时选择了对数计算方式(数据已对数),则需要进行还原显示,实际材料图的检索:检索多个图幅下的实际材料图数据 制作专题图层的制作,其他,数字地质调查技术支持网站,,软件下载操作手册常见问题,电话解答Email“常见问题”栏全部问题浏览,TEL:010-62302295,谢 谢 !,