1、一种识别及处理特高品位值的新方法摘 要: 通过对目前特高品位值识别及处理方式进行综合分析评价,提出一种新的特高品位值识别及处理方式。新方法采用 准则判断特高品位值及特高品位值个数。产生一组3数目为样本数目的数据,要求这组数据符合样品统计分布规律。将样品和随机数都由大到小排序,用相应序列的随机数代替特高品位值。在实例分析时,新方法处理之后其品位分布特征的峰度、偏度均大幅度下降,并且品位均值和标准差均无较大变化。对比应用品位变化系数法处理的结果,在峰度和偏度下降相当时,品位值更加接近原始数据,说明新方法处理结果较为合理。关键词: 特高品位值;随机数; 地质统计学;统计分布; 品位变化系数法1 引言
2、采用地质统计学方法对矿床储量进行估计的过程中,需要对特异值进行处理,然后将处理之后的品位值作为储量估算的原始数据。特高品位对矿床资源储量的估算影响较大,在对矿床资源储量进行估算时,很有必要对特高品位进行处理。特高品位值的处理至今没有一个可以被普遍接受的方法。目前主要采用 准则 1、估计邻域法 2、影响系数法 2,3、3邻近点数据比较法 1、品位变化系数法 4,5、分布函数法 5,6等,这些方法在识别和处理特高品位值的过程中存在对品位分布特征分析不足、识别及处理过程人为影响因素大、关键参数选择缺乏科学理论依据等一系列问题,在处理单一矿床特高品位的时候,有必要采用一种能够反映矿床品位分布特征且可操
3、作性强的处理方式,以降低特高品位值对矿床真实储量的影响。2 特高品位值识别及处理评价2.1 特高品位值对资源储量估算的影响当在地质勘探及矿山地质研究中出现特异值(高值)时,称之为特高品位 2。特高品位一般具有特点 2,7:比所研究的全部数据的算术平均值或中位数的数值要高得多;存在于所研究的母体之中,不是采样或化验分析等所引起的认为误差;只占所研究数据的极少部分,但是对全部数据的统计结果影响较大;存在于所研究母体的一定空间位置。特高品位导致的结果 8主要有:(1)影响数据统计参数的变化,并且影响实验变异函数的性状;(2)影响特异值周围的矿块品位,从而导致高估矿石量和金属量;(3)在使用克里格估计
4、过程中也可能产生奇异的样品权系数,如负的权系数。资源储量估算的准确性关系到整个矿床资源的开发利用,涉及到大量的人力物力投入。而特异值的存在使得资源储量估算存在很多偏差和不准确性。因此所有的特异值都有必要受到特殊的处理,其中包括在可能的情况下重新化验分析样品、根据经验将数据限制在一定的范围之内 8。2.2 特异值识别及处理方法评述孙玉建 8认为如果发现特高品位是分析错误或反应了截然不同的地质子环境或者是一个矿床的特殊的域,就应该采取措施检查这个高值并分析其地质意义,以排除是由于分析错误造成的;如果高值是真实的值,就要分析如何将这些高值融入到资源量估算任务之中。在特高品位处理过程中都要求的是不能给
5、特异值过高的权重。在地质勘探中,特异值识别方式 7主要有:(1)按照样品均方差的倍数来确定是否是特高品位,即特高品位值大于或等于 (其中 m 为均值, 为均方差);(2)按照样品品位变化系数( )来识+3 =/别特高品位;(3)在分布密度函数曲线上将拐点对应值作为特高品位的下限值。特异值处理方法 910主要包括:将特异值去掉,不参加统计;用正常值的最大值代替特异值;用以剔除特高品位或包括特高品位的平均品位代替特高品位值;用特高品位相邻两侧的样品或包括特高品位在内的三个连续样品品位值代替特高品位;用前述各种方法确定特高品位下限值代替特高品位的样品。另外刘振升还提到采用概率分布函数法识别特异值,认
6、为特高品位相邻两个或 3 个或 4 个样品品位的平均值代替特高品位比较实用 11。所有这些方法在生产实践中也不同程度的发挥了作用,但也存在着某些容易忽视的缺点,例如只是经验而无统计意义,或未将特异值与正常值置于同一领域来研究等 2。目前所采用的识别及处理方式评价如下:(1) 准则 1方法,以样本平均值加减三倍标准差作为区间,如果数据分布在区间3意外,则定为特异值,然后分别用正常最大和正常最小值代替特异值。(2)估值邻域法 2,3,是由 D.G.克立格和 D.M 霍斯把地质统计学的基本思想用于识别和处理特异值的方法,它是一种把被识别的观测值(称为可疑样品)置于一个空间连续矿化域的背景上进行研究
7、2。在使用该法时,其中的 n、 以及替代值的确定都是人为确定,2没有一致的标准;在面对大量数据的时候,可操作性不强。(3)影响系数法,该法是通过认为确定特异值的影响程度进行特异值的识别和处理2,3,采用此法是,过程相对比较繁琐,而且参数 K 值的确定存在模糊性。(4)邻近点数据比较法 1,将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时,需要将该数据与总体数据进行比较外,还要将该数据与周围邻近的 8 点的数据进行比较。在实际操作时很难在拿到样点数据时想象出空间数据进行分析,而且也没有给出相关处理特异值的方法,所以实际操作上存在困难。(5)品位变化系数法,有两种实现方式,一种是程宗芳
8、提出的采用估值块段方法确定品位变化系数 4,另外一种是采用矿体均方差和矿体算术平均品位来计算品位变化系数 5。在使用时,如果品位空间位置不明朗,采用后一种方法更加便于实际操作,不过不能反映出品位分布特征对特高品位处理的影响,存在局限性。(6)分布函数法 6,用概率分布函数来确定矿石的特高品位体现了用偶然性的角度来判断特高品位,能更接近矿床的实际情况。能够判断出在 n 个样品中出现高品位值的客观实际性。在识别及处理特高品位值时,要考虑到统计矿区可用品位的分布规律,应用概率统计的方式,给定品位值在一定置信水平(通常为 95%)的期望值,再结合实际应用此统计分布规律去随机产生一些符合概率分布的一组数
9、来代替特高品位值。3 一种新的特高品位值识别及处理方式根据经验得知,单铜金属矿体的品位值的统计分布规律基本上符合对数正态分布,因此在进行特高品位值处理的时候首先要对其数据进行正态分布转化,然后得出其某一置信水平(95% )的期望值以及相应的统计分布特征,以此为基础进行特高品位值的识别及处理。3.1 特高品位值数据前处理常用的正态变换方法 10主要有:(1)对数变换:对于 个样品第 个变量 ,对数变 ijx换后的变量为 ,式中 C 为常数,当分析样品中有小于 1 的数据时,在取对数lg()ijijxc后会出现较大的负数,因此按照公式 加常数 后再取对数 12;(2)lg()ijijxcd2平方根
10、变换: ;(3)反正弦和反余弦变换:ijij或者 ;其中 n1sin/0,1nijx 1os/0,nijijx是正整数,相当于变量初始观测值中最大值的整数位数。以上三种方法都属于使偏态变量接近于正态的变换方法,若数据的频率分布曲线右偏,则用反正弦变换;若是频率分布曲线左偏,按长尾收敛程度选择变换方法,左偏程度较大时采用对数变换,偏度中等采用平方根变换,弱左偏采用反余弦变换。如果区分偏倚程度的尺寸很难掌握,就对同一变量进行多种方法的变换,从中选出适当的变换方法。3.2 概率统计分布及特高品位值识别将数据进行正态分布转换后,统计其期望、标准差,以及峰度、偏度等参数,采用准则 1判断其特高品位临界值
11、及特高品位值个数。即样本平均值(这里用期望)加上 33倍的标准差,大于这个和值的数据定为特高品位值,并统计其个数。3.3 特高品位值处理采用统计分布中的期望及标准差,通过计算机随机产生一组数目为可用样品数目的随机数,这组随机数要求满足原始样品的正态统计分布规律,这里是满足相应的矿体对数转换后的品位值的统计分布规律。将这一组数和特高品位值都从大到小进行排序,利用随机数分别代替相应序列的特高品位值。4 工程实例以四川某铜矿为例,通过地质分析得出共有三个主要矿体 1 号矿、2 号矿、3 号矿。进行资源储量估算时,可用样品品位总数为 912 个。统计分布图形采用 SPSS13 进行处理。可用品位分布直
12、方图见图 1,左偏程度较大,采用对数转换数据,按照式 进行ln()iiyx转换,见图 2,对所有 Cu 品位对数转化后进行 Q-Q 校验分析见图 3。由图可见整个矿区Cu 品位呈现对数正态分布。 10.8.6.04.2.0.业Cu%3025105业 Mean =0.891StdDv7N2图 1 所有 Cu 品位分布直方图Fig.1 All Cu grade distribution histogram 3.021.0-.2-3.04业Cu业%08604业 Mean =-0.467StdDv85N912图 2 所有 Cu 品位对数转化后分布直方图Fig.2 Logarithmic transfo
13、rmation of all Cu grade distribution histogram3210-2-34业420-业Transfom: turlgNormal Q-Ptf ZCu图 3 所有 Cu 品位对数转化后 Q-Q 校验图Fig.3 Logarithmic transformation of all Cu grade of Q-Q parity map4.1 新方法处理鉴于三个矿体之间相关性不强,有必要分别对三个矿体进行特高品位值处理。对三个矿体分别按照(0.3,0.5)和(0.5,+)分成低品位矿体和工业矿体。其中由于 3 号低品位矿体样品数为 5 个,不构成统计分布的条件,不对
14、其进行处理,这里只统计了其分布特征。而 2 号低品位矿体中经判断没有特高品位值。其中 1 号矿体工业矿品位的统计分布曲线见图 46,从图 6 的 Q-Q 校验图看出 1 号工业矿体满足正态对数分布。采用新方法对 1号矿体进行特高品位值处理情况见表 1。 6.054.302.10.业Cu%业086042业 Mean =1.0547StdDv82N3图 4 1 号工业矿 Cu 分布直方图Fig.4 Histogram of 1 industrial mineral Cu2.50.1.50.0.5业业Cu%60543021业 Mean =1.0864StdDv239N图 5 1 号工业矿体 Cu 对
15、数转换后分布直方图Fig.5 Logarithmic transformation of 1 industrial mineral Cu grade distribution histogram3210-2-3业420-4业Transfom: turlgNormal Q-Ptf GCu图 6 1 号工业矿体对数转换后 Q-Q 校验图Fig.6 Logarithmic transformation of 1 industrial mineral Cu grade of Q-Q parity map1 号工业矿体通过新方法判断总共有 5 个特高品位,其特高品位处理见表 1,处理的特高品位值降幅在
16、20%40%。表 1 1 号工业矿体特高品位处理表Table 1 Treatment table of 1 industrial mineral Cu extra-high-grade矿体 特高品位 编号 处理前品位(%) 处理后品位(%) 品位降幅(%) 特高品位临 界值(%)1 5.97 3.821 36.002 4.72 3.795 19.593 4.7 3.540 24.684 4.52 3.348 25.931 号工业矿5 4.41 3.083 30.103.993对 1 号、2 号、3 号矿体进行特高品位处理的结果统计见表 2,其中置信度一栏的数据是通过统计分析其矿床平均品位值在可
17、行度达到 95%以上时的偏差值。由表 2 中可见处理过后的样品平均品位、标准差、方差降低较少,而峰度、偏度等均有较大降幅,说明处理之后的数据更加符合矿体品位的统计分布规律。表 2 新方法处理矿体特高品位综合统计表Table 2 New approach to Cu extra-high-grade comprehensive tables元素 矿体 平均品 位(%) 标准差 方差 峰度 偏度 置信度(95% ) 样品数(个) 处理样品 数( 个)处理前Cu 1 号工业矿体 1.055 0.842 0.710 6.159 2.130 0.085处理后Cu 1 号工业矿体 1.037 0.772
18、0.595 2.541 1.588 0.078382 5处理前Cu 1 号低品位矿体 0.352 0.176 0.031 6.276 1.493 0.028处理后Cu 1 号低品位矿体 0.345 0.150 0.023 0.435 0.216 0.024150 2处理前Cu 2 号工业矿体 1.242 1.272 1.618 10.232 2.622 0.183处理后Cu 2 号工业矿体 1.225 1.179 1.391 3.859 1.922 0.170188 1处理前Cu 2 号低品位矿体 0.342 0.124 0.015 0.050 0.223 0.030处理后Cu 2 号低品位矿
19、体 0.342 0.124 0.015 0.050 0.223 0.03069 0处理前Cu 3 号工业矿体 0.893 0.586 0.344 11.204 2.323 0.107 118 1处理后Cu 3 号工业矿体 0.881 0.520 0.270 1.841 1.088 0.095处理前Cu 3 号低品位矿体 0.374 0.119 0.014 1.503 0.956 0.148处理后Cu 3 号低品位矿体 0.374 0.119 0.014 1.503 0.956 0.148 5 04.2 品位变化系数法处理为方便对比分析,选择品位变化系数法识别及处理特高品位值,其处理方式如下。品
20、位值高于平均品位的 68 倍的样品为特高品位,品位变化系数大时取上限(8 倍) ,品位变化系数小时取下限(6 倍) ,品位变化系数计算见公式 1。,式中 (1)=100%= (1)2+(2)2+()21其中:-品位变化系数;-品位均方差;-矿体算术平均品位;, -已知的采样品位;1 2 n-样品总数。不同的品位变化系数下,铜样品的稳定程度如表 3 所示。表 3 铜样品分布均匀程度 Table 3 Distribution uniformity of copper samples矿产种类 稳定程度 品位变化系数均匀 150该矿较高样品个数较少,样品最大值为 9.45%,特高品位用平均品位代替的方
21、式进行处理,具体的特高样品处理情况见表 4。表 4 矿床特高样品品位变化系数法处理表Table 4 Grade changes coefficients treatment table of extra high deposit samples元素 矿体原始样品平均品位(%)均方差品位变化系数(%)截止品位(%)处理后的平均品位(%)处理样品数量(个)样品总数(个)处理倍数1 号工业矿体 1.055 0.842 79.810 7.390 1.055 0 382 按 7 倍处理1 号低品位矿体 0.352 0.176 50.000 2.110 0.352 0 150 按 6 倍处理2 号工业矿体
22、 1.242 1.272 102.415 8.690 1.198 1 188 按 7 倍处理2 号低品位矿体 0.342 0.124 36.257 2.050 0.342 0 69 按 6 倍处理3 号工业矿体 0.893 0.586 65.622 6.250 0.893 0 118 按 7 倍处理Cu(%)3 号低品位矿体 0.374 0.119 31.818 2.240 0.374 0 5 按 6 倍处理4.3 综合比较可见品位变化系数法和新方法仅在针对 2 号工业矿体进行处理时存在差异,而且品位变化系数法处理的样品数更少(只有一个) 。表 5 给出了对 2 号工业矿体用两种方法处理后得到
23、的平均品位、峰度、偏度变化情况,说明新方法处理效果与品位变化系数法处理后平均品位降幅分别为 1.4%和 3.5%,峰度降幅分别为 62%和 67%,偏度降幅分别为 27%和 30%。在偏度和峰度降幅相当的时候,新方法处理的平均品位更接近于原始平均品位值,可见新方法处理效果更佳,也基本满足对特高品位值的处理要求,能有效的降低特高品位值对矿床储量计算带来的影响。表 5 新方法与品位系数法对比统计表Table 5 New method compared with the grade of coefficient statistical tables矿体 处理方式 平均品位 (%) 峰度 偏度 样品数
24、(个) 处理样品数 (个)处理前 1.242 10.232 2.622 新方法处理 1.225 3.859 1.922 188 12 号工业矿体 品位变化系数法处理 1.198 3.392 1.829 188 15 结论及展望 采用新方法识别及处理特高品位值时唯一不确定的因素就是在处理特高品位值时,采用随机数代替特高品位值。虽然在处理时替代值存在不确定性,但其体现出一定统计分布特征,而且这种统计分布是满足当前条件下整个矿体的统计分布特征,从地质因素不确定的角度考虑,这种处理方式更加能够反映出地质变量的随机性。通过对比分析,这种处理方式跟品位变化系数法更加优越,处理之后数据的峰度、偏度均大幅下降
25、,比起之前的其他方法用定值代替所有的特高品位值,新方法更能减少人为影响,凸显地质品位的随机性特征。新方法识别及处理特高品位值的结果能够让矿体的品位值更加服从统计分布规律,能够为广大地质工作者提供一种参考。这里只是针对统计分布特征评价了一下处理的结果,希望在地质统计学储量估算的过程中能够得到进一步判断。参考文献:1李中元,何腾兵,赵泽英等.土壤养分数据几种特异值处理方法的比较 J.贵州农业科学, 2008,36(2):9396.2侯景儒,张树泉,黄竟先. 特异值的识别、处理及块段平均品位估计J. 地质找矿论丛, 1990,5(3):93102.3刘全明,陈亚新,魏占明. 土壤水盐时空变异数据中特
26、异值处理方式与调控技术J. 灌溉排水学报, 2004,23(4):2629.4程宗芳. 地浸铀矿床储量计算中特高品位的处理方法J.铀矿冶, 2002,21(4):210213.5邱陆军. 数理统计法在查明特高品位中的应用J. 江西地质科技 , 1989, 1:3237.6刘默,支学军. 运用概率分布函数确定特高品位J. 吉林地质 , 2004,23(4):118120. 7丁旭东. 几种特异值处理方法的比较J. 物探化探计算技术 , 1996,18(1):7177.8孙玉建. 地质统计学在固体矿床资源评价中的若干问题研究D.北京:中国地质大学(北京),2008.9王梅英,李云. 特高品位样品确定及其处理方法J. 中国教育与教学 , 2007,5(5):8485.10陈惠新. 变异函数的稳健性及特异值处理方法的研究J. 内蒙古农业大学学报, 2000,21(2):8490.11刘振升. 河台金矿床特高品位及成矿富集规律研究J.黄金, 2001,21(3):1114.12张家书. 凡口铅锌矿矿石特高品位界限值确定方法的探讨及意义J. 有色金属(矿山部分), 2006,58(4):1013.