1、1浅论自动气象站正点地面数据质量控制方法摘要:为了能更好地获取自动站正点地面数据的完整性、准确性和代表性,本文在分析观测资料误差的基础上,梳理正点地面数据质量控制流程,提出利用观测仪器的质量控制方法、实时在线数据质量控制方法和非实时数据质量控制方法等,对自动气象站的正点资料进行质量控制。 关键字:自动站;正点资料;数据质量控制 中图分类号: P41 文献标识码: A 0 引言 自动气象站是一种能自动收集、处理、存储或传输气象信息的装置。自动气象站的广泛使用从根本上提高了我国大气探测现代化的总体水平,减少了由人工观测引起的误差,提高了地面观测资料的完整性、准确性和代表性,也进一步减轻了观测人员的
2、劳动强度。然而尽管在社会经济、技术和业务三大因素的推动作用下,自动气象站在技术上虽然成熟了许多,但它仍存在有不足之处,主要表现在:传感器测量准确度不高;有些气象要素没有合适的传感器,仍需要一部分人工观测如云、部分天气现象等。此外,自动气象站还受分布、站点环境、站点所在地形影响,所以资料实时性强,数据采集和自动化传输程度高,有时甚至比人工观测所得的数据更难控制。所以,完全依靠机器则无法保证观测资料的准2确性或者使观测值处于可接受范围,这就需要对数据进行质量控制。 正点地面数据,即正点资料,它是指自动气象站每小时采集一次的数据,并将该数据每个一小时进行上传。由于该数据同样有误差的存在,因此也需要对
3、其进行质量控制。 1 观测资料误差类型及质量控制标识 1.1 观测站误差类型 误差的来源是在数据采集时一次或多次积累的结果,以及在传输过程中造成的,主要包括以下四种类型的误差:(1)粗大误差:主要由自动站观测仪器异常及在数据编码、处理、传输、存储及解码等业务流程中产生的误差。 (2)随机误差:在相同条件下对同一被测量进行多次测量,由于受到大量微小随机因素影响,测量误差大小和符号没有一定规律,且无法估计,即为随机误差。随机误差是无法避免的, 其总体服从正态分布。 (3)微气象误差:由小尺度天气系统扰动引起,由于观测系统时空分辨率原因,这些天气系统一般不会被完全观测到,但当观测到这种天气系统时,其
4、观测数据就可能误判为异常数据。(4)系统误差:在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差,这主要是由测量仪器本身的局限性以及传感器的长期漂移所引起的偏差。 1.2 质量控制标识 质量控制后的数据应进行质量标识。资料质量标识用质量控制码表示,质量控制码标识数据质量的状况。表示资料质量的标识有:正确、可疑、错误、数据订正、修改数据、缺测、未做质量控制。质量控制码3及含义见表 1。 表 1 质量控制码及含义 2 数据质量控制流程 自动气象站数据质量控制的目的是,通过采用适当的硬件和软件措施最大限度的减少不准确的观测资料和缺测次数。数据质量控制应贯彻在设计、选购、测
5、试、安装和运行的全过程中,在某种程度上,数据质量控制的要求是针对仪器性能和环境条件提出来的。数据质量控制流程分为实时控制和非实时控制两个阶段。实时控制过程是采用一些基本的手段对异常数据进行排除,非实时控制阶段使用一些更精密的评估与处理,从而对数据做出正确的判断。 根据正点资料质量控制的特点:(1) 执行速度要快,标注明确;(2)正点资料质量控制方法必须实用有效。根据以上原则确定正点资料质量控制方法, 即气候极值范围检查、内部一致性检查、时间一致性检查及台站极端事件检查。结合以上数据质量控制的两个阶段,可以将控制过程分为四层(图 1) 。 图 1 数据质量流程控制图 3 正点地面数据质量控制方法
6、 43.1 观测仪器的质量控制 对于观测仪器而言,根据要求首先应当选择合理的站址和环境条件;其次,应建立和使用完善的维护、维修和标定规程。主要包括以下几个方面的内容: (1) 自动气象站的选用:市场上有很多各种类型、型号的自动气象站,它们的各项技术指标也不一样,因此用户应根据上级规定和自身业务的需求来选定最适当的自动气象站。 (2) 传感器的内部检验:每个传感器在采样过程中都会出现一些似是而非的样本值,甚至出现明显不合理的现象,例如气温已上升零度以上,突然出现一个样本值为零下值;相邻两个样本值之间的变化率不一致,例如每十秒钟取一个样本值,发现两相邻样本值相差一度以上等等。通过传感器内部检验程序
7、,可发现以上不合理的样本值。 (3) 硬件检验:在运行过程中,自动气象站的性能会因硬件的老化、不适当的维护以及仪器故障等原因而降低,因此要利用自动气象站的内置测试设备,结合定时的人工检查,使自动气象站的各种设备处于良好的工作状态中。 3.2 实时在线质量控制 在自动气象站中,对传感器进行数据质量实时控制,可以初步确定某个被测的量或被怀疑或存在误差的原因,但这些有较大误差的数据不能被轻易剔除,通过自动气象站的内置硬件对设备进行自检,进一步确定这些数据是否是设备本身的原因造成的,然后这些被怀疑的数据存储在设备管理缓冲器中被传送到中央网络处理系统中。中心站中有多种数5据质量控制措施,如内部一致性检查
8、、时间连续性检查、气候极值检查和台站极端事件检查等。 (1)界限值检查:是检查要素值是否在其测量允许值范围之内。各气象要素的界限值阈值范围参考地面气象观测规范中表 3.1我国自动气象站技术性能要求表以及QX/T 118-2010 地面气象观测资料质量控制 。 (2)气候月极值检查:是指某个固定测站历史记录中某要素曾出现过的最大值(最小值) ,气象资料要素值是否超出极值的检查为极值检查。一般情况下气候极值通过台站多年长序列统计求得。 (3)内部一致性检查:当气象观测要素相互之间关系密切,其变化规律具有一致性,可根据该特性,对相关数据是否保持这种内部关系来检查其是否发生异常,以确定数据质量,即为内
9、部一致性检查。内部一致性检查主要是对以下两方面进行检查: 同类要素之间:如最高值一定正点定时值,正点定时值最小值,对于气温有:TmaxTTmin,P maxPPmin, DmaxDDmin, UUmin 和max 等。 相关类型要素间的相关检查:如可以通过露点温度与水汽压之间的函数关系来计算露点温度,一旦所计算的露点温度与实测温度差较大(绝对值0.5 ),则露点温度与水汽压至少有 1 个要素有误。 (4)时间连续性检查:正点数据在时间上应该有良好的连续性,如果所测得的值随着时间微小的变化而呈现跳跃式的转变,就应将其归结为怀疑数据。如:每一次测量完,将当前的样本与前几个样本进行对比,6得出两两之
10、间的差值,差值超过界定值就可标注当前样本缺失,而不应将其归入样本中。 (5)台站极端事件检查:当发生剧烈天气事件如短时暴雨或大幅降温时,将导致相关要素发生“异常” ,台站大幅降温事件指一个测站由于天气突然变化,从而导致气温和地面温度等要素时间一致性质量控制码1(质量控制码含义见表 1) ,如果不对其做处理,将会导致误检。常见的方法:通过对气温、地面温度和 5 cm 地温的时间一致性质量控制码检测该事件发生与否。如果正点气温,最高、最低气温 3 个要素的时间一致性质量控制码之和4,并且 0 cm 地温,0 cm 最高、最低、5cm 地温 4个要素的时间一致性质量控制码之和5, 则称发生了台站大幅
11、降温事件。这时相应要素的时间一致性质量控制码标注为 0。这样就减少了“异常”数据的误检率。说明台站大幅降温事件主要是由局地强对流天气引起(表 2) 。 表 2 各主要气象要素一小时变检查上下界值 (6)质量控制综合检查 利用上述方法确定每个要素的质量控制码。如果某要素内部一致性、时间一致性检查质量控制码之和3,则认为该数据错误。对不同要素其过程如表 3。 7表 3 各要素质量控制采用方法 3.3 非实时质量控制 在实时质量控制之后应对数据执行非实时质量控制,这阶段主要是将本站与邻站的观测值进行比较,即进行空间连续性检验。 (1)传感器漂移检查 传感器漂移是传感器测量的气象要素值偏离实际真值的大
12、小程度,传感器漂移的主要特点:一是所使用的数据量大且持续时间较长(一般在旬、月以上) ;二是所检查数据的质量状况不是单个数据,而是描述一批的数据质量情况。所以对数据的检测方法也和前面单个数据的质量控制方法不同。 自动气象站传感器漂移状态有两种:一是传感器失效状态,即传感器测量的气象要素值离实际真值很远;二是传感器失真状态,传感器测量的气象要素在实际真值附近,但超过了允许的测量精度范围。对于第一种情况常用的内部一致性检查方法即可检测到,然而对于第二种情况通常的质量控制方法无法实现,目前只能依靠人工参考邻站资料及本站长序列资料各要素变化规律、变化幅度等方面综合判断。出现这种情况较多的是地温、气温及
13、草温传感器。 (2)风记录系统性检查: 8自动站运行以来,风记录也会出现一些系统性问题,如启动风速增大、无静风、风向缺失、风向停在某个方位不变等,这些记录的质量控制主要是依靠人工经验进行分析判断。 启动风速增大检查 风速传感器由于外力(如灰尘污染、轴承磨损等)原因使得当风速较小时,风杯不转(即发生小风不转大风转现象) ,从而引起启动风速增大,导致风速观测数据质量下降,主要表现在静风频率增多。 风向缺失检查 由于雨雪冰冻、雷击或风向观测仪器故障等原因会导致某一范围的风向长时间的缺失(1 个月以上) ,出现这种情况风向大部分是缺 180-360 度;有时也出现风速大于 1M/S 以上,相应的数小时
14、或数天的风向停的某个方位上不变,从而影响风向观测数据的质量。 无静风记录检查 由于风向观测仪器原因导致长时间没有静风(PPC000、PPC001、PPC002) ,影响风向观测数据的质量。 (3)更换仪器前后及检定仪器前后记录的连续性检查 在更换仪器后及检定仪器后要注意记录连续性检查,有时台站操作失误,把有关传感器的接线接反,常出现地温传感器接反。如:某站2013 年 4 月仪器检定后 160 厘米地温与 80 厘米地温接线接反了。 3.4 与人工站误差对比 自动气象站的观测值与人工站所得数据一般情况下相差不大,对比结果,如果相差太大,首先应判断是否取值时间不一致。若气象因素变9化不大,则应可
15、以判断为机器故障,应及时进行检查。在剔除异常数据后,可用多元线性回归分析的方法对自动气象站与人工站的误差进行分析,研究误差因子与定量统计的关系,经不断调整,从而使两者的观测资料的拟合率最高。 4 小结 在台站级建立规范化的自动站正点地面数据质量控制体系,通过界限值检查、气候极值检查、内部一致性检查、时间连续性检查、台站极端事件检查、传感器漂移检查、风记录系统性检查、更换仪器前后及检定仪器前后记录的连续性检查等多种行之有效的质量控制方法应用,检查出可以排除一定数量的可疑及错误数据,从而提高自动站正点地面数据质量。 参考文献 1 胡玉峰.自动气象站原理与测量方法M.气象出版社,2004. 2 徐明时,杨艳敏.在进行自动站地面逐日数据维护时应注意的问题J.气象水文海洋仪器, 2006,27. 3 贾杨,王波.自动站正点地面数据质量控制方法J.黑龙江气象,2009,26. 4 王海军,杨志彪,杨代才等.自动气象站实时资料自动质量控制方法及应J.气象,2007,33 105 刘晋生,李建明等.自动气象站业务运行中常见问题的处理J.山东气象,2006,26.