1、基于支持向量机的粗糙海面风速反演研究【摘要】 本文将支持向量机(SVM)回归技术应用到海海面风速的反演研究。利用双尺度方法(TSM)作为前向电磁算法,数值模拟不同雷达参数下风驱粗糙海面微波后向散射系数,经过敏感性分析,选取 L 波段(1.4GHz) 、C 波段(6.8 GHz)及其合适的入射角作为雷达参数,并设计多种反演方案,分别以单频率双极化双角度、双频率双极化双角度及双极化后向散射系数的比值作为 SVM 的训练样本数据信息,经过适当的训练,利用 SVM 回归技术对海洋表面风速和盐度进行了反演研究。研究结果表明,针对于海面风速的反演,C 波段的反演精度最高。最后,检验了 SVM 反演方法的抗
2、噪声性能,表明本文提出的 SVM 方法能较好地应用于实际海况参数反演问题。 【关键词】 支持向量机 双尺度方法 反演 海面风速 引言 海面风速是研究海气之间相互作用的重要参数,它对短期预报以及季节性和气候年际变化的预测非常重要,海面风速通过调节热量,水汽,海气通量和颗粒物,调节大气和海洋之间的合作用,从而维持全球和区域气候1。 支持向量机2 (Support Vector Machine, SVM)是近年来在统计学习理论的基础上发展起来的一种新的通用学习方法。它有效解决了小样本、过学习、非线性、高维数据等问题,具有良好的推广性和较好的预测精确性 3。近年来,支持向量机被广泛应用于各类实际问题,
3、例如图像检索4、文本分类5、广义预测控制6等。但在微波遥感海洋及海况参数方面,国内外还未见有相关文献报道。 本文利用支持向量机方法对海面风速及海表盐度反演问题进行研究。以双尺度(two scale method ,TSM)作为风驱粗糙海面电磁模型,根据 Windsat 和 SMOS(Soil Moisture and Ocean Salinity)遥感卫星参数,我们选取微波频率为 6.8GHz(C 波段)和 1.4GHz(L 波段) 。首先利用 TSM 数值模拟出不同入射角下的后向散射系数,经过敏感性分析,确定合适的雷达入射角。针对风速设计多种反演方案,以后向散射系数作为输入,相应的风速作为输
4、出,对 SVM 进行训练,建立反演模型,对盐度和风速进行了实时反演。 一、风驱海面双尺度模型 假设大尺度波浪与小尺度波浪统计独立,用截断波数将海谱分割为两部分,然后采用 KA 和 SPM 分别计算两个尺度下的散射场,并对其求和得到粗糙海面总后向散射系数为 设入射面位于 x-z 平面中,则当入射波分别为水平极化和垂直极化时,SPM 部分后向散射系数的计算公式为: 图 1 是采用与文献8相同海况参数及雷达入射频率(f=13.9Ghz)下,经 TSM 数值模拟的 VV、HH 极化后向散射系数与入射角的关系曲线。其中,粗糙海面采用 DV 海谱模型8,在 TSM 模型中输入海况参数是海水介电常数,它与盐
5、度的变换关系采用文献27中的双 Debye 海水介电模型。比较图 2、3 与文献8的结果,两者吻合的很好。后文中的海谱及海水介电模型均与本例相同。 二、反演方案设计 在基于 SVM 的海况参数反演问题中,首先利用双尺度模型生成数据样本,将样本按比例随机分成训练样本和测试样本,然后将训练样本的信息代入 SVM 模型中进行训练,得到相应反演模型,并利用测试样本检测反演模型的准确性。在 TSM 模型中,输入参数包括传感器雷达参数(频率、入射角、极化等)和海况风速。根据前文的敏感性分析,本文设计了三种反演方案,即首先针对 L 波段和 C 波段分别进行反演,然后再将 L 波段和 C 波段结合共同反演。其
6、中 L 波段雷达入射角取为 40、50,C 波段雷达入射角取为 53.8。针对风速的反演,均采用双极化后向散射系数作为 SVM 的输入样本信息。需要说明的是,在实际微波遥感海洋参数时,微波传感器接收到的是粗糙海面同极化后向散射系数如(VV、HH) ,故本文先用 TSM 数值计算粗糙海面同极化后向散射系数VV 和 HH,再得到其比值,并以此作为 SVM 的输入信息来实现海表盐度的反演。表 2 是本文研究中海表参数的变化范围。这些参数的取值范围不仅在 TSM 模型的有效范围内,而且大多数粗糙海表的参数在其范围内。经 TSM 数值模拟,得到 1000 个样本,其中训练样本比例为 70%,测试样本比例
7、为 30%。 三、数值结果与分析 将样本分为训练样本和测试样本,其中训练样本 700, 图 6 单频、双入射角、双极化情况下的风速反演结果用于 SVM 训练学习,建立风速反演模型。剩余的 300 个测试样本用来检验该方法反演风速的精度。 首先,研究单频、双入射角、双极化情况下的风速反演,C 波段的入射角为 53.8,L 波段的入射角为 40、50,海表温度设为 15oC。图6(a) 、 (b)分别给出了 L 波段与 C 波段的反演值与真实值的对比结果。 从图中来看,两种波段下对风速的反演精度都较高。其中 L 波段的相关系数和均方根误差为 0.99988 和 0.11,C 波段的为 0.9999
8、4 和0.07。L 波段与 C 波段的相关系数差别不大,但是 L 波段的均方根误差比C 波段的均方根误差大 51%, 说明 C 波段反演风速的精度略高于 L 波段。其次,将 L 波段与 C 波段的后向散射系数同时作为支持向量机的输入,同时考虑双入射角与双极化对风速进行反演,结果如图 7 所示。 从图 7 可以看出双波段下风速反演的相关系数为 0.99985,均方根误差 0.11,与 L 波段的反演结果相当,略低于 C 波段下的反演精度。这说明在数据信息已较丰富的情况下(双入射角、双极化) ,单纯增加雷达频率并不能显著提高 SVM 的反演精度。 四、结论 本文利用双尺度方法结合支持向量机技术对海
9、面风速及海表盐度进行了反演研究。以双尺度(TSM)作为前向模型,数值模拟不同海况参数下的后向散射系数,并以此作为 SVM 的输入样本。 考虑不同雷达参数对风驱粗糙海面微波散射特性的差异,针对风速和盐度设计了多种反演方案。反演结果表明,针对于风速的反演,C 波段双极化的反演方案精度最高,表明本文提出的基于 SVM 的海况参数反演方法有较好的泛化能力和抗噪声性能。 参 考 文 献 1 Atlas R, Hoffman R N, and Leidner S M, et al. The effects of marine winds from scatterometer data on weather
10、 analysis and forecasting J. Bullentin of the American Meteorological Society, 2001,82(9):1965-1990. 2 Vapnik V. Statistical learning theoryM. New York:Wiley, 1998. 3 Tong Y B, Yang D K, and Zhang Q H. Wavelet Kernel Support Vector Machines for Sparse ApproximationJ. Journal of Electronics (China) , 2006, 23(4): 539-542. 4 Zhang L, Lin F, and Zhang B. Support vector machine learning for image retrievalC. Preceedings of the IEEE on Image Processing, Greece, 2001:107-118.