摘要
本文采用k-NN法,从2491个网格点的预报雨量得到91个站点预报雨量的估计值,并与对应的实测雨量进行统计对比分析。我们建立了平均绝对误差、模糊评分、面雨量三个模型,对两种雨量预报方法进行比较评价,最后为了在评价方法中考虑公众的感受,我们还构造了一个新的评价模型。结果表明方法I和方法II具有较好的晴雨预报能力,但总体上方法I的准确性高于方法II。在上述两种雨量预报方法的基础上,我们还可采用动态权重系数法对其进行综合集成,形成一种新的预报方法,该方法的可靠性要好于每种单独的预报方法。
一. 问题重述
我国某地气象台和气象研究所正在研究6小时雨量预报方法,即每天晚上20点预报从21点开始的4个时段(21点至次日3点,次日3点至9点,9点至15点,15点至21点)在某些位置的雨量,这些位置位于东经120度、北纬32度附近的53×47的等距网格点上。同时设立91个观测站点实测这些时段的实际雨量,由于各种条件的限制,站点的设置是不均匀的。
气象部门希望建立一种科学评价预报方法好坏的数学模型与方法。气象部门提供了41天的用两种不同方法的预报数据和相应的实测数据。
雨量用毫米做单位,小于0.1毫米视为无雨。
(1) 请建立数学模型来评价两种6小时雨量预报方法的准确性;
(2) 气象部门将6小时降雨量分为6等:0.1—2.5毫米为小雨,2.6—6毫米为中雨,6.1—12毫米为大雨,12.1—25毫米为暴雨,25.1—60毫米为大暴雨,大于60.1毫米为特大暴雨。若按此分级向公众预报,如何在评价方法中考虑公众的感受?
二. 符号说明
: 表示第 天,第 个时段,第 个观测站点雨量的实测值(
=1,2,3,4; )
: 表示用第一种雨量预报方法测得第 天,第 个时段,第 个观测站点雨量的
预测值( =1,2,3,4; )
: 表示用第二种雨量预报方法测得第 天,第 个时段,第 个观测站点雨量的
预测值( =1,2,3,4; )
:表示第 天,第 个时段,第 个观测站点的实测雨级( =1,2,3,4; )
:表示用第一种预报方法测得第 天,第 个时段,第 个观测站点的预报雨级( =1,2,3,4; )
:表示用第二种预报方法测得第 天,第 个时段,第 个观测站点的预报雨级( =1,2,3,4; )
: 表示对第 种雨量预报方法在第 天,第 个时段,第 个观测站点的预测值的模糊评分( =1,2,3,4; )
:表示公众对用第c种预报方法测得的第 天,第 个时段,第 个观测站点的预报雨级的满意度( =1,2,3,4; )
三. 问题分析与数据处理
要评价两种雨量预报方法的准确性,就要在相同地点,相同时段对雨量的实测值和预测值进行比较。由于已知数据给出的91个观测站点的地理位置并不在用来预报的2491个网格点位置上,为了使得数据采集的地理位置相同,有两种思路对数据进行处理。一是把91个站点的实测数据扩充到2491个网格点上;二是利用2491个网格点的预报值给出91个站点的预报值。显然,第一种数据处理方式损失的信息比较多,而且是把预报值和处理过的实测值进行比较,其结果难以令人信服。第二种数据处理方式在保持91个观测站点的实测数据不被处理(从而保持实测数据真实可靠)的前提下,利用2491个网格点处的预报值来估计91个站点处的预报值;再对两种不同预报方法给出的预报值和实测到的数据分别进行比较。第二种方式虽然只在91个地点进行比较,但要比第一种方式更加有说服力。所以我们采取第一种数据处理方式,首先要利用2491个网格点的预报值给出91个站点的预报值。
有以下三种方法可以用来给出91个站点处的预报值。
1.k-最近邻居法(k-NN法)[1][2]
给定某个观测站点的位置后,从2491个网格点中找出距离这个站点最近的k个网格点,把这k个网格点处的预报值的平均值作为这个站点处的预报值。k的大小可以根据实际需要进行调整。
2.邻域平均法
对每个观测站点取相同的球形邻域或者正方形邻域,把邻域内网格点处的预报值的平均值作为站点处的预报值(邻域内的网格点的数目不一定相同)。当然邻域的大小可以根据实际情况进行调整。
3.二维插值法
可参见计算数学方面的参考书。
需要说明的是:二维插值法计算程序相对复杂,计算量也较大。k-NN法与邻域平均法都是利用站点周围网格点处的预报值的均值作为这个站点处的预报值。这两种方法计算相对简洁,同时也具有很高的精度。如果假设预报值在整个预报区域内是连续的话,在适当的条件下,k-NN法给出的估计将收敛到真实预报值(参见文献[1],[2]等)。
进一步,可以认为距离站点近的网格点对站点的影响要大些,距离站点远的网格点对站点的影响要小些,因此可以根据这些影响的不同而赋予不同的权重。
本文采用3-NN法计算,以距离第 个观测站点最近的3个网格点的预报值的加权均值作为该观测站点的预报值(程序见附录)。
四. 问题(1)模型建立及求解
1.模型I
为了比较两种预报方法的预报质量,我们对其进行绝对误差值检验分析。误差值为预测值与实测值之差,绝对误差即对误差取绝对值。
第一种雨量预测方法在第 时段的平均绝对误差 = ;
第二种雨量预测方法在第 时段的平均绝对误差 =
结果如表1所示:
表1 两种预报方法的平均绝对误差
平均绝对误差
预测方法I
预测方法II
时段1(21点至次日3点)
1.8780
1.8712
时段2(次日3点至9点)
2.4936
2.4880
时段3(9点至15点)
2.1391
2.1426
时段4(15点至21点)
2.0347
1.9124
由表中得到以下结论:
两种预报方法的平均绝对误差都在2.5mm以内,但方法I和II的预报质量差距并不太大,在第一、二、四时段,方法I的平均绝对误差略小于方法II的平均绝对误差。
进一步我们还给出了两种预报方法的预报-实测相关图(图1)。图中落在斜率为1的直线上的点为实测结果,预测点则落在该直线附近,其偏离直线越远表示预报误差越大。从图中可以看出,这两种雨量预测方法的共同点是:在各个时段对实测雨量较大的预报,大多数均变小。这说明实况出现大雨时预报水平较差。
图1 两种预报方法的预报-实测相关图
2.模型II
为了较客观地评定两种预报方法,我们利用模糊数学中的模糊综合评判方法。模糊数学的创立者 L. A.Zadeh 为了描述和处理事物的模糊关系,把“属于”关系进一步数量化,即集合A 中的某个元素ui 对A 不是要么“属于”要么“不属于”关系而是可以不同程度的“属于”和不同程度的“不属于”,这个程度叫做隶属度。隶属度的范围在0 与1 之间,即ui 的隶属度值域是[0 ,1 ]。“属于”关系用函数关系表示,将论域与值域相对应,故形成子集合A 唯一确定的一个映射,它们一一对应。其特点是在众多的“属于”关系的评价指标基础上进行加权平均,得出一个无量纲的综合评价值,然后比较综合评价值的大小,对受到多个因素制约的事物或对象作出一个总的评价,这就是所谓的综合评判问题[6 ,7 ] 。根据所给的条件,给每个对象赋予一个评判指标,称之为模糊评分。
第 天,第 个时段,第 个观测站点的预测值的模糊评分为
(1)
式(1) 中第一项是预报基础分,规定为60 分;第二项为强度(量级)预报的加权分。当预报雨量与实况一致时(即预报与实况误差为0),该预报评分为100。当预报有误差时,按其误差大小给分,误差越大,分值越低,相反分值越高,预报值越接近于实测值。可以看出,根据误差大小计算的模糊评分,能够很好地表征预报贴近实况的程度,从而较好地检验两种预报方法的预报水平[3]。
为了便于比较,我们给出了在各个时段的模糊评分公式。方法I和II在第 时段的模糊评分为
=1,2,3,4
=1,2,3,4
结果见表2。由表2可以看出,两种方法的模糊评分都在80分以上,预报质量都比较稳定,但在第一、二、四时段,方法I的模糊评分都高于方法II的模糊评分。由此可见,在对雨量预报的准确程度上,方法I高于方法II。
表2 两种方法的预报模糊评分
方法
时段
时段1
时段2
时段3
时段4
预报方法I
84.2593
83.8684
82.3264
80.1272
预报方法II
84.1566
83.6940
82.2567
80.5580
3.模型III
由于91个观测站点的设置是不均匀的,它们较集中地分布在53×47的矩形网格的中央区域内,而面雨量能够更真实地反映平面区域降水的总状况,因此我们用其作为评价这两种方法预报好坏的另一个标准。面雨量是单位面积上的降水量, 实际上为某一特定区域或流域的平均降水状况,它有多种计算方法,如算术平均法、泰森多边形法、逐步订正格点法、三角法、等雨量线法等[4]。
这里我们采用算术平均法计算面雨量:其计算公式如下:
第 种预报方法在第 时段的面雨量 ,
第 时段的实测面雨量
结果见表3。由表3可以看出,无论哪个时段,方法I的面雨量都比方法II更接近实测
值,由此可见,方法I的预报效果好于方法II。
表3 实测及两种方法的面雨量
面雨量
方法I
方法II
实测情况
时段1
1.1167
1.1029
1.4827
时段2
1.5837
1.5498
2.1179
时段3
1.3144
1.3128
1.8007
时段4
1.2437
1.0887
1.6362
五. 对问题2建模及求解
1.模型I
雨量按无雨、小雨、中雨、大雨、暴雨、特大暴雨定义为0~ 6 级,见表4 ;
表4 雨量等级划分表
雨量(mm)
<0.1
0.1-2.5
2.6-6
6.1-12
12.1-25
25.1-60
>60.1
名称
无雨
小雨
中雨
大雨
暴雨
大暴雨
特大
暴雨
雨级
0
1
2
3
4
5
6
在此基础上,我们可将预测雨量与实测雨量转化为相应的雨级,并计算出第 天,第 个时段,第 个观测站点的预测雨级的模糊评分为
(2)
同样我们也可得到方法I和II在第 时段的雨级模糊评分,结果见表5。
表5 两种方法的预报模糊评分(雨级)
方法
时段
第1时段
第2时段
第3时段
第4时段
方法I
86.1192
85.8709
84.5196
82.5788
方法II
85.9831
85.6847
84.4693
82.88772
从表5中我们也发现总体上方法I的预报能力优于方法II。
2.模型II
在评定两种方法的预报质量同时,我们需要考虑公众的感受,由于公众对雨量预报的感受都具有一定的模糊性,可以用{很满意,比较满意,基本满意,不满意}来代替。对此我们有两种方法:
(1) 若预报雨级与实测雨级一致,观众很满意,评分为100;若预报雨级与实测雨级相差一级,观众比较满意,评分为80;若预报雨级与实测雨级相差两级,评分为60;若预报雨级与实测雨级相差两级以上,观众不满意,评分为0。
(2) 采用模糊数学中的隶属函数来处理公众的感受。在隶属函数的选取上,在此这里选用偏大型中升岭形分布函数为隶属函数来处理公众的感受。升岭形函数公式为:
其中 是预报雨级与实测雨级差的绝对值[5]。
用上述两种方法都可以求出公众对第 天,第 个时段,第 个观测站点的预测雨
级的满意度 ,在此我们选取了方法(2)。最后把模糊评分和公众满意度的权重分配分
别确定为0.6和0.4,得到一个新的评价指标 为
=0.6 +0.4
对第 时段关于41天、91个站点求和平均得到预报方法I和II在这个时段的评价指标 ,结果见表6。
表6 两种方法的预报模糊评分(雨级)
方法\时段
第1段
第2段
第3段
第4段
方法I
86.2715
85.2865
84.5318
83.1993
方法II
86.2219
85.2148
84.5096
83.5206
由表6可见,考虑公众感受以后,总体上仍然是方法I优于方法II。
你可以根据自己的水平加以改写
你可以到资料网上看!!~`