推广 热搜: 免费网赚论坛  中国网赚  在家上网赚钱  如何网赚  网赚qq群  福缘网赚  网赚任务平台  网赚博客  酷我网赚  外国网赚 

结合非线性机器学习方法改进降水预报混合模型

   日期:2024-04-12 23:04:52     来源:http://www.900614.com/    作者:小编    浏览:108    

摘要

降水预报是半干旱气候条件下水资源管理的关键。传统的混合模式分别模拟降水序列的线性分量和非线性分量。但它们仍然不能提供准确的预测。本研究旨在利用线性和非线性模型的集成来改进混合模型。预处理配置和基因表达编程(GEP)、支持向量回归(SVR)和数据处理分组方法(GMDH)模型与传统混合模型相同。将它们与所有这三种模型的组合提出的混合模型进行比较。采用不同的方法提高了混合模型的性能。选取伊朗大不里士(Tabriz)和拉什特(Rasht)两个时间步长分别为年和月的气象站对改进的模型进行检验。结果表明,大不里士站的SVR和GMDH相对于GEP分别提高了9%和15%,这是衡量预报与观测差异不平等程度的Theil系数。应用误差判据表明,所提出的混合模型比传统的混合模型具有更好的观测值表征。当我们使用遗传算法代替SVR结合三种机器学习模型时,Rasht站的均方误差降低了67%,Nash Sutcliffe误差增加了5%。总体而言,改进混合模型对非线性模型的表示优于传统混合模型。改进的模型对利用机器学习方法的全部优势对高度非线性系统建模具有重要意义。

1 介绍

尽管对天气和气候模式进行了大量改进,但准确的降水预报仍然具有挑战性(例如,Adhikari和Agrawal 2014;Faramarzzadeh et al. 2023),部分原因是降水的非线性性质。随机模型广泛应用于降水预报。自回归综合移动平均(ARIMA)、季节移动平均(SARIMA)和周期移动平均(PMA)等模型是常见的随机模型(Wang et al. 2013;Murthy et al. 2018;Bouznad et al. 2020;Zarei and Mahmoudi 2020a, b)。尽管这些模式很受欢迎,但它们在表示降水非线性特征方面的应用并不成功。预计线性模型不能捕捉复杂现象(Chen和Wang 2007)。或者,一些机器学习技术,如SVR,被用于解决非线性问题,如降水预报(Hamidi et al. 2015;Shenify et al. 2016),流量预测(Rasouli et al. 2020;Aoulmi et al. 2023)和地下水位估算(Moravej et al. 2020)。机器学习技术也需要严格的搜索算法来获得最优超参数(Zeynoddin et al. 2018)。由于线性模型和非线性模型各有其优点,因此在预测问题中结合使用它们是合理的。文献中引入了混合模型来评估与单个模型相比的预测准确性(Chen and Wang 2007)。混合模型是线性模型和非线性模型的结合,其性能优于每种复合模型。混合模型的非线性分量可以从观测值与线性模型输出的差中获得,也称为误差序列或残差时间序列(Chen et al. 2021)。研究表明,相对于单独的SARIMA或SVR, SARIMA和SVR的结合改善了预测误差(Chen and Wang 2007)。另一个混合模型的例子是Díaz-Robles等人(2008)提出的ARIMA和人工神经网络(ANN)模型的结合,用于城市地区的颗粒物预测。

SARIMA和ANN模型的组合用于预测月度流入,与这两个组合模型相比,组合模型具有较高的决定系数(Moeeni et al. 2017)。另一种基于ARIMA和ANN的混合模型,利用遗传算法预测机械工业的产值(Liang 2009)。采用遗传算法优化神经网络参数,如隐藏神经元数量。传统混合模型的改进,特别是在表示时间序列非线性部分方面的改进,会显著影响预测的准确性。从观测到的时间序列分解出来的时间序列往往是高度非线性的,使用单一的非线性模型对这些时间序列进行准确的预测可能是不够的。此外,预测误差较大的残差会增加预测的不确定性(Mo et al. 2018)。因此,需要将非线性时间序列的预测结合起来,并通过给予较小的权重来避免某些子序列的较大误差。例如,使用GMDH神经网络将非线性模型(如SVR、BP神经网络和GEP)结合起来。最近改进的混合模型的性能优于单个模型,如SARIMA或以前使用的混合模型,如SARIMA- svr和SARIMA- bp (Mo et al. 2018)。耦合非线性时间序列的另一种方法是使用预测的加权组合。在这种方法中,组合是基于为每个模型分配适当的权重,以便更好地从单个模型的时间序列中提取信息(Song and Fu 2020)。

与预测组合相关的一个重要挑战是权重的精确选择(Wang et al. 2019),这会影响预测的准确性。简单平均法(Timmermann 2006),基于误差的方法(Adhikari and Agrawal 2014;Song and Fu 2020)、最小二乘回归法(Frietas and Rodrigues 2006)和差分加权法(Winkler and Makridakis 1983;Chan et al. 2004)是加权组合方法的几个例子。本研究的主要目的是改进数据稀缺、湿润和半干旱气候条件下的降水预报,重点关注时间序列在年和月两个时间尺度上的非线性部分。在本研究中,利用机器学习集成改进了混合模型中被机器学习或神经网络模型误估计的时间序列非线性分量。这在数据匮乏地区的降水预报领域尤其重要,因为这些地区没有任何国家或区域的以物理为基础的天气预报系统。为评估模型性能提供了严格的度量和配置,以清楚地显示所提出模型的新颖性和效率。使用了两种预处理配置,一种只使用残差,另一种使用观测值、线性模型模拟和残差的组合。使用ARIMA和SARIMA来模拟时间序列的线性部分。采用SVR、GMDH和GEP等模型对时间序列的非线性模式进行建模。为了捕捉降水非线性模式的复杂性,使用了三个模型的集合来代替每个模型的输出。采用基于误差的方法、最小二乘回归方法、遗传算法优化以及支持向量回归和神经网络等人工智能技术对各个模型进行组合。

2 材料与方法

2.1 案例研究

为了评估改进的混合模型的性能,使用了1992-2019年伊朗两个气象站的降水数据,即大不里士,东阿塞拜疆和拉什特,吉兰。大不里士年均降水量279 mm,拉什特年均降水量1278 mm。大不里士和拉什特的降水变异系数分别为0.25和0.2。根据湿度计,拉什特的月降水量比大不里士变化更大(图1b, d)。根据De Martonne(1925),大不里士和拉什特的气候分别被划分为半干旱和非常湿润,根据Emberger(1952),大不里士和拉什特的气候分别被划分为寒冷干燥和潮湿。

图1
figure 1

a 1992-2019年东阿塞拜疆省大不里士气象站的位置和温度曲线,以及c伊朗吉兰省拉什特气象站的位置和温度曲线

2.2 交付混合动力模型基于两个线性和Nonlinear模型

时间序列分析的主要概念之一是将它们分为两个线性和非线性分量,如Eq. (1) (Chen和Wang 2007)。混合模型的性能取决于估计的残差,残差定义为观测值与线性ARIMA或SARIMA模型输出之间的差异(Eq. 2)。因此,可以使用不同配置的机器学习技术(如SVR或ANN)来估计非线性成分。预测的时间序列由估计的线性和非线性分量相加得到(Zhang 2003)。

(1) (2)

其中Lt为线性分量;Nt表示非线性分量;是误差项或残差分量。

2.2.1 线性组合的建模时间序列

ARIMA及其用于表示季节变化的扩展(SARIMA)模型可表示为式。(3)和(4)(Box and Jenkins 1976)。

(3) (4)

其中ap(B), eq(B), ap(B)和eq(B)是阶为p, q和p的多项式,q分别为自回归和移动平均项,非季节性和季节性项。(1-B)和(1-B)分别为常规和季节性差值操作。D是差分操作的次数;D为季节差数。Yt为时刻t的观测值;θ0是固定项;rt是一个随机误差(Nwokike et al. 2020)。

2.2.2 模型编号nlinear混合涂料时间序列

支持向量回归

SVR是一种机器学习方法(Vapnik 1999),广泛应用于分类问题、回归估计、模式识别和概率密度函数估计。SVR的一般形式表示为:

(5)

其中w为权系数向量;是将xi变换为高维特征空间的映射或核函数;b为可调节因子(Liu et al. 2014;Ghanbari and Goldani 2021)。换句话说,w和b以可调因子的形式起作用。利用优化问题估计w和b,如Eq.(6)。

(6)

其中w为权系数向量;C是惩罚参数;ε为不敏感损失函数;是松弛变量;n为训练数据的个数(Ghanbari and Goldani 2021)。

SVR中的惩罚参数可以控制系统异常值的容忍度。训练支持向量回归模型的一个步骤是选择最佳核函数。通常,径向基和s型函数的性能优于线性核函数(Xu et al. 2019;Zhu et al. 2018)。

数据处理的分组方法

GMDH是一种多项式神经网络,是一种自组织技术(Jeddi and sharfian 2020)。该模型有一组神经元,其中每层的不同对通过多项式连接。在每一层中,为下一层建立新的神经元。Volterra函数级数的离散形式(Volterra 1959)用于输入和输出之间的一般连接(Eq. 7)。对于非线性输入/输出关系的建模,可以使用Volterra级数(Marzocca et al. 2008)。

(7)

其中y为输出变量;X是输入变量;a是一个系数。

基因的前女友压力的编程

GEP由Ferreira(2001)提出,是一种基于达尔文进化论的数据挖掘算法。GEP相对于遗传算法和GP的优势在于其收敛速度和求解复杂问题的能力。染色体和表达胁迫是GEP的主要组成部分。GEP的开始是基于在亚表达树(sub-ET)中形成一个或多个基因的染色体的随机生成。最好的解决方案是通过代数或布尔(AND, or, NOT)函数连接子集。每个子et提供的关于给定进程的信息少于相应的表达式树。最后,将GP块的功能与GEP结合,通过多基因结构对复杂系统的非线性模式进行建模(Yousefi et al. 2017;DanandehMehr et al. 2019)。

2.3 改进混合模型ba基于一个线性模型和一个集合nlinear模型

提高传统混合模型模拟非线性分量效率的一种方法是利用单个模型的组合来预测残差,而不是使用单个模型。在本研究中,使用GEP、SVR和GMDH对残差进行了两种配置的建模,如下所述。模型预测被赋予权重并进行组合。提出的改进混合模型结构步骤包括(图2):

  1. 1.

    应用随机模型(即ARIMA为年时间序列,SARIMA为月时间序列)模拟降水的线性模式()。

  2. 2.

    根据Eq.(2),利用第一步()的观测值(yt)和估计的线性时间序列,计算残差子序列()。

  3. 3.

    确定两种配置来模拟年(月)和月(月)降水序列的残差子序列。在这些配置中,表示随机误差。

    • 第一种配置基于不同前时间步长(t-1)、(t-2)、(t-3)的残差子序列,如下所示:

    • 第二种配置是基于线性分量()、原观测时间序列的前步时间(t-1或t-12),以及从前步1开始的不同前步时间间隔的残差子序列如下:

  4. 4.

    用GEP、SVR和GMDH非线性模型分别预测步骤3配置的残差子序列。最后的输出是在第一个配置中通过汇总来自单个模型(如GEP)的估计的线性和非线性分量来获得的。

  5. 5.

    获得加权预测。我们将三个非线性模型的预测与最合理的权重相结合(Song and Fu 2020)。加权预测的一般结构如式(8)所示:

    (8)

式中,n表示时间步长;每月1次,每年2次;i为模型类型,1、2、3分别为GEP、SVR和GMDH;C表示配置的个数,1和2;为第i个模型的权重系数;m为模型的总数()。

图2
figure 2

提出了线性和非线性分量混合模型的结构以及采用加权组合预测的改进混合模型,而不是用单一模型来表示非线性分量

方差逆法(Iv)是一种基于相应模型预测误差反演的加权组合方法(Eq. 9)。类似的方法是均方误差逆法(MSEI),它可以归类为基于误差的方法(Eq. 10, Adhikari and Agrawal 2014)。方程中的误差。(9)和(10)是如Eq.(11)中的平方误差(SSE)和如Eq.(12)中的对称平均绝对百分比误差(SMAPE)的和。

(9) (10) (11) (12)

本研究使用最小二乘回归(LSR)方法来最小化加权预测的线性组合的平方和误差。式(8)的矩阵形式可以写成式(13)。因此,观测值与模拟值的误差平方和如式(14)所示。最后,可以通过最小化SSE得到权向量,如式(15)(Frietas and Rodrigues 2006;Adhikari and Agrawal 2014)。

(13) (14) (15)

采用遗传算法优化权重,使观测降水与模拟降水的误差最小。目标函数和约束条件表示如下(Prudêncio and Ludermir 2006)。

(16) (17)

此外,利用GEP、SVR和GMDH预测的降水作为SVR的输入,进一步改进预测(Eq. 18)。根据核函数的类型和惩罚参数进行了灵敏度分析。

(18)

还使用人工神经网络模型来改进GEP、SVR和GMDH模型的预测(Eq. 19)。为了获得最优的隐藏层神经元数量和激活函数类型,进行了灵敏度分析。

(19)

2.4e对模型性能的评估

本研究使用评估指标来比较所提出的改进混合模型与先前混合模型的性能。这些指标包括均方误差(RMSE)、相对均方根误差(RRMSE)、平均绝对误差(MAE)、均方误差(MSE)、Theil系数U1、U2、残差预测偏差(RPD)、绝对百分比偏差(APB)、修正一致指数(dm)、适应平均绝对百分比误差(AMAPE)、精度改进(AI)和几何平均错误率(GMER)。

(20) (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) (31) (32)

式中,Pi为预测值,Oi为观测值,为观测值的均值,S为混合模型的MAE, Sh为改进混合模型的MAE。RMSE、RRMSE、MAE、MSE、APB和AMAPE的最小值表明预测值和观测值之间的相似性(Ruiz-Aguilar et al. 2014;del Carmen baset al. 2017)。Theil系数(Theil 1961, 1966)用于评价模型的预测精度(U1)和预测质量(U2)。U1 = 0和U2 = 0表示完美的预测。AI大于0表示混合模型性能优越,而AI小于或等于0表示混合模型不优于任何单个模型(Chen and Zhu 2013)。NSE等于1表示预报完美。RPD值小于1.5表示性能差,大于2表示性能好。dm的范围在0到1之间,其中1表示模型的高性能(Duveiller et al. 2016)。GMER > 1表示高估,GMER < 1表示低估(Abdelbaki 2016)。我们使用了许多评估标准,这些标准可以确认预测值的可靠性,因为每个指标都显示了预测与观测相对应的特定方面和特征。

目录

摘要 1 介绍 2 材料与方法 3.结果 4 讨论 5 结论 数据和材料的可用性 缩写 参考文献 作者信息 道德声明 搜索 导航 #####

3.结果

年降水观测周期为1964 ~ 2019年,月降水观测周期为2000 ~ 2019年。研究数据集分为三个子集,80%用于校准,10%用于验证,10%用于验证。为了检验数据长度对建模的充分性,在Tabriz和Rasht两个站点确定Hurst系数(Hurst et al. 1965)为0.8和0.6,分别高于数据长度充分性阈值0.5。

3.1 线性组合建模降水时间序列

利用自相关函数和部分自相关函数对降水时间序列的季节性进行检验和确定。自相关函数的间隔为12,说明拉什特降水具有季节性循环。因此,需要SARIMA的季节差异。降水分析的预处理步骤见表1。Kolmogorov - smirnov (Kolmogorov 1933)和Shapiro和Wilk(1965)的试验证实了大不里士降水时间序列的正态性。Rasht降水时间序列正态性检验的显著性水平小于临界值。因此,需要对时间序列进行变换。转换后,正态性检验的显著性水平提高到0.2左右。此外,我们还使用ADF (Augmented Dickey- fuller)检验(Said and Dickey 1984)来检验时间序列的平稳性。统计量tα大于临界值(大不里士和拉什特在1%水平下分别为-3.6和-2.57),表明两个时间序列都是非平稳的(表1)。Mann-Kendall检验显示两个站点的观测降水都有显著的减少趋势。再次进行ADF检验,确保降水值趋于平稳性。为了找到模型的阶数,我们检查了它们的一个范围,p从0到6,ARIMA从0到5,SARIMA从0到3。

表1各降水时间序列采用不同Box-Jenkins步长的随机建模结果

在许多可选模型中,SARIMA(0,1,1) ×(0,1,1)12和ARIMA(0,1,2)对拉什特和大不里士降水的SBC和BIC值最小(表1)。SBC从ARIMA(4,1,1)到ARIMA(0,1,2)减少了6.6%,从SARIMA(1,1,0)(0,1,0)12到SARIMA(0,1,2)(0,1,1)12减少了28.5%。

3.2 建模不nlinear混合涂料降水时间序列

正确的参数估计对降水预报的准确性起着至关重要的作用。因此,我们进行敏感性分析,以确定最优参数和核函数类型(如图3)。模型参数汇总如表2所示。GEP模型参数包括添加量(+)、突变率(0.06)、一点重组率(0.2)、两点重组率(0.3)、基因重组率(0.2)、IS转座率(0.2)。

图3
figure 3

两个时间序列的SVR模型对核函数和惩罚参数的敏感性分析

表2 Gene ex各模型的估计参数压缩规划(GEP)、支持向量回归(SVR)和数据处理分组方法(GMDH)

当我们将核函数从sigmoid切换到C = 0.5的径向基函数时,RMSE降低了15%,当我们将大不里士站和配置站的径向基函数的C参数从2更改为0.5时,RMSE降低了8.8%。另一个对比显示了两种残差配置下单个模型的性能(图4)。

图4
figure 4

两种配置对单个体模型时间序列非线性分量的性能比较,误差标准为a) U1和U2的希尔系数和b) RMSE和MAE。T1、T2、R1、R2表示两种配置下的大不里士站和拉什特站(表2)

如图4所示,误差标准从配置1减少到配置2。例如,在Rasht中,从配置1到配置2,GEP的U2的希尔系数下降了56%,GMDH的U2的希尔系数下降了62%。通过考虑所有模型和所有误差标准,大不里士的平均下降百分比大于拉什特(46%)。采用GEP模型提高了误差准则。例如,在大不里士的第一个配置中,当用SVR代替GEP时,MAE下降了5%,当用GMDH代替GEP时,MAE下降了24%。在Rasht中,当用SVR代替GEP时,U1下降了42%,当用GMDH代替GEP时,U1下降了25%。总体而言,GMDH和SVR对大不里士和拉什特降水的预报效果都比较好,第一种配置下,SVR和GMDH对拉什特时间序列的误差值差较小。

3.3 改进的混合动力车

将采用不同组合方式和加权方式的改进混合模型与仅由一个非线性模型组成一个线性模型的传统混合模型的性能进行对比(表3和图5)。

表3混合动力与改进混合动力车型比较。GEP、SVR和GMDH采用4种误差组合sed(例如Iv + SSE, Iv + SMAPE)和四个机器学习ba使用sed方法(例如SVR)来处理configuration两
图5
figure 5

混合模式的性能为第一配置和拉什特和大不里士站

如图5所示,相对于其他单一非线性混合模型或组合非线性混合模型,使用GEP作为单一模型(表3中的ARIMA + GEP)的混合模型的误差标准有所降低。将非线性模型以混合模型的形式组合在一起,提高了预测精度。例如,在大不里士站的第二种配置中,将ARIMA + GMDH混合模型替换为提出的Iv + SSE等多非线性混合模型后,RMSE有所提高,RMSE降低了43%(表3)。在不同的台站和配置中,性能最高的3种改进混合模型是:1)大不里士站的Iv + SMAPE、GA和SVR方法与第一种配置相结合的混合模型;2)大不里士站的SVR、MSEI + SSE和ANN方法及其二次配置;3) Rasht站和第一组态的SVR、MSEI + SMAPE和GA;Rasht站和第二配置的GA、SVR和LSR方法。

总的来说,混合模型与支持向量回归、遗传算法和基于误差的方法相结合的效果要好于其他方法。大不里士(Tabriz)降水序列传统混合模型在第一和第二种配置下的平均RPD判据分别为0.42和4.33。Rasht站的值分别为1.17和3.11。采用一种线性方法和多种非线性方法的混合模型的RPD标准的平均值得到了提高,在第一种(图5)和第二种(表3)配置下,Tabriz站的RPD标准的平均值达到了0.58和6.83,Rasht站的RPD标准的平均值达到了1.26和4.9。

为了评估改进的混合模型的性能,计算了三个最佳模型的AI准则(Eq. 31)。并与传统混合动力模型的最佳模型进行了比较。结合Iv + SMAPE和SVR方法的混合模型在第一种配置下对大不里士士降水的AI分别为44%和19.3%。混合动力车型第二种配置下的人工智能与SVR相结合为41%。混合模型结合SVR的第一种配置下Rasht时间序列的AI为6.7%。在第二种配置中,结合SVR的混合模型的AI为35%。与其他性能标准一样,与其他传统混合模型相比,所提出的混合模型的AI值得到了提高。在基于误差的三种非线性方法组合中,Iv + SMAPE和MSEI + SMAPE在第一个配置上优于Tabriz和Rasht站,而MSEI + SSE和Iv + SSE在第二个配置上优于前者。验证期、传统模式和混合模式的观测和预报降水序列如图6所示。

图6
figure 6

验证期间伊朗a大不里士和b拉什特气象站第二种配置下11种混合模式观测和预报降水的比较

大不里士(Tabriz) 2018年和2017年最大和最小年降水量(图6a),所有改进的混合模型结合多重误差和其他组合方法保存了最大和最小年降水量。Rasht的月平均降水量为107 mm,与混合模式预报的月平均降水量(110 mm)接近。结合GA的混合模式观测到的拉什特年平均降水量为1279 mm,相关预测值为1317 mm(图6b)。两种性能最佳的混合动力改进模型的散点图如图7所示。将这些模型输出与观测值以及传统的ARIMA + GMDH和SARIMA + SVR混合模型进行比较。

图7
figure 7

基于传统混合模式(ARIMA + GMDH和SARIMA + SVR)和基于支持向量回归(SVR)和遗传算法(GA)的两种加权混合模式对A大不里士和b Rasht气象站降水预报值的观测散点图

在Tabriz中,拟合ARIMA + GMDH作为混合模型、SVR和MSEI + SSE作为改进混合模型的株系的r平方分别为0.96、0.99和0.96;在Rasht中,拟合SARIMA + SVR作为混合模型、SVR和GA作为改进混合模型的株系的r平方分别为0.87、0.99和0.95。使用改进的混合模型,拟合线的r平方增加了3到14%。

混合模型(如ARIMA + GMDH)和改进混合模型(如MESI + SSE、SVR、GA和LSR)的预测结果如图8所示。这些图显示,观测到的降水与改进混合模型的预报结果吻合(图8)。从上下晶须的角度来看,观测到的降水与结合SVR的混合模型具有较高的相似性。观察到的和提出的混合模型的中位数箱线图匹配良好。对于Rasht时间序列,结合遗传算法的混合模型的观测和预测也是如此(图8)。

图8
figure 8

传统混合模型(ARIMA + GMDH)和基于误差的MESI + SSE方法、支持向量回归(SVR)、遗传算法(GA)和最小二乘回归(LSR)的4种加权混合模型组合的a大不里士和b Rasht气象站降水观测和预报箱线图

4 讨论

本研究的目的是提高传统混合模型的精度。为此,必须考虑以下事项:1)使用ARIMA或SARIMA建立时间序列线性分量的适当模型;2)精确选择两种构型的结构,分别具有先验残差子序列;通过先验观测和残差子序列以及线性模型模拟;3)利用人工智能技术选择合适的模型来表示残差子序列(Liang 2009;Chen et al. 2010;Moeeni et al. 2017);4)对所选模型的参数进行准确估计。在Tabriz和Rasht时间序列的GEP模型中,平均RMSE、MAE、U1和U2从第一个配置到第二个配置下降。SVR和GMDH的性能优于GEP模型,这与先前关于伊朗月度参考蒸散估算的研究一致(Ahmadi et al. 2021)。一项研究调查了多元回归样条、最小二乘支持向量回归、GEP和ANN在估计月长期降雨量方面的性能,最佳模型是最小二乘支持向量回归(Mirabbasi et al. 2019)。与人工神经网络相比,SVR模型在降水预报相关时变分析的内部过程中提高了预测误差(Parviz 2020)。当我们将代数从1000减少到100,头大小从8减少到7时,GEP模型预测的RMSE分别下降了44%和4%。

混合模型通过结合两种模型,捕捉时间序列的线性和非线性模式,提高了预测效率。例如,在第一种配置中,当我们用混合模型结合SVR取代SARIMA时,MSE下降了8.5%,当我们用混合模型结合GMDH取代ARIMA时,MSE下降了44%。在伊朗的Rasht和Gorgan站,观测到月度和年度混合模式对降水预测的改善,RMSE得分分别提高了48%和24% (Parviz和Rasouli 2019)。此外,混合模型结构在预测中更为重要。例如,在之前的研究中,我们发现将降水时间序列分解为线性和非线性分量的两个月混合模型误差最小(Parviz 2020)。Pérez-Alarcón等人(2022)将神经网络模型与ARIMA模型相结合,改善了降雨预报。

混合模型在捕获复杂现象方面的性能存在缺陷,因为分解的时间序列的非线性可能很高,并且一个模型不足以捕获所有变量(Mo et al. 2018)。此外,误差序列可能具有高波动性和不规则性(Chen et al. 2021)。因此,对混合动力模型进行改进是必要的。改进混合模型的主要方向是将单个模型的预测与不同的方法结合起来,而不是在时间序列建模的非线性部分使用一个模型。整合预测的组合方法优于单个模型(Wang et al. 2020)。所有的组合方法都提高了混合模型的效率。Adhikari和Agrawal(2014)指出,基于加权方案的评价分数,组合程序显著优于所有单独的方法。但很难选择一种组合方法作为包容性方法。将SARIMA用于时间序列的线性分量,结合SVR、GEP和BP用于非线性分量,可以改善预测结果(Mo et al. 2018)。预测组合旨在整合相互竞争的预测以产生预测集合,这优于每个组成单独模型(Wang et al. 2020)。通过将所有预测与适当的函数组合在一起,预测组合可以充分利用每个预测模型的信息,提高预测的准确性和稳定性(Wang et al. 2019)。组合预测的准确性取决于每个预测模型的权重。从评价指标来看,改进后的混合模型具有较高的性能,包括支持向量回归、遗传算法和基于误差的模型。在基于误差的方法中,对于不同的构型,误差方程的类型和反演方法是不同的。因此,有必要定义一个综合误差方程和相应模型预报误差的反演方法。

在Tabriz和Rasht时间序列中,所有改进混合模型和所有配置的平均误差几何标准差分别为1.4和2,表明预测过高。

5 结论

对降水时间序列的分析可以深入了解降水的时空复杂性。本文引入改进的混合模型,首先分离降水时间序列的线性和非线性分量,然后提取降水时间模式。高性能机器学习方法用于表示伊朗潮湿和半干旱气候下两个气象站降水的非线性成分。结果表明,在Rasht和Tabriz气象站,改进的SVR和GMDH混合模型的预报效果优于GEP。

与传统的降水预报混合模型不同,本文在改进的混合模型结构中采用了多个非线性模型的组合预报,而不是只使用一个非线性模型。采用适当的加权方法和人工智能技术的预报集合提高了年和月时间步长的降水预报精度。所有改进的混合方法均表现出良好的性能。在组合方法中,人工智能技术(如SVR)、优化方法(如GA)和基于误差的方法表现出最高的性能。在基于误差的方法中,误差表达式的类型和反演方法的结构起着至关重要的作用。总体而言,本文采用数据驱动方法进行降水集合预报的主要控制因素有三个:分离线性和非线性分量,并对非线性分量进行适当建模;为非线性建模的每个集成成员分配适当的权重;最后是非线性模型的类型。改进的混合模型的优点之一是能以高置信度从原始观测数据中提取非线性信息。它采用嵌入在其结构中的精确预测组合方法,克服了在观测时间序列中对非线性过程建模的困难。提出的改进混合模型可以成为一个强大的工具,通过结合复杂的机器学习方法的预测,而不是仅仅依赖于单个模型,来提高跨时间尺度降水预测的信心。

下载原文档:https://link.springer.com/content/pdf/10.1007/s11269-023-03528-7.pdf

文章链接:http://900614.com/news/show-82935.html
 
 
更多>同类资讯

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报