倾诉星球 > 随笔杂谈 > 文章详情

非线性组合预测模型(建立灰色预测模型)

投稿:陈三首是哪三首日期:2024-05-16 08:18:58人气:306+

非线性组合预测模型

本文主要介绍了非线性组合权重设置方法并通过模拟说明ARCH模型非线性组合预测方法的优越性。2 ARCH模型简介及参数估计ARCH模型最早是由Engel于1982年提出的, 首先设y...,接下来具体说说建立灰色预测模型

非线性组合预测模型(精选12篇)

非线性组合预测模型 第1篇

现代金融领域中, 时间序列的预测问题逐步引起人们的关注, 一般的线性组合预测方法虽然可以有效提高预测效果, 但是忽略了不同模型之间可能存在的关系, 而非线性组合预测方法将模型之间的关系考虑在内, 近年来应用广泛。

非线性组合预测模型(建立灰色预测模型) ARCH模型相对于传统回归模型来说, 存在异方差、自相关的问题, 故而可以采用非线性组合预测的方法研究预测问题。

本文主要介绍了非线性组合权重设置方法并通过模拟说明ARCH模型非线性组合预测方法的优越性。

2 ARCH模型简介及参数估计

ARCH模型最早是由Engel于1982年提出的, 首先设y{t}为一观测序列, It-1是直到t时刻的所有信息集合, 而ARCH模型的显著性质主要表现在回归模型误差项的假设上, 一般地, ARCH (p) 模型给出的是以下线性回归形式:

3 非线性组合预测权重设置

非线性组合预测中, 权重的选取是一个关键问题, Paulo于2006年针对两候选模型提出了非线性组合预测的思想, 后来Ratnadip将此方法推广应用到存在三个候选的时间序列模型时, 取得较好的效果.本文主要研究当存在多个具有ARCH效应的线性回归候选模型时的非线性组合预测方法.

则组合预测值

平均预测方差:

若θopt=0, 所求权重即为简单线性组合预测权重, 此时权重w*=U-1Z, 相应的平均预测方差为:

4 模拟设置

利用R软件进行蒙特卡洛模拟, 主要产生5个具有不同的ARCH效应的回归模型, 然后进行非线性组合预测, 通过与简单线性组合预测方法对比得出结论。

4.1 模拟过程

考虑如下线性回归模型:

其中{εt, t=1, 2, …, n}*同分布于N (0, 1) , xit (i=1, 2, 3, t=1, 2, …, n) 是由以下模型产生:

其中bt*同分布于U (0, 1) 。

假定回归模型误差项μt具有五种形式, 则可以产生5个不同的模型。

对于每个模型, 产生样本容量为n=20, 30, 50的样本各有100组, 则可以利用极大似然估计方法估计模型中的参数, 然后计算各模型的因变量预测值及样本均方误差, 求得非线性组合预测的权重及均方误差。

令参数初值α= ( (1e-6, 0.05, 0.1, 0.12, 0.13, 0.2) /c) T, β= (0.2, 0.9, 1.2, 2.6) T, 其中c为常数且取初值c=1;给定样本容量n, 生成具有不同ARCH效应的模型因变量, 由此可计算待估参数, 将因变量分成两部分, 一部分作为训练集Ytrain= (y1, y2, …, yp) T, 另一部分作为检验集Yvalidation= (yp+1, yp+2, …, yn) T, p个观测期后, 候选模型的预测值可以得到, 并计算每个候选模型的平均预测方差;对因变量进行非线性组合预测, 计算非线性权重及简单线性权重, 并计算相应的平均预测方差;重复100次, 并记录组合预测方法平均预测方差小于最优候选模型预测平均方差的次数n1, 记比率r=n1/100, r值越大, 说明组合预测效果越好。

改变n与c的值, 重复以上步骤, 观察结果。

4.2 结果对比

对于具有ARCH效应的线性回归模型的非线性组合预测方法的模拟效果很大程度上受模型参数取值以及样本容量的影响.其对比结果如表1。

从表中易看出非线性组合预测方法随着样本容量的增大效果逐渐增强, 而当参数取值不断减小时, 非线性组合预测方法与简单线性组合方法的效果有所提高, 尤其是在小样本情况下, 参数取值较小时, 非线性组合预测方法相对于简单线性组合预测方法更能表现其优势.

5 结束语

本文针对ARCH模型因变量的预测问题, 采用非线性组合预测方法, 系统地讲述了在观测量服从正态分布的重要假定情况下利用极大似然方法进行参数估计以及非线性组合预测权重的设置, 通过模拟总结出这种方法比较适用于参数值比较小的小样本情况, 而对于观测量服从其他分布的情况下, 非线性组合预测方法是否适用, 还有待于进一步研究.

参考文献

[1]Engle R.F. with of the of [J]., 1982, (50) .

[2]Paulo S.A, Antonio J.L.Model combination in neural-based forecasting[J].European Journal of Operation Research, 2006, (173) .

[3] R, R.K. Time a [J]. in , 2012.

人口预测模型的非线性动力学研究 第2篇

人口问题不仅是20世纪我国所面临的最重大的问题之一,而且在新世纪中将继续存在。无论是对我国目前经济发展状况的认识,还是对未来经济发展的预测,人口问题的研究都具有十分重要的意义。

众所周知,人口的增长并不是按比例线性增长的,也就是说人口问题是非线性动力学问题。在非线性系统中,可能会出现分岔现象,分岔理论为我们研究人口问题提供了一种新的方法。分岔和混沌是非线性系统特有的现象,而实际上我们所处的社会经济系统中的绝大部分都是非线性,因此可以运用分岔和混沌理论来研究。本文将分岔和混沌理论用以研究人口问题,提出了人口的跨临界分岔。

一、模型的建立

设在时刻t(以年为单位)时的人口数量为p(t),则人口的增长率为,再假设出生率b(p,t)和死亡率d(p,t)不随时间变化,则由马尔萨斯人口理论可得:

附图

其中:d[,1]=b(p,t)-d(p,t)0,一般而言出生率大于死亡率。

显然马尔萨斯模型存在着重大的缺陷,它没有考虑到物种之间的竞争、自然界的平衡和人文环境因素,即生活资料及空间的局限、人与人的竞争、生产力水平、文化水平以及传统观念等因素。

生活资料及空间的局限和人与人的竞争会导致冲突,对人口的增长起到制约的作用。统计规律显示,从人口p(t)中随机抽取一个人,他与其他人冲突的概率与人口总数成正比,即:冲突次数=k[,1]p(t),那么个人冲突的总次数为。而制约作用也是随着总次数的增长而增长的,同总次数成正比,以δ[,1](p,t)表示制约作用,则

附图

可以认为影响作用与生产力发展水平α[,2]成反比,与文化发展水平α[,3]成反比,与中国传统观念α[,4]成正比,与人口数量p(t)成正比,用δ[,2](p,t)表示这种影响,则:

附图

假设在未来的若干年内,各地区的人口比例保持不变,则对于某个地区来说,机械迁徙的人口数量与该地区经济发达程度α[,5]成正比,与迁出区的人口数量成正比,由于可以近似地认为各地区的人口比例不变,所以可以认为与该地区的人口数量成正比,则:

附图

二、模型分析

附图

运用稳定性分析方法,可以很容易地判断其稳定性。

附图

图中,实线表示稳定,虚线表示不稳定。

由分岔图可以看出该模型发生跨临界分岔。

由分岔图可以看出,在α的某个领域内,当α0时,人口数量是稳定增长的;而当α0时,从α系数的物理含义上看,说明死亡率大于其他影响因素系数之和,但是此时由于先前α0,人口数量已经有所增加,所以能保持人口数量的稳定,同时我们也可以看出只有短期内保持α0,人口数量才会稳定。

将再分岔出周期8解、16解等等,大约在3.56994时,进入混沌区,如图2所示。

三、模型的求解

设初始时刻t[,0]的人口为p[,0],将(5)式分离变量后两边取定积分,进行求解可得:

附图

只要求出α和β,就可以运用(9)式作人口预测。理论上,只要将两年的年份与人口数量,即:t[,1]、P(t[,1])、t[,2]、P(t[,2])代入(9)式,则可得一个二元方程组,通过求解此二元方程组,便可以得到α和β值,但是此二元方程组为超越方程组,求解十分困难。

生态学家通过大量的统计,认为不鼓励也不限制生育时的α值为0.029,将α代入(9)式则可求得:,可以看出β会随着所代入的t的不同而变化,不再是一个常数,而是一个变量;另一方面,我国实行计划生*,限制了出生率,并且模型(5)中考虑了生活资料和空间的局限性、人与人的竞争、生产力水平、文化水平以及中国传统观念等因素的影响,因此α的值不再是0.029。

基于上述原因,本文采用数值解法,即:确定适当的.α和β,使得:

附图

其中:p[,i]是第i年的人口数量。则

附图

根据(11)式求解十分复杂,可以用Matlab或c语言编写一段程序,在一定范围内搜索α与β值,使得(10)式成立。

四、实证分析

本文就河北省1952年~人口数量进行实证分析和检验。

众所周知,在建国后近50年中,我国经历了3年自然灾害,80年代开始实行了计划生*政策,这些都会改变动力系统的特征,因此不能将这49年的数据看成是同一动力系统的,而应该将它们分成不同的动力系统:1952年~1959年、1966年~1979年、1980年~1989年、1990年~20。

3年自然灾害造成了人口数量的骤减,不仅改变了动力系统的特征,而且还造成了1960年~1965年数据的不稳定,应予以剔除;80年代后实行计划生*,但是1989年的**引起了大量人口的机械迁移,因此90年代视为另一个动力系统。

表1数据计算和检验(单位:万人)

附图

由表1可以看出,使用本文所提出的方法,能够较为精确地预测出人口的数量。

四个阶段的α均大于0.029,这表明生活资料和空间的局限性、人与人的竞争、生产力水平、文化水平、中国传统观念、人口机械迁移以及实行计划生*等因素的综合影响,使人口趋于增多。

相对人口增长率,即,总体上越来越小,80年代的攀升主要是由于人口迁移的影响,从整体上看人口自然增长率(一般小于人口增长率)也是逐年降低的。

【责任编辑】顾岚

【参考文献】

1方亚玲.《对人口模型的研究》.《山西煤炭管理干部学院学报》,年第2期.

2罗警山.《人口模型中的分岔研究》.《系统工程与电子技术》,1990年第10期.

非线性组合预测模型 第3篇

关键词:模糊聚类;T-S模糊模型;非线性 

中图分类号:TN273文献标识码:A文章编号:1672-3198(2007)12-0264-02

1 基于T-S模糊模型的非线性预测控制

1.1 T-S模糊模型

为方便描述,这里只讨论单输入单输出系统读者可以很方便地将本文的结果推广到多输入、多输出系统。对象的T-S模糊模型的规则可以描述下:

1.2 T-S模型后件参数的在线辨识

对于实际系统,其结构一般不会发生变化,即模糊模型的规则数目、输入变量和输入空间划分等一般不发生变化。本文只对模型规则的后件参数进行在线调整。

为避免对某种工况的过度调整而造成模型泛化能力下降,本文提出了选择性在线调整,即每次进行调整时,首先计算每条规则对应的激励强度,只对具有最大激励强度的模糊规则参数进行在线调整,而其他规则参数保持不变。

本文采用带自动调整遗忘因子的递推最小二乘法实现模型参数的在线学习,对模型规则的后件参数进行在线调整,遗忘因子随着系统动态特性的变化自动调整。

当系统参数变化快时选择较小的遗忘因子,以提高辨识灵敏度。

当参数变化慢时,选择较大的遗忘因子,增加记忆长度,提高辨识精度。

其后件参数修正递推公式如下:

由于Y1(k)和F(k)仍是U(k)和Y^的函数,所以式(29)仍是一个非线性规划问题。采用工作点参考轨迹线,而非实际的控制量U(k)和模型预测输出Y^,式(29)就变为一个线性二次优化问题。其具体算法如下:

(1)在第k个周期,首先更新T-S模糊模型的结论部分参数,然后利用单步预测控制策略计算优化控制率U0(k);

(2)利用式(28)和U0(k)计算模型输出Y^0;

(3)U0(k)和Y^0形成了新的工作点参考轨线,在新工作点参考轨线上重新计算Y1(k)和F(k);

(4)求解二次优化问题式(29)得到优化解U1(k);

(5)利用式(28)和U1(k)计算模型输出Y^1;

(6)U1(k)和Y^1形成了新的工作点参考轨线,在新工作点参考轨线上重新计算Y1(k)和F(k);

(7)求解二次优化问题式(29)得到优化解U(k);

(8)将U(k)的靠前个元素输出到实际过程。

2 仿真研究

采用如下非线性方程作为计算机仿真研究的对象:

用基于T-S模糊模型的非線性预测控制进行跟踪阶跃仿真研究,其中预测步长为10,控制步长为5,输出最大值1,输出最小值为0,控制增量权重为0.2,输出误差权重为1。

为了便于比较,本文同时设计了将采样时刻得到的模型作为整个预测时域模型的单步线性化预测控制器。

图1给出了采用相同参数的单步线性化预测控制和多步线性化预测控制的结果。

可以看出,多步线性化预测控制响应速度快,且过程的输出超调量小。

而单步线性化预测控制响应以衰减振荡的形式收敛到设定值,过程响应超调量大。

由此可见,多步线性化预测控制效果明显比单步线性化预测控制效果好。

3 结 论

本文提出一种新的基于T-S模型多步线性化的模糊预测控制策略。

采用带可变遗忘因子的递推最小二乘法选择性对T-S模型后件参数进行在线辨识。

在每个采样时刻线性化T-S模型,将T-S模型表示的非线性系统等价为线性时变状态空间模型,并将约束非线性优化问题**为线性二次规划问题。

以方便求解。

其控制信号不需要反复迭代求解,进一步减小了计算量。

仿真结果证明了该方法改善了过程动态特性,跟踪速度快,控制精度高,提高了系统的控制品质。

非线性组合预测模型 第4篇

1 灰色线性回归组合模型预测方法的基本原理

灰色模型是灰色系统理论的体系之一, 灰色系统理论是邓聚龙教授1982年提出的一种研究部分信息明确、部分信息不明确的新系统理论方法[4], 和模糊数学的方法相似, 但着重点不同, 与黑箱系统和白箱系统有明显的区别。

建立模型时, 首先假设原始数据序列为

undefined

其中y (0) (k) ≥0, k=1, 2, …, n。

为使序列的光滑性增加, 对Y (0) 做累加处理得:

undefined

其中y (1) (k) =undefinedy (0) (n) , k=1, 2, 3, …, n。

由灰色模型可得:

undefined

用线性回归方程y=ax+b和指数方程y=cex的和来拟合累加序列Y (1) (t) , 把生成的序列写成:

undefined

为了确定参数, 假设参数序列为

undefined

其中t=1, 2, 3, …, n-1, …。

并假设:

undefined

为了求得λ的值, 对式 (4) 作如下变换:

undefined

为了解得λ, 对两边求导得:

λ=ln[Xm (t+1) /Xm (t) ] (6)

为了提高λ的精度, 通过取不同的m值, 可以得到不同的λ值, 然后求出其平均值undefined作为其估计值。求λ的平均值的步骤如下:

由公式 (6) 求出:

λ (1) (1) … λ (1) (m-1)

同理求出:

累加求平均值得:

undefinedundefined

其中m=n-2。

令undefined, 则式 (2) 化简为

undefined

通过数值分析中的最小二乘法, 可求得c1, c2, c3的估计值。

则有Y (1) =AC, 在MATLAB[5]中输入:

A=[l (1) 1 1;

l (2) 2 1;

l (n) n 1];

undefined

C=inv (A′*A) *A′*Y′

可求得c1, c2, c3的值, 代入公式 (2) 就可以得到生成序列的预测公式:

undefined

2 预测现场校验

鹤壁六矿地处河南省北部, 太行山和华北平原交接处。该矿相对瓦斯涌出量一般为10.64~29.43 m3/t。经过矿井资料统计和插值处理[6], 得出其等距垂深的瓦斯数据, 结果如表1所示。

2.1 线性回归模型预测

线性回归模型是形如y=ax+b的方程, 运用MATLAB作曲线拟合, 得其方程如下:

y=0.046 3x-0.468 9 (9)

通过公式 (9) 预测其瓦斯涌出量, 结果见表2。

2.2 灰色模型预测

灰色模型是形如y=aeλt+b的方程, 运用MATLAB作曲线拟合, 得其方程如下:

y=183.693 5e0.089 6t-171.843 5 (10)

通过公式 (10) 预测其瓦斯涌出量, 结果见表3。

2.3 灰色线性回归组合模型预测

原始序列:

Y (0) ={11.85 16.43 18.27 21.58 23.56 24.85 26.09}

经过一次累加得:

Y (1) ={11.85 28.28 46.55 68.13 91.69 116.54 142.63}

当m=1时:

X (1) (1) =Z (2) -Z (1) =Y (1) (3) -2Y (1) (2) +Y (1) (1) =1.84;

X (1) (2) =Z (3) -Z (2) =Y (1) (4) -2Y (1) (3) +Y (1) (2) =3.31;

X (1) (3) =Z (4) -Z (3) =Y (1) (5) -2Y (1) (4) +Y (1) (3) =1.98;

X (1) (4) =Z (5) -Z (4) =Y (1) (6) -2Y (1) (5) +Y (1) (4) =1.29;

X (1) (5) =Z (6) -Z (5) =Y (1) (7) -2Y (1) (6) +Y (1) (5) =1.24。

解得:

λ1 (1) =0.59, λ1 (2) =-0.51, λ1 (3) =-0.43, λ1 (4) =-0.04。

当m=2时, 同理解得:

X2 (1) =5.15, X2 (2) =5.29, X2 (3) =3.27, X2 (4) =2.53。

由公式得:

λ2 (1) =0.03, λ2 (2) =-0.48, λ2 (3) =-0.26。

当m=3时, 同理解得:

X3 (1) =7.13, X3 (2) =6.58, X3 (3) =4.51。

由公式解得:

λ3 (1) =-0.08, λ3 (2) =-0.38。

当m=4时, 同理解得:

X4 (1) =8.42, X4 (1) =7.82。

由公式解得:

λ4 (1) =-0.07。

则可求得:undefined。

通过MATLAB解算得到:C=[-35.41;-0.77;42.88]。

即得到预测公式如下:

y=-35.41e-0.163t-0.77t+42.88 (11)

通过公式 (11) 预测其瓦斯涌出量, 结果见表4。

2.4 预测模型对比分析

通过以上3种模型, 分别预测出瓦斯涌出量, 其对比分析如表5和图1所示。

相对误差[7]对比分析如表6所示。

从表6中可以看出, 灰色线性回归组合模型和线性回归模型相比, 平均相对误差减小2.46%;灰色线性回归组合模型和灰色理论模型相比, 平均相对误差减小1.35%。

线性回归模型的相关性系数为0.973 9, 灰色模型的相关性系数为0.988 1, 灰色线性回归组合模型的相关性系数为0.997 0。

实例证明, 灰色线性回归组合模型比线性回归模型和灰色模型预测精度要高, 数据相关性系数也得到了一定程度的提高。

3 结论

1) 鉴于线性回归和灰色理论模型存在的不足, 笔者系统推导出更加符合现场实际的灰色线性回归组合模型。

2) 各模型预测值和现场实测数据对比结果表明, 灰色线性回归组合模型预测精度分别比线性回归模型和灰色模型提高了2.46%和1.35%, 数据拟合相关性系数也有一定程度的提高。

3) 灰色线性回归组合模型具有自适应性和动态预测特征, 结合运用MATLAB软件可以逐渐提高模型的预测精度。

摘要:矿井瓦斯涌出量预测是新建矿井、新水平和新采区设计的主要依据。

针对目前灰色理论预测模型和线性回归预测模型的缺点和不足, 系统地推导了灰色线性回归组合预测模型。

结合现场实测数据, 并对比线性回归模型和灰色理论模型预测结果, 发现该模型的预测精度分别提高了2.46%和1.35%, 数据拟合的相关系数也有一定程度的提高。

实证结果表明, 灰色线性回归组合模型可以更好地预测矿井瓦斯涌出量。

关键词:瓦斯涌出量预测,灰色线性回归组合模型,线性回归模型,灰色理论模型,MATLAB

参考文献

[1]于不凡.煤矿瓦斯灾害防治及利用技术手册[K].北京:煤炭工业出版社, 2005.

[2]章立清, 秦玉金, 文忠, 等.我国矿井瓦斯涌出量预测方法研究现状及展望[J].煤矿安全, 2007 (8) :58-60.

[3]都锋, 刘恩, 仇海生, 等.回归分析法在预测瓦斯涌出量中的应用[J].煤矿安全, 2010 (3) :26-27.

[4]施式亮, 伍爱友.GM (1, 1) 模型与线性回归组合方法在矿井瓦斯涌出量预测中的应用[C]//中国职业安全健康协会2007年学术年会论文集, 2007:435-440.

[5]何真培, 李树刚, 林海飞, 等.MATLAB在预测矿井瓦斯涌出量中的应用[J].矿业安全与环保, 2011, 38 (3) :32-35.

[6]郑婧, 张振文, 王雪, 等.基于灰色线性回归组合理论的矿井瓦斯涌出量预测[J].工程地球物理学报, 2009, 6 (4) :508-511.

一种新的组合灰色神经网络预测模型 第5篇

一种新的组合灰色神经网络预测模型

对GM(1,1)灰色和几种灰色组合模型进行了讨论,针对多个相关序列预测的问题,提出了组合灰色GM(1,1)神经网络预测模型.此方法采用灰色模型对各序列进行预测,然后利用神经网络对预测值进行校正,得到最终预测值.实例表明此种模型在实际应用中的确能够提高预测精度.

作 者:许秀莉 罗键 作者单位:厦门大学自动化系,福建,厦门,361005刊 名:厦门大学学报(自然科学版) ISTIC PKU英文刊名:JOURNAL OF XIAMEN UNIVERSITY(NATURAL SCIENCE)年,卷(期):200241(2)分类号:N941.6关键词:模型 BP神经网络 组合灰色神经网络预测模型

非线性组合预测模型 第6篇

关键词 RBF神经网络模型;GM(1,1)模型;ARIMA模型;最优组合预测模型

中图分类号 F831文献标识码:A

1 引 言

非线性组合预测模型 第7篇

关键词:传统包容性检验方法,非线性包容性检验,单一预测模型遴选,非线性组合预测模型

1 引言

1969年, Bates和Granger[1]首次尝试将多个单一模型组合成一个新的预测模型, 结果发现组合模型能克服单一模型仅反映信息片段的缺陷, 实现模型优势互补, 显著提高预测精度。

自此以后, 组合模型在能源需求预测领域取得了广泛的应用。

针对能源需求整体上呈现非线性和不确定性特征, 大量研究成果显示[2,3,4], 线性组合模型较非线性组合模型而言, 解决能源需求预测问题的局限性较大、效果较差, 故非线性组合模型成为该领域的主流。

然而, 对于能源需求非线性组合模型中单一模型的遴选问题, 所选单一模型的数量和单一模型的种类, 都关系着组合模型构建的有效性及预测精度。

为此, 如何判定哪些单一模型可以作为能源需求非线性组合预测模型的一员, 也就是如何判定预测模型的包容性是需要解决的关键问题。

判定一个预测模型是否包含其他预测模型的信息, 这一思想最早是由和提出的。

自从提出预测包容的思想以来, Meese[5]最早提出了一个预测模型是否比另一种预测模型更加具有预测能力的检验方法。

[6]提出了关于两两预测模型的几种等精度检验统计量的渐近分布。

和[7], Chong和[8]等给出了以线性回归模型为基础的预测包容性检验的一般研究方法。

王丰效[9]提出了两个组合预测模型之间的包容性检验方法, 并将该方法应用于组合预测单项模型的选择中, 提高了单一模型间的相互*性, 加强组合模型的预测有效性。

从文献梳理中可以发现, 包容性检验是用于评估预测模型间包容性问题的重要技术之一, 已有包容性检验方法的应用范围从最初的仅局限于两种单一模型组合问题, 发展到多个模型的组合问题, 已取得了较大的进展, 但是预测包容性检验的回归模型仍停留在线性回归的阶段, 在线性组合模型中取得了较好的预测效果, 但不能很好地适应能源需求非线性组合模型的特征, 因此, 本文首次针对线性组合预测模型间的包容性检验的原理加以改进, 提出针对非线性组合预测模型的包容性检验方法, 并通过实证检验, 证实了该方法在能源需求预测领域的有效性。

2 理论依据

2.1 包容性检验及其在组合模型中的理论基础

包容性检验的理论基础是假设一个已知的数据产生过程, 即一个预测模型对原始数据的训练产出拟合数据的过程, 并通过对拟合数据训练产生过程的知识推导来推断出这个预测模型的性质, 而无须对数据的回归分析来识别此预测模型的具体特征, 如果假设成立, 即一个预测模型非常近似于一种数据产生过程, 且任意两个相竞模型间具有直接或间接的相关性, 即包容关系, 便可以从某一预测模型推导出其他预测模型的性质, 从而判断该模型是否包容其他模型, 使此预测模型不断得以凝练, 这一特性是包容理论的本质[10]。

包容性检验的理论似乎与组合模型的理论相违背。

其实, 二者的理念不仅一致, 并且相辅相成。

组合模型能综合多个信息源, 信息源可理解为不同的模型数据信息、不同类型的模型, 或模型对结构变化有不同的识别过程, 组合的效果会因为涵盖了更多的信息而提高[11]。

而包容性检验则直接对相竞预测模型的精度差异来源进行判别, 识别出造成该差异是源于样本的变异性, 或是在构建模型的信息源不同等[12], 从而帮助组合模型遴选出较为*的单一模型。

2.2 非线性包容性检验的思想来源

已有包容性检验是逐步累进地通过相竞模型的线性回归模型对数据近似分析, 然而, Cars和[13]指出数据特征只有在非线性程度较弱的情况下, 运用线性模型对该数据产生过程的近似描述才有效;否则, 当非线性程度较高时, 通过线性模型的近似描述往往不准确, 甚至会导致错误的分析结果。

从个体样本失误对组合预测整体效果的影响来看, 线性组合预测模型因为采用了线性组合加权, 个别样本的较大失误会对整个组合预测模型的预测效果或精度产生较大的影响。

从能源需求的历史数据来看, 能源需求量呈非线性的增长趋势, 因此非线性模型可以更好的适应能源需求系统的特点。

简言之, 针对能源需求组合数据的非线性特征, 需要改进相竞模型的线性回归模型, 采用非线性模型来近似描述该数据, 从而遴选出的单一模型才适用于构建非线性组合模型。

但是传统的包容性检验方法是基于线性的组合预测模型所设计的算法, 具体地说, 传统方法无法对非线性组合预测模型中的权值系数进行α显著性水平下的t检验来确定其值。

因此, 根据以上问题, 本文基于非线性组合的预测模型, 改进了传统的包容性检验方法。

3 包容性检验方法的改进

在多个单一模型组合的包容性检验中, 主要通过每两个单一模型的包容性检验来筛选模型, 进而对筛选出的模型予以组合。然而, 这样忽视了多个模型组合后可能包容组合前所不包容的单一模型的情况。组合模型中可能仍未剔除冗余模型。因此, 本文根据王丰效提出的组合预测模型之间的包容性检验方法进行了改进, 遴选出相互*的单一模型来参与组合预测。

3.1 传统包容性检验方法[9]

设fct为所有m种单项预测模型所组成的线性组合预测模型在t时刻的预测值, 即

其中, xkt为第i种单项预测模型在t时刻的预测值, k=1, 2, …, m, α1+α2+…+αm=1, αk≥0, 而设f (c-i) t为仅不含第i种单项预测模型所组成的线性组合预测模型在t时刻的预测值。考虑fct和f (c-i) t构成的线性预测模型:

其中, β1≥0, β2≥0, 均为回归系数, 且β1+β2=1, ut为随机扰动项。

如果β1=0, β2=1, 则称组合预测模型fct包容组合预测模型f (c-i) t, 如果β1=1, β2=0, 则称组合预测模型f (c-i) t包容组合预测模型fct.如果β1, β2取其它值就称组合预测模型fct和f (c-i) t互不包容, 则表明单项预测模型fi能够提供有用的信息。

令ect=xt-fct和e (c-i) t=xt-f (c-i) t分别表示两个组合模型预测误差, 则由式 (2) 可得:

由于e (c-i) t=xt-f (c-i) t, 可得:

同理可得:

这样组合预测模型的包容性检验问题就归结为对回归模型 (3) 、 (4) 中回归系数β1、β2进行α显著性水平下的t检验, 检验步骤如下。

(1) 设H0:β=0, H1:β≠0, 其中β取值为β1或β2.

(2) 计算统计量。当H0成立时, 可得:

(3) 在给定显著性水平α下, 确定临界值tα/2 (n-2) 。

(4) 检验结果判断。若|t|≥tα/2 (n-2) , 则拒绝原假设H0:β=0, 表明单项预测模型fi显著增加了组合预测的精度;反之, |t|tα/2 (n-2) , 则接受原假设, 表明单项预测模型fi的增加没有改变组合预测的性能, 未能增加新的信息, 即fct和f (c-i) t的预测效果一样, 从而将单一预测模型fi删除。

3.2 包容性检验方法的改进

针对能源需求非线性组合问题, 对传统的线性包容性检验方法作如下改进:

设fct为所有m种单项预测模型所组成的非线性组合预测模型在t时刻的预测值, 即

其中, α1+α2+…+αm=1, αk≥0, k=1, 2, …, m, 而设f (c-i) t为仅不含第i种单项预测模型所组成的非线性组合预测模型在t时刻的预测值。考虑fct和f (c-i) t构成的非线性模型

其中, β1≥0, β2≥0均为回归系数, 且β1+β2=1, ut为随机扰动项。

如果β1=0, β2=1, 则称非线性组合预测模型fct包容非线性组合预测模型f (c-i) t, 如果β1=1, β2=0, 则称非线性组合预测模型f (c-i) t包容非线性组合预测模型fct.如果β1, β2取其它值就称非线性组合预测模型fct和f (c-i) t互不包容, 则表明单项预测方法fi能够提供有用的信息。

令分别表示两个非线性组合模型预测误差, 则经过公式推导, 式 (7) 变为:

同理可推出:

这样非线性组合预测模型的包容性检验问题就**为对回归模型 (8) 、 (9) 的检验, 检验步骤与线性包容性检验的步骤相同。由于改进的包容性检验方法是专门用于非线性组合预测模型的检验, 为此, 将其称为非线性包容性检验方法。

3.3 改进的包容性检验方法在能源需求非线性组合预测中应用的基本步骤

能源需求组合预测模型由于承载了更多的信息源而使预测精度有所提高。也就是说, 组合模型每当剔除一个模型时, 预测精度如果没有变化或者没有提高, 就意味着该模型所提供的信息被其他模型所包含, 应予以剔除;反之, 如果预测精度下降, 说明该模型可以提供有用的信息, 应予以保留。改进的包容性检验方法在能源需求非线性组合预测中应用的基本步骤如下:

步骤1:采用平均相对误差绝对值 (MAPE) 作为能源需求预测评价指标, 评价每个单一预测模型的预测性能, 并根据预测精度对模型进行排序。假定各个单一预测模型根据的预测精度效果排序为f1f2…fm. (表示模型f1优于f2, …, 优于fm) 。

步骤2:对所有单一预测模型f1, f2, …, fm建立组合预测模型fc, 再对不包含预测精度最差的所有单一预测模型f1, f2, …, fm-1建立组合预测模型fc-m.通过两个组合预测模型对单一预测模型fm进行包容性检验, 如果组合模型fc-m包容组合模型fc, 表明fm的加入并没有改善预测效果, 从而将fm从单项模型组中剔除, 则转入步骤3。

反之, 保留fm, 用fc- (m-1) 代替fc-m, 与fc继续对fm-1进行包容性检验。

步骤3:用fc-m代替步骤2中的fc, 与不包含剩余单一模型中精度最差的模型fm-1的组合预测模型fc-m- (m-1) 继续对fm-1进行包容性检验, 直到所有的单一预测模型被检验完为止。

步骤4:将最后保留的单一模型作为参与组合预测的最终遴选模型。[9]

4 实例分析

4.1 数据来源

设f为能源需求总量;zi (i=1, 2, 3, 4) 为解释变量, 分别代表GDP, 总人口, 能源消费结构、产业结构。鉴于各变量数据的可得性, 分别从《2012年中国统计年鉴》获取以上5个变量1990~2012年的时间序列数据, 由于统计数据时GDP釆用的是名义值, 为了使各年经济发展水平数据具有可比性, 所有年份的名义GDP都换算成以1990年为不变价的实际GDP.

4.2 单一预测模型的构建及其结果

采用以下6种单一模型, 即趋势外推模型 (f1) 、GM (1, 1) 模型 (f2) 、GM (1, n) 模型 (f3) 、岭回归模型 (f4) 、BP神经网络模型 (f5) 、RBF神经网络模型 (f6) 分别构建我国能源需求预测模型, 其中, f1、f2、f3、f4, 见式 (10~13) 。

BP神经网络f5的参数设置如下:

训练BP神经网络采用算法, 设置最大训练步数为170步, 期望误差goal为0.000001, 学习速率一般选取在0.01~0.1, 本文选取为Ir为0.05。隐含层函数为S型正切函数, 输出层函数为函数, 训练函数为函数。以均方误差作为参考指标确定步数, 随着步数增加, 均方误差稳定减小, 当epoch=7时, 已达到误差要求, 所以确定步数为7。

RBF神经网络f6的参数设置如下:

将goal参数设定为0.0003, 最大神经元个数 (MN) 19, 训练过程中, 最重要的参数是径向基函数的分布常数spread.spread越大, 网络的预测性能越平滑。

但是过大的spread可能导致计算上出现问题, 这里先将其设定为1, 然后以0.1的间隔递增。

根据大量实验仿真, 当spread=2.7时, 迭代次数在4次以后, 训练误差基本稳定, 预测效果最理想。

此时, 隐层神经元个数为4, MSE=0.0002119。

则RBF神经网络的结构模型为4-4-1。

通过MATLAB7.7.0仿真, 分别拟合我国能源消费数据, 得到2008~2012年的拟合数据以作为观测, MAPE值见表1。

4.3 基于包容性检验的组合预测单一模型遴选

(1) 非线性包容性检验

(1) 根据表2中的MAPE值, 对这6个单一预测模型按预测精度高低进行排序:f3f5f2f1f6f4

(2) 在α=0.05的显著性水平下, 通过f3, f5, f2, f1, f6, f4的组合模型和f3, f5, f2, f1, f6的组合模型来对f4进行包容性检验, 得到t统计量为0.8007, 查t分布临界值表, 可以得到t0.025=3.1824, 有|t|=0.3093.1824, 根据接受原则, f4与其他模型互相包容, 将f4从待评表中删除。

(3) 在α=0.05的显著性水平下, 通过f3, f5, f2, f1, f6的组合模型和f3, f5, f2, f1的组合模型来对f6进行包容性检验, 有|t|=1.0697t0.025=3.1824, 根据接受原则, f6与其他模型互相包容, 将f6从待评表中删除。

(4) 在α=0.05的显著性水平下, 通过f3, f5, f2, f1的组合模型和f3, f5, f2组合模型来对f1进行包容性检验, 有|t|=0.0615t0.025=3.1824, 根据接受原则, f1与其他模型互相包容, 将f1从待评表中删除。

(5) 在α=0.05的显著性水平下, 通过f3, f5, f2的组合模型和f3, f5的组合来对f2进行包容性检验, 有|t|=4.2057t0.025=3.1824, 根据接受原则, f2与其他模型不包容, 保留f2。

(6) 在α=0.05的显著性水平下, 通过f3, f2, f5的组合模型和f3, f2来对f5进行包容性检验, 有|t|=1.3306t0.025=3.1824, 根据接受原则, f5与其他模型互相包容, 将f5从待评表中删除。

(7) 在α=0.05的显著性水平下, 通过f3, f2的组合模型和f2来对f3进行包容性检验, 有|t|=4.6705t0.025=3.1824, 根据接受原则, f2和f3不包容, 保留f3。

(8) 此时, 待评表已经为空, 停止包容性检验。将所保留的单一模型f2和f3作为最终用以组合的单一预测模型。

(2) 线性包容性检验

为了与非线性包容性检验作以对比, 采用线性包容性检验对上述六个单一模型进行筛选, 步骤同上, 可得到各变量的t检验如表2所示。

从表2可以看出, 线性包容性检验仅剩f3作为最终用以预测的模型。

4.4 非线性组合模型

本文选用加权几何平均组合预测模型和加权调和平均组合预测模型作为能源需求的非线性组合模型, 见式 (14) 和式 (15) 。

式 (14) 、式 (15) 中l1, l2, …, lm为各种预测模型的权系数, 一般有, li≥0, i=1, 2, …, m.

以2008~2012年作为观测窗口, 基于改进的包容性检验方法, 构建加权几何平均组合模型 (f23、) 和加权调和平均组合模型 (f23′、f′123456) , 并计算其拟合值及MAPE, 如表3、表4所示。

从表3、表4可以看出:

(1) 无论是加权几何平均组合预测模型, 还是加权调和平均组合预测模型这种非线性组合预测方法, 基于非线性包容检验方法的组合预测误差均为最小 (0.6%) , 线性包容性检验方法次之 (1.55%) , 不用包容性检验方法的组合预测精度最差 (2.36%和2.61%) 。

(2) 通过f23、f3分别与f123456的比较, 或者f23′、f3分别与f′123456的比较, 可以发现, 组合预测模型中单一模型越多, 预测精度反而越低, 这说明信息源越多, 可能存在更多的冗余信息, 会影响组合预测模型的有效性及预测精度, 并不是参与组合的单一预测模型越多越好。

(3) 通过f23和f3、f23′和f3MAPE的比较, f23和f23′的平均误差绝对值远远小于f3 (1.55%) , 说明针对非线性组合预测问题, 非线性包容性检验的方法比线性包容性检验方法更适合、更有效。

5 结论

非线性组合预测模型 第8篇

1灰色线性回归组合模型

经典的灰色GM (1, 1) 预测模型主要适用于单一的指数增长型序列, 对于数据出现异常的情况往往效果不佳。灰色线性回归组合模型在灰色GM (1, 1) 模型的基础上结合一元线性回顾模型, 克服了灰色GM (1, 1) 模型中没有线性因素的不足, 因此, 该模型适用于既有线性趋势又有指数增长趋势的序列。

根据灰色系统的GM (1, 1) 模型可得到:

其形式可记为:

用线性回归方程Y=a X+b及指数方程Y=a eX的和来拟合累加生成序列X (1) (t) , 因此, 可将生成的序列写成:

其中, 参数v及C1, C2, C3待定。

因此得到v的解为:

进而求得:

同理求出:

累加求平均值:

利用最小二乘法可求得C1, C2, C3的估计值

可求得C1, C2, C3的值, 进而得到生成序列的预测值为:

从式中可以看出, 如果C1=0, 则一次累加生成序列为线性回归模型, 如果C2=0则累加生成序列为GM (1, 1) 模型。灰色线形回归组合模型使原线性回归模型中不含指数增长趋势及GM (1, 1) 模型不含线性因素的情形得到改善。

2灰色线性回归组合模型预测

选取我国煤炭2003-2013年百万吨死亡率见表1。

将表1中的数据代入灰色线性回归组合模型, 通过运用MATLAB编程求解, 可得到灰色线性回归组合模型方程, 如下:

3结论

(1) 灰色线性回归组合模型的准确性和精度都符合要求, 能够很好的反映煤矿百万吨死亡率的客观存在与发展态势, 具有实用价值。

(2) 预测值的准确性对煤矿安全目标的制定有重要意义, 可以科学的规划煤炭产量, 合理的制定各种煤炭法律法规, 以便于加强安全管理。

(3) 我国的百万吨死亡率还处在一个很高的水平, 必须加大科技投入, 进一步提升我国煤炭的生产安全性。

参考文献

应用组合模型对我国能源消费的预测 第9篇

能源是国民经济发展和社会进步的重要物质基础, 未来能源的供给能否支撑我国经济的可持续增长, 成为国内外关注的十分重要的问题。因此, 做好未来能源消费预测分析, 为能源规划及政策的制订提供科学的依据, 对于保持我国国民经济健康、持续、稳定的发展具有重要的现实意义。

国内外许多学者或机构对能源需求进行过广泛研究, 提出了许多能源需求预测方法。当前对能源需求进行预测的常用方法可以分为两类:一是情景分析法, 从未来经济社会发展的目标情景设想出发, 构想未来能源需求。二是趋势外推法, 如部门分析法、能源消费弹性系数法、能耗强度法等, 根据对以前较长一段时期能源需求规律的分析来预测未来时期的能源需求。

我国能源消费与经济发展密切相关, 所以现主要从能源消费与经济发展的关系入手, 对我国未来能源消费进行预测。选用神经网络和时间序列两种方法建立我国能源消费系统的单项预测模型, 之后使用标准差法对各模型预测结果进行权重分配建立我国未来能源消费量的组合预测模型。

1预测模型的建立

1.1神经网络预测模型

1.1.1模型简介

BP网络的结构图1所示。

BP网络是一种具有三层或三层以上神经元的神经网络, 包括输入层、中间层 (隐含层) 和输出层。

上下层之间实现全连接, 而每层的神经元之间无连接。

当一对学习样本提供给网络后, 神经元的激活值从输入层经各中间层向输出层传播, 在输出层的各神经元获得网络的输入响应。

然后按照减少目标输出与实际输出之间误差的方向, 从输出层反向经过各中间层回到输入层, 从而逐层修正各连接权值, 这种算法称为“误差反向传播算法”, 即BP算法。

随着这种误差逆向的传播修正不断进行, 网络对输入模式响应的正确率也不断上升。

对于BP网络有一个重要定理:对于任何闭区间内的一个连续函数都可以用单隐层的BP网络逼近, 因而一个三层BP网络就可以完成任意 n 维到 m 维的映射, 因此使用三层的BP网络。

1.1.2 模型建立

模型中能源消费的影响因素的选取应遵循以下原则:

① 选取的影响因素与能源消费关系密切;

② 选取的影响因素变化趋势明显、稳定, 并具有连续变化的特征, 以保证其未来的预期不会出现较大的偏差。

国民生产总值 (GDP, 以1978年价格计算) 、经济结构、人口、城镇化率符合上述原则, 所以将这些变量作为能源消费的影响因素纳入模型中。模型表达式如下

Y = f ( x 1, x 2, x 3, x 4) (1)

式 (1) 中: Y 表示能源消费总量, f 表示神经网络模型, x 1表示GDP, x 2表示经济结构, x 3表示人口, x 4表示城镇化率。

1.1.3 模型预测结果的检验

选取1990—2003年间的数据训练神经网络[1,2], 以2004—2009年的数据来检验神经网络模型的预测精度。神经网络模型由MATLAB实现[3], 神经网络中间隐层的神经元个数选为36个, 所有的输入、输出变量在输入网络前都先进性归一化处理, 使其值落在0到1之间。结果如表1所示。

1990—2003年间的平均拟合相对误差为2.17%, 2004—2009年的平均预测误差为1.86%。神经网络模型的拟合精度和预测精度都相当高。

1.1.4 模型对各输入变量的灵敏度检验

由于神经网络模型对能源消费的预测需要对社会发展的相关指标进行估计, 所以有必要检验模型对各输入变量的灵敏度, 考察当个别变量有较大变动时模型输出结果的变化, 以确定此模型是否适用。以2009年为例, 结果如表2。

注: b 1, b 2, b 3分别代表靠前、第二和第三产业的比例/%

模型对单个变量的灵敏度适中, 均在可接受范围内;GDP和经济结构对能源消费的影响很大。

1.2 时间序列模型

1.2.1 模型简介

选用时间序列组合模型方法来对我国未来能耗强度 (单位GDP能耗) 的变化趋势进行模拟。组合模型完整的形式如下[4]:

X t = f ( t ) + S + T + R (2)

式 (2) 中: X t 为待研究的时间序列, f ( t ) 为 X t 的确定性长期趋势, S 为季节变量, T 为周期变量, R 为随机波动项。

随机波动 R 服从ARMA ( m , n ) 过程, ARMA ( m , n ) 的一般形式如下

Φ ( B ) u t = Θ ( B ) a t

Φ ( B ) =1- φ 1 B - φ 2 B 2-…- φ m B m ;

Θ ( B ) =1- φ 1 B - φ 2 B 2-…- φ n B n (3)

式 (3) 中: a t 为白噪声序列, B 为后移算子, B 的次数表示后移的期数

1.2.2 模型建立及检验

(1) 确定性部分

1978年以来我国万元GDP能耗 (GDP按1978年价格计算) 近似指数衰减, 所以先对其进行对数变换, 设变换后的万元GDP能耗序列为 X t , 然后选 X t 为因变量, 年份为自变量, 对 X t 进行线性回归, 回归式如下[5,6]:

X t =86.816-0.043 t + u t ;

R 2=0.955, D . W =0.174 (4)

回归式的拟合优度很高, 可以解释能耗强度大部分的变动。

(2) 随机部分

若残差序列 u t 之间相互*, 即 u t 为白噪声, 上式则为普通的一元线性回归模型。但 D . W 值显示 u t 之间有很强的相关性, 残差序列 u t 是可预测的。同时残差序列 u t 为一平稳序列, 所以可以对残差 u t 建立ARMA模型。

观察残差序列 u t 的自相关函数和偏相关函数图并比较可选的模型, 确定对其建立ARMA (1, 1) 模型, 结果如下:

u t =0.874 u t -1+0.704 a t -1+ a t (5)

R 2=0.891, 拟合优度较高, 并且模型各项参数均通过了显著性检验。残差序列 a t 的自相关图表明残差的样本自相关函数和偏自相关函数都位于Bartelett带宽以内, 对模型进一步检验:

表3结果显示残差序列 a t 已为白噪声序列。

1.2.3 组合模型

将确定性部分和随机部分组合, 结果如下

X t =81.196-0.04 t +0.884 u t -1+0.727 a t -1+ a t ; R 2=0.996, D . W =1.570 6 (6)

拟合优度非常高, 拟合平均相对误差仅为2.11%。模型各项参数均通过了显著性检验。在 a =0.01下查 D . W 检验临界值表得: d u =1.42, d u D . W 4- d u , 进一步说明残差序列 a t 倾向于白噪声, 因此建立的模型是合适的。

1.2.4 模型预测结果

2 未来六年我国社会发展的预期

根据我国发展现状及发展目标[7,8], 假设未来六年年间GDP年平均增长9%;靠前产业比重平均每年降低0.3%, 第三产业比例平均每年增加0.8%;人口总数年平均增长5&;;城镇化率年平均增加0.9%。

3 未来六年我国能源消费预测

3.1 两种方法的预测结果

使用1990—2009年的数据训练神经网络, 中间隐层的神经元数仍取36个, 拟合平均相对误差为2.14%。对未来六年我国能源消费进行预测, 结果如表5。同时也给出时间模型预测结果。

由表5可以发现:神经网络模型的预测结果高于时间序列模型的结果, 并且随着预测时间的延长两模型的预测结果相差越大。

单位GDP能耗降低是确定的趋势, 但神经网络模型只反映了经济结构对单位GDP能耗降低的作用, 而科技进步、国民节能意识的提高等因素并未纳入神经网络模型中, 因此神经网络模型的预测结果会偏高, 如表1所示。

而时间序列模型模拟的是单位GDP能耗的降低趋势, 根据边际效应递减规律, 我国单位GDP能耗降低的幅度会放缓, 最近几年我国单位GDP的降幅缓慢也可以印证这一点, 所以时间序列模型的预测结果偏低。

未来六年我国能源消费总量应在两模型预测结果之间。

3.2 各方法的预测结果相应权值的确定

为了充分利用单一模型所反映的有效信息, 克服单一模型的缺陷, 同时减少预测的随机性, 提高预测精度, 考虑建立组合预测模型, 采用标准差法确定各模型权重[9]。

设神经网络模型和时间序列模型的预测误差的标准差分别为 σ 1和 σ 2, < id="58"> σ = < ="true"><> i = 1 m > σ > i > ( m 为模型个数) , 权值< id="59"> w i = σ - σ i σ ( m - 1 ) >。计算各单项模型的权重向量 w = (0.464 0.536) , 从而得到组合预测模型:

y =0.464 y 1+0.536 y 2 (7)

式 (7) 中 y 1表示神经网络模型预测结果, y 2表示时间序列模型预测结果。

3.3 2010—2015年我国能源消费总量预测结果

综上, 2010—2015年我国能源消费总量复合模型的预测结果表6。

4 结论

2015年我国能源消费总量将会超过40亿吨标准煤大关, 我国能源供应安全形势十分严峻, 为应对这一挑战我们需要从以下三个方面着力:

(1) 加快节能技术的研发与推广, 并提高国民节能降耗的意识, 尽量降低能源消耗;

(2) 利用各种手段积极保障我国能源供应安全, 特别是石油的供应安全, 争取扩大能源供应的渠道;

(3) 加紧清洁能源和替代能源的研发, 使其尽快为经济社会发展服务。

参考文献

[1]中华人民**国国家统计局.中国统计年鉴—2009.北京:中国统计出版社, 2008

[2]中华人民**国国家统计局.2009年国民经济和社会发展统计公报, 2009

[3]葛哲学, 孙志强.神经网络理论与MATLAB R2007实现.北京:电子工业出版社, 2007

[4]王振龙, 胡永宏.应用时间序列分析.北京:科学出版社, 2007

[5]宇传华.SPSS与统计分析.北京:电子工业出版社, 2007

[6]卢二坡.组合模型在我国能源需求预测中的应用.数理统计与管理, 2006;25 (5) :505—511

[7]邱晓华, 郑京平, 万东华, 等.中国经济增长动力及前景分析.经济研究, 2006;41 (5) :4—12

[8]刘兰凤, 易行健.中国能源需求的估计与预测模拟.上海财经大学学报, 2008;10 (4) :84—91

基于熵权组合模型的风电功率预测 第10篇

风能是一种可再生、清洁的能源,风力发电是最具大规模开发技术经济条件的非水电再生能源。

现今风力发电主要利用的是近地风能。

近地风具有波动性、间歇性、低能量密度等特点,因而风电功率也是波动的。

大规模风电场接入电网运行时,大幅度地风电功率波动会对电网的功率平衡和频率调节带来不利影响。

如果可以对风电场的发电功率进行预测,电力调度部门就能够根据风电功率变化预先安排调度计划,保证电网的功率平衡和运行安全。

因此,如何对风电场的发电功率进行尽可能准确地预测,是急需解决的问题[1]。

为克服风电波动对电力系统运行的不利影响,风电装机容量较大的几个国家都在开发风电功率预测系统。

风电功率预测对于电网安全、经济调控、电力市场及风电场运行都有重要意义。

根据电力调度部门安排运行方式的不同需求,风电功率预测分为日前预测和实时预测。

日前预测是预测明日24小时96个时点(每15分钟一个时点)的风电功率数值。

实时预测是滚动地预测每个时点未来4小时内的16个时点(每15分钟一个时点)的风电功率数值。

在实际应用中,由于实时预测的历史数据在滚动地更新不断地进行短期的预测,因此实时预测的预测精度要高于日前预测。

以某风电场5月30日0时0分至5月30日23时45分的实测数据作为建模的历史数据[1],分别采用灰色预测法、人工神经网络法、ARMA时间序列法进行实时预测。

以5月31日0时0分至5月31日23时45分的实测的风电功率输出数据共96个值作为预测值的比较对象,比较单一预测模型的预测精度。

然后引入熵值理论,建立了熵权组合预测模型对风电功率进行预测,并比较说明了熵权组合预测模型的优势。

1 单一风电功率预测

1.1 灰色预测法

灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况[2]。

GM(1,1)模型是最常用的一种灰色预测模型,它是由一个包含单变量的一阶微分方程构成的模型[2]。设有原始数据系列为 x < id="7"> <> ( 0 ) > >=[ x < id="8"> <> ( 0 ) > > (1), x < id="9"> <> ( 0 ) > > (2),&;, x < id="10"> <> ( 0 ) > >( n )],则经典GM(1,1)模型描述如下:

x < id="12"> <> ( 0 ) > >( k )+ az < id="13"> <> ( 1 ) > >( k )= b , k =0,1,2,&;, n (1)

其中, n 表示观测时间。 x (1)=[ x (1)(1), x (1)(2),…, x (1)( n )]是 x (0)的1-AGO序列,即有

< id="15"> x ( 1 ) ( k ) = < ="true"><> m = 1 k > x > ( 0 ) ( m ) >

z < id="17"> <> ( 1 ) > >=( z < id="18"> <> ( 1 ) > > (1), z < id="19"> <> ( 1 ) > > (2),&;, z < id="20"> <> ( 1 ) > >( k ),&;, z < id="21"> <> ( 1 ) > >( n ))是 x (1)的紧邻均值生成序列,即满足

< id="22"> z <> ( 1 ) > ( k ) = 1 2 ( x <> ( 1 ) > ( k ) + x <> ( 1 ) > ( k - 1 ) ) ( k 2 ) < width="0.25em">> < width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">> ( 2 ) >

则模型式(1)的未知参数向量 θ =( a , b )T的最小二乘估计为< id="24"> θ ^ = ( Φ Τ Φ ) - 1 Φ Τ Y >,其中

< id="25"> < ="left"> Y = ( x ( 0 ) ( 2 ) , x ( 0 ) ( 3 ) , , x ( 0 ) ( n ) ) Τ Φ = ( <> - z ( 1 ) ( 2 ) - z ( 1 ) ( 3 ) - z ( 1 ) ( n ) 1 1 1 > ) Τ > >

模型(1)对应的白化方程为< id="27"> d x ( 1 ) d t + a x ( 1 ) = b < width="0.25em">> < width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">> ( 3 ) >

式(3)的解为

< id="29"> x ( 1 ) ( t ) = [ x ( 1 ) ( 0 ) - b a ] e - a t + b a < width="0.25em">>< width="0.25em">> < width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">>< width="0.25em">> ( 4 ) >

对式(4)离散化可得

称式(5)为式(3)的时间响应序列,其还原值即为GM(1,1)模型预测公式

x (0)( k +1)= x (1)( k +1)- x (1)( k ), k =1,2,…, n

即< id="37"> x ( 0 ) ( k + 1 ) = ( 1 - e a ) [ x ( 0 ) ( 1 ) - b a ] e - a k >。

利用灰色预测法时不需太多的历史数据,因此选用5月30日实测的最后6个时点的数据作为历史数据,即

利用G(1,1)模型进行滚动的实时预测,具体数据处理步骤如下:(1)采用G(1,1)模型预测从5月31日0时0分开始的下4个时点的数据(每隔15 min一个时点),即采用四步预测。(2)接着跟踪机组的输出功率,采集数据不断更新历史数据,即去掉最老的历史数据,保留实时采集数据,继续完成后续预测。

由图1可以看出,利用灰色预测模型进行预测时,在某些点处的预测值与实测值差距较大,导致了预测效果欠佳。

1.2 BP神经网络预测

人工神经网络是指基于误差反向传播算法的多层前向神经网络[3,4],采用有导师的训练方式,能够以任意精度逼近任何非线性映射;可以学习和自适应位置信息;具有分布式信息存储与处理结构,具有一定的容错性,因此构造出来的系统具有较好的鲁棒性,适合处理复杂问题。神经网络的反向传播BP(Back Propagation)算法是多层感知器的一种有效学习算法,它的模型为前向多层网络。

运用BP神经网络模型时,首先初始化网络的结构和权值,然后根据输入样本前向计算BP神经网络每层神经元的输入信号和输出信号,根据期望输出计算反向误差,对权值进行修正,如果误差小于给定值或迭代次数超过设定值则结束。

BP神经网络由非线性函数 f 组成,而 f 由一系列不同权重的线性过滤器组合而成

< id="47"> p ˜ ( t ) = f { < ="true"><> i = 1 l > A > i f [ < ="true"><> j = 1 m > w > i j x j ( t ) ] } >

其中 x j 表示输入变量; w ij 表示权重;< id="49"> p ˜ ( t ) >表示输出值,我们以实测功率与预测功率的最小平方差作为目标函数,训练网格,寻找最优的权值 w ij ,即

< id="50"> S E = < ="true"><> Ν = 1 Ν > [ > p ˜ ( t ) - p ( t ) ] 2 >

式中< id="52"> p ˜ ( t ) >表示预测值, p ( t )表示实测值, N 表示训练数据个数。

本文利用BP神经网络预测,具体建模步骤如下:(1) 采用5月30日的96个时点的数据作为历史数据,用来在学习阶段进行学习,用学习好的参数来预测紧接着的16个时点的数据;(2) 为提高模型的预测精度,我们对历史数据进行更新,利用新收集的数据代替老的数据,已达到滚动预测的目的。(3)设置最大训练步数为10 000,取模拟10次结果的平均值为预测值。

从图2中可以看出,BP神经网络的预测值能够跟踪风电功率的变化趋势,只是在风电功率变化较快时的波峰和波谷处误差较大。BP神经网络模型的预测效果要好于灰色预测,BP神经网络预测结果相对比较稳定。

1.3 时间序列模型——ARMA模型

ARMA是一种精度较高的短期时间序列预测方法[5]。他将预测对象随时间变化形成的序列,看作是一个随机序列。ARMA法的基本思想是:一串随时间变化而又相互关联的数字序列,可以用相应的模型加以近似描述。通过对相应数学模型的分析研究,能更本质地认识这些动态数据内在的结构和复杂性,从而达到在最小方差意义下的最佳预测。

ARMA模型的一般形式为: x t - φ 1 x t -1-&;- φ p x t - p = a t - θ 1 a t -1-&;- θ q a t - q ,用 B k 表示 k 步线性推移算子,即 B k x t = x t - k , B k a t = a t - k , B k c c , c 为常数。

φ ( B )=1- φ 1 B - φ 2 B 2-&;- φ P B P ; θ ( B )=1- θ 1 B - θ 2 B 2-&;- θ P B q ,则可简记为 φ ( B ) x t = θ ( B ) a t

此模型就称作 p 阶自回归- q 阶滑动平均混合模型,记为ARMA( p , q )模型。

特殊的,若 p =0称作纯滑动平均模型,记为MA( q );若 q =0,称作纯自回归模型,记为AR( p ),若 p = q =0,模型退化为 x t = a t ,即{ x t }为白噪声列。

选取5月30日的96个时点数据作为原始数据,用来预测5月31日的96个时点的数据,为了达到实时预测的目的,我们每次仅作一步预测,然后更新数据再进行下一步的预测,主要数据处理步骤如下:1) 为提高预测的精度,对原始数据进行零均值化和平稳化处理;2) 计算置信度为95%的自相关函数,并绘制自相关函数曲线;3) 计算置信度为95%的偏自相关函数,并绘制偏自相关函数的曲线;4) 初步判断ARMA模型的参数;5) 建立模型并实现一步预测,计算误差的自相关函数和误差与输入的互相关函数,并检验误差是否为白噪声。

模型预测结果如图3。

1.4 三种预测方法的比较

风电场发电预测预报考核指标为风电场发电预报准确率和合格率,下面利用准确率、合格率和预测相对误差的公式对模型的预测效果进行计算。

准确率计算公式为:< id="65"> r 1 = [ < ="left" ="-0.1"> > 1 - < width="0.25em">> 1 Ν < ="true"><> Κ = 1 Ν > ( Ρ Μ Κ - Ρ Ρ Κ C a p ) > 2 ] × 1 0 0 % >,其中 r 1为预测计划曲线准确率; P MK K 时段的实际平均功率; P PK K 时段的预测平均功率; N 为总时段数; C ap为该风电场开机容量(本文为850 kW)。

合格率计算公式为:< id="67"> r 2 = 1 Ν < ="true"><> Κ = 1 n > B > Κ × 1 0 0 % >,其中

< id="68"> < ="left"> ( 1 - Ρ Μ Κ - Ρ Ρ Κ C a p ) × 1 0 0 % 7 5 % , < width="0.25em">> B Κ = 1 ( 1 - Ρ Μ Κ - Ρ Ρ Κ C a p ) × 1 0 0 % 7 5 % , < width="0.25em">> B Κ = 0 > >

以每个时点作为一个时段进行计算,因此 N 取为96。

平均相对误差计算公式为:< id="71"> r 3 = 1 n < ="true"><> k = 1 n > Δ > k >,其中< id="72"> Δ k = | &; ( k ) x <> ( 0 ) > ( k ) | >,< id="73"> &; ( k ) = x <> ( 0 ) > ( k ) - < ="true" ="140%"> x 0 > ^ ( k ) >; x (0)=[ x (0)(1) x (0)(2)&; x (0)( n )]为实际功率数据列,< id="74"> < ="true" ="140%"> x 0 > ^ = [ < ="true" ="140%"> x 0 > ^ ( 1 ) < ="true" ="140%"> x 0 > ^ ( 2 ) < ="true" ="140%"> x 0 > ^ ( n ) ] >为预测功率数据列。

带入数据计算可以得到三种预测方法的各项指标值

从三种预测结果与实际值的图像比较和表1中准确度和合格率的计算可以看出:对于单一的预测模型来说,ARMA模型要优于灰色预测模型和BP神经网络模型,但是三种模型的相对误差都不甚理想,预测的精度有待提高。

2 基于熵权法的组合预测模型

常用的组合预测有等权平均组合预测、最小方差组合预测和时变权最小方差组合预测法。本文考虑将引入熵值理论[6],建立熵权组合预测模型对风电功率进行预测。记 n 为预测的时点长度, m 为预测方法种数。则组合预测模型可以描述为

< id="80"> Q t = < ="true"><> i = 1 m > w > i Ρ ˜ i , t >

其中 w i 为权重,< id="82"> Ρ ˜ i , t ( t = 1 , , n >; i =1,&;, m )表示第 i 种预测方法在 t 时段的预测值。在模型中,我们利用熵值法计算 w i ,即假设有 m 个评价指标、 n 个评价对象,将其归一化后转变为标准化数据{ d ij },定义其第 i 个指标的熵为:< id="83"> e i = - 1 l n n < ="true"><> j = 1 n > f > i j ln f i j , < width="0.25em">> i = 1 , 2 , , m , >

其中,< id="85"> f i j = ( 1 + d i j ) / < ="true"><> j = 1 n > ( > 1 + d i j ) >,由熵确定第 i 个指标的熵权重为

< id="86"> w i = ( 1 - e i ) / ( n - < ="true"><> i = 1 m > e > i ) >

w i 带入 Q t 的计算公式即可得到熵权组合预测模型。

利用熵权组合预测模型预测5月31日0时0分至5月31日23时45分的电功率,主要建模步骤如下:1)分别利用灰色预测模型、BP神经网络模型和ARMA模型,按照单一预测模型的建模步骤进行实时动态预测,并记录预测数据;2)计算预测值与实测值的误差;3)以误差数据列列为原始数据,采用熵值法计算权重,具体计算步骤如下。

(1) 选取原始数据列,选取三种预测方法的误差数据列,记为 x ij ,其中 i =96, j =3。

(2) 指标的标准化处理,为提高计算精度,需对数据进行标准化处理,其具体方法如下

< id="92"> X i j = | x i j - x j ¯ | s j j , < width="0.25em">> i = 1 , 2 , , n >; j =1,2,&;, p ;

< id="93"> x j ¯ = 1 n < ="true"><> i = 1 n > x > i j , < width="0.25em">> s j j = 1 n - 1 < ="true"><> i = 1 n > ( > x i j - x j ¯ ) 2 , < width="0.25em">> j = 1 , 2 , , p >

(3) 计算第 j 方法下第 i 个时点的误差占的比重

< id="95"> p i j = X i j < ="true"><> i = 1 n > X > i j , ( i = 1 , 2 , , n ; j = 1 , 2 , , m ) >

(4) 计算第 j 种方法的熵值。

< id="98"> e j = - k < ="true"><> i = 1 n > p > i j ln ( p i j ) >,其中 k 0, k =1/ln( n ), e j ≥0。

(5) 计算第 j 种方法的差异系数。对第 j 种方法,指标值的差异越大,对方案评价的左右就越大,熵值就越小,定义差异系数:

< id="101"> g j = 1 - e j m - E e >,式中< id="102"> E e = < ="true"><> j = 1 m > e > j >,0≤ g i ≤1,< id="103"> < ="true"><> j = 1 m > g > j = 1 >。

(6) 求权值< id="105"> w j = g j < ="true"><> j = 1 m > g > j , < width="0.25em">> ( 1 j m ) >。

3 建立组合预测模型进行预测

通过编程计算得到组合预测模型的权重为 w 1=0.011, w 2=0.237 2, w 3=0.751 8,进而得到熵权组合预测模型的预测结果(图4)。

由图像可以看出组合预测的效果要优于前面三种单一预测方式,下面我们将四种预测方法的预测结果进行图像对比(图5),并计算四种预测方式的相对误差(表2)。

可见,组合预测可以有效地提高模型的预测精度。

4 结束语

风电功率的预测问题是一个非常复杂的问题,阻碍风电功率实时预报精度的因素有很多,归纳起来主要包括以下几个方面:(1)预测用的历史数据的选择,建议要尽可能地选择较新的数据;(2)对历史数据的预处理,因为风电功率输出的波动较大,因此在预测前对数据进行处理是必要的;(3)预测时步长的选择,一般来讲模型预测的步长取的越短,预测的精度就会越高。

由于风电功率有较大的波动性,因此单一的经典预测模型很难提高风电功率的预测精度,所以有必要对经典的预测模型进行改造,本文将熵值理论引入到经典的预测模型中,建立了熵权组合预测模型,有效发挥了各种单一预测模型的优势,有效地提高了对风电功率预测精度。

摘要:利用灰色预测法、人工神经网络法、ARMA时间序列法3种不同的预测模型对某风电场的风电功率进行了预测研究。计算结果表明,利用单一预测模型进行预测的精度有待提高。提出建立组合预测模型对风电功率进行预测,为了充分利用单一预测方法的优势,引入熵值理论。利用熵值法确定组合预测模型中的权重,进而建立熵权组合预测模型。模拟结果表明,熵权组合预测模型可以有效地提高风电功率的预测精度。

关键词:风电功率,灰色预测,人工神经网络,ARMA时间序列,组合预测

参考文献

[1]中国电机工程学会.2011年电工杯全国大学生电工数学建模竞赛賽题.http://www.cseem.org

[2]刘思峰.灰色系统理论及其应用(第三版).北京:科学出版社,2004

[3]范高峰,王伟胜,刘纯.基于人工神经网络的风电功率短期预测系统.电网技术,2008;32(22):72—76

[4]彭怀午,刘方锐,杨晓峰.基于人工神经网络的风电功率短期预测研究.华东电力,2009;37(11):1918—1921

[5]韩路跃,杜行检.基于MATLAB的时间序列建模与预测.计算机仿真,2005;22(4):105—108

非线性组合预测模型 第11篇

关键词 多元线性模型;最优线性无偏预测;岭型预测

中图分类号 O 212.1 文献标识码 A

of of Two in the Model

HUANG Jiewu

(School of Science, Guizhou University for Nationalities,Guiyang,Guizhou 550025, China)

The of the based on the ridge and the in the model was . A and of the of the ridge to the was given under the of the of trace .

the model, the , the ridge

1 引 言

设n×q的观察值矩阵Y满足一般的多元线性模型:

Y=XB+ε,E(Vec(ε))=0,Cov(Vec(ε))=ΔΣ.(1)

其中,B是p×q的未知回归系数矩阵,ε是n×q的随机误差矩阵,X为n×p已知设计阵,且rank(X)=p,Δ和Σ分别为已知的q阶和n阶正定矩阵.

式中Vec(ε)为把ε的列按先后次序排列得到的列向量,ΔΣ表示Δ与Σ的Kronecker乘积,E(•)和Cov(•)分别表示随机向量的期望与协方差阵,rank(•)表示矩阵的秩.

模型(1)的预测问题就是利用已知观察值矩阵Y预测未观察值矩阵

Y0=X0B+ε0.

其中E(Vec(ε0))=0,Cov(Vec(ε0))=ΔΣ0,E(Vec(ε)Vec′(ε0))=0,X0为m×p的已知矩阵,Σ0为已知的m阶正定矩阵,ε0是m×q的随机误差阵.

针对有偏估计的预测问题,文献[1]在线性模型(y=Xβ+ε,ε~N(0,σ2Σ))中针对三类特殊的估计量(1=β,2=(X′Σ-1X)-1X′Σ-1y,3=ββ′X′Σ-1yσ2+β′(X′Σ-1X)β),对未知观察向量y0的最优预测量与经典预测量关于风险函数R()=E(-y0)′A•(-y0)的最优性判别进行了讨论,这里矩阵A≥0.而文献[2]就y0的最优预测量与经典预测量关于离差矩阵M()=E(-y0)(-y0)′的最优性判别进行了讨论.

本文在一般多元线性模型中对基于岭估计的预测量与最优线性无偏预测量的最优性判别进行了讨论,得到了基于岭估计的预测量在矩阵迹意义下优于最优线性无偏预测量的充要条件.

2 岭型预测与最优线性无偏预测

的最优性判别

记L=(X′Σ-1X)-1X′Σ-1Y,L=X0L,易知L=X0L为Y0的最优线性无偏预测,即有E(L)=B,且Cov(Vec(L))=Δ(X′Σ-1X)-1.

定义1 记k=(X′Σ-1X+kI)-1X′Σ-1Y,k=X0k,则称k=X0k为Y0的岭型预测.这里k>0是可选择的参数,称为岭参数或偏参数[3].

易知E(k)=(X′Σ-1X+kI)-1X′Σ-1XB,E(k-Y0)≠0,即k为Y0的有偏预测,且 Cov(Vec(k))=Δ(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1.

定义2 设1、2为Y0的两个预测量,RT(,Y0)trE(-Y0)′(-Y0),若它们满足:

RT(1,Y0)-RT(2,Y0)≥0,

则称预测量2关于RT(•)优于预测量1,或简称为RT(•)准则[4].

引理1 设M≥0,N≥0,则M≥Nμ(N)μ(M),λ1(NM-)≤1.其中λ1(NM-)与M-的选择无关[5].

引理2 设Σ是n阶正定阵,Q是n×m的矩阵,则

Q′Σ-1Q≤IQQ′≤Σ.

证 若Q′Σ-1Q≤I则λ1(Q′Σ-1Q)≤1λ1(Σ-1QQ′)≤1λ1(Σ-1QQ′Σ-1Σ)≤1,又μ(Σ-1QQ′Σ-1)μ(Σ-1),所以有:

Σ-1QQ′Σ-1≤Σ-1QQ′≤Σ.

Q′Σ-1Q≤I.

引理证毕.

经 济 数 学第 28卷第1期黄介武:多元线性模型中两类预测的最优性判别

定理1 Y0的岭型预测k关于RT(•)准则优于它的最优线性无偏预测L,即RT(L,Y0)-RT(k,Y0)≥0的一个充要条件是:

BB′≤tr(Δ)(2kI+(X′Σ-1X)-1).

证 因RT(L,Y0)=trE(X0L-Y0)′(X0L-Y0),由E(X0L-Y0)=0,

Cov(Vec(X0L-Y0))=ΔX0(X′Σ-1X)-1X′0

+ΔΣ0,

通过计算可知:

RT(L,Y0)=tr(X0(X′Σ-1X)[-1X′0)tr(Δ)+

tr(Σ0)tr(Δ) .

由E(X0k)=X0(X′Σ-1X+kI)-1X′Σ-1XB,

Cov(Vec(X0k-Y0))=

ΔX0(X′Σ-1X+

kI)-1X′Σ-1X(X′Σ-1X+kI)-1X′0+ΔΣ0,

E(X0k-Y0)=-kX0(X′Σ-1X+kI)-1B计算可得

RT(k,Y0)=tr(k2X0(X′Σ-1X+kI)-1•

BB′(X′Σ-1X+kI)-1X′0)+tr(X0(X′Σ-1X+

kI)-1X′Σ-1X(X′Σ-1X+kI)-1X′0)tr(Δ)+

tr(Σ0)tr(Δ) ,

RT(k,Y0)≤RT(L,Y0)

tr(k2X0(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1X′0)

≤[tr(X0(X′Σ-1X)-1X′0)-tr(X0(X′Σ-1X+

kI)-1X′Σ-1X(X′Σ-1X+

kI)-1X′0)]tr(Δ).(2)

因为

X′Σ-1X+kI>X′Σ-1X,

所以

(X′Σ-1X+kI)-1(X′Σ-1X+kI)(X′Σ-1X+kI)-1

>(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1.

(X′Σ-1X+kI)-1<(X′Σ-1X)-1.

所以

(X′Σ-1X+kI)-1X′Σ-1X(X′Σ-1X+kI)-1<

(X′Σ-1X)-1X0(X′Σ-1X+kI)-1•

X′Σ-1X(X′Σ-1X+kI)-1X′0≤

X0(X′Σ-1X)-1X′0.

当k2(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1≤

(X′Σ-1X)tr(Δ)-(X′Σ-1X+kI)-1X′Σ-1

X(X′Σ-1X+kI)-1tr(Δ).

必有

k2X0(X′Σ-1X+kI)-1BB′(X′Σ-1X+kI)-1X′0≤

X0(X′Σ-1X)X′0tr(Δ)-X0(X′Σ-1X+kI)-1•

X′Σ-1X(X′Σ-1X+kI)-1X′0tr(Δ).

即式(2)一定成立.而

k2(X′Σ-1X+kI)-1B′(X′Σ-1X+kI)-1≤

(X′Σ-1X)-1tr(Δ)-(X′Σ-1X+kI)-1•

X′Σ-1X(X′Σ-1X+kI)-1tr(Δ)BB′≤

tr(Δ)(2kI+(X′Σ-1X)-1)B′X′Σ-1XB≤tr(Δ)I

λ1(B′X′Σ-1XB)≤tr(Δ).

定理证毕.

推论1 若λ1(B′X′Σ-1XB)≤tr(Δ),则对一切k>0,在矩阵迹意义下,k优于L.

定义3 设1、2为0的两个预测量,M(,Y0)E(-Y0)(-Y0)′若它们满足

M(1,Y0)-M(2,Y0)≥0,

则称预测量2关于MDE-优于预测量1,或简称为MDE-准则.

定理2 RT(1,Y0)-RT(2,Y0)≥0等价于M(1,Y0)-M(2,Y0)≥0.

证 因为RT(,Y0)=trE(-Y0)′A(-Y0),M(,Y0)=E(-Y0)(-Y0)′,

从而

RT(1,Y0)-RT(2-Y0)=trE(1-

Y0)′A(1-Y0)-trE(2-Y0)′A(2-Y0)

=EtrA(1-Y0)(1-Y0)′-EtrA(2-Y0)•

(2-Y0)′=trA[M(1,Y0)-M(2,Y0)]

RT(1,Y0)-RT(2,Y0)≥0.

M(1,Y0)-M(2,Y0)≥0.

定理证毕.此结论说明以上两种判别准则等价.

定理3 Y0的岭型预测k关于MDE-准则优于它的最优线性无偏预测L,即M(L,Y0)-M(k,Y0)≥0的一个充分条件是:

BB′≤tr(Δ)(2kI+(X′Σ-1X)-1).参考文献

[1] . and in [M] New York: Wiley, 1977.

[2] C R Rao , H . and in [M].New York: , 1995.

[3] Rao . least and [M].New York:,1995.

[4] 杨婷,杨虎,张洪阳.基于岭估计的最优预测与经典预测的最优性判别.重庆大学学报,2002,25(6):56~58.

[5] 喻胜华 何灿芝任意秩多元线性模型中的最优预测 应用数学学报,2001,24(2):227-236.

非线性组合预测模型 第12篇

关键词:GM(1,1)模型,灰色关联度,组合预测模型,菜粕期货价格

2012年12月28日,菜粕期货在郑州商品交易所正式上市,标志着中国菜粕市场体系的基本建立。菜粕已成为我国期货市场上的活跃品种, 影响逐渐增大,在这一背景下,探索我国菜粕期货市场价格发现功能的发挥状况对未来我国菜粕期货市场的发展大有裨益。自从菜粕期货上市以来,其在发现未来价格、规范市场秩序、保护农民利益,发挥了积极的作用。

目前,国内对期货价格预测的研究取得了一定的进展. 常用方法有ARMA模型[1]、ARIMA模型[2]、Bayes判别法[3]、ARMA - GARCH模型[4]等,但这些方法要求数据序列和价格系统中影响因子的权重具有较高的精确性,由于权重的确定具有主观性,这会影响价格预测的准确性。

在预测领域内,由于小样本、贫信息不确定系统的大量存在,GM( 1,1) 模型作为灰色预测理论的核心, 得到了广泛的应用。

但不少学者在应用该模型时发现,模型的精度不稳定,提出了许多改进措施. 如: 改进模型中参数的估计方法[5,6]、对模型残差的修正[7]、改进模型的背景值[8]。

灰色关联度是对系统动态发展过程量化分析以考察系统诸因素之间的相关程度,这种相关程度在几何上体现为数据序列所对应曲线的相似程度( 距离的相近性或者变化率的相似性) 。传统的邓氏关联度利用位移差来反映序列间发展过程或量级的相近性,进而对序列之间的关联程度进行量化。但已有学者证明了这种定义的关联度不满足规范性[9]。

本文充分利用新老信息,综合利用各种单个GM( 1,1) 预测模型所提供的信息,以其适当的加权形式得出组合预测模型。把灰色关联度引入到组合预测中来,提出了一种改进的灰色关联度,其中蕴含了数据变化的依赖关系,通过这种关系建立模型从而实现对未知数据的预测改变了传统灰色预测模型的不足,提高了预测精度。通过实例分析和精度检验,该模型具有重要的实用价值。

一、灰色预测 GM( 1,1) 模型[10]

灰色预测理论的GM( 1,1) 模型是1阶的,一个变量的微分方程。

1. 原始数列

设X( 0)为非负序列,其中

X(1)为X(0)的1 - AGO( 对原数列一次累加生成) 序列:

其中,

2. 构造数据序列和数据向量

令Z( 1)为X( 1)的紧邻均值生成序列:

其中,

,k = 2,3,…,n数据序列B和数据向量Y分别为:

3. 确定a,b

x(0)(k) + az(1)(k) = b为灰微分方程,其中a,b是需要通过建模求解的参数,a称为发展系数,b称为灰色作用量。

设为待估参数向量,即,则求GM(1,1) 模型x(0)(k) + az(1)(k) = b的最小二乘估计系数列满足。

称dx(1) /dt+ ax(1)= b为GM (1,1) 模型x(0)( k) + az(1)( k) = b的白化方程,也叫影子方程。

4. 白化方程的解

方程dx(1) /dt+ ax(1)= b的解也称时间响应函数为:

GM( 1,1) 模型x( 0)( k) + az( 1)( k) = b的时间响应序列为:

k = 1,2,…,N

还原值( 也即预测方程)

其中,k =1,2,…,n

5. 模型检验

ε = ( ε( 2) ,ε( 3) ,…,ε( n) ) ,其中,,k =2,3,…,n

相对误差序列为:

,为平均相对误差为残差平方和,为X( 0)的均值,为X( 0)的方差,为残差均值,为残差方差,则:

( 1) 称c = S2/S1为均方差比值; 对于给定的c0 0,当c c0时,称模型为均方差比合格模型。

( 2) 称为小误差概率,对于给定的p0 0,当p p0时,称模型为小误差概率合格模型。

二、基于灰色关联度的组合模型建模方法

随着系统的发展,老数据的信息意义将逐步降低,在不断补充新信息的同时,及时地去掉老信息,建模序列更能反映系统在目前的特征。但是完全丢掉老信息,显然是不合理的。本文提出的灰色组合预测模型基本思路就是综合运用新老信息建立等维递补的单一预测模型,然后基于改进的灰色关联度赋予其权重信息,从而得到灰色组合预测模型。

本文对原始数据序列

X(0)= ( X(0)(1) ,X(0)(2) ,…,X(0)(n) ) ,首先,利用原始数列的前个数据序列建立GM( 1,1)模型,将其还原可得到,k =1,2,…然后,去掉一个最老的数据,增加一个新的原始数据,使序列等维。

则去掉靠前个数据后的m个数据X2 (0)= ( X(0)(2) ,X(0)(3) ,…,X(0)(m +1)) 建立GM( 1,1) 模型,得其还原值,k =1,2,…这里我们约定

1/2( x(0)(1) + x(0)(2) ) 。以此类推,可以得到( n- m + 1) 个单个灰色GM( 1,1) 模型。然后对这个单个灰色GM( 1,1) 模型进行组合建模,利用它们的线性组合建立模型:

这里的权系数由灰色关联度来确定,即ωi= roi。其中,灰色关联度定义如下:

设序列

Xi= ( xi( 1) ,xi( 2) ,…,xi( n) ,i = 0,1,2,…, l,称Δi( k) 为序列Xi由( k -1) →k的数据增量, k = 2,3,…,n,即

称Ei为数据增量Δi( k) 绝对值的平均值,即

称为序列X0在( k - 1) →k数据增量Δi( k) 的均值化,即

称r0i( k) 为序列X0与Xi从的灰色关联系数,即

称r0i为序列X0与Xi的灰色关联度,即

称R0i= ( r0i( 1) ,r0i( 2) ,…,r0i( n) ) 为序列与的关联系数序列,根据灰色关联度的规范性,可知R0i为非负序列,满足GM( 1,1) 模型的建模条件。现在以序列R0i建立GM( 1,1) 模型,对r0i( h) ( h n) 进行预测,可得r0i( h) 的预测值。

与xi( h) 的关联系数为:

一般情况下取θ = 0. 5。设,则基于灰色关联度的组合预测模型为:

其中,这里的权系数ωi由灰色关联度r0i来确定,即。

三、灰色组合预测模型在菜粕期货价格预测 中的应用

以郑州商品交易所2013年8月8号 ~16号菜粕1401合约期货价格( 周六、日不交易) 为基准量,构建预测模型,其中数据来源于文华财经信息交易系统,如表2所示。

为了建立菜粕1401合约期货价格的灰色组合模型,首先,等维递补的GM( 1,1) 模型建立单个灰色预测模型。这里取m =5,先利用前5个原始数据( 8 ~ 14号) 建立灰色GM( 1,1) 模型。然后用后5个原始数据( 9 ~15号) 建立灰色预测模型( 预测结果见表3) 。

由公式( 1) ,得序列的数据增量如表4。

由公式( 3) ,得数据增量的均值化如表5:

根据公式( 4) 计算、与的灰色关联系数,如表6。

根据表6,可得关联系数序列:

R01= ( 0. 802,0. 517,0. 522,0. 659,0. 775) , R02= ( 0. 760,0. 769,0. 593,0. 572,0. 0954)

计算知r01= 0. 655,r02= 0. 730

分别根据R01和R02建立模型,得预测值分别为:

加权得:

建立序列X0与X1和X2的组合预测模型,根据公式( 8) ,得

由上表可以看出,灰色组合预测模型的预测精度要好于单个GM( 1,1) 模型,说明该模型是有效的。

四、结 语

本文来自 09-12

以上就是非线性组合预测模型(建立灰色预测模型)的详细内容,希望大家能够有所收获!更多请关注倾诉星球其它相关文章!

声明:本站所有作品(图文、音视频)均由用户自行上传分享,本文由"陈三首是哪三首"自行发布,本站仅供存储和学习交流。若您的权利被侵害,请联系我们删除798597546#qq.com(#改成@)。如若转载,请注明出处:https://www.qsxq.cn/sbzt/8gj6fvn6.html

Elva

倾诉你的情感,分享属于你们的故事

Copyright www.qsxq.cn 【倾诉星球】 联系我们 |皖ICP备2021018307号-4

本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。