神经网络预测方法十篇

时间:2024-03-28 18:29:52

神经网络预测方法

神经网络预测方法篇1

欧阳亮(1984―),女,湖南大学工商管理学院(长沙,410082)。研 究方向:金融工程与风险管理。

[关键词]汇率预测;汇率波动;神经网络

汇率作为一个重要的经济变量,其变动对国民收入的增减、工农业的发展、国内利率、就业 等各方面都有着重要的影响。因此,汇率预测受到广泛的关注,大量的计量经济模型和时间 序列模型被用于汇率预测。其中,人工神经网络(Artificial Neural Networks, ANN)作为 一种非参数的数据驱动型的方法,不需要对数据特征进行事先假设,通过合理的样本训练, 学习专家的经验、模拟专家的行为,并引入非线性转换函数来求解各种复杂的非线性问题, 具有很强的模式识别能力和高速信息处理能力,从而在时间序列数据预测方面有独特的优 势。[1]

利用神经网络方法预测汇率波动,国内外学者已经进行了比较广泛的研究。总结国内外学者 的研究成果,用神经网络预测汇率有3个层次。它们分别是同质神经网络模型、 异质神经网络模型和神经网络组合模型。

一、汇率预测的同质神经网络模型

同质神经网络预测模型是用神经网络根据历史汇率数据来预测未来汇率,这是作为一种汇 率预测的非参数方法提出来的。由于汇率波动具有非线性相关性和 长效记忆性,因此通过历史数据进行汇率预测是一种可行的方法。同质神经网络预测模型认 为;汇率有一个隐含的生成机制,历史汇率和未来的汇率都由这个机制生成,通过对历史数 据的观测,识别这个生成机 制,就可用这个生成机制预测未来的汇率。由于神经网络是一个数据驱动的自适应的非参数 方法,不基于假设,即使产生数据的过程是未知的,或者很复杂,神经网络也能识别。

用同质神经网络进行汇率预测,是根据汇率的历史数据加上输入延迟来预测汇率的变化或变 化趋势。用于汇率预测的神经网络模型很多,其中最常用的是多层后向神经网络模型,即BP 神经网络。BP神经网络一般采用三层结构:输入层、隐含层、输出层。BP神经网络的算法 和训练如图1。

以t时刻汇率种类R的预测为例,滞后期为n,预测长度为L。输入层的数据是从时刻t开始前n 期的历史汇率观测值序列,yt,…, yt-n,输入才由长度n的滑动窗口产生。输出层 依次输出从t时刻开始的L个汇率预测值,yt+1,…, yt+L。相邻汇率的时间间 隔是等长的。汇率预测的同质神经网络模型的结构如上图2。

用同质神经网络预测汇率的研究很多,1993年,Refenes等人采用神经网络方法预测汇率变 动,他们将数据分成训练组(Training Subsample)、测试组(Testing Subsample)和预测组( Forecasting Subsample),先用训练组和测试组数据训练神经网络,然后用预测组数据进行 预测,这种尝试以及随后的评议肯定了神经网络在一定的情况下比“标准”的预测方法表现 要好。[2]Kuan和Liu(1995)用神经网络对5个不同币种兑美元的汇率进行预测。这5 种货币包括英镑、加拿大元、德国马克、日元以及瑞士法郎。研究发现神经网络对日元和英 镑的预测的均方差(MSE)很低,但对其余3个币种的预测效果一般。[3]De Matos(19 94)通过对日元期货预测比较了多层后向神经网络(MLFN)和重复网络的预测效果。[4]Zhang和Hu(1998)用多层后向神经网络对英镑和美元的汇率进行预测,发现神经网络的预 测效果明显优于线性模型,尤其在预测期比较短的时候。[5]

虽然研究表明神经网络的预测效果比其他方法好,但是其预测精度和可靠性仍然不尽人意。 对此,学者们对神经网络进行了改进,提出了诸如聚类神经网络、重复神经网络、广义回归 神经网络、模糊神经网络等经改进的神经网络进行汇率预测,或者将其他方法与神经网络结 合,以改善神经网络的预测能力。例如,Shazly等(1999)用遗传算法训练神经网络的权值。 惠晓 峰和胡运权等(2002)结合遗传算法,提出了基于实数编码的GA-BP神经网络汇率预测人民币 兑美元汇率的模型。姚洪兴, 盛昭瀚和陈洪香(2002)提出了一种改进的小波神经网络结构。

这些研究在一定程度上提高了神经网络的预测效果,但是神经网络的结构、训练算法、阀值 函数的选择以及滞后期的确定等问题仍然难以解决。而且,汇率由历史汇率唯一决定这一 前提也缺乏足够的理论支持。

二、汇率预测的异质神经网络模型

用异质神经网络模型进行汇率预测,是指在预测过程中,考虑影响汇率的各种因素,如利率 、通货膨胀率、原油价格、货币供应、贸易收支差额、消费价格指数、消费信心指数等,根 据这些影响因素来预测汇率。Shazly(1997)选取一个月欧洲美元存款利率、一个月欧洲外币 存款利率、即期汇率 和一个月的远期汇率作为输入变量,预测一个月后的即期汇率。结果表明,神经网络的预测 效果比通过远期汇率进行的预测效果要好。[6]杨火斤 和马洪波(1999)选取GNP、CPI、工业股 票价格指数、短期利率、货币供应量、长期利率6个影响因素,将这些变量作为神经网络的 输入变量,训练神经网络根据这些变量预测汇率。[7]Hui Xiao-feng等(2005)也用 模糊神经网 络进行汇率预测,输入的变量包括两国的CPI和GDP、两国的利率差、货币供应比、净出口额 等。[8]

异质神经网络模型的网络结构和训练算法与同质神经网络相似。区别在于同质神经网络的输 入是一段时滞的历史汇率数据,是一维的数据,而异质神经网络的输入数据是多个变量的数 据,是二维的数据。令x1, x2,…, xn分别表示影响汇率变动的各个因素,异质神经 网络的结构如图3所示。

图3 异质神经网络模型

随着布雷顿森林体系的崩溃,各国纷纷采用浮动汇率制度,影响汇率变动的因素更加多样化 、复杂化,难以确定。因此,学者们开始用神经网络与其他预测方法结合使用。一种是与基 本因素分析模型如购买力平价模型、利率平价模型等相结合。根据这些模型确定的影响因素 作为神经网络的输入变量,通过神经网络训练优化变量的权值,从而进行汇率预测。例如, Qi和Wu(2003)用基于货币理论的神经网络对英镑和马克1个月、6个月、12个月的汇率进行预 测,输入变量为货币供应量M1,各个国家的实际工业生产收入、利率作为输入变量。Lee和W ong(2007)用微观结构理论和宏观经济的6个变量作为神经网络的输入,预测汇率波动。

另一种方法是用神经网络与协整方法结合。先通过协整分析确定影响汇率变动的因素,再用 神经网络确定各变量的权值。Inc和Trafalis(2006)构建了一个结合协整方法和人工神经网 络的汇率预测模型方法,先用协整方法确定对汇率有影响作用的变量,然后用ANN对这些变 量进行非线性组合,预测汇率。[9]

异质神经网络模型将汇率视为整体经济系统中的一个变量,汇率波动受众多因素的影响,因 此汇率的波动是根据这些影响因素的波动来预测的,与同质神经网络模型相比有更强的理论 支持。但是,它的预测效果取决于影响因素的选择,因此汇率的影响因素的选择是异质神经 网络预测模型的关键。

三、汇率预测的神经网络组合模型

神经网络进行汇率非线性组合预测是一个两步组合预测模型。Bates和Granger(1969)证明了 预测方法的线性组合比单模型能产生更小的误差。[10]此后,一些学者在这方面做 了很多研 究。在众多的组合方法中,神经网络非线性组合是最广泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型预测条件波动,并对这些预测值分别进行线形和非线性组合,结果表明 用神经网络进行非线性组合的预测效果是最好的。[11]Tseng等(2002)用BP神经网 络和时间 序列模型――SARIMA模型进行组合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)对汇率进行线性预测,再用神经网络处理SARMIA模型预测的残差,进行汇率预测 。[12]用同样的方法还有Zhang(2003)用ARIMA和ANN组和对英镑和美元汇率进行预 测。[13]Yu, Wang和Lai(2005)组合广义线性自回归模型(GLAR)和神经网络进行 汇率预测。[14]

用神经网络对汇率进行非线性组合预测时,是将汇率数据分解成线性部分和非线性部分。先 用基本因素模型或者参数模型对汇率进行第一步预测;然后用神经网络对第一步预测残差进 行非线性组合;再根据两步的预测结果进行汇率预测。或者用神经网络对不同的参数模型的 预测结果进行非线性组合。下面以神经网络和ARIMA模型的非线性组合为例,说明神经网络 组合模型的基本原理。

(3)用神经网络mode残差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)

其中,f表示神经网络的预测的非线性函数,et是随机误差。

(4)组合ARIMA和神经网络:[AKy^]=[AKl^]+[AKn^]t[JY](5)

神经网络组合模型使用神经网络和线性方法进行非线性组合,考虑了汇率作为一个复杂系统 同时具有线性和非线性特征的实际,充分利用了参数方法和非参数方法的优势,并综合了各 种汇率理论的分析结果。大量的实际研究表明,组合预测的效果比单独用线性模型或单独用 神经网络预测的效果要好。

四、比较与结论

同质神经网络预测模型是根据历史数据进行汇率预测,是用一维的数据训练神经网络。它没 有 考虑汇率作为经济系统中的一个变量,受到众多因素的影响,而仅仅把汇率视为一系列没有 经济含义的无规则数据。而异质神经网络模型则把汇率视为复杂经济系统中的一个变量,认 为在统计上无规则的汇率数据是由众多因素共同决定的。异质神经网络模型用二维数据进行 训练,与同质神经网络模型相比,其预测有更充分的理论支持。但是,影响汇率的因素至今 没有定论也没有统一的选取法则。

同质神经网络预测模型和异质神经网络预测模型都将汇率视为单纯的非线性变化的时间序列 ,而实际汇率的波动不是单纯的线性或非线性的,而是同时包含线性和非线性模式,因此单 纯的线性模型和非线性模型都不能很好地预测汇率。而神经网络组合预测模型则与前两种方 法有本质的不同,它同时考虑了汇率的线性和非线性特征,在线性预测的基础上再进行非线 性组合,充分利用参数方法和非参数方法的优势。一方面,研究表明线性预测有很多效果很 好 的方法,如ARIMA,GARCH等参数模型;另一方面,这些模型都基于很强的假设条件,不同的 条 件下预测效果有很大差别。因此,在实际预测时候,很难确定某个模型比其他模型有更好的 样本外预测效果。最优模型的选择是件很困难的事情。用神经网络组合模型,避免了 最优模型选择的问题,又综合了不同的汇率理论的分析结果。

另外,同质神经网络预测模型和异质神经网络预测模型都是单模型的一步预测的方法,研究 表明单一的模型往往只能适应某一特定的情况或者反映一部分的信息,而实际汇率是一个复 杂的系统,组合不同的参数模型或者参数模型不同参数的预测结果,能够较大限度地利用各 种预测样本信息,比单个预测模型考虑的问题更系统、更全面,从而提高了预测的精度。

自2005年7月21日起,中国实行汇率改革以来,央行入市干预的力度明显减弱。由市场供求 关系决定的人 民币汇率受到众多因素的影响,波动幅度较以往明显加大。用神经网络组合模型对人民币汇 率进行预测,充分考虑了汇率波动的复杂性。结合线性方法和非线性方法的优势,能抓住汇 率波动的线性和非线性特征,并能全面挖掘和反映样本信息,有较好的样本外预测效果。因 此,神经网络组合模型是人民币汇率预测的最佳选择。

但是,用神经网络组合模型进行汇率预测也存在一些难以解决的问题。首先是神经网络自身 的优化问题,如隐藏层数及隐藏层结点数的确定、激活函数的确定、局部最优等,神经网络 的结构直接影响着预测效果。其次,在神经网络进行组合预测时,如何选择被组合的模型以 及模型的个数,是另外一个难以解决的问题。第三,神经网络可以根据残差最小的原则不断 地调整参数来改变预测效果,但是它不能改变输入数据,而汇率数据往往是剧烈波动,存在 噪音的。因此,如何对数据进行除噪,优化神经网络的输入数据是另一个值得研究的问题。

主要参考文献:

[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.

[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.

[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.

[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.

[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.

[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.

[7]杨 火斤, 马洪波. 人工神经网络在中长 期汇率预侧中的应用[J]. 系统工程, 1999, 17(1): 18-24.

[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.

[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.

[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.

[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.

[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.

[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.

[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.

Forecasting Exchange Rate with ANN: A Comparative Anal ysis

Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.

Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN

神经网络预测方法篇2

关键词:风电机组;matlab;人工神经网络;风功率预测

1 风电功率预测模型

1.1 径向基神经网络

神经网络算法是近年来发展起来的一种新型人工智能算法。不同于以往的数学算法,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,具有自学习、自适应和自组织能力的特点。

径向基神经网络(即RBF神经网络)是一种三层前向网络,由输入层、隐含层和输出层组成,网络结构如图1所示。由输入到输出的映射是非线性的,而隐含层到输出层是线性的,从而大大加快了学习速度并避免局部极小问题。

根据径向基函数中心选取方法的不同,RBF神经网络有很多学习方法,如随机选取中心法、梯度训练法、有监督选取中心法和正交最小二乘法等。这里,选用梯度训练法作为RBF神经网络的学习方法。

1.2 梯度训练方法

RBF网的梯度训练方法是通过最小化目标函数实现对各隐节点数据中心、扩展常数和输出权值的调节。使用一种带遗忘因子的单输出RBF网学习方法,此时神经网络学习的目标函数为:

(1)

其中,?茁j为遗忘因子,误差信号ej的定义为:

(2)

由于神经网络函数F(X)对数据中心ci、扩展常数ri和输出权值wi的梯度分别为:

(3)

(4)

(5)

考虑所有训练样本和遗忘因子的影响,ci、ri和wi的调节量为

(6)

(7)

(8)

其中,?椎i(Xj)为第i个隐节点对Xj的输出,?浊为学习速率。

1.3 数据归一化

数据归一化是神经网络预测前对数据常用的一种处理方法。数据归一化处理将所有数据都转化为[0,1]之间的数,其目的是取消各维数据间数量级别差,避免因为输入输出数据数量级差别较大而造成神经网络预测误差较大。

风速归一化:应用多年统计的极限风速对风速数据进行归一化处理

(9)

其中,Vg为归一化处理后的风速标量值;vt为应用于预测的历史风速值;vmax为风场气象观测到的历史最大风速,如不超过风场风机最大切除风速,则取为风机的切除风度。

风功率归一化:根据风电机组额定功率,采用与风速归一化相同的方式,对风电机组历史出力情况进行归一化,并对网络预测的输出功率进行反归一化,得到预测结果。

1.4 神经网络的构建

首先挑选几组数据风功率作为样本,将每个样本的前n个风速和风功率值进行归一化处理,将处理后的数值作为RBF神经网络的输入;可将每个样本的后n个风速和风功率值进行归一化处理,将处理后的数值作为RBF神经网络的目标输出,通过对RBF神经网络的训练学习,实现从输入空间到输出空间的映射。

2 短期风功率预测结果

将前10天的风功率数据作为训练样本,对风机功率提前1小时进行预测。图2预测风功率与实测风功率比较可知,可以看到神经网络预测风功率变化趋势与实际风功率变化基本趋势一致,并且预测功率比实际功率变化平缓。

神经网络在风功率预测时,每点的预报误差不尽相同,这主要与早晚温差造成的风速突然变化以及当天天气变化情况等有关,从预测曲线的总体趋势以及与实际曲线误差值大小来看,该神经网络模型预测结果基本令人满意。

3 结束语

采用人工神经网络进行预测精度较高、训练速度快,适用于在线预测的场合。但是由于所用训练数据为风速相对平稳时期的数据,所以该模型对于突变风速的处理能力仍然有限,为提高预测结果的精度,还需对模型进行进一步改进。总体而言,通过建立神经网络模型,对短期风功率进行预测,虽有一定局限性,但其预测精度满足工程要求。

参考文献

[1]Tony Burton,等.风能技术[M].北京:科学出版社,2007.

神经网络预测方法篇3

关键词:BP神经网络;管芯式散热器;性能

1.设计预测网络参数、结构参数

1.1输入量的选择

输入量必须选择那些对输出影响大且能够检测或提取的变量,各输入量之间互不相连或相关性很小。在大多数情况下,直接送给神经网络的输入量无法直接得到,常常需要用信号处理与特征提取技术从原始数据中提取能反映其特征的若干参数作为网络输入,输出量表示可以是数值也可以是语言变量[1]。本文进行的预测目标已经确定,就是要预测管芯式散热器的热工性能,而解决问题的关键就是确定输入层的节点数,即影响输出的直接变量。

1.2训练样本集的设计

网络的性能与训练用的样本密切相关,设计一个好的训练样本既要注意样本规模,又要注意样本的质量。一般来说样本的数目越多,训练结果越能正确反映其内在规律,但样本的获取往往有一定困难,另外样本数量过多,网络的精度也很难提高。样本要有代表性,样本的组织要注意将不同类的样本交叉输入。一般将收集到的可用样本随机分成两部分,一部分为训练集,一部分为测试集。本文就是通过管芯式散热器的性能试验来获得样本集的,在编写预测程序时也相应将样本集分为两部分。

2影响散热器传热性能的主要因素

输入量必须选择那些对输出影响大且能够检测或提取的变量,此外还要求各输入变量之间互不相关或相关性很小。目前对于汽车散热器传热性能研究的理论已经比较成熟,衡量散热器优劣的一个重要指标就是传热系数的值,对于不同类型或同一类型不同结构参数的散热器进行传热性能比较的关键就是比较传热系数K的值。所以传热性预测模型建立的输出层节点数已经确定就是传热系数K,而影响传热系数的主要因素即输入层节点的数目就要从传热系数的计算公式入手了。由公式(2-1)知

3影响散热器阻力性能的主要因素

散热器的阻力包括水流阻力和空气阻力。影响各个阻力性能的主要因素应分别做出具体的分析。

3.1影响水流阻力的主要因素

水管流经管道,产生沿程阻力和局部阻力,这两部分阻力的计算公式前面已经叙述,通过传热学知识可以看出,水流动的速度,是影响沿程阻力的主要因素。而散热器水管的长度、水管直径试验前已经确定,它们的值不随流量和温度的改变而变化;通过文献[3]分析可知水流阻力受管排数M的影响,水的密度是与温度有关的物理量(本文将空气密度、水的密度通过拟合方法求得,拟合的温度分别是水、空气进出口温度的平均值),通过以上分析可知,影响水流阻力的主要变量因素是水流速度、水的进出口温度、管排数。

3.2影响空气阻力的主要因素

空气流过散热器通道的压力损失可以通过文献[4]确定,如下式:

(3-1)

建立神经网络预测模型就是要通过输入层物理量的变化来预测输出变量,所以输入层的各节点就是影响输出变量的可以通过试验测定的主要因素。通过对公式(3-1)可以看出影响影响散热器空气阻力性能的主要变量是空气的质量流量、散热器进出风温度,另外由文献[5]可知:散热器管排数M同样影响空气阻力的大小。通过以上分析可知,影响管芯式散热器空气阻力的主要因素是管排数、空气的质量流量、散热器的进出风温度。

3.4 散热器性能预测模型的建立

图3-1散热器传热性能预测BP神经网络模型

图3-2 散热器水阻性能预测BP神经网络模型

通过以上分析可以建立管芯式散热器神经网络预测模型,分别为传热性能预测模型和阻力性能预测模型,建立预测模型时应尽量使网络的结构紧凑。传热性能预测模型如图3-1所示,阻力性能预测模型如图3-2、3-3所示。

神经网络预测模型建立的准确与否直接影响着最终的预测结果,所以要经过反复的验证。图3-1、3-2给出了模型的输入节点和输出节点的具体情况,通过具体的编程可以实现管芯式散热器的性能预测,为矿用的管芯式散热器的结构改造提供理论依据。■

参考文献

[1] 朱大奇,史慧.人工神经网络原理及应用[M].北京:科学出版社,2006

[2] 曹志峰,余波,王永强等.基于MATLAB神经网络的变风量空调控制的仿真[J]:制冷与空调.2007,2:114-116

[3] 彭国谱.重型车用新型散热器的设计[J]:机电设备.1999,6:44-47

[4]朱聘冠. 换热器原理与计算[M].北京:清华大学出版社,1986:7-14.

神经网络预测方法篇4

【摘要】 目的: 探讨矽肺纤维化同生物活性介质之间的关系。方法: 利用Delphi语言编制了BP人工神经网络模型计算机程序,建立并分析了矽肺胶原纤维预测的数学模型。结果: 选定网络隐含层节点为9,初始权值阈值约为(-0.2,0.2),最大相对误差为4%,最小相对误差为0.2%。 结论: 应用神经网络具有较好的预测效果,可为临床医学研究提供一个很好的研究思路。

【关键词】 BP神经网络; 生物活性介质; 矽肺; 胶原纤维; 预测

矽肺是尘肺中最严重的一种类型,是由于长期吸入超过一定浓度的含有游离二氧化硅的粉尘,肺内发生广泛的结节性纤维化。矽肺纤维化的预测困难,诊断滞后。目前,矽肺的发病机理仍然不完全清楚,尚无有效的早期诊断(筛检)方法,也无早期诊断的特异性指标和特异性的治疗药物和方法。一经传统的后前位胸大片确诊,肺部病变已经无法逆转。因此,寻找早期诊断(筛检)特异性的生物介质组合,对预防、治疗乃至最终消除矽肺具有重要意义。矽肺的发病与细胞因子(Cytokine,CK)网络调控有密切联系,高宏生等用系统生物学的方法论证了细胞因子对矽肺纤维化的网络调控关系[1,2],论证了细胞因子复杂非线性致炎致纤维化的网络调控假说。王世鑫等用判别方程的方法,通过诊断肺纤维化正确率。矽肺纤维化与不同活性介质、基因表达等多种因素密切相关[3],因此预计是一个多目标决策问题。传统的预测方法是用多元线性回归来进行预测,统计者千方百计的想找出决策目标和各因素之间找出一个线性的公式关系,试图想用一个严格的数学模型公式表达出相应的关系。实际上,具有良好的非线性的神经网络可以预测矽肺纤维化结果。本研究图基于神经网络的方法预测生物活性介质网络调控的矽肺纤维化。

1 神经网络的基本理论

人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能。从本质上讲,人工神经网络是一种大规模并行的非线性动力系统。它具有许多引人注目的特点:大规模的复杂系统,有大量可供调节的参数;高度并行的处理机制,具有高速运算的能力;高度冗余的组织方式等。

在预测领域中应用最广泛的还是BP网络。BP网络的学习算法是一种误差反向传播式网络权值训练方法。实质就象最小二乘法一样,BP算法是在样本空间中耦合这样一个曲面,即使所有的样本点均在这个曲面上,若这样的曲面不存在,就找到离样本点的距离之和最小的曲面作为近似解。

BP网络的学习过程包括:正向传播和反向传播。当正向传播时,输入信息从输入层经隐单元处理,后传向输出层,每一层神经元的状态只影响下一层的神经元的状态。如果在输出层得不到希望的输出,则转入反向传播,将误差信号沿原来的神经连接通路返回。返回过程中,逐一修改各层神经元连接的权值。这种过程不断迭代,最后使得信号误差达到允许的误差范围之内。如图1所示为3层神经网络结构图。

输入层

隐含层

输出层

图1 神经网络结构

设3层BP神经网络,输入向量为X=(x1,x2,…xn)T ;隐层输出向量为Y=(y1,y2,…ym)T ,输出层向量为O=(o1,o2,…ol)T ,期望输出向量为d=(d1,d2,…dl)T 。

对于输出层,有ok =f(net),netk=m j=0wjkyj ,k=1,2,…l

对于隐层,有yj =f(net),netj=n i=0vijxi ,k=1,2,…m

f(x)=1 1+e-x ,BP学习算法权值调整计算公式为:

Δwjk=η(dk-ok)ok(1-ok)yj

Δvij=η(l k=1δ0k wjk)yj(1-yj)xi

δ0k =(dk-ok)ok(1-ok)

η∈(0,1)

2 应用实例

2.1 矽肺预测的影响因素

大量研究表明,肺泡巨噬细胞和肺泡上皮细胞在肺组织炎症反应及纤维化病变的启动、发展过程中起到最为关键的作用,主要是通过分泌细胞因子、炎性介质等生物活性物质,发挥直接或间接的生物学作用。这些CK包括:白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)等,主要介导细胞免疫应答,与炎症有关,具有抗纤维化作用,可抑制成纤维细胞的增殖及纤维的生成。Th2主要分泌白介素-4 (interleukin-4,IL-4)、白介素-5 (interleukin-5,IL-5)、白介素-10 (interleukin-10,IL-10)、白介素-13(interleukin-13,IL-13)、单核细胞趋化蛋白-1 (monocyte chemoattractant protein-1,MCP-1)等,而Th2主要介导体液免疫反应,可促进成纤维细胞的增生,导致胶原蛋白合成增加,并抑制胶原蛋白的降解,最终导致细胞外的基质蛋白沉积和纤维生成。Th1 型和Th2 型免疫应答之间存在着交互的负反馈作用,维持着正常的免疫平衡。其负反馈调节通常就是靠产生的细胞因子起作用的,即一型CK可以下调另一型CK的功能。Th1/Th2型CK失衡可导致机体对损伤的异常反应。总之,矽肺病人存在CK网络的平衡紊乱,其错综复杂的调控机制可能参与矽肺的发生和发展[6~9],如图2所示。

图2 细胞因子网络调控图

2.2 矽肺预测的BP网络模型的设计

本研究运用神经网络的模型方法,对矽肺预测进行设计,得出其预测模型。

2.2.1 输入层、隐含层、输出层的设计

矽肺纤维化输入层的确定:根据meta分析和微分方程网络模型确定生物活性介质为输入层。

转贴于

对于矽肺预测,应当依据其关键要素来确定输入层各因素,在神经网络模型中,输入层可以选定白介素(interleukin,IL)、肿瘤坏死因子(tumor necrosis factor ,TNF)、转化生长因子(transforming growth factor,TGF)等。根据分泌细胞因子不同将Th 细胞分为Th1 和Th2 两种类型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干扰素-γ(Interferon-γ,IFN-γ)作为输入层,输入单元数为8,隐含层节点的确定参考下面单元计算公式:

c=n+m+a

其中c 为隐层单元数,n为输入神经元个数,m 为输出神经元个数,a 为1~10之间的常数。本研究中,隐层单元数计算如下:

8+2+1≤c≤8+2+10

即:4.33≤c≤13.33

根据c 的计算值,由小到大改变节点数训练并检验其精度,当节点数的增加误差不进一步减小时,其临界值即为应采用的值。最后,经过网络的实际训练结果比较,选定网络隐含层节点为9,此时网络能较快地收敛至所要求的精度。

2.2.2 初始权值的确定

在神经网络模型中,初始权值选取对于输出结果是否最接近实际,及是否能够收敛、学习时间的长短等关系很大。初始权值太大,使得加权之后的输入和N落在了网络模型的s型激活函数的饱和期中,从而会导致φ′(·)非常小,而由于当 φ′(·)0时,则有δ0,使得Δwji 0,最终使得调节过程没有什么效果。所以权值及阈值的初始值应选为均匀分布的小数经验值,约为(-2.4/F,2.4/F)之间,其中F为所连单元的输入层节点数。本模型输入端节点数为11,所以初始值约为(-0.2,0.2),可随机选取[4]。

2.2.3 目标值及学习步长的选取

对矽肺预测之前,应先根据影响矽肺预测的因素进行综合预测。在实际操作时,还应结合经验值。若Sigmoid函数选取反对称函数——双曲正切函数,综合评估指标的目标值D的范围也应在[-1,1]之间,也即是综合指标的无量纲数值在[0,1]之间。通常输出单元的局部梯度比输入端的大,所以输出单元的学习的步长应比输入单元小一些[5]。

通过以上分析可得网络模型结构如图3。利用Delphi语言编制了BP人工神经网络模型计算机程序进行训练集样本训练,训练输入节点数为8,表1为矽肺预测输入训练样本和检测样本,当误差给定E=0.00005,学习步长为0.1,经200次训练,网络精度达到要求,如表2和图4所示。表1 矽肺预测输入训练样本和检测样本表2 训练样本训练次数网络误差

样本经200次训练后,网络误差满足精度要求,隐含单元到各输入单元的权值和阈值及输出单元到各隐含单元的权值和阈值调整为表3和表4所示。

由于矽肺预测神经网络模型经训练后,网络精度已经达到要求,可以用检验样本检测预测效果,如表5所示。

从预测结果看,最大相对误差为4.0%,最小相对误差为0.2%,预测效果非常明显,该网络的检验性能稳定,可以很好的对矽肺进行预测。表3 隐含单元到各输入单元的权值和阈值表4 输出单元到各隐含单元的权值和阈值表5 检验样本及矽肺预测结果

3 讨论

本研究通过采用神经网络的方法,探讨矽肺纤维化同生物活性介质之间的关系,并建立了矽肺纤维化的影响因素和Ⅰ型胶原、Ⅲ型胶原的BP神经网络,从预测效果看,能够较准确的预测矽肺纤维化。但还应当看到神经网络应用到预测还有许多不尽如意的问题,主要的弱点之一是它是一种黑盒方法,无法表达和分析被预测系统的输入与输出间的关系,因此,也难于对所得结果作任何解释,对任何求得数据做统计检验; 二是采用神经网络作预测时,没有一个便于选定最合适的神经网络结构的标准方法,只能花大量时间采用凑试法,从许多次实验中找出“最合适”的一种。本研究在矽肺预测上运用神经网络建模上进行了初步的探讨,对网络模型的拓展性、收敛性等问题还有待于进一步的研究 。

参考文献

1 高宏生, 伍瑞昌, 张双德, 等. 基于meta分析和微分方程模型的肺纤维化细胞因子调控网络研究. 军事医学科学院院刊,2008,32(3):312~316.

2 高宏生,杨霞,丁朋,等. 应用meta分析肺纤维化TNF-α的时空变化. 武警医学院学报,2008,17(8):561~562.

3 刘萍 王世鑫 陈蕾,等. 矽肺患者血清克拉拉细胞蛋白和表面活性蛋白D的改变. 中华劳动卫生职业病杂志, 2007, 25(01):18~21.

4 韩力群.人工神经网络理论、设计及应用.化学工业出版社,2001.

5 何海龙,王青海,王精业.神经网络在装备保障性评估中的应用. 系统工程理论与实践,2003,9:111~116.

6 Kohonen T.Self-Organization and Associative Memory. Berlin Heidelberg:Springer-Verlag,1984.

7 Lapedes A,Farber.Nonlinear signal processing using neural networks :prediction and system modelling[R].Technical Report LA-UR-87-2662,Los Alam os National Laboratory.Los Alamos.NM,1987.

8 Wang CH, Mo LR, Lin RC, et al. Artificial neural network model is superior to logistic regression model in predicting treatment outcomes of interferon-based combination therapy in patients with chronic hepatitis C.Intervirology,2008,51(1):14~20.

9 Kato H, Kanematsu M, Zhang X,et al. Computer-aided diagnosis of hepatic fibrosis: preliminary evaluation of MRI texture analysis using the finite difference method and an artificial neural network.AJR Am J Roentgenol, 2007,189(1):117~122.

10 Piscaglia F, Cucchetti A, Benlloch S,et al. Prediction of significant fibrosis in hepatitis C virus infected liver transplant recipients by artificial neural network analysis of clinical factors. J Gastroenterol Hepatol, 2006,18(12):1255~1261.

神经网络预测方法篇5

[关键词] 药品;神经网络;组合预测;需求预测

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051

[中图分类号] TP183 [文献标识码] A [文章编号] 1673 - 0194(2014)08- 0084- 05

0 引 言

随着人工智能技术的发展,人工神经网络得到了广泛研究和应用。由于神经网络具有良好的学习能力和较强的非线性处理能力、不依赖于特定数学模型等优势,其作为一种预测方法已被广泛应用于许多领域。

在医药企业、医药卫生管理领域,药品需求预测一直是管理部门关心的热点问题。药品需求除了受由药品自身属性影响外,还受国家政策或医药行业规定等因素的影响,如药品在某地区是否中标、是否为处方药等;同时,制药企业自身制定的定价、渠道以及促销等营销策略和销售团队的组建制度也对药品需求产生不同程度的影响。药品需求特征的多样性,决定了药品需求预测本质上是一个复杂的非线性系统建模问题。

国内外众多学者对药品需求预测进行了深入的研究,产生了一批有价值的研究成果。目前,药品需求预测的主要方法包括:回归分析法、时间序列分析法、神经网络、遗传算法等。这些方法从不同角度出发建模,均取得一定效果,尤其是BP神经网络,已经在药品预测研究中取得了众多应用。尽管相关讨论和研究不断增多,但是目前常用的神经网络预测方法普遍存在以下问题:由于药品需求特征颇为复杂的特殊性,运用单项预测方法对其进行预测无法涵盖其较多的特征信息,通常表现为对某类特定的药品预测效果良好,而对其他药品则预测性能较差,从一定程度上限制了预测模型的适用范围。

本文采用基于神经网络的组合预测模型来解决上述问题。组合预测方法(combined forecasting)是指通过一定数学方法将不同的单项预测模型组合起来,综合利用各种单项预测方法所提供的信息,从而达到提高预测精度的目的。组合预测方法最早由Bates和Granger[1]于1969年提出,他们认为对于一个包含系统独立信息的单项预测方法,与预测精度较小的预测方法进行组合预测完全可以增强系统的预测性能。

考虑到各种神经网络预测方法的特点及其适用范围,本文选择BP神经网络预测方法、RBF神经网络预测方法和基于广义回归神经网络(GRNN)3种常用的神经网络预测方法作为组合预测模型中的单项预测方法。在此基础上,用平均绝对相对误差(MAPE)和方差为衡量标准,并根据设置的阈值对单项预测方法进行筛选,最后选取了MAPE作为最优准则计算得到权重,从而建立组合预测模型,在提高组合预测模型精度的同时,使得组合预测模型具有现实意义。实验结果表明,本文提出的模型的预测精度高于传统的线性组合模型的预测精度。

1 相关工作

基于神经网络的预测方法具有很多其他预测方法所不具备的优点,近年来越来越被人们所关注。吴正佳 等(2010)[2]针对某备货型企业的产品需求量,建立了基于良好学习能力的BP神经网络预测模型,并通过实证分析与简单移动平滑法和加权移动平滑法的预测结果相比较,结果表明BP神经网络预测结果比其他两种更为有效果。童明荣 等(2007)[3]提出一种季节性RBF神经网络预测模型,对具有季节性的产品月度市场需求进行预测,最后利用构建好的RBF神经网络模型进行仿真实验,并与ARIMA模型、分组回归模型等常用季节预测模型做对比分析,结果表明前者的预测误差均方差最小,预测精度较高。Maria Cleofé(2005)[4]利用人工神经网络(ANN)对圣保罗地区的降雨量进行预测,并通过实证分析与其他线性回归模型作对比评价,实验结果表明人工神经网络有着更好地预测效果。此外还有其他很多学者在交通、航运、气候等多个领域运用神经网络进行了预测[5-7],不在此赘述。

针对药品销量预测这一特定问题,国内外部分学者也做了一定的研究工作,试图寻找合适的预测方法对药品需求做出较为准确的预测。马新强 等(2008)[8]提出了一种基于BP神经网络的药品需求预测模型,该文先利用数据仓库及数据挖掘技术分析提取了相关有效的药品销售信息作为研究对象,在此基础上利用BP神经网络对其进行预测,最后在较为精确销售量的基础上提出了一种优化的生产决策系统方法。王宪庆 等(2009)[9]利用BP神经网络模型对药品超市的药品销售情况进行预测并做了相关实证分析,该文通过观察药品预测的显著性差异评价模型的性能,最终取得了良好的效果,支持了其BP神经网络非常适用于资金有限、仓储量不大的药品超市的结论。刘德玲(2012)[10]提出了一种针对大范围内的药品销售的预测方法。该文利用遗产算法优化支持向量机药品销售预测方式进行预测,提高了药品销售预测的精确度,得到了较为满意的结果。

尽管有关研究不断增多,但由于药品需求特征颇为复杂的特殊性,运用单项预测方法对其进行预测无法涵盖其较多的特征信息,从一定程度上限制了预测模型的适用范围。本文根据药品需求高度非线性的特点选取了3种不同特性神经网络模型作为单项预测方法,每种神经网络都有其所针对的药品需求特征,并在此基础上建立组合预测模型,扩大了药品预测模型的适应范围,对于提高药品预测精度和预测稳定性具有重要意义。

2 基于神经网络的药品需求组合预测模型的建立

基于神经网络的药品需求组合预测模型的具体步骤如下:

(1)数据异常点预处理。为提高组合预测模型的适用范围和预测精度,本文运用基于距离的异常点检测方法对存在异常点的药品需求数据进行异常点修复,得到正常的需求数据。

(2)单项预测方法的选取。针对药品需求的不同特征,选取3种不同特性的神经网络模型作为单项预测方法,以此作为组合预测模型单项预测方法的筛选基础。

(3)单项预测方法的筛选与变权重的计算。因为不同药品具备不同需求特征,在进行组合预测时仍需要在已选取单项预测方法的基础上再次筛选合适的单项预测方法进行组合,以相对误差为最优准则,通过求解二次规划问题得到权重并按照一定的变权规则进行变权。

(4)根据权重建立组合模型进行预测。

2.1 药品数据异常点预处理

在药品销售数据中,由于特殊事件(如铺货)等原因,个别数据会表现出明显突变,导致药品历史数据存在异常点,掩盖了数据本身的规律。本文通过基于距离的异常点检测方法和多项式拟合方法对药品数据做预处理,具体处理步骤如下:

首先,选择一个较大的数(如1010)将缺失数据补足,然后运用基于距离的异常点检测方法进行检测。第一步,对药品需求数据进行归一化处理并计算出各个数据之间的距离,得到距离矩阵P。计算公式如下:

Pij=|xi-xj|,i,j=1,…,n(1)

式中,xi表示时间序列中第i期的数据,Pij表示时间序列中i期数据与j期数据之差的绝对值。距离矩阵P的第i列表示时间序列第i期数据与长度为n的时间序列中所有数据(包括第i期数据本身)的距离。

P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)

通过设置距离阈值d,计算出所有满足Pij>d的距离个数,记di,得到判别矩阵D。

D=[d1,d2,d3,…,dn](3)

将di与阈值f进行比较,若大于f,则识别该点为异常点,否则为正常值。最后利用多项式拟合方法,将检测出来的异常点作拟合处理,得到建模需要的正常数据。

2.2 单项预测方法的选取

药品需求预测是一个复杂的非线性系统建模问题,相对于传统分析方法(如指数平滑方法、ARMA模型、MTV模型),神经网络依据数据本身的内在联系建模,具有良好的自组织、自适应性,以及抗干扰能力以及非线性映射能力,能够较好地解决非线性数据拟合问题。

本文选取3种具有不同特征的神经网络模型,即BP神经网络、RBF神经网络和GRNN广义回归神经网络,综合其各自优势建立组合预测模型,提升整个预测模型的泛化能力,提高预测精度与预测稳定性。

2.2.1 基于BP神经网络的药品需求预测方法

BP神经网络由Rumelhard和McClelland于1986年提出,它是一种典型的多层前向型神经网络。药品销售记录作为BP神经网络输入值,药品需求预测即为BP神经网络输出值。当输入节点数为m,输出节点数为n时,BP神经网络就表达了从m个自变量到n个因变量的非线性函数映射关系。

BP神经网络侧重对全样本的学习,因此适合对样本整体特征相近的时间序列进行预测,即适应受某一特定因素影响显著,且该影响因素相对稳定的药品预测。

2.2.2 基于RBF神经网络的药品需求预测方法

径向基函数(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一种三层前馈网络,即输入层、隐含层和输出层。从输入层到隐含层是一个非线性到线性的变换过程,从隐含层到输出层是一个线性处理过程。RBF神经网络在处理非线性问题时,引入RBF核函数将非线性空间映射到线性空间,极大地提高了非线性处理能力,且RBF神经网络采用自组织有监督的学习算法进行训练,其训练收敛速度具有显著的优势。

RBF神经网络具有很好的非线性处理能力,其学习算法属于局部激活性较高的高斯函数,对于相似的样本有着较高的逼近能力,因此适用于受会随时间变化而较为显著变化的因素影响的药品需求预测。

2.2.3 基于GRNN的药品需求预测方法

广义回归神经网络(GRNN,Generalized Regression Neural Network)由美国学者Donald F. Specht在1991年提出,它是径向基神经网络的一种。GRNN具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题。

GRNN在逼近能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本量积聚较多的优化回归面,并且在样本数据较少时,预测效果也较好。此外,网络还可以处理不稳定数据。因此GRNN适用于数据不全、异常点较多的药品。

综上所述,3种神经网络都具有良好的非线性处理及预测能力,因为学习算法的不同有着各自侧重的学习方向,皆为应用广泛的预测方法,且对各自适应范围内有着较好的预测效果。因此本文选择BP神经网络、RBF神经网络以及广义回归神经网络作为单项预测方法,并在此基础上建立组合预测模型。

2.3 单项预测方法的筛选与变权系数的计算

本文在已选取3种单项预测方法的基础上,再根据合适的MAPE和误差方差筛选出组合模型中的单项预测方法,计算出变权系数。假设药品需求的实际时间序列为y(t),t=1,2,…,N,N+1,…,N+T,其中t表示预测区间,T表示预测步长。

(1)单项方法筛选

单项方法进一步筛选的具体步骤为:

①预先设置选择单项方法MAPE阈值m 和误差方差阀值ε

②进行逐期单步预测,预测序列为:

{i(t),i=1,2,…,n;t=N+1,…,N+T}

③计算n种单项方法的相对误差ei(t)、误差方差εi(t)和MAPE。其中,单项预测方法的相对误差序列为:

ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)

单项预测方法的误差方差为:

εi(t)=(5)

单项预测方法的MAPE为:

MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)

④若MAPEi(t)

(2)变权系数的计算

本文考虑预测效果,选用基于相对误差为最优准则的最优加权法进行计算。

假设从n中方法中筛选出p(p≤n)种单项预测方法,则组合模型第t+1期的权系数w(t+1)由相对误差ei(1),…,ei(t)决定,其中i=1,…,p。变权规则如表1所示。

权系数具体计算过程如下:

①设组合权重wi为方法mi在组合预测方法中权重,则组合预测方法第t期相对误差为:

e(t)=wi*ei(t),i=1,2,…,p(7)

②组合模型前t期的相对误差平方和为:

e2=e(1)2+e(2)2+…+e(t)2(8)

令w=[w1,w2,…,wP]T,

E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t)

建立如下目标规划:

min P=e2=wT*ET*E*w

s.t. wi=1(9)

③求解该目标规划得到变权系数w。

2.4 建立组合模型进行预测

组合预测模型可表示为:

式中, wi(t)表示第t期单项方法mi的变权系数,(t)表示第t期组合预测方法的预测值。根据该模型对药品进行预测。

3 实验与分析

本文以上海市某制药企业月度销售额为药品需求预测的实证数据,根据销售地区的不同抽取有代表性的药品销售数据,其中选取上海地区10种药品,北京地区4种药品及全区域销售数据12种药品,数据长度皆为30(2009-1至2011-6)。

数据选择依据如下:①药品销售有一定的连续性,为公司主推或在某地区主推药品,具有代表性及预测意义;②在考虑异常点和数据缺失时,选取异常点和缺失数据较少的药品。

3.1 单项方法筛选和变权系数计算

根据不同销售区域药品需求的具体情况,设定单一省市药品的MAPE阈值和方差阈值分别为20%和0.1;设定公司的MAPE阈值和方差阈值分别为30%和0.1。shy03和all03的单项预测方法选取结果如表2 所示。

利用单项预测方法的6期预测结果计算组合预测模型的3期权重,选相对误差最优准则进行权重计算,运用MATLAB的二次规划函数quadprog求解。变权规则及权重计算结果如表3所示。

3.2 预测模型的精度比较

本文选取平均绝对相对误差(MAPE)和预测有效度两个指标来综合评价模型的预测精度。当MAPE越小时,说明预测精度越高。然而当实际值非常小时,即使是预测值与真实值之差较小,其平均绝对相对误差也会很大,而预测有效度能很好地避免此类问题,故我们引入预测有效度来综合评价预测精度,预测有效度越大,预测精度越高。

用单项预测方法BP、RBF、GRNN与组合预测方法单一省市和全区域药品销售预测值的MAPE和有效度,对MAPE和有效度的情况进行统计并且计算MAPE和有效度的平均值,比较结果如表4所示。

可以看出,运用组合预测方法对单一省市的14种药品进行需求预测时,MAPE小于标准值20%的有8个,占药品总数的57.14%,优于BP(7)、RBF(4)、GRNN(6)方法;14种药品的MAPE平均值为19.81%,优于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。预测有效度大于标准值0.5的有11个,占药品总数的78.57%,优于BP(8)、RBF(10)、GRNN(8)方法;14种药品的预测有效度平均值为0.62,优于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。

此外,运用组合预测方法对全区域销售的12种药品进行需求预测时,MAPE小于标准值30%的有7个,占药品总数的58.33%,优于BP(4)、RBF(6)、GRNN(3)方法;12种药品的MAPE平均值为25.22%,优于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。预测有效度大于标准值0.45的有10个,占药品总数的83.33%,优于BP(7)、RBF(9)、GRNN(5)方法;12种药品的预测有效度平均值为0.58,优于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。

通过上述实证结果,从整体上看,组合预测方法的预测精度优于单项预测方法,而且模型的适用范围较广。

3.3 预测模型的稳定性比较

本文选择预测误差的方差作为评价模型稳定性的指标。将单项预测方法BP、RBF、GRNN与组合预测方法的误差方差进行比较,单一省市和全区域的比较结果如表5所示。

可以看出,运用组合预测方法对单一省市的14种药品进行需求预测时,误差方差小于标准值0.1的有12种,占药品总数的85.71%,优于BP(10)、RBF(11)、GRNN(10)方法;此外,14种药品误差方差平均值为0.0263,优于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。运用组合预测方法对全区域销售的12种药品进行需求预测时,误差方差小于标准值0.1的有11个,占总数的91.67%,优于BP(9)、RBF(10)、GRNN(8)方法,此外,14种药品的误差方差平均值为0.031 0,优于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此从整体上看,组合预测方法的预测稳定性优于单项预测方法。

4 总结及展望

本文选择3种具有不同适应特征的神经网络模型作为单项预测方法,建立了基于神经网络的药品需求组合预测模型,以上海市某药企的实际销售数据作为实证对象,验证了该模型在预测精度和预测稳定性上均优于单项预测方法。当然,虽然建立的神经网络组合模型在一定程度上弥补了现有方法的不足,扩大了预测方法的适用范围,但在研究过程中依然存在亟待解决的问题:

(1)单项预测方法的参数优化有待进一步研究。本文在参数优化时,大部分采用遍历法和经验法进行设置,缺乏相应理论依据和方法指导。如何采用合适参数寻优方法进行参数确定是下一步亟待解决的问题。

(2)进行组合预测时,选择合适的最优准则有待于进一步研究。本文选取相对误差作为最优准则进行需求预测,该准则的选取忽视了量纲统一性,未来的研究应该综合考虑量纲统一、预测误差和预测稳定性,使组合预测方法更科学、更合理。

主要参考文献

[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.

[2]吴正佳,王文,周进.BP神经网络在备货型企业销售预测中的应用[J].工业工程,2010(1):105-108.

[3]童明荣,薛恒新,刘路冰.基于季节性RBF神经网络的月度市场需求预测研究[J].运筹与管理,2007(3),146-150.

[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.

[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.

[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.

[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.

[8]马新强,黄羿.基于BP神经网络的药品销售预测模型设计[J].重庆文理学院学报,2008(2):64-66.

神经网络预测方法篇6

【关键词】神经网络;网络流量;预测径向基算法;BP算法

随着网络的迅速发展,网络上承载的业务和应用日益丰富。加强网络管理、有效提高网络运行速度和利用率,网络流量预测是关键,也就是对网络出口的流量发展进行动态分析,并在定性基础上对流量进行定量的计算。有很多种因素可以影响网络流量,在实际发生的时间序列中,弱相依性、突变性和随机性等复杂非线性特征对网络流量预测都存在很大的影响,而且在以往的学者中针对于这些特点所构建的数学模型也不是很完善,还不够成熟。针对这些特点本文将在时间序列的预测中结合使用径向基神经网络的方法,在时间序列的延迟性中运用自相关分析技术进行合理分析,建立基于MATLAB6.5环境下的黑龙江信息技术职业学院网络出口流量预测的径向基神经网络数学模型,并对实际网络出口流量数据惊醒有效的验证。

1、建立径向基神经网络流量的预测模型

对于网络流量这样的非线性系统进行建模时,本文采用径向基神经网络技术,针对隐层节点的数量处选择合理的改进方法。经过实际操作的甄选后选择网络流量的均方误差的目标值为0.001,隐层节点数选择最大为23个。除此之外,为了保证径向基神经网络泛化能力的良好运行,并且保证径向基函数的输人输出范围足够大,就需要对输入的训练值进行postmnmx归一化处理。

从隐含层到输出层之间的权值是基于径向基神经网络函数来调整,并采用线性传递函数进行实现的,综合考虑,这样就不存在在局部会出现极小点的问题。对于这种基于径向基神经网络的局部函数,会有很快的网络学习速度,对于函数迫近时的收敛速度问题,能够很好地克服。

2、算例分析

对基于径向基神经网络函数是有一定的精度要求的,本文采用newrb函数进行设计,并满足函数的精度要求。函数格式为:net=newrb(a,b,m,n),采用基于径向基神经网络函数进行逼近原始函数时,newrb函数能够自动增加基于径向基神经网络的隐层神经元,直到均方误差满足为止。对于输入向量矩阵、目标向量矩阵、均方误差和径向基的分布分别使用式中变量a,b,m,n来表示。

在时间序列的预测上采用用sim函数进行预测。函数格式为:y= sim(net,x),对于待评价时间序列的输入向量和用基于径向基神经网络对时间序列进行计算的预测值分别使用式中的x,y进行表示。基于径向基神经网络的网络流量预测模型是在Matlab6.5环境下的,并对网络流量在时间序列上进行预测。

基于径向基神经网络采用1个输出单元和23个输人单元,并对基于径向基神经网络进行训练,自动调整网络训练程序的最终隐含层节点数,调整后的节点数为23个。最后比较网络流量预测模型所得的最后的网络输出和实际的网络流量数据,其结果如图1所示。

把表1中2013年10月28日实际发生的网络流量真实值作为训练的样本,在MATLAB6.5环境下的基于径向基神经网络模型对2013年10月28日我校网络流量进行预测,其预测的结果如表1所示,在MATLAB6.5环境下的网络训练的图形输出结果及预测结果如图1所示。

在表1中实际数据值和预测值可以看出,经过多次的历史预测,每次模型预测的绝对误差值均为0,可以总结为采用的训练样本的合格率均为100%,具有较好的拟合精度和预测精度。

在图1中我们可以看到,基于径向基神经网络模型通过训练对网络流量能够准确的预测,在泛化能力上也有很大的提高。经过后期计算,通过网络训练的均方误差为MSE=2.1731e-010,预测的均方误差为MSE=0.0012。从误差变化曲线能够表示出,训练到达第22步时,网络流量预测模型的精度要求基本满足。

神经网络预测方法篇7

【关键词】BP神经网络;预测;误差

1.引言

许多金融学家和计量学家对发达国家成熟市场的波动性进行了广泛的研究,但是在对股市的预测上,由于人们在知识、能力、经验上存在着较大的差异,加之问题本身又具有很大的随机性和高度的非线性,即使是一些金融专家、炒股高手对出现的同一复杂行情进行分析,往往也会得出不同的结论。此外,传统方法还要事先知道各种参数,以及这些参数在什么情况下应作怎样的修正。这都给预测股市带来一定的困难。

基于以上股市预测的困难性,本文提出了人工神经网络的预测方法。随着计算机、人工智能尤其是专家系统的发展,人工神经网络技术逐渐成熟并开始应用于各个领域。人工神经网络(ANN,简称神经网络)作为一种由大量简单神经元广泛相互联接而成的非线性映射或自适应动力系统,恰好能有效解决股市预测处理中常见的困难,因此它很快在股市预测分析与处理领域得到了广泛的应用。

2.BP神经网络介绍

2.1 BP 网络算法的基本原理

2.1.1 标准的BP 网络算法的基本原理

BP(Back Propagation)网络是反向传播的多层前馈式网络,是目前使用最为广泛的一种人工神经网络。它的核心是BP算法,一种对于多基本子系统构成的大系统进行微商计算的严格而有效的方法,采用最小均方差学习方式。BP 神经网络的原理说到底就是给它一些输入变量,然后就有一个输出,输出值的情况与实际的情况进行比较,差多少,然后再进行网络的内部调整,属于有导师的学习规则,使得网络输出与实际逼近。

神经网络能学习和存贮大量的输入―输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。人工神经网络由非线性函数组成,而由一系列不同权重的线性过滤器组合而成:

2.1.2 BP网络算法的优化

由于常用的BP算法主要缺点为收敛速度慢,局部极值,难以确定隐含层和隐含层的个数,使得在实际应用中BP算法很难应用,因此,出现了许多改进算法。BP算法的改进主要有两种途径,一种是采用启发式学习方法;另一种则是采用更有效的优化算法,本文采用了动量法和学习率自适应调整的策略,从而提高了学习速度并增加了算法的可靠性。动量法降低了网络对于误差曲面局部极值的敏感性,有效地抑制了网络陷于局部极小。

2.2 BP神经网络的模型识别及步骤

模式通常指对事物的一种定量描述或结构描述,“识别”是指对客观事物按其物理特征进行分类。模式识别的基本原理就是从待识别对象和理想标本之间若干特征的相似性推断它们之间总体的相似性。BP神经网络模式识别过程分为训练阶段和模式分类阶段,分为初始化、数据与处理、网络训练以及模式分类四个步骤。以下利用实证分析来进行着四个步骤。

3.实例分析

下面以上证的某股600个交易日的股票价格收盘指数作为原始样本数据,对上述神经网络模型进行求解,预测20天的收盘价,与实际收盘价进行比较,并求出其误差:

式中,表示第日的实际收盘指数,表示第日的预测值,表示误差。主要按照如下几部分来处理:(1)准备600个数据的时间序列,进行归一化。BP神经网络中每个神经元的输出值由传递函数Sigmoid函数来计算,其输出值的范围是(0,1);(2)留出最后20个数据,作为预测检验使用;(3)绘制图像,包括实际值和预测值,能量函数;(4)分析实际和预测两曲线的趋势。

采用I-J-K学习模型,该模型是输入层I个神经元,隐层J 个神经元,输出层K个神经元。利用BP神经网络模型训练500次、800次、1000次的输出值和期望值以及能量函数(或者叫误差函数)E,结果见图1到图3。

通过上面的图示,可以看到用BP神经网络预测的效果比较明显,这说明该模型适用于短期预测吗,股市的波动在很多地区都是非常剧烈的,各种因素的综合作用也使得长期股指的变动具有极大的不确定性,使得预测变得很困难。而BP网络的算法原理和自学习的特点使其能够充分挖掘出隐含在样本数据中的规律性,实现从输入空间到输出空间的非线性映射,对样本数据进行精确的拟合。从而BP神经网络的方法对于股市上的一些很难看出规律的数据列的预测而言,无疑是一个比较精确的预测方法。

4.结论

本文介绍了股市的特点以及股市预测的困难性,提出了利用BP神经网络的方法来解决股市预测问题。文章介绍了BP神经网络算法的基本原理,BP神经网络算法的优化,BP神经网络模型识别及步骤,最后后以上海证券交易所每日股票价格收盘指数为分析对象,把原理应用于实际,利用BP神经网络对股票价格收盘指数进行了短期预测,并计算出预测值和实际值的误差。通过实验发现该模型收敛速度快,预测精度非常高,对预测短周期内股指波动具有较强的适用性。

参考文献

[1]高琴.人工神经网络在股市预测模型中的应用[J].微电子学与计算机,2007年第24卷第11期.

[2]周翠红,路迈西.线性回归与人工神经网络预测煤炭发热量[J].煤炭科学技术,第37卷第12期.

[3]尹庆双,奉莹.人工神经网络在第三产业就业分析中的应用[J].人口与经济,2009年第6期.

[4]邹文安,刘宝,姜波,杨春生.基于Excel 技术平台人工神经网络BP模型及应用[J].水文,第30卷第1期.

[5]康进,刘敬伟.非参数回归估计与人工神经网络方法的预测效果比较[J].统计与决策,2009年第23 期.

[6]杨本昭,田耕.基于人工神经网络的客户价值分类研究[J].科技管理研究,2007年第12期.

神经网络预测方法篇8

    关键字 前馈型神经网络 差价 股价预测

    近年来在基于神经网络的股市预测的文献中为减小预测误差用到的方法很多,主要有:采用大量的数值实验进行对比分析的方法,确定了比较适合股票市场预测的初始条件;用BP网络模型进行短期预测,采用交叉验证集的方法来确定隐层节点数,对输入变量进行敏感性测试,选出影响输出变量最重要的5个因素;基于RBF股市趋势预测,其中RBF网络中心点的选取采用最近邻聚类学习算法;基于RBF神经网络的股市预测建模方法,采用遗传算法训练RBF网络的参数、权重。从以上资料可以看出,近年来多数文献把研究重点放在具体的网络拓扑结构设计和相应的学习算法的优化,及选择对股价有显着影响的输入变量,来减少预测误差。这些方法都是以实际股价作为网络的预测。而本文提出的方法是以相邻两天的股价差价作为网络的预测。实验结果表明该方法的预测误差小,预测效果好,有望取代目前的以实际股价作为网络预测的方法。

    1 预测股价的神经网络模型

    1.1 数据的准备

    对股市价格进行神经网络预测的基础是股市中大量的历史数据,主要有每日开盘价、收盘价、最高价、最低价、成交额和成交量等6个原始数据。本文选用对股价有显着影响的开盘价、收盘价、最高价、最低价作为网络输入。选取个股中国石化(600028)2005年4月1日~2005年12月9日的150组交易数据作为原始数据,数据来源于证券之星网站。将150组数据分为训练样本和测试样本。把中国石化的2005年4月1日~2005年11月16日期间的120组交易数据交给神经网络学习,让神经网络给出剩余数据的股市收盘价的预测。

    1.2 网络结构,参数设置

    用于股价预测的前馈型神经网络主要有BP神经网络和RBF神经网络。本文选用有代表性的BP网络。采用三层网络,网络结构为5L-16-1,L为输入数组的维数,5是技术分析周期采用5日,L是输入向量的个数,在本文指的是2,4。隐含层单元的传递函数采用Tausig函数,输出层单元的传递函数取线性函数y=x,网络的学习率取为0.1。学习时要求输出误差d≤0.005,训练次数最大设置为500。应用动量法和学习率自适应调整改造后的BP算法来训练网络。实验证明,上述一系列参数的选取,既可以加快网络的收敛速度,又可以使网络具有较好的逼近精度。

    1.3 差价预测模型

    在相同的输入下,以预测股价,预测差价分别建立网络模型。因为股价的差价取值范围比股价本身的取值范围小,所以会使得差价预测模型的预测误差范围比股价预测模型的预测误差范围小,从而可获得较好的预测效果。

    Pn是第n天的收盘价,Pn-1是第n-1的收盘价,Pn=Pn-Pn-1是相邻两天收盘价的差价,把Pn作为差价预测模型的网络训练目标,网络输出记为Pn,那么预测的第n 天的收盘价为Pn=Pn+Pn-1。

    2 实验结果

    下文分别给出了以开盘价、收盘价和开盘价、收盘价、最高价、最低价两种组合输入的模型预测结果。用指标(MAPE)平均绝对误差百分比来评价两个模型的预测结果:

    MAPE=■■■×100

    其中,Pn-1是第n-1的收盘价,Pn=■n+Pn预测的第n天的收盘价,N是用于网络预测的样本总数。

    图1中:(a)为差价预测模型网络训练达到目标的步数是9步;(b)为差价预测模型的预测数据与原始数据;(c)为差价预测模型的预测误差(MAPE=1.1725%);(d)为股市收盘价预测模型网络训练达到目标的步数是24步;(e)为股市收盘价预测模型的预测数据与原始数据;(f)为股市收盘价预测模型的预测误差(MAPE=1.7%)。

    图2中:(a)为差价预测模型网络训练达到目标的步数是6步;(b)为差价预测模型的预测数据与原始数据;(c)为差价预测模型的预测误差(MAPE=1.2%);(d)为股市收盘价预测模型网络训练达到目标的步数是19步;(e)为股市收盘价预测模型的预测数据与原始数据;(f)为股市收盘价预测模型的预测误差(MAPE=1.735%)。

    3 结语 

    图1、图2的结果表明股价的差价预测模型的网络训练时间较短,预测误差较小,预测精度较高,证实了股价的差价预测方法优于目前的股价预测方法。相比之下该方法具有显着的优势,因而是一个极有前途的新方法。

    股价的差价预测精度高效果好,原因在于股价的差价范围比股价本身的范围小,因而会使得它的预测误差范围比股价预测模型的预测误差范围小,这相当于减小了预测误差。因此,该方法是减小预测误差的一个可行有效的方法,也可推广到神经网络的其他应用领域。

    参考文献

    1 吴微,陈维强,刘波.用BP神经网络预测股票市场涨跌[J].大连理工大学学报,2001(1)

神经网络预测方法篇9

[关键词] BP神经网络出口预测非线性预测

一、引言

出口贸易受到一国(或地区)的经济条件、自然条件、贸易政策等国内因素的影响,还受到国际市场需求变动、全球经济增长等国际因素的影响,且各影响因素以及相互之间存在非线性关系,因此,出口贸易是一个复杂时变的非线性系统。而传统的时间序列、线性回归等线性预测方法虽然具有简单、直观且解释性强的优点,但难以解决非线性的预测问题,因此非线性的预测方法越来越受到出口贸易预测研究者的重视。在其研究中表明中国外贸环境发生了较大变化,导致建立在原来数据结构之上的模型出现失真,而解决的方法就是将其非线性化。

而神经网络是目前应用得非常广泛的非线性预测方法,它具有强大非线性映射功能,具有很强的鲁棒性(robust)和容错性,适合于解决动态非线性出口贸易系统的预测决策问题。且神经网络的算法和模型较为成熟,预测结果可靠,在股市预测、证券预测、外汇预测、GDP预测、库存需求预测、产品成本定价、风险预测、财务报警等经济领域内皆有应用。本文将BP神经网络应用于重庆市出口贸易额的预测,建立起预测模型并进行实证预测,预测的结果可以作为相关部门制定重庆市出口贸易发展目标的决策参考依据。

二、预测模型结构设计

1.BP神经网络理论

BP神经网络(Back Propagation Neural Network)是一种按误差逆向传播算法训练的多层前馈神经网络,它由输入层、隐含层、输出层构成,每层由若干个神经元组成,各神经元的输出值由输入值、激活函数和阀值决定。

图1BP神经网络结构图

典型的单隐含层BP神经网络结构如图1所示,输入层、隐含层和输出层的神经元数分别为n、q、m,隐含层和输出层的激活函数分别为、,则网络输出:

(1)

假设输入P对学习样本,第p个样本的网络输出为,其期望输出为,则总体误差:

(2)

L-M(Levenberg-Marquardt)算法下的权值修正公式:

(3)

式中,J是误差对权值导数的雅可比矩阵:μ是一个能够自适应调整的非负标量;是单位矩阵;θ项保证可逆,否则JTJ可能不可逆;e是误差。

2.具体算法设计

(1)对数据进行预处理。。本文选用常用的线性函数对原始数据进行标准化的预处理,预处理的结果将原始数据映射到[0,1]的区间范围内,预处理公式为:

(4)

式中、分别是原始序列和预处理之后的序列;、分别是最小值和最大值。

(2)确定网络各项参数。BP网络的各项参数包括网络的隐含层数;输入层、隐含层和输出层神经元数;以及各层激活函数。

研究已经证明任意一个连续函数都能与含有一个S型隐含层和线性输出层的BP神经网络建立任意映射关系,因此本文选择单隐含层的BP网络模型,即三层BP模型。输入层和输出层的神经元数分别由输入数据和输出数据的维数确定。

隐含层神经元存储连接权值,体现了样本的内在规律,增加隐含层神经元数,能提高网络从样本中获取和概括信息的能力,但隐含层神经元数过多,又可能将噪声等样本中非规律性的信息学会并存储,从而出现“过度拟合”(Overfitting)的问题。因此在满足精度要求的前提下,隐含层应该选择尽可能小的神经元数。本文采用“试凑法”确定隐含层神经元数目,具体做法是先设置较少的隐含层神经元数来训练网络,然后逐渐增加隐含层神经元数,当隐含层神经元数增加而网络误差没有明显改善时,将临界的隐含层神经元数作为BP网络的隐含层神经元数。隐含层激活函数采用Sigmoid:,其中,是权值的加权和。输出层激活函数采用purelin纯线性函数。

(3)初始化网络。初始化各神经元的权值和阀值。

(4)网络学习训练。输入P对学习样本对网络进行训练,判断网络误差是否满足精度要求,如果满足精度要求,则结束训练,存储权值和阀值。如果不满足精度要求,则原路反向传播,并沿途修正各层神经元的权值和阀值,进入下一轮学习训练,当训练次数大于给定的最大训练次数仍不满足精度要求时,退出训练过程,调整网络参数并重新训练,即从2)开始重新调试。

三、实证预测

本文用于模型实证预测的时序数据为1987年到2005年重庆市出口贸易额历史数据,见表1。

表11987年~2005年重庆市历年出口贸易额 单位万美元

资料来源:1987年~2004年数据来源于《重庆统计年鉴――2005》,2005年数据来源于“重庆市对外贸易网”公布的数据。

通过反复多次调试,最后确定将顺序前四年的出口贸易额数据作为网络输入数据,后一年的出口贸易额数据作为输出数据,网络结构为4×6×1。利用2004年以前的数据训练网络,然后对2005年和2006年重庆市出口贸易额数据进行预测,预测结果分别为257374万美元和275869万美元,而传统的指数平滑、移动平均和自回归的预测结果见表2,预测曲线见图2。

从表2预测结果可以看出,BP神经网络预测的误差在3%以内,具有较高的预测精度;而指数平滑、移动平均和自回归预测的最大误差分别为26.57%、27.07%、10.91%,误差远大于BP神经网络的预测误差。再从图2的预测曲线来看,BP神经网络的预测曲线紧贴着实际数据变动,数据拟合效果好;而指数平滑、移动平均和自回归预测的预测曲线在实际数据出现明显波动时开始明显偏离实际数据,即这三种传统的预测方法不适合于非线性问题的预测。

表2不同预测方法的预测结果单位万美元

图2不同预测方法的预测曲线

神经网络预测方法篇10

【关键字】 灰色理论 BP神经网络 预测模型

一、引言

随着大数据时代的到来,BP神经网络预测模型已成为学术界研究的热点,并应用到多领域中。BP神经网络具有很好的非线性逼近以及自学习的能力,可高精度拟合预测值,但是,由于很多系统存在不确定性,传统的BP神经网络将原始时间序列直接作为输入值,而原始时间序列中具有很大的随机性和不确定性,使得神经网络在预测结果中,存在较大偏差。解决此问题的有效方法是将原始时间序列经过灰色理论进行白化处理,过滤掉数列中的不确定性和随机性等灰色特性,再将白化处理后的结果作为BP神经网络的输入。

二、灰色预测理论研究

根据研究对象的特性可将其分为白、灰、黑三类,该分类取决于研究者对系统信息的掌握程度,是基于认识程度而言,具有相对性。其中白色系统信息完全明确,黑色系统信息完全缺乏,而灰色系统是介于白色系统和黑色系统之间,其信息具有不充分、不完全的特性。灰色预测为灰色系统最典型的应用,在样本数据量较少、预测结果具有一定的随机性时,灰色理论是应用最为广泛的,克服了系统周期短和数据不足的矛盾。对于样本少、贫信息的不确定性系统[1]而言,由于原始数据毫无规律可循,因此灰色理论首先将原始时间序列进行累加,使其具有递增规律,然后对其进行拟合,最终将累加数据进行还原。其具体原理如下所示:设原始时间序列为累加为时间序列为,累加后是单调不减时间序列,可见,一般累加可将非负的任意无规律数列转换为单调不减数列。根据该时间序列,建立白化方程并得到方程的解。所得即为的估计值,但是由原始数列累加变换所得,因此,还需对估计值进行累减处理,最终即为所求预测值。

三、BP神经网络理论研究

BP神经网络是一种具有连续传递函数的前馈神经网络,其训练方法是误差反向传播算法,常用的为梯度下降法[2]。以均方误差最小化为目标不断修改网络权值和阈值,最终能高精度地拟合数据。BP神经网络模型结构分为三层,第一层为输入层,输入值为预测系统的主要影响因素的定量值;第二层为隐含层,每个神经网络模型至少包含一个隐含层,为了计算方便,本论文中采用一个隐含层进行预测;第三层为输出层,输出即为系统的预测结果,输出可为一个或多个,本文采用一个输出模式。设输入层的输入值为,隐含层的神经元值为,输出层的神经元值为。输入层神经元与隐含层神经元的权值为,隐含层神经元与输出层神经元的权值为。隐含层神经元的阈值为,激发函数为,输出层神经元的阈值为,激发函数为。在神经网络进行训练时,分为两个方向:信息正向传递和误差反向传播。在信息正向传递的过程中,隐含层每个神经元通过该神经元的阈值、其与输入层各神经元的权值及输入层各神经元本身的值的结合,在本层激励函数的作用下取得。神经网络经过以上的正向信息传递,将M维向量的N个样本数据作为输入,计算出隐含层神经元的值,最后计算出实际输出值。利用其与期望输出值T可计算出均方误差。将所得MSE沿原来正向信息传递的路径逐层反向传递,依据输出的MSE计算出各层的,并将作为依据,更新各连接的阈值和权值,此时误差反向传递完毕。网络模型反复进行信息正向传递和误差反向传递着两个过程,直到MSE达到标准或小于标准ε。

四、灰色神经网络预测模型的建立

由于灰色系统具有明显的不确定性,因此用灰色模型先将原始输入数据进行累加,使其具有明显的指数特性,并对其进行白化即用微分方程对其进行拟合预测。对于有N个参数的灰色神经网络的微分方程为:

其中,xi(1)(i=2,3,...,N)为系统输入值,xi(1)为系统输出值。记微分方程系数为

将GM(1,N)的输出值作为神经网络的输入值,即可得到灰色神经网络模型。

总结和展望:由于现实世界中的系统很多属于灰色系统,在对未来数据的预测过程中,仅凭传统的BP神经网络预测存在很大的偏差。而本文提出的灰色神经网络预测模型可以有效地过滤系统中的灰色特性,并充分发挥灰色理论和BP神经网络各自的优势,二者取长补短,使得最终对灰色系统的预测更加准确。但值得注意的是在神经网络预测的过程中,采用的梯度下降法只能找到局部最有值[3],无法准确获取全局最优。可在以后的预测模型研究中考虑加入遗传算法等对此模型进行优化。

参 考 文 献

[1] 刘金英. 灰色预测理论与评价方法在水环境中的应用研究[D].吉林大学,2004.