神经网络隐含层数的确定范文

时间:2024-04-02 18:03:41

导语:如何才能写好一篇神经网络隐含层数的确定,这就需要搜集整理更多的资料和文献,欢迎阅读由公文云整理的十篇范文,供你借鉴。

篇1

1.1区位因素

区位因素是高校周转房房租市场化价格影响因素中较为宏观却具有重要地位的影响因素。区位能够反映房屋在城镇中所处的位置,反映房屋与商服、学校、医院等生产生活不可或缺的重要设施之间的空间关系。

1.2邻里因素

邻里因素反映了房屋所处的小区级范围内各类生产、生活要素的情况,相对于区位因素而言,邻里因素更加注重诸如容积率、物业管理、车位等更加微观、具体的因素。

1.3个别因素

个别因素是从出租房屋本身的面积、户型、楼层、装修、建筑年代、建筑结构、评估时点等情况考虑,反映房屋自身情况与租金之间关系的要素。

2 高校周转房房租市场化价格评估指标体系的建立

2.1指标的确定

遵循指标体系构建原则,结合高校周转房房租市场化定价的实际情况,确定指标体系,具体如表1所示。

3 基于神经网络的高校周转房租金市场化价格评估模型构建

3.1样本的选取与预处理

BP神经网络能够通过对一定数量网络输入输出样本数据学习、训练,确定网络输入输出的映射关系。为保证其准确性和高效性,需运用一定的方法对样本进行选取和预处理。基于神经网络的高校周?D房租金市场化价格评估模型的构建,应当选取正常市场条件下,与评估对象相似或相近的样本数据,并对数据不完整或某指标存在明显异常值的样本进行甄别和剔除,对指标数据进行无量纲化处理,以避免不同指标数据的实际单位对评估模型的收敛速度和准确性造成的影响。

3.2神经网络的建立与学习

3.2.1神经网络层数的确定

神经网络一般包括输入层、隐含层、输出层。神经网络的层数越多,神经网络的结构越复杂,其数据学习和处理能力就越强,但神经网络的学习时间也相应的越长。根据已有的相关研究,输入层、隐含层、输出层各为一层的三层神经网络能够对闭合区间内任意连续函数进行无限逼近,考虑到基于神经网络的高校青年教师周转公寓租金市场化定价模型并不复杂,确定其输入层、隐含层、输出层各为一层。

3.2.2神经网络节点数的确

根据已构建的高校周转房房租市场化价格评估指标体系中三级评估指标的个数,确定神经网络输入层的节点个数为15个。基于神经网络的高校青年教师周转公寓租金市场化定价模型的最终结果为待估对象的房租价格,因此,确定神经网络的输出层节点个数为1个。隐含层节点个数的确定需要运用经验公式和试验调整确定。

3.2.3激活函数的确定

激活函数是网络输入转换为网络输出的关键,常用的激活函数有线性激活函数、对数S型激活函数、阶跃型激活函数等。高校青年教师周转公寓房租价格评估指标与房租价格之间并非线性关系或离散关系,对数型激活函数连续可微,计算简便,在神经网络建模中运用较为普遍,因此,本文选取对数S型函数作为激活函数。

篇2

关键词:BP神经网络、图像分割、特征提取

Abstract: the image recognition process including the image preprocessing, feature extraction, image understanding and analysis. Which BP artificial neural network in the image segmentation using better; In the feature extraction phase BP neural network is also very good find application, and obtain the better feature extraction results; In the image understanding and the analysis phase using neural network classifier design, can get accurate classification results.

Keywords: BP neural network, image segmentation, feature extraction

中图分类号:TP183 文献标识码:A文章编号:

引言

BP人工神经网络算法是现今应用较为广泛的多层前向反馈式神经网络算法,BP人工神经网络有较好的容错能力、鲁棒性、并行协同处理能力和自适应能力,受到了国内外众多领域学者的关注。由于神经网络高效率的集体计算能力和较强的鲁棒性,它在图像分割方面的应用已经很广泛,Jain和Karu采用了多通道滤波与前向神经网络相结合的方法实现图像纹理分割算法。神经网络算法在特征提取阶段,压缩特征数量,以提高分类速度和精度。在图像识别领域中神经网络作为分类器的研究也得到了很大的进展,尤其是其学习能力和容错性对于模式识别是非常有利的,在一定程度上提高了训练速度和识别率。Le Cun等人提出了多层特征选择(Multilayer Selection Procedure)方法用于字符识别,每一层神经网络处理较低层次的特征,获取该层特征信息并传给上一层。

BP神经网络的基本原理

人工神经网络的研究起源于对生物神经系统的研究,它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络的学习过程实际上就是不断地调整权值和阈值的过程。根据有无训练样本的指导可以将神经网络的学习方式分为两种:监督学习方式和非监督学习方式,也称为有导师指导学习方式和无导师指导学习方式。监督学习方式,是在给定固定的输入输出样本集的情况下,由网络根据一定的学习规则进行训练学习,每一次学习完成后,通过对比实际的输出和期望的输出,以此决定网络是否需要再学习,如果还没有达到期望的误差,则将实际误差反馈到网络,进行权值和阈值的调整,使实际的误差随着学习的反复进行而逐步减小,直至达到所要求的性能指标为止。非监督学习方式,是在没有外界的指导下进行的学习方式,在学习过程中,调整网络的权重不受外来教师的影响,但在网络内部会对其性能进行自适应调节。

BP神经网络分类器的设计

BP神经网络是基于误差反向传播算法(Back Propagation Algorithm,BPA)的多层前向神经网络,由输入层、输出层、一个或多个隐含层所组成。BP神经网络结构确定之后,通过对输出和输入样本集进行训练,反复修正网络的权值和阈值,达到学习训练的期望误差,以使网络能够实现给定的输入输出映射关系。BP人工神经网络的学习过程分为两个阶段,第一阶段是输入己知的学习样本数据,给定网络的结构和初始连接权值和阈值,从输入层逐层向后计算各神经元的输出;第二阶段是对权值和阈值进行修改,即根据网络误差从最后一层向前反馈计算各层权值和阈值的增减量,来逐层修正各层权值和阈值。以上正反两个阶段反复交替,直到网络收敛。具体实现步骤如下:

(1) 网络的初始化:首先对输入的学习训练样本进行归一化处理,对权值矩阵W和阈值向量赋初值,将网络计数器和训练次数计数器置为1,网络误差置为0。

(2) 输入训练样本,计算输入层,隐含层以及输出层的实际输出。

(3) 计算网络输出误差。将实际的输出和期望的输出值进行对比,采用均方根误差指标作为网络的误差性能函数。

(4) 若误差还没达到期望标准,则根据误差信号,逐层调整权值矩阵和阈值向量。

(5) 若最终调整之后的网络输出达到了误差范围之内,则进行下一组训练样本继续训练网络。

(6) 若全部的训练样本训练完毕,并且达到了期望的误差,则训练结束,输出最终的网络联接权值和阈值。

BP神经网络可以逼近任意连续函数,具有很强的非线性映射能力,而且BP神经网络中间层数、各层神经元数及网络学习速率等参数均可以根据具体情况设定,灵活性较强,所以BP神经网络在许多领域中广泛应用。一般来说,神经网络方法应同传统的人工智能方法相联系的。神经网络本身结构及性能上的特点使其对问题的处理更富有弹性,更加稳健。神经网络的基本特点是采用自下而上的设计思路,使其容易确定具体的目标分割或识别算法,在增加了不确定因素的同时也产生了网络最优化的问题,这就是所谓的伪状态(pseudo-trap)。尽管在实践中并非所有的伪状态对应完全失败的结果,但是毕竟这不符合对之完美的或者说合理的期望。人工智能则一般采用自上而下的方法,偏重于逻辑推理建立系统模型。因此将神经网络同人工智能结合起来,相当于赋予神经网络高层指导的知识及逻辑推理的能力,具有潜在的优势。

输入层中间层 输出层

图1 BP人工神经网络结构

BP神经网络的训练

4.1 BP神经网络的设计

BP神经网络的设计主要包括两方面内容:一是神经网络结构的确定,特别是隐含层层数及隐含层单元数目的确定;二是高精度收敛问题,隐含层和隐含层单元数过多,将导致训练时间过长并出现过度拟和的问题,隐含层单元数过少又导致网络收敛速度慢甚至不收敛,达不到误差精度要求。在确定隐含层层数以及隐含层单元数目时,没有一个严格的理论依据指导,需要根据特定的问题,结合经验公式确定大致范围来进行逐步试算比较得到。

4.2 数据预处理

为了加快网络的训练速度,通常在网络训练前进行神经网络输入和输出数据预处理,即将每组数据都归一化变为[-1,1]之间的数值的处理过程。

4.3 神经网络的训练

%当前输入层权值和阈值

inputWeights=net.IW{1,1}

inputbias=net.b{1}

%当前网络层权值和阈值

layerWeights=net.LW{2,1}

layerbias=net.b{2}

%设置训练参数

net.trainParam.show = 1000;%限时训练迭代过程

net.trainParam.lr = 0.1; %学习率,缺省为0.01

net.trainParam.epochs = 100000; %最大训练次数,缺省为100

net.trainParam.goal = 0.001; %训练要求精度,缺省为0

[net,tr]=train(net,P,T);%调用 TRAINGDM 算法训练 BP 网络

A = sim(net,P) %对 BP 网络进行仿真

E = T - A;%计算仿真误差

MSE=mse(E)

结束语

BP网络因为具有较强的学习性、自适应型和容错性,在很多领域均已经大量运用。本文将BP人工神经网络运用于图像的识别,探索人工神经网络在图像识别领域中的重要的现实意义。研究表明,BP人工神经网络应用于图像识别在一定程度上提高了识别的效率和准确率。但是,BP神经网络算法还存在以下几点不足之处:(1)权的调整方法存在局限性,容易陷入局部最优;(2)网络的结构需要提前指定或者在训练过程中不断的修正;(3)过分依赖学习样本,由于学习样本是有限的或者学习样本质量不高,那么会导致训练达不到效果;(4)对于规模较大的模式映射问题,存在收敛速度慢、容易陷入局部极小点、判断不准确等缺陷。总之,如何解决以上问题,如何进一步提高识别精度,扩大识别范围,使之更具有更好的工程实用性,是有待进一步研究的内容。

参考文献:

[1] WE Blanz,S L Gish.A Connectionist Classifier Architecture Applied to Image Segmentation.Proc.10th ICPR,1990,272-277.

[2] Y Le Cun,L D Jackel,B Boser,J S Denker,H P Graf,I Guyon,D Henderson,R E Howard,and W Hubbard,Handwriten Digit Recognition:Applications of Neural Network Chips and Automatic Learning,IEEE Comm.Magazine.Nov.1989.

[3] A K Jain and K Karu,Automatic Filter Design for Texture Discrimination,Proc.12th Int’l Conf.NeuralNetworks,Orlando,Oct.1994,454-458.

[4] 边肇其,张学工.模式识别(第二版)[M].清华大学出版社,北京.1999,12.

[5] 陈书海,傅录祥.实用数字图像处理[M].科学出版社,北京.2005.

[6] 万来毅,陈建勋.基于BP神经网络的图像识别研究[J].武汉科技大学学报(自然科学版).2006,6.

[7] 丛爽.面向MATLAB工具箱的神经网络理论与应用(第2版)[M].北京:中国科学技术出版社,2003.

[8] 王娟,慈林林等.特征方法综述[J].计算机工程与科学.2005.27(12).68-71.

[9] 贾花萍.基于神经网络的特征选择与提取方法研究[J].网络安全.2008,7.33-35.

[10] 龚声荣,刘纯平等编著.数字图像处理与分析[M].清华大学出版社,北京.2006.7.

篇3

关键词:农田有效灌溉面积;BP神经网络;支持向量机;预测

中图分类号:S279.2;TP183 文献标识码:A 文章编号:0439-8114(2013)09-2157-04

农田有效灌溉面积指有固定水源、灌溉工程设施配套、土地平整、在一般年景下能够进行正常灌溉的耕地面积,包括机灌面积、电灌面积、自流灌溉面积和喷灌面积[1]。它是反映农田水利建设和水利化的重要指标,也是我国各地区制定水利发展规划的重要指标之一。对农田有效灌溉面积进行预测可以为了解未来农村水利基础设施的建设状况提供有价值的参考信息,同时也可为相关部门合理制定行业发展规划提供理论支持。

1 预测方案的确定与预测方法的选择

1.1 预测方案的确定

农田有效灌溉面积的变化受多方面因素的影响,比如政策、中央财政资金投入、地方财政资金投入、农民收入状况等。这些因素并不是孤立地对农田有效灌溉面积产生影响,而是耦合在一起以非线性的方式影响农田有效灌溉面积的变化。

农田有效灌溉面积的预测有两大类方案:一种为结构式的预测方法,就是通过一定的方式建立起各主要影响因素与农田有效灌溉面积之间的关系,然后根据未来各影响因素的变化去预测相对应的农田有效灌溉面积;另一种为数据序列预测法,就是将各年度的农田有效灌溉面积数值作为连续的时间序列看待,可以认为农田有效灌溉面积的变化规律已经蕴含在数据序列之中,再采用合适的方法对该序列在未来的取值进行预测。

在第一种方案中,首先需要确定具体影响农田有效灌溉面积变化的因素种类及其影响规律,另外还需要对各因素的未来变化进行预测。准确地确定影响农田有效灌溉面积变化的各种因素本身就很有难度,各因素对有效灌溉面积影响规律的辨识也同样是一个比较复杂的问题,而预测各因素未来的变化更是一个几乎和预测农田有效灌溉面积难度相当的问题。在第二种方案中,首先需要建立起能够充分反映农田有效灌溉面积变化规律的预测模型,然后通过求取该预测模型在未来的输出值即可实现预测。两种方案相比,显然第二种方案更容易实现。因此,在以下研究中采用数据序列预测方案。

1.2 预测方法的选择

在数据序列的预测中,目前广泛采用的方法有移动平均法、指数平滑法、线性回归法、灰色预测法、神经网络法和支持向量机方法等。这些方法中神经网络法和支持向量机方法从本质上来说更为适合应用于非线性预测问题。而农田有效灌溉面积所构成的数据序列是一个典型的非线性序列。显然在该研究中采用神经网络法和支持向量机方法较为合适。为了充分研究这两种方法的适用性,以下对这两种方法进行对比分析。

2 两种预测方法的理论基础及特性分析

2.1 BP神经网络预测的理论基础及特性分析

在各类神经网络中,BP神经网络堪称最经典、使用最为广泛的一种神经网络[2,3]。

BP神经网络是误差反向传播(Back error propagation,简称BP)神经网络的简称。BP神经网络通常由1个输入层、若干隐含层和1个输出层组成,在每层中可以包括若干个神经元。各相邻层神经元之间多为全连接方式,而同层神经元之间则无连接[4]。各神经元间的连接传递相应的权值,隐含层及输出层各神经元都有自己的阈值。BP神经网络作为一种前馈网络,具有前馈网络的共性。研究表明,三层前馈网络就能够以任意精度逼近任意连续函数及其各阶导数[5]。对序列进行建模,从本质上来说就是获得序列的变化泛函,BP神经网络的函数逼近功能正好可以实现此过程。

但BP神经网络也存在若干缺陷,其中比较突出的是网络结构的不易确定、易限于局部收敛和收敛速度慢。其中网络结构的不易确定是指在确定网络结构参数的过程中没有准确的依据可以遵循。而局部收敛则对BP神经网络的函数逼近功能影响较大。

2.2 支持向量机预测的理论基础及特性分析

3 预测模型的建立

3.1 样本数据的准备

从河南统计年鉴中收集了1986-2010年河南省农田有效灌溉面积的统计数据[10]。为了降低预测模型的复杂程度,采用峰值法对这些数据进行了归一化处理。将归一化后的1986-2009年数据作为训练样本,2010年数据作为检验样本。

确定预测模型每次的输入样本中包含6个数据,即用连续6年的数据预测第七年的数据。据此可建立训练时的输入样本矩阵(6×18)和输出样本向量(1×18)。

3.2 预测模型基本参数的确定与训练

1)BP神经网络基本参数的确定与训练。确定BP神经网络的隐含层数为1,输入层神经元数为6,输出层神经元数为1,隐含层神经元数为11。隐含层和输出层的激励函数分别采用正切型Sigmoid函数和对数型Sigmoid函数。为了提高收敛速度,训练时采用了Levenberg-Marquardt数值优化算法。

2)支持向量机基本参数的确定与训练。采用Epsilon型支持向量机回归算法,经过多次试验,确定拉格朗日乘子上界为5,不敏感函数取值为0.000 01,核函数采用高斯型,高斯核函数的宽度取0.15。

4 预测与分析

4.1 两种模型预测能力对比

利用训练完毕的两种预测模型仿真预测1992-2009年的河南省农田有效灌溉面积并进行反归一化处理。反归一化后的各预测值、预测误差的绝对值和预测相对误差的绝对值见表1。从表1可以看出,支持向量机的各预测值与实际值更为接近,其预测误差的绝对平均值、预测相对误差的绝对平均值都远小于BP神经网络预测结果的对应参数。图1中的各预测数据也全部经过了归一化处理,从图1中1992-2009部分也可以看出,支持向量机的预测值基本和实际值重合在一起,而BP神经网络的预测值在一些地方则与实际值相差较大,说明基于支持向量机的预测模型泛化能力更强。

利用这两种预测模型分别预测作为检验样本的2010年河南省农田有效灌溉面积,反归一化后的预测结果如表2和图1所示。从表2和图1可以看出,基于支持向量机的预测模型在检验样本处的实际预测精度也远高于BP神经网络,其预测误差仅为BP神经网络预测误差的11.8%。

4.2 河南省“十二五”期间农田有效灌溉面积的预测与分析

实际上,预测结果是在现有条件的基础上从数据序列的角度进行的预测,如果在“十二五”期间,政府大幅增加水利行业的资金投入,最终的发展情况将会比该预测结果更好。

5 小结

在对农田有效灌溉面积进行预测时,数据序列预测法比结构式预测法更为简单易行。在各种数据序列预测方法中,神经网络预测方法和基于支持向量机的预测方法更为适合农田有效灌溉面积的非线性变化规律。

研究针对BP神经网络和支持向量机两种预测方法进行了对比分析。理论研究表明,基于支持向量机的预测方法可以克服BP神经网络的诸多缺陷,具有优越性。

以河南省1986-2010年的农田有效灌溉面积统计数据为基础,详细阐述了利用两种预测方法建立预测模型的过程,并进行了应用验证。验证结果表明,基于支持向量机的预测方法具有更好的泛化能力,预测精度更高。最后获得了河南省“十二五”期间农田有效灌溉面积的预测数据并指出了其发展趋势。

参考文献:

[1] 郑家亨.统计大辞典[M]. 北京:中国统计出版社,1995.

[2] 卞凤兰,黄晓明,刘 睿.城镇化进程中公路网用地的BP神经网络预测模型[J].东南大学学报(自然科学版),2010,40(5):1073-1076.

[3] 尹健康,陈昌华,邢小军,等. 基于BP神经网络的烟田土壤水分预测[J]. 电子科技大学学报,2010,39(6):891-895.

[4] 陈 明. 神经网络模型[M]. 大连:大连理工大学出版社,1995.

[5] 柳小桐. BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123,126.

[6] 张 华,曾 杰.基于支持向量机的风速预测模型研究[J]. 太阳能学报,2010,31(7):928-932.

[7] CHEN B J,CHANG M W,LIN C J. Load forecasting using support vector machines:A study on EUNITE competition 2001[J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.

[8] VAPNIK V N. The Nature of Statistical Learning Theory[M].New York:Springer,1995.

篇4

关键词: 设施蔬菜病害; 预警; LVQ神经网络; BP神经网络; 黑星病

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)10-0189-03

Abstract: In order to make better in early warning of facilities vegetable diseases, two kinds of algorithms of LVQ neural network and BP neural network are used to construct static early-warning models of facilities vegetable diseases. In order to test the feasibility and applicability of two models, this paper takes cucumber scab for example and makes comparation of the two models. The result shows that two kinds of models are both able to better and accurately realize the forecasting of cucumber scab. It turns out that BP neural network model, which costs less time, is more effective in practice.

Key words: facilities vegetable diseases; early warning; LVQ neural network; BP neural network; cucumber scab

预警是一个军事术语,指用来对付突然袭击的防范措施,是组织的一种信息反馈机制,后来逐步引申到现代政治、经济、技术、医疗、灾变、生态、治安等自然和社会领域[1]。当下,预警在重大气象灾害方面起到重要作用。而创新地把预警应用于设施蔬菜病害方面,利用数据挖掘方法,探寻设施环境条件与病害的关联关系,把以诊治为主的设施蔬菜病害防控模式转变为以预防为主,降低了病害防控成本,减少了农药污染,大幅度地提高蔬菜产量和质量,在农业科技和食品安全方面发挥重要作用[2]。文中以棚室黄瓜为例,构建黄瓜病害静态预警模型。通过实时地对温度,湿度,土壤酸碱度等自然条件的测量,对病虫害的发生进行预测,再根据预测结果调整当前环境,从而达到黄瓜病害预警的目的。运用LVQ神经网络、BP神经网络两种算法建立黄瓜黑星病静态预警模型并比较两种模型的优劣。结果表明,在以黄瓜黑星病为例的蔬菜病害静态预警实验中,运用BP神经网络算法所构建的模型优于LVQ神经网络,在实际的蔬菜病害静态预警的应用中更有参考价值。

1 模型的构建及分析

以黄瓜黑星病为例,分别使用LVQ神经网络、BP神经网络两种算法构建黄瓜黑星病静态预警模型,并从时间、空间复杂度和模型预测的确诊率三个方面对两种模型的适用性和可行性进行比较分析。

1.1 样本指标的选取与数据收集

构建基于LVQ神经网络和BP神经网络算法的黄瓜黑星病静态预警模型,其基础的工作是进行黄瓜黑星病样本指标的选取和对所选取的样本指标进行数据收集。这两项工作为模型的构建提供数据支持。

1.1.1 样本指标的选取

黄瓜是一种常见的蔬菜,甘甜爽口,清淡香脆,是城镇居民常备的家常菜之一。黄瓜在生长过程中容易发生各种病害而导致减产,如霜霉病、白粉病、黑星病等等。因此,在黄瓜的生长过程中,可通过对当前温度,光照,土壤ph值等环境条件的测量,预测黄瓜得病的可能性而调整当前环境。文中以黄瓜黑星病为例测试模型的性能。此病的病因为瓜疮痂枝孢菌,病菌以菌丝体附着在病株残体上,在田间、土壤、棚架中越冬,成为翌年侵染源,也可以分生孢子附在种子表面或以菌丝体潜伏在种皮内越冬,成为近距离传播的主要来源。病菌在棚室内的潜育期一般3~10天。整个生育期均可侵染发病,幼瓜和成瓜均可发病。幼瓜受害,病斑处组织生长受抑制,引起瓜条弯曲、畸形。该病菌在低温高湿等一系列复合条件下容易发生和流行。一般在2月中下旬就开始发病,到5月份以后气温高时病害依然发生[3-4]。文中选用容易感染此种病害的品种津研四号进行试验[5-6]。经查阅资料可知:黄瓜黑星病发病的因素有土壤ph值,空气相对湿度,温度,光照,黄瓜栽培品种等等。其中土壤ph值,空气相对湿度,温度这三个因素在黄瓜发病过程中起主要作用。致使黄瓜黑星病发病的各因素范围如下:ph值:2.5-7 ; 空气相对湿度:>=90;温度:15℃-25℃。

1.1.2 数据收集

黄瓜黑星病的发病是一个过程,是多个发病因素相互交叉、共同作用的产物。根据黄瓜病害书籍资料,搜集所需的数据。共330组数据,290组数据作为训练集,40组数据作为测试集。290组训练集作为样本数,每个样本数中有三个输入特征数据,即土壤ph,空气相对湿度,温度等三类,所有样本数共分为2个类别,即正常与异常。分别用LVQ神经网络、BP神经网络两种算法测试模型的可行性并对其进行比较分析,为预测模型的选择提供参考。

1.2 LVQ神经网络预警模型

构建基于LVQ神经网络的黄瓜黑星病静态预警模型,测试模型的可行性,并对模型进行优化,进而比较优化前、后的黄瓜黑星病预警模型,分析模型的适用性。

1.2.1 LVQ神经网络思想

LVQ神经网络[7-8](Learning Vector Quantization)是在有“导师”状态下对竞争层进行训练的一种学习算法,属于前向有监督神经网络类型,在模式识别和优化领域有着广泛的应用。LVQ神经网络由三层组成,即输入层、隐含层和输出层,网络在输入层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出层神经元与隐含层神经元的不同组相连接。隐含层和输出层神经元之间的连接权值固定为1。在网络训练过程中,这些权值被修改。隐含层神经元和输出神经元都具有二进制输出值。当某个输入模式被送至网络时,参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争,因而允许它产生一个“1”,而其他隐含层神经元都被迫产生“0”。与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”,而其他输出神经元均发出“0” 。网络结构如图1:

1.2.2 网络创建及测试

在Matlab R2012b的平台上进行预测。建立一个3层的向量量化神经网络函数,隐含层神经元首次尝试设置为15个,学习速率设置为默认值0.01,权值学习函数也设置为默认函数:net=newlvq(minmax(P_train),15,[rate_B rate_M],0.01,‘learnlv1’)。

利用LVQ神经网络算法开始模型训练,训练结束后将会生成相应的神经网络,再通过相关验证数据的输入将计算出的预测值与期望输出进行比较分析,得出相关的结论。40组数据作为测试集进行10次预测,测试结果如表1:

经计算,当隐含层神经元为15个时,正常、异常黄瓜的平均确诊率分别为91.508%、91.05%,平均确诊率高达90%,此设定准确率较高。经过多次运行,运行时间数量级皆为1级。表明LVQ神经网络用于模式识别是有效的,在黄瓜黑星病的预警中具有很大的参考价值和指导意义。

1.2.3 隐含层神经元个数优化

在LVQ神经网络算法基础上,为了得到可靠稳定的模型,提高正确率,可使用带有交叉验证功能的LVQ神经网络程序进行预测。此功能可确定最佳的隐含层神经元个数。常见的交叉验证形式之一为K-fold cross-validation。K次交叉验证,初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练。交叉验证重复K次,每个子样本验证一次,平均K次的结果或者使用其他结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次。在此采用常用的5折交叉验证法进行训练。

每一次网络的训练都会产生不同的最佳隐含层神经元个数,这是由于每次训练集和测试集是由计算机随机产生,且每次训练过程都不相同造成的。经过多次实验,发现隐含层神经元个数在11~20范围内较为适宜。运行一次带有交叉验证功能的LVQ算法程序需要的时间数量级是3级。运行时间较长,但在确诊率上没有明显的改善。因此,带有交叉验证功能的LVQ神经网络模型在确定无交叉验证功能的LVQ神经网络模型隐含层神经元个数范围方面起重要的借鉴作用,但由于其所需预测时间较长,不适用于实际预测的应用。

1.3 BP神经网络预警模型

构建基于BP神经网络的黄瓜黑星病静态预警模型,调整网络参数进行仿真训练,并分析模型的适用性。

1.3.1 BP神经网络思想

BP神经网络[8-10] (Back Propagation)是一种采用误差反向传播算法的多层前向神经网络,其主要特点是信息正向传播,误差反向传播。在传递过程中,输入信号经过输入层、隐含层的逐层处理,直至输出层,若在输出层得不到期望值,则反向传播,根据预测误差调整权值和阈值,使BP神经网络的输出不断逼近预测输出值。网络结构如图2:

1.3.2 网络创建及测试

同样在matlab R2012b的平台上进行预测。在该三层网络中,第一层传递函数默认为‘tansig’, 第二层传递函数设置为‘purelin’,训练函数设置为‘trainlm',隐含层神经元个数设置为10个,输出层神经元为1个。创建该网络,进行训练,仿真并测试返回结果。相关程序为:

net=newff(minmax(P_train),[10 1],{‘tansig’,‘purelin’},‘trainlm’)

net.trainParam.epochs=1000;

net.trainParam.show=10;

net.trainParam.lr=0.1;

net.trainParam.goal=0.1;

net=train(net,P_train,Tc_train);

T_sim=sim(net,P_test);

for i=1:length(T_sim)

if T_sim(i)

T_sim(i)=1;

else

T_sim(i)=2;

end

end

对于多层前馈网络来说,隐层节点数的确定是成败的关键。若数量太少,则网络所能获取的用以解决问题的信息太少;若数量太多,不仅增加训练时间,更重要的是隐层节点过多还可能出现所谓“过渡吻合”问题,即测试误差增大导致泛化能力下降,因此合理选择隐层节点数非常重要。关于隐层数及其节点数的选择比较复杂,一般原则是:在能正确反映输入输出关系的基础上,应选用较少的隐层节点数,以使网络结构尽量简单。隐含层神经元个数选择是一个较为复杂的问题,往往需要设计者多次试验来决定,因而不存在一个理想的解析式来表示。确定隐含层神经元个数方法可参考公式[n2=log2n1]和[n2=2×n1+1](是输入层神经元数,是隐含层神经元数)[11]。对黄瓜黑星病预测实验而言,=3,则网络训练需要从隐含层神经元个数为=1训练到个数为=7。理论上最佳隐含层神经元个数在1~7个左右,但仍需要多次测试来确定。适当增加隐含层神经元个数可以减少训练误差。经验证,当隐含层神经元个数设为7时,进行10次预测,模型测试确诊率较高。如此既保证正确率,又能较节省时间。预测结果如表2:

如表2,经计算,在10次预测中,正常黄瓜平均确诊率为91.511%,异常黄瓜平均确诊率为94.542%。运行时间数量级为0级,速度更快。经多次运行、测试总结可得,BP神经网络模型在准确率上不次于LVQ神经网络模型,在时间上也远快于LVQ神经网络模型。由此看出,BP神经网络算法在黄瓜黑星病的预测过程中,效果更好,参考价值更高。

1.4 两种模型比较分析

算法,是预测黄瓜黑星病的核心。在评价哪种算法更适用于黑星病的预警时,应兼顾时间、空复杂度和确诊率。这两种模型空间复杂度基本相同。相比空间需求,实际操作中,我们更关注程序运行的时间和确诊率。两种神经网络算法在训练预测过程中各有利弊,但预测结果的准确性都高达90%左右。因此,时间开销便成了两种模型适用性的最重要因素。分别运行两种模型20次,得到程序运行的时间开销折线图如图3。由图3可知,运用BP神经网络可快速得到预测结果,在实际运用过程中实时性更突出。

2 总结

本文研究发现两种模型均可用于黄瓜黑星病的预警,模型预测的准确率相差无几高达90%左右。这进一步表明了数据的准确性、指标建立的合理性和模型建立的可行性。也证明把预警应用于设施蔬菜病害方面,利用数据挖掘方法,探寻设施环境条件与病害的关联关系这一构想的合理性和可操作性。

若结合结果的准确率和时间开销,BP神经网络模型在实际的黄瓜黑星病及其他病害的预测过程中比LVQ神经网络模型更胜一筹,具有更高的时效性。

参考文献:

[1] 霍松涛.旅游目的地旅游预警系统研究[D].开封:河南大学,2006.

[2] 邵峰晶,于忠清.数据挖掘原理与算法[M].北京:电子工业出版社,2003.

[3] 王生荣,杨升炯.黄瓜黑星病菌生物学特性及流行规律研究[J].甘肃科学学报,1999,11(3):83-86.

[4] 易齐,王蔚,王传英,等.黄瓜黑星病及其蔓延为害现状[J].植物保护,1987,13(6):40-41.

[5] 许勇,朱其杰.黄瓜黑星病抗病性离体子叶接种鉴定方法[J].北京农业大学学报,1994(1):31-34.

[6] 朱建兰,陈秀蓉.黄瓜品种对黑星病的抗性鉴定结果[J].甘肃农业科技,1998(7):32-33.

[7] 段明秀,何迎生.基于LVQ神经网络的手写字母识别[J].吉首大学学报,2010,31(2):41-43.

[8] 史忠植.神经网络[M].北京: 高等教育出版社,2009.

[9] 王文剑.BP神经网络模型的优化[J].计算机工程与设计,2000,21(6):8-10.

篇5

关键词:人工神经 网络之下 建筑施工 安全评价

前言

建筑施工,在整个城市发展过程当中占据着非常重要的地位的,并且也是推动一个国家城市化的重要基础,但与此同时,建筑施工领域本身也是具有较强的危险性,并且,自身还具有生产流动性大以及产品形式光,施工技术比较复杂等等特点,所以,定期定时的对建筑施工采取合理有效的安全评价,不光是能够在很大程度上提升了建筑施工作业的全面管理水平,还是能够为整个建筑施工的安全性,打下结实的基础保障。

一、训练人工神经网络

训练人工神经网络,其实主要是就通过使用BP算法的神经网络,也是当前被我国各个领域所广泛使用到的一种神经网络,主要是由众多的神经元所组合而成的,包括了输入、隐含、输出等层,其在实际工作运行的过程当中,主要是分成以下步骤:1.学习期。对于此状态下的各个计算单元自身的状态值是不发生任何改变的,但是,在对其网络的连接权进行修改的过程当中,也使得系统的输入、输出之间的呈现出一种映射的关系,也即为函数关系,其主要的目的也是为了能够在最大限度上保证,整个系统实际的输出则是为期望输出。2.工作期,此时各个连接权是被固定的,然后计算单元状态变化以求达到稳定[1]。

在整个模型的输入层单元数即是对安全评价指标数目,则是根据前面分析的建筑施工现场自身的安全评级指标,在其的输入层当中的节点数则是设定在了20,那么对于中间层则是要确认为隐含层,其层数与之所相对应的节点数的选取则是为一个非常具有复杂性的问题,这里主要是因为,在采用不同的内部表象的过程当中,其所需要的内部单元数上,是完全不相同的,所以,这也就意味着,综合评价结果对应的是很安全、较安全、合格、较危险、危险等几种不同的程度的,这里对于输出层的节点数则设定在5,那么其标准的输出模式则是分别在了(1,0,0,0,0)、(0,1,0,0,0)、(0,0,1,0,0)、(0,0,0,1,0)、(0,0,0,0,1)[2]。

二、实力分析

依照于我国某个建筑施工的安全评价指标体系,所选取出二级指标的16个指标,作为整建筑施工事故可能会发生的一些潜在患,然后在对其进行全面综合的分析,以此来有效的判断出,整个建筑施工自身的安全状况[3]。

(一)样本数据的离散化和约简

本文主要重点阐述在使用运用BP进行样本数据的约简,从而通过使用Boolean Reasoning Algorithm的方式,来对整个样本的数据进行离散化,然后在合理的通过使用Genetic algorithm的方式来对整个样本数据,进行属性上的约间,从而使得约简出来的总共多达1700度条规则,然后在以此依照于BP人工神经自身的约减规则,从而有效的选择出了关于LHA自身的覆盖率以及RHS自身的覆盖率等指标,然后在对整个数据集,合理的进行规则上的提取,从而有效的到了30条规则。在通过对于提取规则进行进一步的研究分析,在优先参考我国相关建筑施工人员自身的意见,从而才能够最终的确定好几项指标,是在整个建筑施工安全当中的关键核心要素,即U12U24U32U42U43.在针对于约简前的评价指标当中,主要是存在大约16个左右,在对于训练样本上则是分成了14组,在通过对样本数据离散化以及属性的约简以后,就能够将原本众多的评价指标,逐渐的变为5个,这样也是在最大限度上降低了整个输入空间,也是便于之后简化神经网络结构的展开以及运行,以此提升训练的效率强度[4]。

(二)约简后的样本数据进行预测概述

在这里主要是按照已经被约简之后所得到的属性集,剩下的U12U24U32U42U43这五列数据,便能够很好得的得出了约简以后的神经网络训练的样本。对于这五列数据,均采用三层的BP神经网络结构,在输入层为5个神经元上,在合理的采用以上几种方式,估计出其中所隐含的层节点数为3.以此,有效的计算出其中所隐含的层节点数的设置,在将这些数值求出总体的平均值。

三、结果

在合理的通过对于建筑施工安全相关的指标体系的研究,并且,主要依照于建筑施工自身的实际,在合理的通过使用安全系统的整体工程原理,在立足于人、机器、环境、管理等几方面上,对其更进一步的研究,从而有效的确定出了建筑施工安全的16个评价指标。在基于人工神经网络之下的建筑施工安全评价模型,也主要是将粗糙集作为整个神经网络自身的前段处理器,主要将其应用在了有效缩减整个神经网络学习过程当中的一些学习样本,这样做也是为了能够在最限度上满足于简化神经网络结构所对其提出的各种要求,不仅如此,还合理的利用BP神经网络,并且,自身也是具有较强的预测精准度的。在利用人工神经网络下的建筑施工安全评价模型当中,也是对我国各个实际建筑施工工程自身的安全状况,进行了及时有效的安全评价,其所显示出来的结果也是完全与建筑施工工程自身的实际情况所想符合[5]。

四、结论

只有真正的增强人工神经网络下的建筑施工安全评价的重视度,才能够在最大限度上提升我国建筑施工的安全以及稳定性。

参考文献:

[1]袁宁,杨立兵.基于粗糙集-人工神经网络的建筑施工安全评价及应用[J].安全与环境工程,2012,01:60-64.

[2]张文博,宋德朝,郑永前.基于人工神经网络的建筑施工安全评价[J].工业工程,2011,02:

75-79.

[3]宋飞,许程洁,吴红霞. 基于改进BP神经网络的建筑施工安全评价[J].工程管理学报,2011,

06:629-632.

[4]徐平. 基于BP神经网络的建筑施工现场安全评价研究[J].江苏建筑,2013,02:63-64+69.

篇6

关键词:中小企业 营销风险 神经网络

中图分类号:F273 文献标识码:A

文章编号:1004-4914(2011)11-270-02

随着中小企业内、外部环境的复杂化,中小企业面临的营销风险不断上升,这不仅影响着中小企业的正常经营,而且严重制约着中小企业的发展。然而,由于中小企业面临的营销风险受到很多因素的影响,因而要加强对中小企业营销风险的管理,使企业有效地衡量其面临的营销风险水平,就必须对其进行科学而准确的评价与定量分析。

目前,我国对于营销风险管理的研究还处于起步阶段。国内一些学者对营销风险的定量评价进行了相关研究,其中应用较为广泛的包括层次分析法、模糊综合评价法、BP算法等。但这些评价方法均存在一定不足,主要表现为:一是在评价中的随机因素影响较多,评价结果易受评价者主观意识的影响及其和经验、知识的局限,易带有个人偏见和片面性,主观性较强;二是神经网络(ANN)采用BP算法对网络进行训练时,学习过程收敛速度慢,容易陷入局部极小点,特别是当学习效率设置高时,可能产生震荡;三是BP算法的健壮性不好,网络性能对网络的初始设置比较敏感。为此,笔者根据Elman神经网络的特点,利用其非线性与泛化的能力,建立了一个基于Elman神经网络的中小企业营销风险识别及评估模型并进行了实证研究。

一、Elman神经网络理论基础

Elman神经网络是一种典型的动态回归神经网络,一般分为4层,即输入层、隐层、承接层和输出层。其输入层、隐层、输出层的连接类似于前馈网络,输入层的单元仅起着信号传输的作用,输出层单元起线性加权作用。隐层单元的传递既可采用线性函数也可采用非线性函数,承接层用来记忆隐层单元前一时刻的输出值。神经网络的非线性状态空间表达式为:

Y(k)=G(w3X(k))

X(k)=F(w1Xc(k)+w2(U(k-1))(1)

Xc(k)=X(k-1)

式中:Y,X,U,Xc分别表示m维输出结点向量;n维中间层结点单元向量;r维输入向量和n维反馈状态向量;w3,w2,w1分别表示中间层到输出层、输入层到中间层、承接层到中间层的连接权值;G(・)为输出神经元的传递函数,是中间层输出的线性组合;F(・)为中间层神经元的传递函数,采用逻辑斯蒂函数。

二、基于Elman神经网络的中小企业营销风险识别模型的分析及建立

(一)神经网络模型的构建

本文建立的神经网络营销风险评估模型的任务是完成营销风险评估指标和营销风险等级之间的映射。建立合理的营销风险评估模型,一方面需要解决营销风险评估指标的权值问题,另一方面需要探索营销风险评估指标和营销风险等级之间的映射规则。

神经网络的结构是通过神经元的特性以及网络中神经元连接的特性来定义的。对于营销风险评估模型可以用Elman神经网络模型的输入和输出节点数以及隐含层数量和各隐含层节点数来表示。在评估模型的网络结构中,输入节点的数量可以比较直观地得到,它就是营销风险评估指标的数量。评估模型的输出节点数可以是一个,也可以是多个,对于分类模型,输出节点数量和分类的类别数量有关,假定营销风险等级分为m个级别,则评估模型的输出节点数量可以为m或log2m。在很多情况下,为了简化网络结构,提高模型的训练效率,可以将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型。按照这个原则,本文对评估模型的输出进行简化,首先,将营销风险等级分为5个级别,即1级风险为优良状态(无险)、2级风险为正常状态(轻险)、3级风险为中度风险状态(中险)、4级风险为高度风险状态(重险)、5级风险为危急风险状态(巨险);其次,参照营销风险评分的方法,将评估模型的输出转换为一个连续型的变量,变量的不同取值范围对应不同的风险等级。

隐含层节点数的确定一般遵循以下经验法则:较好的隐含层节点数介于输入节点和输出节点数量之和的50%至70%之间;隐含层节点数m必须小于N>1(其中N为训练样本数)。为了得到评估模型的合理的隐含层节点数,本文将根据以上经验法则,确定隐含层节点数的一般范围,然后在该范围内,采用扩张法,通过反复的实验确定合理的隐含层节点数。

(二)模型求解速度和误差界值分析

对于Elman神经网络模型,模型的求解速度等价于BP学习算法的收敛速度,一般用达到指定误差精度时的学习次数表示,它受多种因素影响,包括模型本身的结构、样本数据的数量和数据特点、模型的初始权值以及模型的学习参数等。

对Elman神经网络算法训练速度的影响参数有学习率η、动量因子α和收敛误差界值E(w)等,对于学习率必须小于某一上限,取0

在评估模型训练之前,应根据实际情况预先确定误差界值E(w),误差界值E的选择完全根据评估模型的收敛速度大小和具体样本的学习精度来确定。E值的选择必须在分类精度和训练效率之间权衡,当E值选择较小时,评估模型分类精度高,但收敛速度慢,训练次数增加;如果E值选择较大则相反。本文在综合考虑评估模型的收敛速度和分类精度的前提下,采用变学习率和加动量项相结合的方法以改进评估模型的训练效率,学习率η取0.8,动量因子α取值0.9,误差精度E(w)设为0.001。

三、模型的实证分析

(一)指标和样本数据选取

根据营销环境引起的中小企业营销风险的实际,中小企业营销风险评估指标主要包括营销人员风险、市场竞争风险、顾客风险、产品销售风险、供应商风险、营销组织管理风险6个方面。由于我国中小企业的营销系统还没有实现信息化,对营销风险相关数据的统计工作没有很好的开展;直接针对营销风险工作的统计数据还非常少,无法直接加以利用。因此,本文采取参考已完成的同类研究的相关数据作为模型的样本数据。

(二)实证分析

确定中小企业营销风险评估模型结构为43×m×1,训练样本数量为50。根据隐含层节点数介于输入节点和输出节点数量之和50%~70%之间的规则,隐含层节点数m的取值范围大约为22

本文采用Matlab工具完成营销风险评估神经网络模型的研究和验证工作。从神经网络模型输出结果可以看出,对于全部50个训练样本,其分级准确率为89.1%。因此,该模型可以满足中小企业评估营销风险的要求,并且具有很高的精度和很快的收敛速度。

四、结论

通过分析得出以下结论:

1.通过建立基于Elman神经网络的中小企业营销风险评估模型来对中小企业进行营销风险分析是切实可行的,而且其判别准确率比较高。

2.Elman神经网络的非线性与泛化的能力能够适于中小企业营销风险分析过程中的复杂性和实际情况下的高度非线性,对中小企业面临的不同营销风险能够较准确地识别和评估。

参考文献:

1.张云起,赵国杰,梁文东.基于优化BP神经网络的营销风险衡量与控制[J].西北农林科技大学学报(社会科学版),2006(2)

2.李轶敏.工业企业营销风险预警指标体系及综合评价方法[J].时代经贸,2007(58)

3.张兰霞,周蓉姿,王俊.基于BP网络企业营销风险预警模型[J].企业管理,2004(7)

4.谢庆国,沈轶.Elman人工神经网络的收敛性分析[J].计算机工程与应用,2002(6)

篇7

欧阳亮(1984―),女,湖南大学工商管理学院(长沙,410082)。研 究方向:金融工程与风险管理。

[关键词]汇率预测;汇率波动;神经网络

汇率作为一个重要的经济变量,其变动对国民收入的增减、工农业的发展、国内利率、就业 等各方面都有着重要的影响。因此,汇率预测受到广泛的关注,大量的计量经济模型和时间 序列模型被用于汇率预测。其中,人工神经网络(Artificial Neural Networks, ANN)作为 一种非参数的数据驱动型的方法,不需要对数据特征进行事先假设,通过合理的样本训练, 学习专家的经验、模拟专家的行为,并引入非线性转换函数来求解各种复杂的非线性问题, 具有很强的模式识别能力和高速信息处理能力,从而在时间序列数据预测方面有独特的优 势。[1]

利用神经网络方法预测汇率波动,国内外学者已经进行了比较广泛的研究。总结国内外学者 的研究成果,用神经网络预测汇率有3个层次。它们分别是同质神经网络模型、 异质神经网络模型和神经网络组合模型。

一、汇率预测的同质神经网络模型

同质神经网络预测模型是用神经网络根据历史汇率数据来预测未来汇率,这是作为一种汇 率预测的非参数方法提出来的。由于汇率波动具有非线性相关性和 长效记忆性,因此通过历史数据进行汇率预测是一种可行的方法。同质神经网络预测模型认 为;汇率有一个隐含的生成机制,历史汇率和未来的汇率都由这个机制生成,通过对历史数 据的观测,识别这个生成机 制,就可用这个生成机制预测未来的汇率。由于神经网络是一个数据驱动的自适应的非参数 方法,不基于假设,即使产生数据的过程是未知的,或者很复杂,神经网络也能识别。

用同质神经网络进行汇率预测,是根据汇率的历史数据加上输入延迟来预测汇率的变化或变 化趋势。用于汇率预测的神经网络模型很多,其中最常用的是多层后向神经网络模型,即BP 神经网络。BP神经网络一般采用三层结构:输入层、隐含层、输出层。BP神经网络的算法 和训练如图1。

以t时刻汇率种类R的预测为例,滞后期为n,预测长度为L。输入层的数据是从时刻t开始前n 期的历史汇率观测值序列,yt,…, yt-n,输入才由长度n的滑动窗口产生。输出层 依次输出从t时刻开始的L个汇率预测值,yt+1,…, yt+L。相邻汇率的时间间 隔是等长的。汇率预测的同质神经网络模型的结构如上图2。

用同质神经网络预测汇率的研究很多,1993年,Refenes等人采用神经网络方法预测汇率变 动,他们将数据分成训练组(Training Subsample)、测试组(Testing Subsample)和预测组( Forecasting Subsample),先用训练组和测试组数据训练神经网络,然后用预测组数据进行 预测,这种尝试以及随后的评议肯定了神经网络在一定的情况下比“标准”的预测方法表现 要好。[2]Kuan和Liu(1995)用神经网络对5个不同币种兑美元的汇率进行预测。这5 种货币包括英镑、加拿大元、德国马克、日元以及瑞士法郎。研究发现神经网络对日元和英 镑的预测的均方差(MSE)很低,但对其余3个币种的预测效果一般。[3]De Matos(19 94)通过对日元期货预测比较了多层后向神经网络(MLFN)和重复网络的预测效果。[4]Zhang和Hu(1998)用多层后向神经网络对英镑和美元的汇率进行预测,发现神经网络的预 测效果明显优于线性模型,尤其在预测期比较短的时候。[5]

虽然研究表明神经网络的预测效果比其他方法好,但是其预测精度和可靠性仍然不尽人意。 对此,学者们对神经网络进行了改进,提出了诸如聚类神经网络、重复神经网络、广义回归 神经网络、模糊神经网络等经改进的神经网络进行汇率预测,或者将其他方法与神经网络结 合,以改善神经网络的预测能力。例如,Shazly等(1999)用遗传算法训练神经网络的权值。 惠晓 峰和胡运权等(2002)结合遗传算法,提出了基于实数编码的GA-BP神经网络汇率预测人民币 兑美元汇率的模型。姚洪兴, 盛昭瀚和陈洪香(2002)提出了一种改进的小波神经网络结构。

这些研究在一定程度上提高了神经网络的预测效果,但是神经网络的结构、训练算法、阀值 函数的选择以及滞后期的确定等问题仍然难以解决。而且,汇率由历史汇率唯一决定这一 前提也缺乏足够的理论支持。

二、汇率预测的异质神经网络模型

用异质神经网络模型进行汇率预测,是指在预测过程中,考虑影响汇率的各种因素,如利率 、通货膨胀率、原油价格、货币供应、贸易收支差额、消费价格指数、消费信心指数等,根 据这些影响因素来预测汇率。Shazly(1997)选取一个月欧洲美元存款利率、一个月欧洲外币 存款利率、即期汇率 和一个月的远期汇率作为输入变量,预测一个月后的即期汇率。结果表明,神经网络的预测 效果比通过远期汇率进行的预测效果要好。[6]杨火斤 和马洪波(1999)选取GNP、CPI、工业股 票价格指数、短期利率、货币供应量、长期利率6个影响因素,将这些变量作为神经网络的 输入变量,训练神经网络根据这些变量预测汇率。[7]Hui Xiao-feng等(2005)也用 模糊神经网 络进行汇率预测,输入的变量包括两国的CPI和GDP、两国的利率差、货币供应比、净出口额 等。[8]

异质神经网络模型的网络结构和训练算法与同质神经网络相似。区别在于同质神经网络的输 入是一段时滞的历史汇率数据,是一维的数据,而异质神经网络的输入数据是多个变量的数 据,是二维的数据。令x1, x2,…, xn分别表示影响汇率变动的各个因素,异质神经 网络的结构如图3所示。

图3 异质神经网络模型

随着布雷顿森林体系的崩溃,各国纷纷采用浮动汇率制度,影响汇率变动的因素更加多样化 、复杂化,难以确定。因此,学者们开始用神经网络与其他预测方法结合使用。一种是与基 本因素分析模型如购买力平价模型、利率平价模型等相结合。根据这些模型确定的影响因素 作为神经网络的输入变量,通过神经网络训练优化变量的权值,从而进行汇率预测。例如, Qi和Wu(2003)用基于货币理论的神经网络对英镑和马克1个月、6个月、12个月的汇率进行预 测,输入变量为货币供应量M1,各个国家的实际工业生产收入、利率作为输入变量。Lee和W ong(2007)用微观结构理论和宏观经济的6个变量作为神经网络的输入,预测汇率波动。

另一种方法是用神经网络与协整方法结合。先通过协整分析确定影响汇率变动的因素,再用 神经网络确定各变量的权值。Inc和Trafalis(2006)构建了一个结合协整方法和人工神经网 络的汇率预测模型方法,先用协整方法确定对汇率有影响作用的变量,然后用ANN对这些变 量进行非线性组合,预测汇率。[9]

异质神经网络模型将汇率视为整体经济系统中的一个变量,汇率波动受众多因素的影响,因 此汇率的波动是根据这些影响因素的波动来预测的,与同质神经网络模型相比有更强的理论 支持。但是,它的预测效果取决于影响因素的选择,因此汇率的影响因素的选择是异质神经 网络预测模型的关键。

三、汇率预测的神经网络组合模型

神经网络进行汇率非线性组合预测是一个两步组合预测模型。Bates和Granger(1969)证明了 预测方法的线性组合比单模型能产生更小的误差。[10]此后,一些学者在这方面做 了很多研 究。在众多的组合方法中,神经网络非线性组合是最广泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型预测条件波动,并对这些预测值分别进行线形和非线性组合,结果表明 用神经网络进行非线性组合的预测效果是最好的。[11]Tseng等(2002)用BP神经网 络和时间 序列模型――SARIMA模型进行组合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)对汇率进行线性预测,再用神经网络处理SARMIA模型预测的残差,进行汇率预测 。[12]用同样的方法还有Zhang(2003)用ARIMA和ANN组和对英镑和美元汇率进行预 测。[13]Yu, Wang和Lai(2005)组合广义线性自回归模型(GLAR)和神经网络进行 汇率预测。[14]

用神经网络对汇率进行非线性组合预测时,是将汇率数据分解成线性部分和非线性部分。先 用基本因素模型或者参数模型对汇率进行第一步预测;然后用神经网络对第一步预测残差进 行非线性组合;再根据两步的预测结果进行汇率预测。或者用神经网络对不同的参数模型的 预测结果进行非线性组合。下面以神经网络和ARIMA模型的非线性组合为例,说明神经网络 组合模型的基本原理。

(3)用神经网络mode残差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)

其中,f表示神经网络的预测的非线性函数,et是随机误差。

(4)组合ARIMA和神经网络:[AKy^]=[AKl^]+[AKn^]t[JY](5)

神经网络组合模型使用神经网络和线性方法进行非线性组合,考虑了汇率作为一个复杂系统 同时具有线性和非线性特征的实际,充分利用了参数方法和非参数方法的优势,并综合了各 种汇率理论的分析结果。大量的实际研究表明,组合预测的效果比单独用线性模型或单独用 神经网络预测的效果要好。

四、比较与结论

同质神经网络预测模型是根据历史数据进行汇率预测,是用一维的数据训练神经网络。它没 有 考虑汇率作为经济系统中的一个变量,受到众多因素的影响,而仅仅把汇率视为一系列没有 经济含义的无规则数据。而异质神经网络模型则把汇率视为复杂经济系统中的一个变量,认 为在统计上无规则的汇率数据是由众多因素共同决定的。异质神经网络模型用二维数据进行 训练,与同质神经网络模型相比,其预测有更充分的理论支持。但是,影响汇率的因素至今 没有定论也没有统一的选取法则。

同质神经网络预测模型和异质神经网络预测模型都将汇率视为单纯的非线性变化的时间序列 ,而实际汇率的波动不是单纯的线性或非线性的,而是同时包含线性和非线性模式,因此单 纯的线性模型和非线性模型都不能很好地预测汇率。而神经网络组合预测模型则与前两种方 法有本质的不同,它同时考虑了汇率的线性和非线性特征,在线性预测的基础上再进行非线 性组合,充分利用参数方法和非参数方法的优势。一方面,研究表明线性预测有很多效果很 好 的方法,如ARIMA,GARCH等参数模型;另一方面,这些模型都基于很强的假设条件,不同的 条 件下预测效果有很大差别。因此,在实际预测时候,很难确定某个模型比其他模型有更好的 样本外预测效果。最优模型的选择是件很困难的事情。用神经网络组合模型,避免了 最优模型选择的问题,又综合了不同的汇率理论的分析结果。

另外,同质神经网络预测模型和异质神经网络预测模型都是单模型的一步预测的方法,研究 表明单一的模型往往只能适应某一特定的情况或者反映一部分的信息,而实际汇率是一个复 杂的系统,组合不同的参数模型或者参数模型不同参数的预测结果,能够较大限度地利用各 种预测样本信息,比单个预测模型考虑的问题更系统、更全面,从而提高了预测的精度。

自2005年7月21日起,中国实行汇率改革以来,央行入市干预的力度明显减弱。由市场供求 关系决定的人 民币汇率受到众多因素的影响,波动幅度较以往明显加大。用神经网络组合模型对人民币汇 率进行预测,充分考虑了汇率波动的复杂性。结合线性方法和非线性方法的优势,能抓住汇 率波动的线性和非线性特征,并能全面挖掘和反映样本信息,有较好的样本外预测效果。因 此,神经网络组合模型是人民币汇率预测的最佳选择。

但是,用神经网络组合模型进行汇率预测也存在一些难以解决的问题。首先是神经网络自身 的优化问题,如隐藏层数及隐藏层结点数的确定、激活函数的确定、局部最优等,神经网络 的结构直接影响着预测效果。其次,在神经网络进行组合预测时,如何选择被组合的模型以 及模型的个数,是另外一个难以解决的问题。第三,神经网络可以根据残差最小的原则不断 地调整参数来改变预测效果,但是它不能改变输入数据,而汇率数据往往是剧烈波动,存在 噪音的。因此,如何对数据进行除噪,优化神经网络的输入数据是另一个值得研究的问题。

主要参考文献:

[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.

[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.

[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.

[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.

[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.

[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.

[7]杨 火斤, 马洪波. 人工神经网络在中长 期汇率预侧中的应用[J]. 系统工程, 1999, 17(1): 18-24.

[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.

[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.

[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.

[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.

[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.

[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.

[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.

Forecasting Exchange Rate with ANN: A Comparative Anal ysis

Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.

Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN

篇8

[关键词] 工作岗位;BP神经网络;系统设计

[中图分类号] F240 [文献标识码] A [文章编号] 1006-5024(2007)12-0030-04

[基金项目]安徽省高校青年教师科研资助计划项目“人工神经网络在工程评价中的应用”(批准号:2004jq143);安徽理工大学 青年科学基金资助项目“基于人工神经网络的综合评价系统设计”(批准号:2007jg12)

[作者简介] 汪克亮,安徽理工大学教师,硕士,研究方向为综合评价、决策分析;

杨 力,安徽理工大学副教授,硕士,研究方向为系统工程、复杂系统建模;

查甫更,安徽理工大学教师,硕士,研究方向为环境质量评价。(安徽 淮南 232001)

人力资源是企业中最宝贵的资源,对企业的生存、发展和竞争力的不断提高都起着至关重要的作用。人力资源的培育、开发与利用,不仅成为经济增长的决定性因素,而且直接构成企业核心竞争力的关键性战略资源。作为人力资源管理的一个重要组成部分,工作岗位评价是建立在工作说明书的基础上,综合运用多种学科的理论和方法。即它是按照一定的客观标准,从工作岗位的环境、劳动强度、承担责任、所需资格条件等因素出发,对工作岗位进行系统的衡量和评价,在定性的基础上进行定量测评,以量值来表现工作岗位特征,使得性质相同、相近的岗位具有统一的评判、估价标准。这种评价方法可以比较出岗位与岗位之间的相对价值大小,从而可以将员工在企业中的作用和贡献量化,为企业岗位归级、分类等工作奠定基础,为建立公平合理的薪酬制度提供客观依据。

对工作岗位进行评价的方法很多,传统的方法有排列法、分类法、评分法、因素比较法,等等。实践证明,这些方法都具备一定的合理性,但是还不够完善。这是由于评价指标的量值和权重的确定都是依据评估人员的经验进行的,主观性强,缺乏客观性,这样就在很大程度上使得评价结果缺乏公平性、科学性,从而进一步影响到薪酬制度的公平合理性。近年来出现的人工神经网络(Artificial Neural Network,简称ANN)因其广泛的自适应、自学习和强大的非线性映射能力,在多变量非线性系统的建模方面有着广泛的应用。BP神经网络(Back-Propagation Network)是目前在各领域中研究和应用最广泛的人工神经网络,体现了人工神经网络理论与应用中最精华的部分,它擅长的是处理那种规律隐含在一大堆杂乱无章数据中的映射逼近问题。由于工作岗位评价系统是由评价指标、评价标准、评价技术和方法等一系列子系统组成的复杂非线性系统,作为一种处理复杂非线性系统问题的有效工具,本文尝试利用BP神经网络来设计工作岗位评价系统,为定性和定量评价工作岗位提供一条新的思路。

一、工作岗位评价指标体系的建立

1.选择评价指标的原则

要对工作岗位进行公平合理的评价,前提是要建立科学的评价指标体系。因为工作岗位评价不仅要明确工作状况和工作量的差异,而且要满足企业人力资源管理基础工作的需要,促进人力资源管理工作的发展。因此,必须在决定工作岗位工作状况和工作量的众多因素中选择合适的因素,进行全面、科学的评价。对于评价指标的选择,应该考虑以下三个原则:

全面性。评价指标的全面性是进行科学评价的基础,评价指标应该能够全面地反映工作岗位的工作状况和工作量,体现不同岗位的工作差别,反映出岗位工作对企业的贡献。

可评价性。评价指标的可评价性主要体现在两个方面:一是指在目前企业的工作实际中,运用现有的技术和方法,能够对评价指标进行测定或评定,作出评价;二是指对每一个评价指标都能够按照统一的评价标准作出独立的评价,最好是能作出定量评价。

实用性。主要是指在选择评价指标的时候,选择那些对企业的人力资源管理工作有用、能促进企业人力资源管理工作发展的因素作为评价因素。这样可以使得评价结果能够直接应用于企业人力资源管理实践。

2.工作岗位评价指标体系

工作岗位评价的内容非常广泛,影响因素众多,我们经过深入调研,密切联系实际,依据上述的选择原则,共建立5个一级指标:劳动技能、劳动责任、劳动强度、劳动环境、社会心理因素。每个一级指标又由若干个二级指标组成,一共22个二级指标,这些指标既能全面体现企业岗位的工作状况和工作量,又能应用目前的技术和知识进行评定和测量,使岗位的具体工作抽象化、定量化,从而产生可比性。建立的评价指标体系如表1所示。

二、BP算法及其改进

1.BP神经网络

人工神经网络是人工智能的一个重要部分,人工神经元是人工神经网络的基本处理单元。它是一个近似模拟生物神经元的数学模型,通过与其相连的神经元接收信息。根据网络中神经元的连接方式,神经网络可以分为前向网络、反馈网络和自组织网络三种基本类型。

BP网络,又称为误差反向传播网络,是一种典型的前馈网络。它具有三层或三层以上的阶层,其各层之间各神经元实现完全连接,而每层的神经元之间无连接。BP网络主要是由输入层、隐含层、输出层组成,各层之间实现完全连接。输入信号从输入层节点输入,依次传过各隐含层节点,然后传到输出节点。实践已经证明了三层BP网络可以以任意精度逼近一个连续函数。

2.BP算法

BP网络所完成的信息处理工作,从数学意义上讲是利用映射训练样本(x1,y1),(x2,y2),…(xk,yk)…,实现从n维欧氏空间子集到f[A]的映射。BP网络的学习过程是由正向传播和反向传播两部分组成。在正向传播过程中,输入样本从输入层经过隐含层处理并传向输出层,每一层神经元状态只影响下一层神经元状态,如果在输出层得不到期望的输出,则转入反向传播。此时,误差信号从输出层向输入层传播并沿途调整各层之间的连接权值以及各神经元的偏置值,以使误差信号不断减小,经过反复迭代,当误差小于允许值,网络的训练结束。BP网络具体的学习过程按以下步骤进行:

(1)置各权值或阈值的初始值:Wji(0),θj(0)为小的随机数值。

(2)提供训练样本:输入矢量Xk,k=1,2,…,P;期望输出dk,k=1,2,…,P;对每一个输入样本进行下面(3)到(5)的迭代。

(3)计算网络的实际输出及隐含层单元的状态:

okj=fj(∑wjiokj+θj),其中f(x)为转移函数,采取Sigmoid函数,即

(4)计算训练误差:

δkj=okj(1-okjj)(tkj-okj) (输出层)

δkj=okj(1-okj)∑δkmwmj(隐含层)

(5)修正权值和阈值:

wkj(t+1)=wji(t)+ηδjoki+α[wji(t)-wji(t-1)]

θj(t+1)=θj(t)+ηδj+α[θj(t)-θj(t-1)]

(6)当k每经历1至P后,判断指标是否符合精度要求:

E≤ε; ε:精度。

(7)结束。

3.BP算法的改进

传统的BP网络把一组样本的输入/输出问题变为一个非线性优化问题,使用了优化中最普通的梯度下降算法。BP算法在应用中最突出的优点是具有很强的非线性映射能力,网络的隐含层数、各层的神经元数以及网络的学习系数都可以根据具体情况任意设定,对问题的识别具有很强的功能,对于复杂的非线性模型仿真从理论上来说可以达到任意小的程度。在实际预算中,标准BP算法存在着收敛速度慢和容易陷入局部极值两个重要问题。为此,我们以如下两项措施来改进BP算法。

(1)学习率自适应调整。标准BP算法收敛速度慢的一个重要原因是学习速率不当。学习率太小,收敛太慢;学习率太大,则可能导致振荡甚至发散。我们采用学习率的自适应调整,即当连续两次迭代其梯度方向相同时,表明下降太慢,将步长加倍;而当连续两次迭代其梯度方向相反时,表明下降过头,则步长减半。

(2)加动量项。标准BP算法在修正w(t)时,仅按照t时刻的瞬时负梯度方向进行修正,没有考虑以前时刻的梯度方向,从而使学习过程常常发生振荡,收敛很慢。我们加动量项的目的是为了降低网络对误差曲面细节的敏感性,从而抑制网络限于局部极小。

改进后的权值修正公式为:

w(t+1)=w(t)+α(t )[(1-η)d(t)+ηd(t-1)]

α(t)=2λα(t-1)

λ=sign[d(t)d(t-1)]

式中:α(t)为学习率,为k时刻的负梯度,η为动量因子,0≤η≤1。

三、基于BP神经网络的工作岗位评价系统设计

1.评价指标的标准化

由于工作岗位评价涉及到一系列的指标,有定性指标和定量指标,各个评价指标的量纲也不一样。因为根据BP网络的特点,输入节点数据的取值范围应该是[0,1],所以,必须对评价指标进行标准化处理。

(1)定量指标

对于评价指标ui,其中mi和Mi分别为评价指标ui的最小值和最大值。设ri为决策者对评价指标ui的属性值xi的无量纲化值,且ri∈[0,1]。根据评价指标的类型,可采用下列两种无量纲化标准函数:

当目标越大评价越好时,

当目标越小评价越好时,

(2)定性指标

在该评价指标中,大部分是一些不能直接量化而只能进行定性描述的指标,可以采用确定指标评价等级隶属度的方法来实现其量化。其方法是:设Ui为定性评价指标,Ui相对于评价集A=(α1,α2,…,αn)的隶属度向量为:ri=(ri1,ri2,…,rin)。此处隶属度向量可采用专家调查的方法,并通过集值统计方法来确定,或者可以通过模糊数学中确定隶属函数的方法来确定。另外,一种最简单的方法就是直接利用专家打分的方法来确定,评分时专家充分审核、分析每个工作岗位的影响因素,给出各个评价指标评分值,取值范围是[0,1]。但是,为了保证与定量指标的可比性,可以根据上面定量指标的处理方法,将得到的评分值进行标准化处理后再作为神经网络的输入。

2.系统结构设计

实践证明,具有单隐层的BP网络可以逼近任意连续函数。本文设计了一个三层BP网络来模拟工作岗位评价系统的评价过程。其中,将评价指标的标准化值作为网络的输入向量,所以,本文中输入节点共有22个,输出节点为1个,输出值为工作岗位评价结果,即工作岗位相对价值的量化值。由于输入向量和输出向量之间不满足线性关系,因此,选择单极性的sigmoid函数作为转移函数。另外,隐含层的节点数也直接影响到网络的性能。对于隐含层节点数的确定,我们可以采用经验公式:Pm= Pn+r+L,其中,Pm、Pn、r分别为隐含层、输入层、输出层的神经元数目,L为1-10之间的一个整数。可以采取对比实验的方式来选择最佳隐含层节点的数目。采用改进BP的算法来进行学习,根据学习时间及次数与达到全局误差的综合效果来看,6个隐含层神经元比较合适。

以技术知识要求、质量责任等22项工作岗位评价指标的标准量化值作为网络输入向量,用X=(xi,x2,…,x22)表示;隐含层节点用向量Y=(y1,y2,…,y6)表示;O=(o1)表示输出向量,根据转移函数的性质,o1∈[0,1],是工作岗位的综合评价值,用S∈[0,1]来表示,分值越大,则表明该工作岗位的相对价值越高;反之,相对价值就越低。 将训练集的实际输出数据转换为[0,1]的数值,期望输出用T=(t1)表示。 输入层节点到隐含层节点的权值用向量V=(v1,1,v1,2,…,v22,6)表示,隐含层节点到输出层节点的权值用向量W=(w1,1,w2,1,…,w6,1)表示。对于隐含层有:

yj=f(∑vijxi) (j=1,2,…,6)(1)

对于输出层有:

oj=f(∑wj1yj)(2)

这样(1)、(2)两式就建立了工作岗位评价系统。系统结构图如图1所示:

3.网络训练样本的获得

神经网络要具有评价功能,必须经过一定数量样本数据的训练。所以,获得适当数量的训练数据是进行网络训练的前提。选取某个企业的20个工作岗位作为实证分析的对象,即神经网络的训练单元。其中,将该企业的20个工作岗位的22项评价指标的专家打分值作为训练单元的输入数据,而以相应工作岗位的评价值作为网络的期望输出。对于网络期望输出结果的获得,我们可以采取常用的层次分析法(The Ana-lytic Hierarchy Process,简称AHP),这种方法是由美国著名的运筹学家T.L.Saaty于20世纪70年代提出的一种以定性与定量相结合的系统化、层次化决策分析方法。层次分析法的原理是把复杂的问题分解为各组成因素,将这些因素按支配关系分组,以形成有序的递阶层次结构。通过两两比较判断,确定每一层中因素的相对重要性,建立判断矩阵,通过矩阵的最大特征值与特征向量的计算,得出该层要素对于上层准则的权重。利用层次分析法,不仅可以得出每一个工作岗位评价指标对于工作岗位相对价值的权重,而且可以将每一个评价指标的评分值与指标权重加权相加,得出每一个工作岗位的综合评价值,该评价值就能作为网络的期望输出。这样采用层次分析法,便能获得训练样本与仿真样本。

4.网络训练与系统仿真

获得了网络训练样本数据,再对网络进行训练。我们将编号为1-15岗位数据作为训练单元输入BP神经网络,给定的学习精度为ε=0.0001,初始学习速率为0.05,每个训练样本岗位的综合评价值作为网络期望输出。采用Matlab 7.0神经网络工具箱对网络进行训练,当训练误差达到了精度要求,训练停止。将编号为16-20的样本岗位作为仿真样本来检验网络的评价和预测精度,发现网络的仿真结果同样本的评价结果非常接近,如表2所示。这一点表明该网络具有很好的泛化能力,采用BP神经网络建立工作岗位评价系统是完全可行的。

四、结束语

工作岗位评价是企业人力资源管理工作的重要内容,对工作岗位进行科学、客观的评价,是确定公平、合理的薪酬制度的基础,这一点对于提高员工工作积极性和保持企业活力都具有很重要的意义。本文在建立工作岗位评价指标体系的基础上,采用BP神经网络来设计企业工作岗位评价系统,利用BP神经网络自身强大的非线性映射能力和很强的自学习性、自适应性和容错性,能够充分地挖掘出样本评价指标中有关规律和信息,揭示影响工作岗位相关因素的内在作用机制,有效地克服评价过程中人为确定标准值和权重的主观性因素的干扰,并且针对BP网络收敛慢、容易陷入局部极小的缺点,采取了加动量项和学习率自适应调整的方法进行改进,以弥补BP网络的缺陷,更能够体现工作岗位评价的科学性和客观性。仿真试验表明,该评价系统取得了令人满意的结果。在实际应用中,为了保证系统评价的有效性,应该对系统进行必要的修改和调整,对系统的运行状况进行检查和控制,力求系统达到准确、高效、易操作及具备良好的适应性。只要做好以上工作,基于BP神经网络的工作岗位评价系统就能够成为企业人力资源管理的有效工具。

参考文献:

[1]沈世镒.神经网络系统理论及其应用[M].北京:科学出版社,1998.

[2]焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1993.

[3]安鸿章.工作岗位的分析技术与应用[M].天津:南开大学出版社,2001.

[4]安鸿章.工作岗位研究原理与应用[M].北京:中国劳动出版社,1998.

[5]李永杰,李强.工作分析理论与应用[M].北京:中国劳动社会保障出版社,2005.

[6]赵曼.人力资源开发与管理[M].北京:中国劳动社会保障出版社,2002.

[7]石全涛.现代人力资源开发与管理[M].上海:上海交通大学出版社,1999.

[8]杨力.基于BP神经网络的城市房屋租赁估价系统设计[J].中国管理科学,2002,(10).

[9]张新红,郑丕谔.基于神经网络的管理信息系统综合评价方法[J].系统工程学报,2002,(5).

篇9

关键词:BP神经网络;广义回归神经网络;量子粒子群算法;水质预测

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)23-5373-04

在水产养殖中, 水体环境直接影响到养殖水产品的产量及质量,渔业健康养殖要求能够对水质的变化进行实时的监控及预测预警。物理、生物及化学等多方面因素会对养殖环境的水质产生影响,其主要包括:水温、PH值、溶解氧含量、硝氮含量、氨氮含量等。作为水质预测预警的工具,水质预测模型的研究一直受到各国专家学者的广泛关注。国内外已有不少学者对水质预测模型构建进行了研究,Karul C等[1]应用BP网络建立水库富营养化模型。Kuo等[2]使用BP人工神经网络以水体中五种物质的浓度为特征参数来预测台湾乌脚病区地下水水质变化;殷高方等[3]将BP神经网与水体环境因子的高频实测数据相结合,构建了巢湖水华的短期动态预测模型;张升东等[4]建立适用于水库水质评价的 BP 人工神经网络模型,将模型应用于卧虎山水库 2010年 8月到2011年12月的水质评价。虽然到目前为止BP网络在水质预测中已得到了广泛的应用,但由于其自身存在收敛速度慢和容易陷入局部极小的不足,其预测性能还有待进一步提高。

GRNN[5]由The Lockheed Palo Alto研究实验室的Donald Specht在1991年提出,它建立在数理统计的基础上,具有良好的逼近性能,学习能力很强;另外,由于其只需确定合适的光滑因子而无需对权值进行反复训练,故收敛速度较快,上述优点使其在预测方面比BP网络具有更高的预测精度及更快的运行速度[6-7]。

平滑因子是GRNN唯一待确定的参数,平滑因子的确定对整个预测模型的性能具有关键性作用。该文采用QPSO来确定合适的平滑因子,以提高GRNN模型的预测能力,使之能够更好地做好养殖水环境参数的预测工作。

1 BP神经网络及其改进

BP神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。其主要思想是:输入学习样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使网络的误差平方和最小。但是,BP算法是一种梯度下降算法,并且由于非线层单元的存在,导致网络存在多个最小点,故最后可能会产生局部最小值。其次,对于一些复杂问题,由于学习速率太小会造成学习过程收敛速度较慢等问题,另外对网络隐含层层数和单元数的选择尚无理论上的指导,需通过经验或不断实验来确定,故可能对预测结果产生影响的人为干扰因素较多。针对上述问题,不少学者对BP神经网络进行了一些改进,如采用L-M优化算法(又称阻尼最小二乘法)改进BP神经网络,降低网络对误差曲面局部细节的敏感性,以提高中等规模神经网络的收敛速度和泛化能力[8]。

2 基于QPSO-GRNN的氨氮预测模型

2.1 量子粒子群算法

QPSO算法[9-10]是在经典的PSO算法基础上所提出的一种有较高收敛性和稳定性的进化算法,在许多优化问题中,QPSO已经证明比PSO要优越。

2.2 基于QPSO-GRNN的氨氮预测模型

氨氮是渔业养殖中一项十分重要的水质指标,它对鱼类的生长有着重要的作用,由于用来监测氨氮的设备要比监测溶氧等其他因子的设备昂贵很多,故可以通过其他因子与氨氮之间存在的相互关系来预测氨氮值。

本文收集了国家罗非鱼产业技术研发中心无锡养殖基地25天内连续监测的100组数据作为建模数据。其中输入数据为PH值、温度值、硝氮值和溶氧值,输出数据为氨氮,把前90个样本作为训练样本进行训练,后10个样本作为预测样本。

3 结论

针对BP网络用于预测水质时存在的收敛速度慢和易陷入局部极小的不足,提出基于QPSO-GRNN的水质预测模型,实验结果证明:该模型与BP网络和L-M BP网络相比较,预测的精度较准确,运行速度也得到较大提高。

参考文献:

[1] Karul C, Soyupak S, Yurteri C. Neural network models as a management tool in lakes. Hydrobiologia, 1999, 408 /409: 139-144.

[2] Kuo Y M, Liu C W, and Lin K H. Evaluation of the ability of an artificial neural network model to assess the variation of groundwater quality in an area of black foot disease in Taiwan. Water Research, 2004, 38: 148-158.

[3] 殷高方,张玉钧,胡丽,等.BP神经网络在水华短期预测中的应用[J].北京理工大学报,32(6)2012.6: 655-660.

[4] 张升东,徐征和,杜敏,等.基于BP神经网络的卧虎山水库水质评价[J].济南大学学报:自然科学版,2013,27(4): 419-423.

[5] Specht D F. A general regression neural network[J]. IEEE, Transactions on Neural Networks,1991, 2(6):568-576.

[6] Leung M T, Chen A S, Daouk H. Forecasting Exchange Rates Using General Regression Neural Networks [J]. Computers & Operation Research, 2000, 27(4):1093-1110.

[7] Terri L. Cravener, William B. Roush. Prediction of amino acid profiles in feed ingredients: Genetic algorithm calibration of artificial neural networks [J].Animal Feed Science Technology.2001, 2(90):131-141.

[8] HAGAN M T, MENHAJ M B. Training feed-forward networks with the marquardt algorithm[J]. IEEE Transactions on Neural Networks,1994,5( 6) : 989-993.

[9] Sun J, Xu W B. A Global Search Strategy of Quantum-behaved Particle Swarm Optimization[C]//Proceedings of IEEE Conference on Cybernetics and Intelligent Systems. [S. l.]: IEEE Press, 2004:111-116.

[10] 毛力,马亦先,梁淑萍,刘以安.群智能在Ad Hoc网络QoS组播路由中应用的研究[J].计算机工程与应用,2011,47(24): 73-76.

[11] Mandal P, Senjyu T, Urasaki N, Funabashi T, Srivastava A. A novel approach to forecast electricity price for PJM using neural network and similar days method[J].IEEE Transactions on Power Systems,2007, 22(4):2058-2065.

篇10

关键词:数据;时间序列;分析;处理

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)09-2090-02

Time Series Analysis of Wave data

YEXiao-ying, ZHENG Xue-yu, CHEN Feng, HAN Fei

(Neusoft Institute of Information Technology,Foshan 528225,China)

Abstract: In this paper, we discuss the analysis and process methods of time series data. Time series come from a lot of industrial data procession. The Analysis of time series is important. Some time series data are periodical, such as complex periodical functions of electrical signal. Others are aperiodicity, such as a signal with stochastic processes.

Key words: data; time series; analysis; process

在实践应用的很多领域,都有对波动数据的分析与处理。从最简单形式的周期性物理波形,到复杂一些的声波等复合波动的时域频域分析,模式识别领域的处理与应用方法,经济金融领域的非周期复杂波动数据的特性研究。虽然问题产生的各自领域有很大的跨度,从方法论的角度来看,认识与解决问题的时候,常常有穿越领域的应用。而一些最常用的处理方法基本上成为所有领域内分析理论的基础。例如使用更简单的多个函数来拟合复杂函数、微分分段考察问题特性、积分近似实际情形、使用随机统计分析方法等等。

波动数据有的具有规律的周期性,更普遍的波动数据没有规律的周期性。

1时域与频域的分析

周期性出现的波动数据时间序列,在知识领域内通常可以称为周期信号或简称信号,可以通过考察其时域与频域特性来分析。时域与频域作为周期信号的基本性质,是观察信号的不同角度,两者可以通过傅里叶变换来互相转换。信号的上升时间与下降时间,是判断信号是否高速的依据。信号的频宽表示的是信号所含的高频分量。信号的上升与下降时间决定了信号的高频分量。

波动数据的时间序列信号唯一存在于时域中(张贤达,2002),这是我们可以真实观察并感受到波动数据的域。时域中信号的可见波形,可以简单直观表达信号的存在以及变化趋势。当以波形描述一个信号时,应注意在波形图上可见的该信号关键值,关键值包括有信号的不连续点、零点、最大值点和最小值点等。许多问题的求解都可以通过分析信号波形而得到简化。

包含随机因素的数据,处理起来需要加入更复杂的模型,或需要引入数理统计模型。不包含随机因素的信号是确定性信号。对于不包含随机信号的确定性信号,一般分为连续信号与离散信号。通过数据抽样,可以把连续信号转化为离散信号。时域中的任何波形,都可以用频域中的正弦波来合成,并且可以得到唯一的描述。

时域与频域是从不同的域来观察同一件事物。时域是从现实中观察动态的信号。频域是在另一个空间以频率为坐标轴来观察动态信号(奥本海姆,2010)。在很多时候,这种观察空间的转换,能够更加容易看出信号的特性,而频域分析也具有更为简练的描述形式。

傅里叶变换可以将时域的信号变换到频域。傅里叶变换有三种类型:傅里叶积分(FI)、离散傅里叶变换(DFT)、快速傅里叶变换(FFT)。在频域中,对波形的描述变为不同正弦波的集合。每个频率分量都有各自的幅度与相位。对于时域中非周期的信号可以进行以信号存在时间为周期的周期拓延,从而变为周期信号来进行分析。

在频域中,第一个正弦波频率称为一次谐波,第二个正弦波频率称为二次谐波,依次类推。每个谐波都有不同的幅度和相位。所有谐波及其幅度的集合称为频谱。频域中的频谱表示的是时域波形包含的所有正弦波频率的幅度。在知道频谱的情况下,要观察它的时域波形,只需将每个频率分量变换成它的时域正弦波,再将其全部叠加即可。这个过程称为傅里叶逆变换。不同的数学变换,变换对原始数据观察的角度与空间,或许能使得内在规律性变得更加清晰。

图1时域与频域变换示意图

2有限元方法

在结构分析领域中,关于静力结构、结构震动、弹塑性材料等研究中,为了得到尽可能精确的数学物理数据,常采用有限元分析方法来进行波动与震动的描述。有限元分析的目的:针对具有任意复杂几何形状变形体,完整获取在复杂外力作用下它内部的准确力学信息,即求取该变形体的三类力学信息(位移、应变、应力)。

有限元方法使用基于“离散逼近(discretized approximation)”的基本策略,可以采用较多数量的简单函数的组合来“近似”代替非常复杂的原函数。例如(廖振鹏等,1992)所进行的对波动有限元模拟的研究。时域有限元法不但可以用于研究复杂线弹性介质中的波动问题,而且利用计算机图形仿真技术还可以把波动过程动态地显示出来,直观地揭示与波动源和传播路径等有关的各种物理因素和波动特征之间的关系.因此,这一方法是研究工程科学中一系列重要波动问题的有力工具。

有限元方法对波动时间序列传播的物理介质媒体建立结构震动的三大类方程(平衡方程、几何方程、物理方程等)以及边界与初始条件,来进行波动时间序列的研究(来翔,2007)。这一类波动数据的时间序列,其物理特征是完全依赖于传播的媒介。在时域频域分析中,具有一定带宽的信号,其在一定媒介中传播的过程,也是需要考虑信号衰减的。在这一点上,与有限元方法的情况类似。

3模式识别与神经网络方法

时间序列数据或信号在更复杂的分析处理情形下,就不仅仅停留在信号本身的物理特性上。对信号携载的语法以及语义的判断分析是更重要的目的。线性神经网络可以应用于系统辨识、信号辨识、自适应滤波和控制等方面。目前在神经网络的多数应用中,采用BP神经网络,其具有广泛的适应性与有效性,主要应用于模式识别与分类。

在BP神经网络的应用中(孙虎儿,2009),增加网络层数可以提高网络识别性能,提高精度,但同时使得网络结构复杂,增加训练时间。因此首先考虑增加隐含层的神经元数,而不是增加网络层数来提高网络性能。隐含层数、隐含层的神经元数的适当数量,需要通过具体的试验来大概确定。

在使用BP神经网络进行字母表的图像识别中(朱凯,2010),设计并训练一个BP网络,完成26个英文字母的5X7像素二值数字图像的识别。取得了较好的噪声样本训练下的一定容错性。

4经济与金融领域的复杂数据模式的波动性研究

在经济与金融领域里,对时间序列数据的研究,具有非常重要的理论与实践应用意义。在时间序列中,按照所得到的数据的连续性分为离散时间序列与连续时间序列。按照是否存在一定的趋势,分为平稳时间序列与非平稳时间序列。平稳时间序列的观测值基本上在一定的范围之内,不会有增长或者减少的趋势,也不会有超出范围的波动。在现有的平稳时间序列处理中,往往把波动看作是随机的。非平稳时间序列包含趋势性,或有季节性、周期性,也可能是趋势性与季节与周期性的复合序列。

在时间序列分析的过程中(王燕,2008),首先对取得的数据进行相关分析。在有趋势拐点的时候,使用不同的模型分段拟合前后时间序列。然后判断恰当的随机模型来拟合时间序列的观测数据。对于简单的时间序列,可以用趋势模型和季节模型来拟合。对于平稳时间序列,可用ARMA模型来拟合。对于非平稳时间序列要将其转化为平稳时间序列来分析。

在更加复杂的情况下,可以考虑数据的Markov特性,使用Markov链的运用。有时一个时间序列中仅仅部分数据体现出Markov性,而其他部分的则是无规律的。

5结论

该文从波动数据的时间序列的最简单的形式出发,论述在数据不同领域以及不同复杂度之下的分析处理方法。很多处理方法是跨领域的,例如时域频域分析方法就从数学这样的纯理论研究领域出发,应用在电子、通讯、计算机、机械、农林、地质、经济、金融等几乎所有的学科中。波动数据如果不借助领域内知识,很难建立有效的分析判断模型。在诸多波动数据的时间序列处理中,依然没有有效的方法。例如外汇市场价格的高频数据分析于处理,迄今没有很好的方法。对波动数据时间序列的研究在可见的未来一直具有理论与实用意义。

参考文献:

[1]张贤达.现代信号处理[M].2版.北京:清华大学出版社,2002.

[2](美)奥本海姆.信号与系统[M].西安:西安交通大学出版社,2010.

[3]廖振鹏,刘晶波.波动有限元模拟的基本问题[J].中国科学B辑,1992(8).

[4]来翔.几类双曲型方程交替方向有限元分析[D].山东大学,博士学位论文,2007.

[5]孙虎儿.基于神经网络的优化设计及应用[M].北京:国防工业出版社,2009:36-53

[6]朱凯,王正林.精通MATLAB神经网络[M].北京:电子工业出版社,2010:220-224.