数据挖掘疾病预测研究

时间:2022-01-30 09:20:02

数据挖掘疾病预测研究

【摘要】随着计算机和数据挖掘分析日益剧增,在医学预测方面已经取得了很好的结果,具有非凡的意义,深度学习最近几年已经有个初步的结果,并且用到了医学领域。那么工作分为,数据归一,基于DBN的数据构建,设计DBN模型,以及实现预测。设计模型,包括数据预测模块,预测结果以及展示结果。将数据进行分析处理,预分析,以及初步的测试,得到结果。

【关键词】大数据;疾病预测;医学信息系统;数据挖掘,DBN算法的基本原理

1引言

近年来非典病毒在我国泛滥,出现这一问题有很大的社会因素。那就是危机意识。非典毫无疑问是一场公共卫生危机,这场危机之所以能够爆发并造成严重影响,除了病毒的新发性之外,危机意识的淡薄以及由此导致的社会预警系统的缺乏和应有的防治措施的不力,这是一个决不可忽视的社会因素。再来说影响非典发病的因素。最主要的是疫苗因素,如今生产疫苗的工厂多,所以就造成了疫苗品种多,价格差异大,这样就不能保证社会的总体免疫力良好,就给了病毒传播的机会。其次是对药品的滥用,长期过量使用氯霉素,链霉素,庆大霉素及皮质激素等药物,因其破坏白细胞和淋巴细胞,而抗体均是由B淋巴细胞产生,因此大大影响了免疫效果,是人对非典抵抗下降加快病毒的扩散。疾病预测是疾病预防,准确的预测人群以及个体的疾病发展趋势成为人们预测防范疾病是一个重要的手段,预测分为定性预测和定量预测,定性预测可以直观的判断预测主要是依靠经验以及直观判断能力,不用或者用少量的计算,定性的预测能充分发挥人的主观作用,考虑无法定量的因素,灵活省时省事,但缺乏数据的精确描述,而定量的预测,可以运用数学统计的方法对未来发展趋势,增减速度以及可能达到发展的数量的说明。利用并构建DBN模型,设计实现疾病预测行为定性预测方面,建立模型进行预测的相关算法,利用波尔兹曼机以及BP网络,采用贪婪逐层学习的方法对于疾病预测风险评估,利用模糊算法,回归算法,支持向量机,预测年际变化。利用BP神经网络预测每年疾病数目。由于疾病信息大,噪声大,数据不完全以及随机模糊性,疾病的风险预测显得极其重要。本文采用了深度学习深度信念网络的模型方法,来提高疾病的预测的准确性,采集疾病病人的体检数据,对数据进行分析处理,归一化,建立计算处理的基础表示数据库,对于数据进行分析,论文预测构建。分为预处理,疾病建立,开发DBN系统以及参考测试结果。

2学习方法

当前几种疾病的预测方法,先已有的包含,回归预测,时间序列预测,灰度预测,以及人工神经网络等方法。但是此几种方法各有缺陷,而深度学习的方法是基于数据特征进行学习,论文提出的DBN模型不仅可以学习特征还能自适应,也可以避免BP的局部极小的情况。2.1BP神经网络。BP网络是通过逆向传输,通过梯度下降得到一个较好的效果,BP网络也称为梯度下降网络,通过误差平方和最小,BP的神经网络的拓扑结构,输入输出隐层,信息正向传输,误差率反向传播的过程,双向并行进行。输入层接收信息,输出层输出处理之后的结果,中间主要是通过数据转换,信息变换,通过数据处理得到想要的答案。误差则通过输出层,按照误差梯度下降的方法修正各个权值,向隐层以及输入层传播,去调节权值去达到误差最小。最常见的就是一个三层的网络机构,如图1所示。此种网络有很强的映射能力,非线性性能完备。那么在BP网络中,隐层足够的情况下,能够实现任意非线性函数的逼近,但是BP存在他自身的局限性,譬如:梯度消失,局部最优,学习速度慢,无法控制隐层个数等等问题。2.2DBN学习预测疾病。DBN算法是数据挖掘技术中常用的一种分类和预测方法。深度信念机,是由多个波尔兹曼机组成的神经网络,存在一个n层的网络模型,针对隐层以及可视层实现联合概率分布。进行预学习以及整个DBN的模型学习训练,是对一个受限波尔兹曼机单独进行训练,之后叠加一层,作为下一层输入,再通过反向学习算法进行调节,图2所示。此模型的好处在于,首先对于数据特征进行一次学习,然后通过自学的方式再将结果输出,作为下一层的输入进行训练学习。一步一步层层学习和训练,作为深度学习的过程,对于特征分析可得到更好的结果。深度信念网络实现了从上向下的学习结构,自生成的结构,处理模糊信息加以传播,从而减少传播的误差。在此网络用于各个网络过程,实现了较好的结果。

3预测模型建立

基于DBN的模型,首先数据采集,采集心血疾病的各项体征,将数据分为测试和预测两份。(1)数据采集,采集医学数据以及划分数据分析。(2)构造DBN的模型,采用疾病分析方法的网络构架,包括输入点,隐层点和输出点的设计。(3)构造模型,以及利用训练数据,对其加速训练,以及设计最好的网络结构进行分析,得到误差函数。设计权值矩阵以及共轭梯度。(4)测试,将数据输入模型进行测试。(5)分析结果。

4结论

本文基于DBN算法建立流程,通过验证实验结果准备率,相比与BP的网络进行对比,DBN准确率高于深度学习的准确率。通过建立数据,以及样本的归一化,实现确定各个层数的隐层以及输出,对数据进行学习,数据处理完成模型建立完毕。

参考文献

[1]谭慭莘,田考聪.数学模型在人群疾病预测研究中的应用[J].中国医院统计,2005,12(1):83~85.

[2]袁莺楹,董建成.基于数学模型的疾病预测方法比较研究[J].软件导刊,2009(5):108~110.

[3]涂德华,张理义,陶凤燕.军人心理疾病预测量表的信度及效度检验[J].江苏大学学报(医学版),2009,19(2):168~172.

[4]余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,09:1799~1804.

[5]由清圳.基于深度学习的视频人脸识别方法[D].哈尔滨:哈尔滨工业大学,2013.

[6]王山海,景新幸,杨海燕.基于深度学习神经网络的孤立词语音识别的研究[J].计算机应用研究,2015,8.

作者:高骁智 单位:陕西延安中学