基于数据挖掘交通流预测分析

时间:2022-06-17 05:43:25

基于数据挖掘交通流预测分析

摘要:随着社会的进步道路交通状况越来越拥挤,交通拥堵几乎成为了所有发达城市所面临的问题。因此改善交通状况变得尤为重要。文章旨在从数据的角度建立模型,来进行交通流预测。在阅读了大量文献的基础上,首先对数据挖掘技术的国内外研究情况进行基本了解,对所有数据进行预处理。然后通过线性回归分析,分别研究了单一因素和多因素对交通流预测的影响,得到各因素的影响因子,建立了模型。并进行了实例分析,结果拟合良好,验证了模型的准确性。最后,对本次模拟进行了总结,为今后的改进方向提供了思路。

关键词:交通流预测;线性回归分析;单一因素分析;多因素分析

基于数据挖掘的交通流预测系统研究就是将大量的数据运用到交通流预测模型中,为决策者提供帮助来引导交通系统的畅通。从近几年国内交通治理的情况来看,单纯增加交通道路及路面硬化的方法已经不可能从根源上解决交通压力[1]。交通流数据采集系统在很长一段时间内通过人工和自动数据收集、积累了大量数据,使用数据挖掘技术人们不仅可以存储历史数据,还可以为决策系统和导航系统提供数据等等。现在已经有模型应用于交通流预测中。为了提高预测的精度和可靠性,应结合其他可靠的方法和模型来研究适合我国的交通流预测模型。智能交通系统研究的目的是使人、车、路与环境和谐共处[2]。将数据挖掘技术运用到交通流预测对交通系统的拥堵、交通事故都会有很大的改善。

1方案设计

1.1数据预处理。数据预处理是数据挖掘中一个非常重要的步骤。这个过程可以剔除异常数据,使得数据挖掘的结果更加准确。预处理方法一般包含有数据清洗、数据变换和数据规约等。它们各自有优点和缺点[3]。1.2程序设计及计算。交通是一个大工程,影响它的因素有许多种。因此,需要从单一因素及多因素分别研究对交通流的影响。1.2.1单一因素对交通流的影响。一个地区如果要进行土地开发利用,交通必将是先导;反过来一个地区的交通便捷程度也决定着这个地区的土地利用率的大小[4]。土地利用是对交通影响最重要的因素之一。因此,本文首先选择土地利用率作为单一因素,对交通流的影响进行研究。先做散点图以确定回归函数的类型:用Matlab编程得出散点图,如图1所示:由图1知其模拟结果符合线性回归,运用回归分析在Matlab中实现。其残差图中存在数据对应的残差图不过0线,因此去掉第16个数据后继续做回归。直至所有残差图过零线。如图2。从图2可知,数据可以使用。以此为数据库进行模拟,得到仿真结果为y=13.8986+78.1208X。其中X为土地利用率。1.2.2其它多因素对交通流的影响。众所周知交通系统是一个复杂的系统,影响交通流的因素非常之多,道路的宽敞程度、周围商圈的繁华程度等等。它都影响着交通流,并对经济也有一定的促进作用。交通是一个城市的基本骨架,它伴随着城市的发展不断地演化、扩大;也是社会活动的一个载体,影响着经济的发展。居民收入也是影响交通流的一个主要因素,经济情况的好转,对车辆的购买欲增强,也就是增加了交通流。交通流的影响因素如下表2所示:由图3知所有的残差图均过0线,且显著性概率为0,因此,回归效果显著。仿真结果为:y=22.4680+5.3205X1+3.9334X2-0.0092X3其中,X1为车道数,X2为当地居民收入,X3为交通流量。

2实例分析

2.1单一因素验证。下表是临泉县滨河大道近几年土地利用与交通流之间的关系,通过上一章所得出的方程来进行数据验证,以此来验证方程的准确性。如表3所示:将该表中的数据带入上一章的一元线性回归模型y=13.8986+78.1208X中进行验证,得到验证结果。并且对于单一因素对交通流影响的预测值要进行偏移率的计算来测定该方程的合理性及预测的准确性,所以验证结果和偏移率如下表4所示:在此实验中,是一元线性回归模型通过模拟出的散点图可知道土地利用率与交通流呈线性关系,通过编程模拟出其残差图,根据结果继续模拟,直到其数据都过0线为止,最后得到其回归方程。通过数据验证及偏移率数值分析,其符合结果。2.2多因素验证。下表是滨河大道多种因素与交通流之间的关系,如表5所示:将该表中的数据代入上一章的多元线性回归模型y=22.4680+5.3205X1+3.9334X2-0.0092X3验证结果。并且对于多因素对交通流影响的预测值要进行偏移率的计算来测定该方程的合理性及预测的准确性,所以验证结果和偏移率如下表6所示。在此实验中,是验证以上三种影响因素对交通流的影响,通过上一章的统计分析及编程得到模拟结果,并得到其多元线性回归方程。通过数据验证和偏移率的数值分析,其符合结果。

3总结展望

数据挖掘已经成为决策支持、道路交通、金融等行业的主要研究方向。在这个到处都是大数据的现代社会中,每年都会产生新的技术及方法,也由于人们对它的广泛应用和深入研究,算短了技术换代的时间,促进了挖掘技术的快速发展。但是数据挖掘技术仍存在许多问题,如数据挖掘方法的效率有待提高,尤其是超大规模数据挖掘的效率。本文从数据挖掘的角度出发,深入研究了数据挖掘中数据预处理技术及一元和多元线性回归模型在交通流预测系统中的应用,并对它们进行了分析对比。

本文是基于数据挖掘的交通流预测并且得到一定的研究成果,但是由于时间及各种原因造成不能更进一步的深入研究,况且交通系统本身就是一个巨大且复杂的系统,所以还有很多地方需要完善和改进。(1)交通流数据本身有其内在的关系,速度、流量和占有率是最重要的三个属性,它们之间是相互联系、相互作用的,本文仅对流量的影响因素进行分析,今后可以对三者之间的影响关系进行分析预测,并通过交通流预测模型为交通系统提供决策支持,同时它将更加的合理和准确。(2)本文仅使用了线性回归模型,可以考虑将多种模型混合使用,提高预测结果的准确性。(3)今后还应对不同路段、路面的种类因素等进行分析研究。同时恶劣天气、交通事故等因素也是未来需要进一步研究的方向。

参考文献

[1]高雅.短时交通流预测模型及预测方法的研究[D].上海:华东师范大学,2011.4.

[2]许兆霞.基于数据挖掘技术的交通流数据分析研究[J].淮海:淮海工学院,2009.3.

[3]郭敏.道路交通流短时预测方法综述[A].北京:北京科技大学,2009.2.

[4]李明江.数据挖掘技术及应用[A].都匀:黔南民族师范学院,2010.

[5]国家统计局.中国统计年鉴[J].北京:中国统计出版社,2010.

[6]国家统计局.中国统计年鉴[J].北京:中国统计出版社,2007.

作者:杨凯茜 刘玮蔚 单位:1.西安航空学院车辆工程学院 2.中交第一公路勘察设计研究院有限公司