工程机械厂家自动识别系统研究

时间:2022-09-25 11:30:17

工程机械厂家自动识别系统研究

摘要:工程机械在施工的过程中,需要加强机械设备的统一管理,因而建立和健全机械设备的统计管理制度至关重要。对此,本文设计研究了一种用于工程机械厂家的图像识别系统,该系统使用matlab构建alexnet迁移学习模型对工程机械厂家数据集进行训练,通过对工程机械目标的外观和标志为特征进行训练,以达到提高施工现场机械设备调度效率的目的。

关键词:深度学习;系统开发;工程机械

工程机械行业的产业升级对国家基础建设的发展至关重要。但是,现在存在的问题就是现在有的工程项目在施工时,当参与建设的施工设备过多时,就会产生设备调度和管理无序的情况。因此,设计一套用于工程机械厂家的图像识别系统,对于实现我国工程机械的施工统一管理具有重要的意义。对此,本文选定alexnet深度学习网络进行训练,通过不断调试深度学习模型的层次、丢失层丢失率、学习率、训练步数等参数,探讨不同深度的特征提取网络对识别效果的影响。

1图像识别网络模型的选用

合适的识别网络对于系统的构建极为重要,由于本文所使用的工程机械的图像数据集规模较小,所以要求网络具有良好的特征学习能力。对此针对实验的实际的情况和识别算法的可行性在经过对现有主流的图像分类方法分析后,发现Alexnet和vgg16网络在训练速度和精度方面都有着不俗的效果。本文主要以Alexnet作为实验的基础框架,并将其与层次较深的vgg16网络进行了简单对比。

2图像样本数据集建立

良好的图像样本数据库对于图像识别网络的分析极为重要,在进行数据库构建时,其中主要有数据集的构建、图像数据集的标签化处理、图像数据集归一化、图像数据集扩充、图像数据集的划分。(1)数据集构建。数据集共含有18家工程机械厂家,共计900张,基本涵盖了目前市面上的常见主流工程机械厂家。为了保证识别的精度,每个图像中仅有一或两辆工程机械,并且图像中的厂家特征没有重叠或损坏。(2)图像数据集的标签化处理。由于深度学习算法需要采用有标签的样本图片进行训练,而本文采集的工程机械图像是无标签的,因此,需要对样本图像进行打标签处理。使用matlab内置的app“imagelabeler”对厂家图像进行人工标定,将标定完的含有标签信息的mat文件保存在特定的文件夹,随后批量将mat文件导出为.jpg标签图片,保存训练样本图片用于厂家识别网络的训练。(3)图像数据集归一化。在深度学习模型中的输入样本来自imagelabeler裁剪出来的图像,因此,存在裁剪的图像大小不一致的问题,而因为AlexNet模型要求图像的输入尺寸为227×227×3,VGG16的要求为224×224×3,所以需要进行归一化处理,将数据集的图像尺寸统一。(4)图像数据集扩充。为了获得更好的训练效果,提高识别精度,应使数据集的规模尽可能地大,这样网络能学习到更多的特征,训练出的模型效果更好,因此,数据增强成为一种非常便捷的数据集扩充途径。本文采取的数据增强途径有旋转、镜像、添加噪声,以此通过较小的人工采集工作量获得大量的数据样本。(5)图像数据集的划分。按照网络的训练步骤,在训练开始前,需要将样本数据集划分为训练集和测试集两部分,由于样本数据集较小,为了保证训练效果将训练集的比例增大,测试集的比例减小,将训练集和测试集按照4:1的比例进行划分,规定每种厂家的样本图片中4/5为训练集,1/5为测试集。其中,训练集作为网络的训练提供数据支持,测试集用于在训练完成后对模型的识别精度进行检测和自我评估。

3模型训练以及数据对比

(1)模型的训练结果。对模型的训练选择使用迁移学习,采用ImageNet数据集上进行过预训练的AlexNet网络模型,将自建的样本数据集输入网络的最后三层,新模型预训练后其收敛速度得到了极大提升。采用迁移学习方法训练得到网络模型的识别精度更高,训练效果更好。通过对alexnet迁移学习后的网络进行主要参数的不断对比调试,得到了11组不同参数下的网络模型,第一组为训练网络的最佳结果,准确率为87.89%。具体如表1所示。(2)使用不同网络模型的对比实验,本节中分别使用alexnet和vgg16模型进行训练,为防止训练参数变化以及不同数据集对训练结果的影响,在对比实验中,两次的训练学习使用了相同的参数和数据集,训练结果如图1所示。图1由实验结果可知,使用相同网络和参数的情况下,使用alexnet模型训练的网络识别精度为87.89%,训练时间为23min10s,使用vgg16模型训练网络的识别精度为86.11%,训练时长为160min53s。alexnet模型的层数较少,训练速度较快,且识别效果较好,vgg16模型的层数较多,训练速度明显减慢,且识别精度未有明显提升。实验结果表明,alexnet模型的训练速度更快,且训练效果与更深层次的vgg16相似,因此,本文选用alexnet模型进行训练更加合适。(3)样本集扩充效果对比实验。本节中分别在原始数据集和扩充数据集上进行网络的训练,原始数据集为未经过数据扩充的图像,扩充数据集为经过加噪声、镜像、翻转处理后扩大五倍的样本集,使用相同的测试集比例,验证数据集扩充对网络模型识别精度的影响。为防止训练参数变化对训练结果的影响,在对比实验中,两次的训练学习使用了相同的参数,由实验结果可知,使用相同网络和参数的情况下,使用扩充的数据集训练网络模型可以得到87.89%的识别精度,训练时间为23min10s,使用未扩充的数据集训练网络得到的识别效果大打折扣,只有60.56%的准确率,训练时长为2min31s。虽然数据集的扩充使得训练时长有所增加,但是在分类较多而样本数据集较小的情况下,使用数据集扩充的方法,可以极大地提高网络的识别效果。实验结果表明,数据集的扩充会增加训练时长,但可以有效提高网络准确率,弥补样本数据集较小的不足。

4结语

本文主要介绍了工程机械识别系统建立的每个过程,从数据集的收集整理,到工程机械图像数据集的扩充、打标签处理,以及网络模型的建立结果对比。详细地阐述了基于alexnet网络实现工程机械厂家识别任务的整个流程。从网络对工程机械厂家的识别率和实时性来看,本算法能满足实际工程生产时的准确率和实时性要求。

参考文献:

[1]李新叶,朱婧,麻丽娜.基于深度学习的场景识别方法综述[J/OL].计算机工程与应用:1-14[2020-02-13].

[2].MathWorks2018b版本的MATLAB和Simulink中扩展深度学习功能[J].单片机与嵌入式系统应用,2018,18(11):95.

[3]楚翔宇.基于深度学习的交通视频检测及车型分类研究[D].哈尔滨工业大学,2017.

[4]赵振兴.基于深度学习的车牌识别技术研究[D].青岛科技大学,2017.

作者:魏建昊 靳浩伟 王祥澳 傅隽翰 叶敏 单位:长安大学工程机械学院