计算机视觉处理技术范文
时间:2023-12-22 18:03:15
导语:如何才能写好一篇计算机视觉处理技术,这就需要搜集整理更多的资料和文献,欢迎阅读由公文云整理的十篇范文,供你借鉴。

篇1
关键词:计算机;视觉技术;应用;分析
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)03-0242-02
计算机人工智能技术中的一项重要技术就是计算机视觉技术,这种技术主要是让计算机利用图像来实现认知环境信息的目的,这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展,计算机视觉技术也得到了较快发展,并且在实际生产与生活中的应用也越来越广泛。
1 计算机视觉技术概述
1.1 基本概念
计算机视觉技术主要研究计算机认知能力的一门技术,其具体主要是通过用摄像机代替人的眼睛,用电脑代替人的大脑,最终使计算机具备类似于人类的识别、判断以及记忆目标的功能,代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术,通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说,计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,利用计算机来分析、处理视觉信息的技术,它是现代社会新兴起的一门高新技术。
1.2 工作原理
在亮度满足要求的情况下,首先使用摄像机对具体事物的图像信息进行采集,利用网络把采集到的图像信息向计算机内部输送,然后在计算机系统内部处理加工图像信息会把事物的原始图像得到,随后利用图像处理技术进一步处理原始图像,获得优化质量效果之后的图像,分类与整理图像中有特征价值的信息,通过智能识别技术识别与描述提取到的图像信息特征,最后把得到的高层次的抽象信息存储起来,在进行识别事务时分析对比这些储存信息就可以实现事物的识别,这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示:
1.3理论框架
人类研究视觉技术虽然起步比较早,但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了,视觉技术是一项特别复杂的信息处理过程,要想对视觉的本质准确完整的理解,必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为:计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术,我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。
所以,可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程,其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次,可大致把计算机视觉技术划分为:低层视觉处理、中层视觉处理、高层视觉处理三个层次。
2 计算机视觉技术在自动化中的应用
2.1 农业自动化中计算机视觉技术的应用
在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况,便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量,例如可以应用计算机监测技术来监测大多数蔬菜的质量,传统的人工检测蔬菜质量的方法,不仅费时费力,而且检测结果的准确性也不能很好的保证,在实际人工检测过程中还容易伤害蔬菜,可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小,然后和质量达标蔬菜的光线能量大小进行对比,根据这些对比结果可以把蔬菜质量的好坏准确判断出来,在蔬菜质量检测过程中应用计算机视觉技术,把传统的蔬菜检测方法完全颠覆了,极大的方便了农产品的质量检测,由此可见,计算机视觉技术在农业生产中有很高的使用与推广价值。
2.2 在工业自动化中计算机视觉技术的应用
计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸,其测量与被测对象的原理如图2所示。
光学系统、计算机处理系统以及CCD摄像头,是计算机检测系统的主要组成,被测物体由光源发出的平行光束进行照射,利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上,然后再通过计算机处理这些图像,进而把被测部位的轮廓位置信息获取下来,若被测对象是出现位移时,可通过两次重复测量,利用两次测量的位置差就可以得出,被测物体的位移量。
此外计算机视觉技术还可以应用于逆向工程中,应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值,同时还能构建曲面,保存成CAD或CAM图像,把这些图像送入CNC制作中心加工,便可制作出产品,这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现,最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸,获得各部位数据,进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现,器具体轮廓结构示意图如下图3所示。
这种测量方法的工作原理为:利用激光穿越平行、等距的振幅光栅组件,或直接采用干涉仪发出的干涉条纹,形成平面条纹结构光,再向物体表面投射,由于物体各表面的深度与曲率的不同,条纹会自动出现变化,然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中,把图像信号转化为模拟信号,再转化为数字信号,然后经过传送再还原信号到图形处理系统,就得到三维轮廓图像。
在工业自动化中计算机视觉技术的深入广泛应用,不但使工业产品的生产质量得到了保障,而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量,封口质量以及印刷质量等等,如我国重点指定的印刷造币机器的南京造币厂,由于货币制造印刷是由印刷造币机器来实现的,所以要严格要求其生产工艺,一丝一毫的生产差错都不允许存在,为了保障印刷制造出来的造币机器质量完全达标,必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术,随着计算机视觉技术的不断进步,计算机视觉技术已经对印刷造币机器的需求完全满足了,实际的应用效果也非常理想,印刷造币机器在实际生产的过程中,南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上,硬币受到重力下落的瞬间,计算机视觉技术可以瞬间采集图像的信息,准确拍摄硬币在下落过程中的图像,通过高速光纤传感器可以把硬币图像向计算机系统快速传输,利用计算机系统处理信息与识别信息的超强能力,可以及时识别硬币质量,经大量实践研究得出,在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生,由此可知,在工业自动化中计算机视觉技术的应用不但可行,而且发展空间还很大。
2.3 在医学自动化中计算机视觉技术的应用
在医学领域计算机视觉技术也得到了广泛应用,如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术,这些技术的广泛应用很大程度上方便了医生准确判断病人病情,另外,在生产药品的过程中,应用计算机视觉技术可以高效检测药品包装的合格与否,其基本流程是:传送装置先准确运输药品到指定位置,传送装置自身又可分为检测与分离两个区域,在传送药品的过程中药品的图像信息会被特定的摄像机采集,采集完成后向计算机系统传递采集信息,然后计算机系统会分析与处理这些信息,把没有包装好的药品自动识别出来,并且向分离区传递识别信息,分离区的自动装置会依据传输的分离信息,隔离开没有包装好的药品,这样就可以有效分类包装好的药品与没有包装好的药品,在药品包装检测方面应用计算机视觉技术代替传统人工检测,不但可以实现药品准确无误的检测,而且还可以大大提高检测药品包装质量的效率,完善了药品生产的自动化,由此可见,在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。
3 结束语
总之,计算机视觉技术是一门研究计算机识别能力的高新技术,它涵盖了很多其他技术,具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用,我们必须在明白其基本概念、工作原理以及理论框架的基础上,结合实际生产情况,不断进行深入研究,只有这样才能使计算机视觉技术得到更好地推广与应用,才能使这项现代化的高新技术更好的服务于社会,服务于人类。
参考文献:
[1] 龚超,罗毅,涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化,2003(1).
[2] 李永奎,刘冬.计算机视觉技术在农业生产中的应用[J].农业科技与装备,2011(6).
篇2
1、引言
随着经济的迅猛发展,汽车的迅速普及,根据社会对汽车产业的要求,车辆的各方面指标都受到人们越来越多地关注,汽车涂装过程中的瑕疵直接影响汽车的外观质量,因此如何在生产过程中利用计算机视觉检测技术检测出并及时修补汽车涂装过程中产生的瑕疵就成了首要的任务[1]。本文的研究内容是首先了解计算机视觉检测系统的工作原理,汽车涂装瑕疵的种类,然后结合两者的特点,应用计算机视觉检测系统检测汽车涂装瑕疵。该研究的价值在于两方面:①对于汽车生产的自动化和过程自动化,计算机视觉是现实真正意义的自动的基础和一种重要的质量控制的手段;②对于汽车涂装瑕疵的修补可以提高其修补的精度。
2、汽车涂装瑕疵的计算机视觉检测系统
汽车涂装瑕疵检测系统主要包括照明系统、图像采集卡、CCD摄像机、计算机以及软件处理等几个主要部分[2]。综合计算机视觉检测系统的构成和线结构光测量的原理,基于计算机视觉的汽车涂装瑕疵的检测系统大致是这样构成的:将线结构光投射到被测物上,所形成的光斑作为传感信号,用CCD摄像机采集光斑图像,采集到的图像信号被传输到计算机,根据图像处理和计算机视觉检测系统的处理产生处理结果,返回到涂装生产线,对车身的涂装进行修正,从而提高产品质量。汽车涂装瑕疵的视觉检测系统如图1所示[3]。
3、计算机视觉检测
计算机视觉是计算机对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。图像中的内容往往是某些机器零件,而处理的目标不仅要能对机器零件定位,还要能对其进行检验。计算机视觉系统基本原理:机器视觉系统通常采用CCD相机摄取图像,将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号进行处理,从而得到所需要的各种目标图像特征值,并在此基础上实现模式识别、坐标计算、灰度分布图等多种功能。计算机视觉系统能够根据其检测结果快速地显示图像、输出数据、指令,执行机构可以配合其完成指令的实施。计算机视觉系统主要由图像获取、图像分析和处理、输出显示或控制三个功能模块组成[4]。视觉检测按其所处理的数据类型可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测。另外,还有X射线检测、超声波检测和红外线检测。一个完整视觉检测系统包括:图像采集、图像分割、零件识别、模型匹配和决策判断。Newman[5]等描述了利用深度图像进行零件检测的AVI系统,具有一定的代表性。一个典型的AVI系统如图2所示。
4、汽车涂装瑕疵的检测算法
由于汽车涂膜中一些缺陷的边界比较模糊,例如:气泡、爆裂气泡孔、气泡针孔、抽缩等等。边缘处灰度变化很小,直接用传统的微分边缘检测算法无法有效的检测出来。所以对缺陷模糊边缘的检测成为了算法的关键[6]。本文介绍了基于线结构光的边缘检测方法。汽车涂装表面被光源投射器发出的线结构光照射,反射出的图像被CCD摄像机所接收传输到计算机视觉检测系统中。若涂装表面没有瑕疵,则产生图3的图像。若涂装表面有瑕疵,则产生图4的图像[7]。
篇3
关键词:计算机;视觉检测技术;原理;应用
中图分类号:TP391.41
受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。
1 关于对视觉技术的相关研究
1.1 基于计算机的视觉检测技术的原理分析和探究
图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。
基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。
1.2 视觉检测技术中传感器的作用
在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。
2 基于计算机的视觉检测技术的应用研究分析
2.1 基于计算机的视觉检测技术的发展状况研究
在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。
基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。
就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。
二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。
2.2 基于计算机的视觉检测技术的相关应用分析
2.2.1 数码相机中所采用的图像采集技术
视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD 摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。
2.2.2 微文字识别系统的相关研发和设计
随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。
2.2.3 特殊用纸水印在线检测系统
基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。
3 基于计算机的视觉检测技术的发展展望
综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。
4 结束语
随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。
参考文献:
[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.
[2]张江明,张娟.浅谈制造业中计算机视觉检测技术的应用与发展[J].科技创新导报,2011(24):1.
篇4
【关键词】Opencv;计算机视觉技术;系统;研究
随着计算机技术的快速发展,计算机设备逐渐被应用到社会生活的各个方面,尤其是在当前计算机视觉技术和图像处理技术快速发展的时期,各个科技领域中的计算机视觉技术已经逐渐成熟。计算机视觉技术主要是利用计算机智能化来替代人眼,即对于客观存在的三维立体化世界的理解和识别,整个实现过程均是以计算机技术作为基础。随着计算机视觉技术的不断发展,现今其已逐渐成为了一门神经生理学、计算机工程、信号学、物理学、应用数学等综合性学科。计算机视觉技术系统其在高性能计算机基础之上来实现对大量数据的获取,并且通过智能算法来对获取数据进行处理,从而完成对数据集成。
一、视频中运动物体检测原理
对于视频中的运动物体检测主要分为两中方法,其一为宏观检测法;其二为微观检测法。宏观检测法是对获得的整幅图像进行检测,而微观检测法则是对所需要的区域进行图像检测。视觉技术在检测运动物体的时候,首先对图像进行采集,并对采集的信息数据进行预处理,将图像进行分割,然后分别提取运动物体的影象,从而实现参数的更新。图像采集过程中采用背景差分法,实现对背景图像的提取,其通过一定算法采用人为手段获取没有背景的图像。另外在进行运动物体检测的时候还可以采用帧间差分法,其主要是实时获取帧图,然后实现一帧一帧图像比值的比较,从而获取具有差值的图像。运动物体进行检测的时候需连续获取帧图,将这些帧图组合起来,其实就是物体的运动轨迹,然后同分割技术就能勾勒出物体的轮廓。随着计算机视觉技术的不断深入研究,发现此两种方法单独使用仍然存在的一些缺点,于是研究人员将二种检测方法进行融合,形成一种综合检测方法。综合检测法将两者检测方法的优势进行了融合,并将其灵活的应用到了生产和生活之中,取得了十分不错的效用。
二、基于Opencv的计算机视觉技术探究
(一)基于Opencv的运动物体检测
运动物体在进行检测的时候,基于Opencv的检测原理主要为:根据物体某项特定信息,例如,颜色、轮廓、性状等,在复杂背景中利用这些特定的信息将物体分离出来。整个图像的分离过程首先是进行视频流捕捉,然后是进行视频的格式转换,再将图像进行预处理,从而提取前景物体,减少环境因素对图像处理的误差,最后根据物体特征提取,并完成对运动物体的跟踪。从图像中提取所需的目标物体,其实质就是对整个屋里轮廓进行检测和分割,根据每个图像的帧差异来进行提取。
(二)基于Opencv图像预处理
视觉技术应用于复杂的环境之中,由于存在着光照的变化,其场景中所出现的环境因素对视频采集设备性能影响很大。环境因素会使得获取的图像信息的质量降低,并且在图像中无法避免的存在着噪点,这对于运动物体的检测和图像采集会造成很大的影响。当获取视频帧图像之后需对其数据进行预处理,通常有平滑度滤波处理、图像填充、图像背景更新等。
1.平滑度滤波处理
由于在进行视频图像采集的时候存在着噪点,那么我们就需要对其进行噪点处理,以求减小噪声。滤波平滑度滤波处理,其具有线性和非线性两种方式,其中线性方式进行处理器运算简单、运算速度快,但是在进行处理之后的图像都会呈现不清晰的情况。而非线性方式尽心给处理之后,虽然能够很好的减小噪点,确保信号的局部特点,但是其运算的速度会较慢。
2.图像填充
对于帧图像进行处理,通常采用检测边缘填充法或者是腐蚀膨胀法来完成,其中填充法是指当检测出目标物体之后,利用边缘检测方法来对物体进行辨识,然后利用形态学的漫水填充法进行填充。图像的腐蚀膨胀则主要是由于摄像机的性能等问题造成的。
3.实时背景更新
在进行图像差分之前,需要对背景图样进行确定,并且需要对其进行初始化处理。以方便以后在进行检测时候能够对实时背景图进行差分计算,只有这样,才能够获得极佳的前景效果。在进行图像差分时,首先需要根据指定法来确定第一帧背景的图像,并将其指定为第一张背景图片,然后在检测过程中根据算法对背景实施更新。整个图像在进行更新时,其主要的流程为:判断并读取图像是否为第一帧;将Opencv处理的图像转化为单通道灰度值;将实时采集的图像进行高斯平滑度处理,去除噪点;最后使用形态学滤波处理噪点。
(三)提取前景运动物体图像
检测运动物体的时候,只有在检测流程中确保精确度,才能够获取满意的前景跟踪效果。此过程中主要分为两个步骤,第一步为二值化图像之后进行分割;第二步,图像分析前处理,进行充分填充,确保前景图的完整性。其中,前景图的提取主要分为下面几个步骤:首先对前景图像和背景图像进行差分,然后对差分的图像进行二值化,再对背景中的前景图像边缘进行检测,根据轮廓进行填充图像。由于摄像头存在于不同的场景和环境之中,不论是室外或者是室内随着场景的变化都会对图像的采集产生影响。那么在前景图中提取目标就需要在检测系统中采用有效手段来完成背景实时更新。
阀值二值化分割法可以对检测的物体进行前景和背景差图分割,从而使目标物体能够分离出图像,且阀值分割先要确定每个像素的点是否处于灰度范围值之内。将图像中的像素灰度与确定的阀值进行比较,其结果解释所有像素点分为2类,一类像素的灰度小于阀值,另外一类就是大于阀值。阀值二值化分割时,确定分割的阀值T,然后分割图像。选取合适的阀值进行分割,可以有效的减少光照因素影响,常用的动态阀值主要有直方图来法与最大类方差法这另种分割方法。
三、计算机视觉三维技术
计算机视觉技术的核心为分割问题、运动分析、3D立体场景重构等,立体视觉主要是从多幅图像的参照中获取目标物体的三维几何信息。计算机视觉所模拟出的3D立体画面只需要摄像机从不同的角度同一时间针进行图像捕获,将2D信息进行3D重构,进而将计算机程序重建于真实的三维场景之中,以恢复物体的真实空间信息。
(一)视觉系统
视觉系统捕获图像的过程,实则可以看成为对大量信息进行处理过程,整个系统处理可以分为三个层次,其一,理论层次;其二,描述层次;其三,实现层次。在摄像机视觉系统之中,输入的是2D图像,但是输出为3D信息,而这就可以实现对图像的位置、距离等信息的如实描述。视觉系统分为三个进阶层次,第一阶段为基础框架;第二阶段为2.5D表达;第三阶段为三维阶段。在第二阶段中实现的2.5D表达,其原理是将不完整的3D图像信息进行表达,即以一个点为坐标,从此点看去某一些物体的部分被遮挡。第三阶段的三维阶段,则是人眼观察之后可以从不同的角度来观察物体的整体框架,从而实现了将2.5D图像信息的叠加重合运算,进一步处理之后得到了3D图像。
(二)双目视觉
人们从不同角度观看同一时间内的同一物体的时候,可以利用算法测量物体间的距离。此法被称为双目立体感觉,其依据的原理是视觉差原理,利用两台摄像机或者一台摄像机,对两幅不同的图像进行不同角度观察,并且对其观察的数据进行对比分析。实现双目立体视觉与平面视觉图像获取,其主要的步骤为:
(1)图像获取
从两台不同的摄像机,捕获帧图像,由于环境因素会造成图像差异困难。为了更好的跟踪目标、检测,当捕获图像之后,需要对图像进行预处理。
(2)摄像标定方式
获得真实坐标系中的场景点中的与平面成像点占比见的对应关系,借用三维立体空间中的三维坐标,标定之后确定摄像机的位置以及属性参数,并建立起成像的模型。
(3)特征提取方式
所谓的特征提取方式主要是为了提升检测、跟踪目标的准确性,需要对目标物体进行特征提取,从而实现对图像分割提取。
(4)深度计算
深度信息主要是根据几何光学原理,从三维世界进行客观分析,因为距离会产生不同的位置,会使得成像位置与两眼视网膜上有所不同。简单来说,客观景物的深度可以反映出双目的视觉差,而利用视觉差的信息结合三角原理进行计算,可呈现出深度的图像信息。
(三)摄像机模型
摄像机在标定过程中确定了其建立的基础为摄像机的模型,摄像机模型在标定过程中关系到三个不同坐标系的转换,分别为2D图像平面坐标系、摄像机自身坐标系以及真实的世界坐标系。摄像机在摄像的时候起本质是2D图像坐标转换,首先要定义摄像机的自身坐标系,将坐标系的原点设置为光心,X、Y、Z成立三维坐标系。其次则是建立平面的图像坐标系,用以透视模型表示,其原点也在广心的位置,称之为主点。实际应用中,物理的距离光心的位置d≠f焦距,而且会远远大于焦距,为了解决如此问题就提出了平面概念。在光轴z上设置一个虚拟的图像平面,然后在此位置于平面关于光心对称。接着,在设置的虚拟2D坐标系中,光轴和原点重合,并且摄像机与垂直平面的垂直方向相同,真实图像上的点影射到摄像机坐标系。
(四)3D重构算法
视频流的采集,主要是采用Kinect设备、彩色摄像头、红外发射摄像头、红外接收摄像头。使用微软提供API控制Kinect设备,在操作之前需调用NUI初始化函数,将函数的参数设置为用户信息深度图数据、彩色图数据、骨骼追踪图数据、深度图数据。上述的视频流的打开方式不同,既可以是一种打开方式,也可以是多种打开方式,尤其在进行Kinect传输数据处理的时候,需遵循三条步骤的运行管线。此三条管线分别为:第一条为处理彩色和深度数据,第二条为根据用索引添加颜色信息,并将其放入到深度图之中,第三条为骨骼追踪数据。
四、总结
随着计算技术的快速发展,视觉技术逐渐被广泛的应用于我们日常的研究之中。本文通过对视觉技术的相关问题进行分析,探究了图像处理、分割、前景提取、运动物体观测以及重构3D图等问题,为实现视觉技术更加深入研究做出了相应的贡献;为广大参与计算机视觉技术研究同仁提供一个研究的思路,为实现视觉技术的腾飞贡献薄力。
参考文献
[1]张海科.基于Opencv的人手识别与跟踪定位技术研究与实现[D].云南大学,2013.
篇5
关键词:计算机;交通监管系统;视觉
中图分类号:TP277
近年来,道路交通安全问题因公路交通事业的快速发展而受到越来多关注。据2002年世界银行统计,全球平均每年死于道路交通事故高达117万人。而在中国,据2008年公安部交通管理局公布的数据显示,全国道路交通事故多达265204起,死亡人数为73484人。
全国道路交通事故防御工作随公路里程、机动车保有量、道路交通流量、驾驶人数的增加成递增趋势。而通过必要的技术手段构建交通安全保障机制,降低交通事故是重中之重。若要好的为基础的交通违规行为检测技术的不断更新,市场上已出现了自动检测与记录的商业化产品,能实时记录出闯红灯、违规超车、违规停车、超速、逆行等违规行为。然而,我国高速交通监控体系仍比较落后,大多在交叉路口设置电子警察系统以此检测车辆闯红灯的违规行为。交通管理部门并不能对出现违规行为的车辆进行及时的交通管制和处理,概括来说管理与检测仍处于管理误区与盲目状态。针对该现象,文本研究了基于计算机的交通监管系统设计与实现。
1 智能交通管理系统简介
ITS系统,该系统综合先进的现代计算机网络技术、信息电子通讯技术、现代信息技术以及自动控制技术等,并将其在整个交通运输管理体系进行有效的运用,为此建立起一种实时、有效、准确、范围广的全方位发挥作用的交通运输控制体系和综合管理系统。近几年人流、车流随着城市发展而猛增,交通职能部门对更加智能的交通管理系统的需求越来越急迫。所以,ITS成为21世纪地面交通管理、运输科技、运营的主要研究方向,带领着交通运输一场伟大的变革。北美、西欧、日本自上世纪80年代末就开始竞相发展智能运输系统,并制定相应的开发计划加以实施,而发展中国家也开始对ITS系统的全面研究与开发。
2 认识基于计算机视觉的智能交通监控系统
2.1 计算机视觉技术
所谓计算机视觉,理解为使用可替代人眼的高清摄影机设备或其他现代高清电子影像摄录装备进行观察,实现对目标的追踪定位、图像识别、模拟数据测量等,并对采集的视觉数据信息送达远端计算机服务器,通过计算机服务器的信号图形图像处理技术对视频数据信息进行进一步加工,实现三维重现现实情景的计算机观察呈现技术。
2.2 智能交通监测系统
通过使用现有的、先进的计算机智能化、视觉化、信息化科技对国内各大路况交通运输实施监测,为工作于交通运输人员呈现数据信息的自动化采集、分析、处理等的智能化服务,且该交通管理系统存在一定自作能力和指挥能力,即为智能交通系统。随着道路、车辆的飞速发展,人民生活水平及国民生产总值的不断提高,智能交通系统,在国内外受到越来越多的青睐。近几年,各道路关键路段、路口随着道路监控机制的普遍建立,也都基本完成了视频监控。
2.3 基于计算机视觉的智能交通监控机制
根据前面2.1对计算机视觉技术和2.2对智能化交通监控系统概念的解析与理解,可总结出以计算机视觉为基础的智能化交通监控机制,其是通过现代高端计算机对视觉信息收集、提取、处理、分析等技术,实现对城市道路交通信息的实时监控、视频数据的收集、信息分析处理,并对城市交通状况使用智能交通机制状况,并通过视频影像引导车辆行驶,以此降低或避免各种各样交通事故发生的智能化交通监控机制。
3 构建以计算机视觉为基础的智能交通监控机制及配套措施
3.1 基于计算机视觉的智能交通监控机制的构建
监控指挥系统、实时交通信息收集系统、高质量信息传输系统是基于计算机视觉的智能交通监控的三大系统。实时交通信息收集系统由多套信息收集装置组成,通过这些信息采集装置实时监控不同位置交通现状。实时交通信息收集系统不仅能进行路段监控与实时交通信息采集的工作,还能将收集数据信息,经由高质量信息传输系统实施输送,或在服务器中存储已处理的信息;一个中央数据库与一个中央服务器是高质量信息存储传输系统核心部分,其中中央数据库对获取到的实时交通路况信息进行存储。而为了便于工作者能通过界面对中央数据库实施提取、查询、查看等操作,因此该界面就由中央服务器来提供,此外该服务器还能将已处理的实时路况数据通过高质量的传输系统输送到监控指挥机制,达到对各路段的交通进行管制、部署及指挥的目的。
3.2 专业技术人员的储备
以计算机视觉技术为基础的智能交通监控机制是一个庞大的系统,具有突出点的优点,该系统集自动化、信息化、智能化为一体,只有专业的技术人才才能使该系统高效工作,因此开展培训储备相关技术人员至关重要。实时交通信息借助于先进的高清装置的正常采集工作,所以储备一批针对高清装置安装、检测、调试及故障修复的技术人员极为重要。现代基于计算机视觉的智能交通监控机制虽然本身具有一定的图形图像分析及处理能力,然而有些工作人是永远被替代的,所以培养储备一批专业的图形图像处理技术人员也是重要的。储备服务器维护技术工,每天以计算机视觉技术为基础的智能交通监控机制都会获取大量的监控信息数据,然而只有大型的服务器才能存储这些数据,可想而知一旦服务器瘫痪就会引发整个机制的崩溃,造成严重的后果,因此专业服务器维护工作者的储备与培养也尤为重要。基于计算机视觉技术的智能交通监控机制并不能取代交通指挥员,其仅是用来采集实时交通信息的系统,仅为了协助交通指挥员监管及疏导城市交通,因此要求储备一批高素质、高质量的交通指挥员也极为必要。
3.3 交通知识的宣传
大城市的交通问题,并不是依靠单纯的开发先进的计算机视觉智能交通监控系统就能处理解决,也不是单单要求市政建设增加公交数量、增铺几条公路或增开通几条地铁就能解决的,以上这些仅是辅助方法。关键在于开展交通知识的宣传与教育工作,强化驾驶员的素质,倡导不酒驾、不逆行、不超速、限号行驶等,自觉遵守道路交通规则,提倡公交地铁出行,减少私家车辆行驶,齐心协力共同打造和谐的交通环境。
3.4 获取政府支持
市政建设的主要问题之一即是交通问题,政府的支持是万万不可缺失的。由于构建以计算机视觉技术为基础的智能交通管制机制,涉及面广,包括道路勘测、先进装置的引进、专业技术人员的储备、装备组织安装与调试、后期维护等等多方面,这些都需要投入大量的人力、财力、物力,而对于任何一个单位、部门或几个市政部门来说都无法独自承担,由此可知政府的大力支持是必不可少的,以政府的力量为媒介,将各部门进行协调、协作,只有这样才能构建成较健全的交通监控体系。
4 结束语
道路交通杂、乱是国内城市交通最突出的特点之一,对于我国的交通事业来说进行行人识别势在必行。而我国对于行人识别的研究仍处于起步阶段,还较落后。且基于计算机的交通监管系统设计较为复杂,涵盖点较多,因此本文仅对设计进行简要介绍,希望达到抛砖引玉的效果。
参考文献:
[1]康晓丽.无线网络技术在交通管理中的应用[J].科技情报开发与经济,2011(21).
[2]钟振,赖顺桥,肖熠琳,张沛强.RFID车辆智能管理系统[J].机电工程技术,2011(02).
[3]文军.视频监控系统软件现状与技术分析[J].金卡工程,2007(08).
[4]张玉风.简述视频监控系统的发展历程[J].铁道通信信号工程技术,2006(06).
[5]马伏花,朱青.基于射频识别技术的车辆自动识别系统的实现[J].中国仪器仪表,2006(11).
篇6
关键词 模式分析 计算机视觉 教学改革
中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。
近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦
在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
2 模式分析与视觉处理课程群特点
模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。
(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。
(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。
(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。
3 模式分析与视觉处理课程群改革举措
针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
3.1 师资队伍结构优化
为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。
近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。
与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。
综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。
3.2 课程群知识体系梳理与授课模式改革
模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。
我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。
在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。
在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。
除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。
3.3 课程群实践体系完善与考核方式改革
工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。
首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。
图1 多层次菜单式实验内容示意图
基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。
综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。
在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。
其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。
再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。
4 结语
本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。
注释
① https:///learn/machine-learning/
② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.
③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.
④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.
⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.
篇7
关键词:计算机智能视频监控;运动目标检测方法;目标跟踪方法
中图分类号:TP311 文献标识码:A 文章编号:1674-7712 (2012) 10-0104-01
随着人工智能技术日新月异的发展,基于人工智能的计算机视觉技术也得到了广泛的推广和应用,成为计算机智能领域一个重要的发展方向。到目前为止,计算机视觉技术已经过20余年的发展,其在社会人文,军事技术及工业生产领域得到了广泛的应用,并以其独具特色的技术优势逐渐形成了一门具有一定先进理论支撑的独立学科。其中,著名学者Marr提出的视觉计算理论已成为计算机智能视频监控领域的主导思想,为大多数该领域内的研究人员所接受。从广义上讲,计算机视觉技术的实质就是实现对在复杂环境中运动物体的几何尺寸、形状及相关运动状态的识别和认知,即把实际空间中的三维对象转换为计算机视觉系统识别的二维图像。近年来,计算机视觉技术以其迅猛的发展态势及成熟的应用技术成为了业界的新宠,并得到了广泛的应用,取得了瞩目的成绩。
一、运动目标检测方法分析
(一)运动目标在静止背景条件下的检测分析
1.差分检测法
将同一背景不同时刻两幅图像进行比较,可以反映出一个运动物体在此背景下运动的结果,比较简单的一种方法是将两图像做“差分”或“相减”运算,从相减后的图像中,很容易发现运动物体的信息。在相减后的图像中,灰度不发生变化的部分被减掉,则前区为正,后区为负,其他部分为零。由于减出的部分可以大致确定运动目标在图像上的位置,使用相关法时就可以缩小搜索范围。
2.自适应运动检测方法
当两帧图像的背景图像起伏较大时,简单的差分法难以得到满意的解。此时可以考虑用自适应背景对消的方法,该方法可以在低信杂比的情况下压制背景杂波和噪声,检测出非稳态图像信息。在背景杂波较大时,常用的门限分割不能分出这种运动目标。在图像序列中,每一个像素点的灰度值都是这一点所对应传感器的输出信号值与噪声值的叠加,因此,如何克服噪声的影响确定一个最佳门限将目标与背景分离,就成为弱小目标检测的一个重要环节。
(二)目标在运动背景条件下的检测方法分析
块匹配法是目标在运动背景条件下的主要检测方法。基于块的运动分析在图像运动估计和其他图像处理和分析中得到了广泛的应用,比如说在数字视频压缩技术中,国际标准MPEG1-2采用了基于块的运动分析和补偿算法。块运动估计与光流计算不同,它无需计算每一个像素的运动,而只是计算由若干像素组成的像素块的运动,对于许多图像分析和估计应用来说,块运动分析是一种很好的近似。这里主要介绍块匹配方法。块匹配方法实质上是在图像序列中做一种相邻帧间的位置对应人物。它首先选取一个图像块,然后假设块内的所有像素做相同的运动,以此来跟踪相邻帧间的对应位置。各种块匹配算法的差异主要体现在:匹配准则、搜索策略及块尺寸选择方法上。
1.匹配准则
典型的匹配准则有:最大互相关准则、最小均方差准则、最小平均绝对值差准则、最大匹配像素数量准则等。
2.搜索策略
为了求得最佳位移估计,可以计算所有可能的位移矢量对应的匹配误差,然后选择最小匹配误差对应的矢量就是最佳位移估计值。因此,人们提出了各种快速搜索策略。这种策略的最大优点是可以找到全局最优值,但十分浪费时间。因此,人们提出了各种快速搜索策略。尽管快速搜索策略得到的可能是局部最优值,但由于其快速计算的实用性,在实际中得到了广泛的应用。下面讨论两种快速搜索方法:二维对数及三步搜索法。
二维对数搜索法开创了快速搜索算法的先例,分多个阶段搜索,逐渐缩小搜索范围,直到不能再小而结束。其基本思想是从当前像素点开始,以十字形分布的5个点构成每次搜索的点群,通过快速搜索跟踪最小误差MBD点。
三步搜索法与二位对数法类似,由于简单、健壮、性能良好等特点,为人们所重视。例如其最大搜索长度为7,搜索精度取一个像素,则步长为4、2、1,只需三步即可满足要求,因此而得名三步法。其基本思想是采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8个点构成每次搜索的点群,然后进行匹配计算,跟踪最小块误差MBD点。
三、运动目标跟踪方法
成像跟踪系统经过图像的预处理、图像的分割识别等一系列信息处理,最终实现对目标位置的实时精确测量。跟踪策略基本上可分为两大类:波门跟踪和相关跟踪。
(一)波门跟踪法分析
参考被跟踪目标外观的实际尺寸形态,事先确定好跟踪窗口就是我们通常所定义的“波门”的概念。与传统的图像处理方法不同,采用波门跟踪法进行图像的分析和处理,其原始状态的图像数据仅仅限于波门内的数据,这样系统一旦捕捉到目标,不仅可以避免传统技术对整幅图像处理过程的耗时缺点,而且这种跟踪技术应用和操作更为简单,跟踪及成像效果也能够得到切实的保障。
(二)相关跟踪法分析
当被跟踪的目标物体出现运动、姿态的调整或由于自然条件等因素造成了背景的杂波干扰时,目标图像的分割及提取工作由于目标矩心及形心的不确定将难于进行。这种情况下,就可以采用相关跟踪的方式进行处理。这种基于图像匹配为基础的相关跟踪技术是以图像相识性度量为基础,获取现场图像中实时的最接近目标图像值的一种跟踪方式。由于分析及处理过程中,不需对用于分割及提取的特征值进行处理,因而可以应用于对图像数据的原始资料的处理方面,这种方法不仅可以使图像的信息得以全部的保留,而且适合众多复杂的环境及场景,是一种操作简单,结果精确的测量方法。
四、结语
近年来,各行各业对视频监控的需求不断升温,但已有的视频监控产品不能满足日益增长的需要。因此,计算机视觉和应用研究学者适时提出新一代监控—视频智能监控。它是目前国内外计算机视觉研究领域热点问题之一。因而,在生产实践中,不断加强对其的分析和研究具有非常重要的现实意义。
参考文献:
篇8
关键词:印制电路板;图像处理;机器视觉;PCB裸板;自动光学检测;缺陷检测 文献标识码:A
中图分类号:TP391 文章编号:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我国是全球第一大PCB生产基地,作为电子产品承载体的电路板,其集成度和产量不断在提高。为了保证电子产品的性能,电路板缺陷检测技术已经成为电子行业中非常关键的技术。建立在图像处理算法基础上的机器视觉检测技术与传统的人工检测技术相比,提高了缺陷检测的效率和准确度。因此,设计一种高效精准的机器视觉检测电路板缺陷的系统,具有非常重要的现实意义。评估印刷电路板质量的一个重要因素就是表观检测,PCB的表观质量对产品性能及成品使用安全有着极大的重要性。而伴随着近年来在工业生产领域崛起的计算机视觉,当前表观缺陷检测和分类识别的研究方向已经转向了利用计算机视觉技术来实现。计算机图像处理识别技术这种基于计算机视觉的检测技术成功取代了传统的PCB缺陷检测方法,在自动光学检测系统众多应用中占据了相对重要的地位,一跃成为PCB生产业表观缺陷的主要检测方法。
图1 系统框图
因此本文通过设计AOI自动光学检测系统,搭建较为简单的PCB缺陷自动检测系统的实验平台,对PCB中四类较为关键、常见的缺陷进行检测、分析、识别、判定,为研究推广PCB缺陷自动检测系统开拓应用前景,如能实现工业上的产业化检测,将有高额的经济收益。本文侧重对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,即通过复杂算法对采集到的图像进行处理、配准、对比,从而得出PCB缺陷类型及对其进行标识。如图1所示。
1 硬件设计方案
PCB缺陷检测的总体系统设计方案主要是基于自动光学检测技术来搭建PCB缺陷检测系统,硬件设计是使用CNC-T程控光源高精度影像测试系统操作台,对待测电路板进行图像采集,再通过VS2010软件所编写程序处理,得出待测电路板的缺陷种类。整个系统主要分为运动控制、光源、图像采集、图像处理四个模块,分模块简要阐述了实验过程、所需设备以及软件算法,搭建了一个相对完整的系统工作平台。
图2 CNC-T程控光源影像操作台
该设备具有测量元素种类齐全、手动测量、自动对焦等多种功能,使用该设备采集图像进行二维检测,测量软体为YR-CNC,将图像储存至电脑后便由VS软件进行图像处理。实验组成如图3所示:
图3 实验系统框图
1.1 运动控制模块
本系统运动流程为:被检测的PCB在检测台上,通过步进电机XY轴运动到摄像机拍摄区域,CCD摄像机固定在工作台上方(Z轴),通过Z轴的运动实现聚焦。如图4所示:
图4 平台运动示意图
设备工作台台面尺寸为746mm×506mm,承载玻璃面尺寸为452mm×354mm,有效测量行程为400×300×200。本装置既可通过软件驱动自动采集图像,也可以通过手动控制,移动并聚焦采集待测PCB的图像。
1.2 光源模块
辅助光照――采用的是正向和背向光源这两种辅助光照。其中正光源和摄像头同侧,均位于Z轴上,正光源主要用于检测待测物体的表面特征。背光源位于检测台面下方,与正光源处于同轴反向关系,背光源能突出待测物体的轮廓特征,常用于检测物体轮廓尺寸。
图像采集:分别利用正光源突出PCB表面如走线、过孔和焊盘等主要特征,而下光源主要使PCB的轮廓尺寸和过孔产生强烈的轮廓对比。
光源:使用的是高度集中照明光源中心的LDR系列,由于该光源的伞状结构紧密排列着LED且采用了CCS独创的柔性板,使之成为LED照明系统的标准模式。照明系统如图5所示:
图5 照明系统
1.3 图像采集模块
图像采集模块是由图像采集卡、相机和镜头组成的,该模块是图像配准阶段的硬件基础。计算机采集图像的媒介就是相机,而相机按照不同原理又分为多种,常见的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)两类。本系统采用的是CCD 1/2英寸43万像素彩色摄像头和高清晰度0.7~4.5X变焦倍率镜头,显示分辨率为0.001mm。
1.4 图像处理模块
通常获得的图像将受到工业现场环境、光照等条件的干扰,计算机所获得的图像质量多数参差不齐,图像的清晰度不一致,大大增加了PCB缺陷检测的难度,所以在利用复杂算法检测、识别PCB缺陷前要先对图像进行预处理。
本图像处理模块主要通过VS软件在OpenCV计算机视觉库的基础上,通过一系列算法对图像进行处理对比。
2 系统软件设计
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一个跨平台的可以运行在Linux、Windows和Mac OS操作系统上的基于(开源)发行的计算机视觉库。它重量轻而高效,开放了多种接口如MATLAB、Ruby和Python等,并且在计算机视觉和图像处理中大多数通用的算法都是被允许的。OpenCV可用于开发实时图像处理、计算机视觉和模式识别方案,它提供了多种函数,实现了大量的计算机视觉算法,算法涵盖了从最基础的滤波至以高级的物体检测。OpenCV实际上是一堆C和C++语言源代码文件,许多常见的计算机视觉算法由这些源代码文件实现。如C接口函数cvCanny()实现Canny边缘检测算法。它可直接加入到我们自己的软件项目编程中,而无需去编写自己的Canny算子代码,就是没有必要重复“造轮子”。
根据OpenCV中源代码文件巨多的特点,以算法的功能为基准,将这些源文件分到多个模块中,如core、imgproc、highgui等。将每个模块中的源文件编译成一个库文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用户在使用时,仅需在自己的项目中添加要用的库文件,与自己的源文件一起连接成可执行程序即可。
OpenCV计算机视觉库的出现,是为了使人们利用方便快捷的计算机视觉框架,在计算机视觉领域可以更加轻松地设计出更为复杂的应用程序。OpenCV涵盖了多种计算机视觉应用区域,如用户界面、信息安全、医学影像学、工厂产品检验、立体视觉、机器人和摄像机标定等,约有500多个函数。因为计算机视觉与机器学习是相辅相成的,所以OpenCV也开放了MLL(Machine Learning Library)机器学习库。MLL除了在视觉任务相关中使用,也可以很容易地应用到其他机器学习中。
2.2 Microsoft Visual Studio2010
Visual Studio是微软公司推出的开发环境,是同行业中目前最流行的Windows平台应用程序开发环境。Visual Studio 2010于2010年4月12日,其集成开发环境(IDE)已被重新设计和组织,变得更简单了。
Visual Studio 2010同时带来了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持开发面向Windows 7的应用程序。除了Microsoft SQL Server外,它还支持IBM DB2和Oracle数据库。目前有专业版、高级版、旗舰版、学习版和测试版五个版本。Visual Studio的用处十分广泛,不仅可被用来基于Windows平台创建Windows应用程序和Web应用程序,还可被用来创建智能设备、Office插件和Web服务等应用程序。微软的Visual Studio 2010将成为一个版本的经典,这是相当于6.0版本。该版本可以自定义开始页,新功能还包括:(1)C# 4.0中的动态类型和动态编程;(2)多显示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增强;(8)使用Visual C++ 2010创建Ribbon界面;(9)新增基于.NET平台的语言F#。本课题将基于OpenCV计算机视觉库使用Microsoft Visual Studio2010开发环境,通过编辑算法实现PCB缺陷检测。
3 图像预处理
要使用计算机对图像进行处理,所得到的连续图像就必须被转换为离散的数据集,这是因为计算机只能处理离散度数据,这一过程我们称之为图像采集。图像采集由图像采集系统实现,如图6所示。图像采集系统的三个主要模块是成像系统、采样系统和量化器。
图6
将整理出的字符图像交予识别模块来识别,被称为图像的预处理。PCB的图像预处理包括灰度化、增强、滤波、二值化、配准等,处理后的PCB输出的图像质量将得到改善,在很大程度上使得该图像特征更直观,方便计算机分析和处理。PCB的图像预处理为整个PCB缺陷检测系统的核心部件,很大程度上决定了检测的准确性。图像预处理流程如图7所示:
图7 图像预处理流程图
4 PCB缺陷检测
本文针对四种常见缺陷:断路、短路、毛刺(凸起)、缺损(凹陷)进行检测研究。在这四种缺陷中,最为严重的缺陷类型是断路和短路,它们将会使整块板子失去本来的功能;而凸起、凹陷也可能影响到PCB在使用过程中的稳定性能。如图8所示为几种常见的缺陷:
图8 常见电路板缺陷
4.1 PCB缺陷的检测方法
常用的PCB缺陷检测方法有参考法和非参考法两种。要是从概念理解和电路难易程度看,参考法明显更加具有概念直观、电路简单的优势;要是从检测所需要的条件来看,非参考法则在不需要待测PCB与标准PCB进行准确对准这一点上优于参考法。
本课题采用参考法进行PCB缺陷检测。
使用参考法对PCB缺陷进行检测的流程为:(1)确定标准的PCB图像并放入参考库;(2)通过成像设备采集待测PCB图像,进行图像预处理之后,再二值化PCB待测图像,并对其进行连通域提取;(3)然后将处理结果与标准图像进行对比,利用图像相减来判断PCB可能存在的缺陷;(4)进行分类,确定缺陷类型。
4.2 图像连通域
像素是图像中最小的单位,每个像素周围有8个邻接像素,常见的邻接关系有两种:4邻接与8邻接。4邻接一共4个点,即上下左右。包括对角线位置的点,8邻接的点一共有8个,如图9所示:
图9 领域示图
如果像素点A与B邻接,我们称A与B连通,即有如下的结论:
如果A与B连通、B与C连通,则A与C连通。在视觉上看来,点与点相互连通,形成一个区域,而不是连通的点形成不同的区域。这种相互立体的所有的点,我们称为连通区域。连通区域标记常用的方法有Two-Pass(两遍扫描法)和Seed Filling(种子填充法)两种方法,本课题主要介绍第二种。
Seed Filling来源于计算机图形学,通常应用在填充图形上。思路:以一个前景像素当作种子,而后在处于同一像素值且位置相邻的连通区域,把和种子相邻的前景像素融合到同一组像素中,结果将是获得一个像素集,即连通区域。接下来介绍使用种子填充法实现的连通区域分析法:
第一,重复扫描图像,当得到当前像素点B(x,y)=1时停止:(1)赋予B(x,y)一个label,并将像素位置作为种子,接着将所有位于该种子周围的前景像素都压入栈中;(2)将栈顶像素赋以相同的label值并弹出,接着将全部位于栈顶像素周边的前景像素都压入栈中;(3)重复(2)步骤,直到栈为空。此时,图像B中的一个像素值被标记为label的连通区域便被找到了。
第二,在扫描结束前,重复第一个步骤,由此可以获得图像B中所有的连通区域在扫描结束后。
扫描所得的连通域如图10所示:
图10 图像连通域提取
4.3 缺陷识别
缺陷识别具体特征如表1所示:
表1 缺陷特征
缺陷种类 二值图像面积 连通区域数
断路 减少 增加
短路 增加 减少
凸起 增加 不变
凹陷 减少 不变
第一,短路和断路。在出现短路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会减少。同理可得,在出现断路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会增多。因此,断路和短路缺陷便可利用比较连通区域数来判定和识别。
第二,凸起和凹陷。凸起缺陷将导致导线和导线、导线和其他导体间的间隙变小,而凹陷缺陷将导致导线和导线、导线和其他导体间的间隙变大,二者均会导致PCB使用过程中出现不稳定状态。而观察可知,这两种缺陷的连通区域相同,差别在于各自二值化面积的大小,所以可以通过计算该待测图像的连通区域面积来识别凸起、凹陷缺陷。
识别过程:将经过图像预处理的待测PCB图像与标准图像进行对比后,通过算法找出缺陷。比较二者的连通区域数,若前者大于后者,则标定该缺陷点为断路,反之则为短路;若二者连通区域数相同,则比较二值化图像面积,若前者大于后者,则标定该缺陷点为凸起,反之则为凹陷。检测流程如图11所示:
图11 PCB缺陷检测流程图
5 系统实验
本文使用CNC-T程控光源高精度影像测试系统操作台,结合VS2010软件基于OpenCV计算机视觉库的算法编程来实现PCB的缺陷检测。整体实验过程为:手动控制操作台捕捉、聚焦、采集待测PCB的图像,采集到的图像与标准图像进行对比、识别,得出缺陷种类并显示结果。
本课题一共就所研究缺陷类型,做了40组实验,通过实验结果计算正确率。如表2所示:
表2 实验结果统计
缺陷类型 实验次数 正确率
断路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
针对不同电路板图中出现的同种断路类型进行检测,效果如图12a、图12b、图12c所示,可准确检测出缺陷存在。
图12
针对不同电路板图中出现的同种短路类型进行检测,效果如图13a、图13b、图13c所示,可准确检测出缺陷存在。
图13
针对不同电路板图中出现的同种凸起类型进行检测,效果如图14a、图14b、图14c所示,可准确检测出缺陷存在。
图14
针对不同电路板图中出现的同种凹陷类型进行检测,效果如图15a、图15b、图15c所示,可准确检测出缺陷存在。
图15
6 结语
PCB板面向体积越来越小、密度越来越高的方向发展。在检测产品价格方面,国外AOI检测产品价格普遍偏高,而由于经济原因,在国内PCB板生产制造商多数仍采用人工目测等传统检测方法检测。随着经济的发展,数字图像处理研究的深入,自动光学检测系统也开始频繁活跃在人们视线中,但在PCB缺陷检测方面的应用却还有待完善。因此,本论文建立在深入掌握工控系统结构并从PCB板的质量标准、图像特点、缺陷特征及检测要求的分析基础上,对以图像处理为基础的PCB缺陷检测技术进行了深入研究。由于PCB缺陷自动检测系统的研究涉及多个领域的知识,其研究过程十分耗时、繁琐,由此,本论文仅仅对PCB缺陷检测中较为常见的问题进行了较深入研究,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定。虽然还未实现真正实现工业上产业化检测,但是在未来几十年中,研究推广的PCB缺陷自动检测系统将有十分良好的应用前景,也将有高额的经济收益。
参考文献
[1] 陈胜勇,刘盛,等.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.学习OpenCV[M].北京:清华大学出版社,2009.
[3] 周长发.精通Visual C++图像处理编程(第3版)
[M].北京:电子工业出版社,2006.
[4] 党振.中国大陆PCB产业的现状与未来[J].印制电路信息,2006,32(1).
[5] 胡跃明,谭颖.自动光学检测在中国的应用现状和发展[J].微计算机信息,2006,(4).
[6] 李汉,何星,等.印刷电路板的自动光学检测系统
[J].无损检测,2004,26(6).
[7] 张利,高永英,等.PCB板检测中的定位研究[J].中国图像图形学,1999,4(8).
[8] 姚立新,张武学,等.AOI系统在PCB中的应用[J].电子工业专用备,2004,(5).
[9] 范小涛,夏雨人.一种基于图像处理的PCB检测算法研究[J].计算机工程与应用,2004,(13).
[10] 傅莉.印制电路板的发展及前景[J].电脑与电信,2010,(5).
[11] 张明轩.基于视频序列的人脸检测与跟踪算法研究[D].中北大学,2011.
[12] 张驰.基于机器视觉的智能控制与图像识别问题研究[D].兰州理工大学,2009.
[13] 谢飞.基于计算机视觉的自动光学检测关键技术与应用研究[D].南京大学,2013.
[14] 张静.PCB表观缺陷的自动光学检测理论与技术
[D].电子科技大学,2013.
[15] 俞玮.AOI技术在PCB缺陷检测中的应用研究[D].电子科技大学,2007.
篇9
【关键字】行人检测 目标检测 图像处理
一、引言
在计算机视觉领域中,行人检测是目标检测的一个重要研究热点,其主要利用各种传感器获取行人的数据信息,通过图像处理及模式识别等算法从图像数据中检测出行人。其中传感器包括激光、雷达等。行人检测并不是孤立存在的,它与行人跟踪、行为分析、姿态估计、场景分割等问题息息相关,因此具有极高的科研价值和商业价值。
二、行人检测技术发展趋势
如图1所示,早在2007年开始就已经出现了行人检测技术的研究。2007至2010年期间,专利申请量虽然呈逐步增长趋势,然而增长速率较平稳,每年的申请量没有太大的变动;2011年相比较于2010年增长率达到两倍以上,此后2012年和2013年相较前一年都有较大的增长量,然而在2014年专利申请量与其前一年2013年相比,呈现减少的趋势,这可能与发明专利未提前公开有关,但该年的总量在除2013年以外的其它各年中仍占有绝对性的优势,预计2014年申请量不会低于2013年。
三、行人检测技术解析
常见的行人检测方法可分为基于简单的图像处理的行人检测方法和基于计算机视觉的行人检测方法。
3.1基于简单图像处理的行人检测技术
该类技术主要分为:帧间差分法、光流法和背景差分法等。其与基于计算机视觉的技术相比算法较为简单,不需要事先准备大量的训练样本或模板,处理速度也较快,因此在国内也占据一定的申请量。如上海交通大学的专利CN201210586125采用高斯混合模型对背景建模从而检测行人,宁波大学的专利CN201210017307采用图割方法进行行人检测,奇瑞汽车股份有限公司的专利CN201310382009通过获取候选区域的至少两个特征图进行候选区域是否包含行人的判断。
3.2基于计算机视觉的行人检测方法
基于统计学习的方法与其他方法相比占绝对性的优势,是最近几年高校和科研院所所研究的重点,同时也是公司企业发展的方向。如北京中星微电子的专利CN200710179786采用积分图像和平方积分图像提高分类器的检测速度,江苏大学的CN201110447411对特征向量进行稀疏表示并组合成稀疏化的混合特征向量作为分类器的特征进行行人检测。
特征和分类器是统计学习的两大关键技术。对特征的改进占56%,如中国科学技术大学的专利CN200810101705利用种群优化寻找行人检测最优特征进行行人检测,北京博康智能信息技术有限公司的专利CN201210082846利用梯度特征和线性边缘特征进行行人检测;
分类器的改进分别占42%,如杭州海康威视数字技术股份有限公司的专利CN201210169536利用多尺度的Adaboost作为分类器进行行人检测,无锡慧眼电子科技有限公司的专利CN201310076413首先基于Adaboost得到级联分类器。
篇10
关键词: 计算机视觉; 考试; 自动监考; 视频帧
中图分类号: TN957.52+3?34; TP373 文献标识码: A 文章编号: 1004?373X(2017)14?0099?03
Abstract: In view of the high packet loss rate and low intelligent degree of the current video monitoring for test invigilation, the optimal design was carried out for the computer vision based automatic monitoring system of student examination. A video frame cycle error correction coding based design method of automatic invigilation system based on computer vision is put forward. The system design is divided into hardware and software design, including the A/D circuit, clock circuit, video frame cycle error correction coding circuit, program load circuit and output interface circuit. The experimental test results show that the system can reduce the video packet loss in the invigilation process effectively, improve the vision coverage degree of invigilation area, and has high system integration and intellectuality.
Keywords: computer vision; examination; automatic invigilation; video frame
0 引 言
随着视频图像处理技术的发展,采用计算机视频监测方法进行现场O控设计,提高对监控区域的自动化识别和管理能力[1]。学生考试自动监考系统是考试智能化管理系统的重要部分,采用计算机视觉分析方法进行自动监考,首先采用计算机视频监控方法进行考试现场的实时视觉画面采集,从而实现对考试现场的检验分析和指导。研究学生考试自动监考系统,在促进智能化考试管理和提高考场监考的管控能力方面具有积极重要意义[2],对学生考试自动监考系统是建立在视频图像分析基础上的,结合系统硬件设备设计和软件开发,采用计算机视觉分析方法进行监控现场的异常信息特征提取和分析,采用视频帧循环纠错编码避免监控过程中的丢包和误码失真。首先进行系统的总体构架分析,然后进行监考系统的硬件模块化设计,最后进行系统调试分析,得出有效性结论。
1 系统设计与实现
1.1 器件选择
根据上述设计思想和总体设计构架,进行基于计算机视觉的学生考试自动监考系统的硬件模块化设计,学生考试自动监考系统的数据采集系统是整个系统的基础。通过PCI桥接芯片与PC机进行数据通信,采用PCI9054的LOCAL 总线设计方法,进行数据特征采集,把学生考试监考现场的视频信息存储到PCI总线上,在嵌入式RAM中对监控视频信息进行收发转换和视频帧间编码,基于视频帧循环纠错编码方法进行视频纠错。硬件设计主要包括如下几个部分:学生考试监考现场的视频信息的DSP信号处理器、模拟信号预处理机、视频信息的逻辑控制设备、外部I/O设备以及A/D设备和电源供电设备,用DSP控制A/D转换FLASH寄存器寄存学生考试监考现场的视频视觉特征信息,同时DSP与PCI通信,DSP接收PCI总线的用户信息,输出多路视频编码到功率放大器。通过串行E2PROM进行配置校验,在C 模式下通过PCI总线送采样数据或处理结果到PC机进行监考现场的监控信息分析。
1.2 监考系统的电路设计
根据上述总体设计要求,结合选择的器件,采用可编程DSP芯片ADSP?BF537作为核心处理芯片,进行学生考试自动监考系统的电路设计,主要包括了A/D电路、时钟电路、视频帧循环纠错编码电路、程序加载电路和输出接口电路等,分别设计描述如下:
(1) A/D电路。学生考试监考系统的A/D电路是实现对输入视频采集信息的数/模转换,提供给计算机和DSP芯片可识别的原始计算机视觉信息,结合视频帧循环纠错编码方法进行可视化校对和视频编码。外部I/O设备包括A/D转换器AD7864两片,A/D电路的分辨率为12位,最大采样频率25 kHz,采用AD7864(以下简称7864)作为A/D芯片,它是4通道输入、转换速度1.65 μs的高性能AD芯片,自动监考系统的A/D输入电压满足:
采样通道数由DSP数据总线dspD[3:0]控制[3],A4~A0和译码,利用信号作读数标志信号,得到A/D电路的接口硬件设计图如图1所示。
考虑到系统处理视频传输信息的时间和读数匹配问题,在进行A/D设计中,需要考虑7864模拟输入/输出对应码表,见表1。
(2) 时钟电路。时钟电路执行学生考试自动监考系统的时钟中断控制功能[4],采用5409A 作为自动监考系统的时钟中断的核心控制芯片,5409A有3个多通道缓冲串口McBSPs,提供串行A/D、D/A 设备以及其他的串行器件直接接口,本地总线支持复用/非复用的 32 位地址/数据,包括 PCI 总线操作和LOCAL总线操作,PC9054 内部CI9054的LOCAL 总线与PCI总线通过异步操作实现两个 DMA数据的串行接口输入和输出。时钟电路的引脚设计如图2所示。
(3) 视频帧循环纠错编码电路。视频帧循环纠错编码电路是整个系统设计的核心模块,视频帧循环纠错编码通过Emulator由JTAG(Joint Test Action Group)口下载到DSP中运行,在IEEE 1149.1标准协议下进行 5409A芯片器件的操作测试,芯片采用4通道高性能运放,带宽为10 MHz。使用ADUM1201进行帧同步信号设计[5],选择Motorola 公司高性能 MPC850/86作为自动监考系统的三维特征分析模块,从外部16位存储器读取监测视频图像的编码特征,引出双排的14脚插针外接上拉或下拉电阻,选择引脚、时钟信号输入引脚,数据总线LD 9054与应用电路连接,以串行E2PROM的配置电路作为I/O 初始化控制寄存器模块单元,直接从地址0x20000000执行16位打包模式实现视频纠错编码,得到视频帧循环纠错编码电路设计如图3所示。
(4) 程序加载电路。选择Motorola 公司高性能 MPC850/86作为学生考试自动监考的可视化校验视觉分析的程序加载电路的核心处理芯片。在程序加载电路中,采用可编程逻辑芯片PLC进行图像信息分析,在程序加载中,从外部16位存储器直接执行16位打包模式,引导ROM配置异步存储器空间,通过连续读取0x00字节的个数来确定学生考试自动监考系统的SPI存储器的片选[6],程序加载电路设计如图4所示。
图4中,在VCC和地之间并联1个电容,满足程序加载电路的可编程的硬件写保护和片内的偶然性的写保护功能。
(5) 输出接口电路。输出接口电路设计中,通过JTAG接口访问CPU的内部寄存器,通过串行E2PROM进行配置校验。使用JTAG仿真器执行12通道DMA异步串行口设计,采用分立元件构成串口复位电路,降低DSP的能耗。开关频率也可在0~1间调节,内核电压在0.8~1.2 V间调整,内核电源通过10 和0.1 电容滤波,以减少电源噪声。实时时钟电源与I/O电源采取分别供电策略,综上分析,得到输出接口电路见图5。
在上述进行系统的硬件模块化设计的基础上,进行系统集成设计与软件开发。
2 实验测试分析
对上述学生考试自动监考系统进行软件开发和系统调试分析。件开发建立在CCS 2.20开发平台下,借助于 LabWindows/CVI,C/C++开发计算机视觉下的图像和视频信息处理程序。根据编写的PCI卡驱动程序进行视频信息采样和监考系统的原始数据采集,得到学生考试自动监考的视频采集分析界面如图6所示。
从图6可见,采用本文设计的考试自动监考系统,能有效实现计算机视觉下的监考视频信息传输。为了定量测试系统的性能,图7给出了不同方法进行监考视觉分析的视频丢包率对比结果,从图7得知,该系统能有效降低监考过程中的视频丢包,从而提高监考区域的视觉覆盖度。
3 结 语
本文提出一种基于视频帧循环纠错编码的计算机视觉自动监考系统设计方法。系统设计分为硬件和软件部分,首先进行了学生考试自动监考系统的总体设计构架分析和功能指标描述;然后以ADSP?BF537并行微处理芯片为核心进行监考系统的硬件设计,包括A/D电路、时钟电路、视频帧循环纠错编码电路、程序加载电路和输出接口电路;最后在Visual DSP++集成开发环境中进行自动监考系统的软件开发设计,结合视频帧循环纠错编码进行程序加载,实现计算机视觉下的自动监考。实验测试结果表明,该系统能有效降低监考过程中的视频丢包,提高了监考区域的视觉覆盖度,具有优越性能。
参考文献
[1] STOEAN C, PREUSS M, STOEAN R, et al. Multimodal optimization by means of a topological species conservation algorithm [J]. IEEE transactions on evolutionary computation, 2010, 14(6): 842?864.
[2] LIANG J J, QU B Y, MAO X B, et al. Differential evolution based on fitness Euclidean?distance ratio for multimodal optimization [J]. Neurocomputing, 2014, 137(8): 252?260.
[3] 章俊,张冬梅,王辛刚.一类参数不确定连续正系统受限控制[J].信息与控制,2015,44(5):592?597.
[4] 陆兴华,吴恩.基于安卓客户端的智能家居电力控制优化设计[J].电力与能源,2015,36(5):692?695.