计算机视觉特点范文

时间:2024-01-11 17:41:08

导语:如何才能写好一篇计算机视觉特点,这就需要搜集整理更多的资料和文献,欢迎阅读由公文云整理的十篇范文,供你借鉴。

计算机视觉特点

篇1

关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物

中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3

计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。

1 计算机视觉中与摄像机定标解析

计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。

2 传统的摄影机定标方法及应用特点

传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。

2.1 基于3D立体靶标的摄像机定标

这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。

这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。

2.2 基于2D平面靶标的摄像机定标

基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。

这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。

2.3 基于径向约束的摄像机定标

基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。

总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。

3 摄像机自定标方法及其应用特点

摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。

3.1 基于主动视觉的自定标法

目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。

这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。

3.2 基于Kruppa方程的自定标方法

基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。

这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。

3.3 分层逐步定标法

分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。

这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。

3.4 基于二次曲面的自定标方法

基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。

在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。

4 传统摄像机定标方法与自定标方法优缺点分析

从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。

4.1 传统的摄像机定标方法弊端

传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。

总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。

4.2 摄像机自定标方法相关问题

目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。

5 结束语

随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。

参考文献

[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.

[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.

[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.

[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.

[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.

[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.

[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.

[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.

篇2

【关键词】计算机;视觉系统;框架构思

在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。

1 计算机视觉系统现有理论框架

1.1 计算机世界理论框架

20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。

1.2 基于知识的视觉理论框架

基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。

1.3 主动视觉理论框架

主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。

基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。

2 计算机视觉理论框架中存在的问题

计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。

基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。

主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。

3 计算机视觉系统框架的新构思

在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。

计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。

在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。

模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。

视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。

计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。

【参考文献】

篇3

关键词:动态场景;自适应预测;多特征融合;计算机视觉;运动目标

接受信息的关键手段之一就是视觉系统,随着科学技术水平的不断发展,以及计算机和信号处理理论的诞生,让机器拥有人类视觉功能已经不再是梦。对所采集视频中的运动目标进行跟踪、检测,并对其目标行为进行分析,就是运动目标分析的内容,运动目标分析是计算机视觉领域关键内容之一,其属于图像理解与图像分析的范畴。而在运动目标分析系统中,跟踪与检测运动目标则为中级和低级处理部分,是分析与理解行为的高等层分析模块的基础。检测与跟踪运动目标技术主要包括了:机器人视觉导航、军事领域、运动图像编码、交通管制、视觉监视等。

1目标检测算法

连续图像序列由视频中提取出,由前景区域与背景区域共同组成了整个画面。前景区域包含了如运动的人体、车辆等动态要素,它是指人们较为感兴趣的区域。而背景区域主要包含例如树木、建筑物等静态要素,它的像素值仅发生微弱变化或者不产生变化。在连续图像序列中,采用一系列算法分隔开背景区域和前景区域,将运动目标信息有效提取,则为运动目标检测。以静态场景为基础的运动目标检测算法包括了光流法、背景差分法、帧间查分法等,文章主要针对背景差分法进行介绍。

背景差分法通常适用于静态场景,其是将背景图像与当前帧图像进行差分,运动目标依靠阀值化进行检测,因为该算法仅能够在背景变化缓慢或者不发生变化的情况下应用,因此就有着一定的局限性。假设当前帧图像为fk(x,y),背景图像B(x,y)可通过一定的方法得出,而这时背景差分图像则为:

(1)

而假设二值化阀值为Th,二值化图像B(x,y)则为:

(2)

运动目标检测结果可通过数学形态学处理获得。

2 背景模型的实时更新

要更新背景图像可采用一阶KALMAN滤波来实现,为了克服气候变化、光照变化等外部环境变化对运动检测产生的影响,采用一阶KALMAN滤波更新背景图像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子则为:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是权值系数;M是第k时刻二值化后目标图像中p像素的值;B为背景图像;I为当前帧图像。要想将运动目标从背景序列图像中有效分割出来,就必须要达到?琢2足够小的条件,且?琢1应等于或者大于10?琢2,若?琢1值过大,就会将算法自身的去噪特性丧失,在序列背景图像中也会存储越来越多的运动变化。

3 更新车辆目标模型

核与活动轮廓算法具有效率高、技术复杂度低等特点,它以非参数核概率密度估计理论为基础,在视频运动目标跟踪中广泛应用。彩色图像序列通过摄像机获取,人脸目标模型可以采用RGB颜色空间来进行描述。在跟踪车辆的过程中,噪声、遮挡、光照等干扰或多或少存在,因干扰因素的存在,车辆像素特征也会发生相应的微弱变化。若不对目标模型进行更新,会对跟踪精度产生影响,所以,采用的矩形模板会包括一定背景。而在实施跟踪的过程中,要对车辆目标模型进行更换。如果其过程物遮挡,当BHATTACHARYYA系数满足?籽>Tudm条件时,更新车辆目标模型,更新模型为:

(5)

公式中Tudm是模板更新阀值;qk-1是更新之前的车辆目标模型。通过视频跟踪,在近场景和远场景拍摄到的视频中,多尺度图像空间由各个帧图像构成。例如:将将书本作为跟踪对象,由远及近从书本的正上方拍摄六十帧图像,为了能使矩形框正好能够包含书本,对每帧图像张书本手工划定矩形框,并对框内图像的信息量进行统计。最后,随书本尺度的变化,给出图像信息量变化曲线。

4 计算机视觉原理

计算机视觉是一门研究怎样使机器进行观察的科学,更切确地说,就是指利用电脑和摄影机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为传送给仪器检测或更适合人眼观察的图像。计算机视觉研究相关的理论和技术作为一个科学学科,尝试创建能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。

计算机视觉就是由计算机来代替大脑完成处理和解释,用各种成象系统代替视觉器官作为输入敏感手段。使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力就是计算机视觉的最终研究目标,而需要经过长期的努力才能达到这个目标。所以,在实现最终目标以前,通过努力的中期目标是建立一种视觉系统,这个系统能依靠反馈的某种程度的智能和视觉敏感完成一定的任务。例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但要实现自主导航的系统,却还没有条件实现象人那样能识别和理解任何环境。所以,人们通过不懈的努力,研究在高速公路上具有道路跟踪能力,有效避免与前方车辆碰撞的视觉辅助驾驶系统。人类视觉系统是有史以来,人们所知道的功能最强大和完善的视觉系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,但并不等于计算机必须按人类视觉的方法完成视觉信息的处理。可以说,对人类视觉处理机制的研究将给计算机视觉的研究提供指导和启发,所以,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,与此同时也是一个十分重要和让人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉领域的不完善性与多样性为其突出特点。

5 结束语

对视频中的运动目标进行跟踪、识别、检测,并对目标行为进行研究、分析,这就是基于视觉运动目标分析。以计算机视觉为基础,分析运动目标,包括了目标行为的理解与分析、目标跟踪、运动目标检测、预处理图像等,它是计算机视觉领域重要内容之一。理解与分析运动目标的行为,既是计算机视觉的根本目的之一,也是检测与跟踪运动目标的最终目标。从理论层考虑,理解与分析运动目标的行为可以分为人工智能理论研究与模式识别。简要阐述基于计算机视觉的运动目标分析,而所面临的是对运动目标行为的理解。

参考文献

[1]杨可,刘明军,毛欣,夏维建,刘伟,周旋,吴炜,周凯.基于计算机视觉的电缆终端表面温升分析系统[J].电视技术,2013(7).

[2]叶闯,沈益青,李豪,曹思汗,王柏祥.基于人类视觉特性(HVS)的离散小波变换(DWT)数字水印算法[J].浙江大学学报:理学版,2013(2).

[3]何青海,马本学,瞿端阳,李宏伟,王宝.基于机器视觉棉叶螨自动监测与分级方法研究[J].农机化研究,2013(4).

[4]贾挺猛,苟一,鲍官军,董茂,杨庆华.基于机器视觉的葡萄树枝骨架提取算法研究[J].机电工程,2013(4).

篇4

关键词:计算机视觉;研讨式教学;小组探讨;课前回顾

作者简介:陈芳林(1983-),男,湖南株洲人,国防科学技术大学机电工程与自动化学院,讲师;周宗潭(1969-),男,河南洛阳人,国防科学技术大学机电工程与自动化学院,教授。(湖南 长沙 410073)

中图分类号:G643.2 文献标识码:A 文章编号:1007-0079(2013)26-0065-02

进入21世纪,创新型人才的培养成为各国政府和高等教育界关注的一个焦点。世界各国研究型大学的共同特点是在研究生教育阶段致力于培养富有创新意识和创新能力的高级人才。[1]研讨式教学是培养研究生创新精神、科研能力的有效途径,教师讲解与学生探讨两部分相结合是研讨式教学采用的主要模式。[2]将课程分成两部分之后,教师讲解的时间就必须压缩,教师一方面需要思考如何在较短的时间内完成课程的讲解,同时还需要考虑课程讲解要与学生探讨部分紧密结合。因此,如何上好研讨式教学教师讲解这部分课,越来越受高等院校的重视。本文针对笔者教授工科研究生课程“计算机视觉”的实践与经验,阐述了笔者对于如何上好研讨式教学教师讲解这部分课的个人体会。总结为两点:第一,首先要充分做好课程准备;第二,上课环节采取回顾—案例—小结的讲解方式。下面从课程准备、课前回顾、课程讲解、课后小结四个方面分别阐述(如图1所示)。

一、“计算机视觉”课程准备

要上好一门研讨式教学的课程,一定要结合该门课程的特点,量身定制课程内容,进行精心准备。本节先介绍“计算机视觉”课程的特点,然后结合该门课程的特点,介绍笔者对于“计算机视觉”的课程准备。

1.“计算机视觉”课程特点

“计算机视觉”是“数字图像处理”和“模式识别”等课程的后续课程。该课程重点在于图像或者图像序列的分析理解。课程知识在机器人导航、侦查、测绘、测量、精密加工和目标跟踪等多个领域都有广泛的应用。[3]近年来基于视觉信息的控制反馈也开始受到广泛关注。国内高校一般都为研究生开设了此门课程。

计算机视觉技术应用广泛、算法原理涉及面广:涉及到概率与数理统计、信号与系统、图像等基础知识。“计算机视觉”是一门重要的控制类、电子类及计算机类专业研究生的选修课程,它内容广泛、综合性强,研讨能力的培养显得非常关键。

2.课程准备

首先,结合“计算机视觉”课程内容广泛、技术日益更新和丰富的特点,将课程36学时分为12次课,每次课为3小时,每堂课教师讲解一个专题。这种设计,一方面可以更广地涉及计算机视觉的各个领域;另一方面以专题的形式来讲解,可以将学生带入到该专题,介绍基本背景、理论、知识和方法,让学生有一个初步的了解,方便课后学生对感兴趣的专题进一步深入挖掘与研究。

其次,在课程开始之前,教师仔细统筹,安排好每次课的专题,这样既方便学生一开始对整个课程有一个整体的了解,也方便学生选择课堂研讨的题目与内容。根据12个专题,将各个专题讲解的内容与课件在开课之前准备好,这样有利于把握各个专题之间的前后承接关系。例如,“区域”与“分割”是既有区分又有联系的两个专题,在课程开始之前,将课件准备好,就有利于宏观把握,在“区域”专题提到的分割算法,就不需要在“分割”专题再次重复,而在“分割”专题可以结合前面“区域”专题进行互相补充,以帮助学生融会贯通。

最后,在每个专题上课之前,再对课件进行精雕细琢,主要是对内容分好层次,对方法进行分类,力图在较短的时间内,让学生对该专题有较全面的认识。例如,在讲解图像分割时,由于图像分割方法非常多,可以将分割方法分为若干个大类,每个大类只讲1~2个方法。这样既可以尽可能涉及更广的领域,又可以提高讲解的效率。

二、“计算机视觉”课前回顾

课前回顾是指每堂课的前面一小段时间用来回顾上一堂课的内容。虽然课前回顾时间非常短,一般为3~8分钟,但是课前回顾是课堂教学中的一个重要环节。课前回顾可以帮助学生加强将要学习的内容与已学过内容之间的联系。通过课前回顾,学生可以回忆前续课程所讲解的概念、理论、算法的步骤等内容,有助于解决新问题或者理解新知识。

课前回顾最重要的是既要复习前续课程的内容,又要注意将前续内容与当前内容联系起来。由于讲解时间有限,要使研讨式教学的教师讲解部分效率高,教师帮助学生回忆上堂课的概念、模型、算法等内容,就变得非常重要。如果不做课前回顾,那么当讲到某处新知识时,往往需要停下来,将前续课程再讲一遍,否则学生无法理解新的知识,这样就降低了教学的效率。

课前回顾的时间,一般以3~8分钟为宜。课前回顾的形式可以多样化,如讲解课后作业、回顾概念、提问等。笔者认为应根据当天课程与前续课程的关系,采取合适的方式。各种方式结合使用,提高课前回顾的效率。

三、“计算机视觉”课程讲解——案例教学

案例教学已经成功地应用于数学、计算机科学等领域的教学。通过案例,学生可以很快地掌握相应的概念、算法的步骤等,从而提高教师讲解部分的效率。[4]例如,在讲解马尔科夫随机场时,笔者通过案例式教学,将马尔科夫随机场用一个生活中的例子来向学生解释。首先,将马尔科夫随机场分解成两个重要的概念,分别是随机场与马尔科夫性,然后将它们对应到例子中,帮助学生理解。

随机场包含两个要素:位置(site)和相空间(phase space)。当给每一个“位置”中按照某种分布随机赋予“相空间”的一个值之后,其全体就叫做随机场(如图2(a))。[5]这个概念非常抽象,难以理解。笔者应用案例式教学,拿庄稼地来打比方。“位置”好比是一亩亩农田,“相空间”好比是种的各种庄稼。给不同的地种上不同的庄稼,就好比给随机场的每个“位置”,赋予“相空间”里不同的值。所以,可以形象地理解随机场就是在哪块地里种什么庄稼的布局(如图2(b))。

马尔科夫性指的是一个随机变量序列按时间先后顺序依次排开时,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。为了更直观地理解马尔科夫性,笔者仍然拿庄稼地打比方,如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关,与其他地方的庄稼的种类无关,这种性质就是马尔科夫性。

符合上述两个特征,那么这些地里种的庄稼的集合,就是一个马尔科夫随机场。通过案例式教学,笔者发现可以加深加快学生对课程内容的理解,提高教师讲解环节的效率。

四、课后小结

课后小结指的是一堂课将要结束时,教师对本堂课进行一个简短的总结。许多成功的教师都会在其教学中坚持课后小结这个环节,给学生一个总体的印象,以帮助学生消化本次课程的内容。

研讨式教学教师讲解部分的课后小结与普通教学方式应有所区别。笔者认为这主要是因为通过课后小结可以将本次课程所讲内容与学生的研讨环节结合起来,而不仅仅是对内容进行简单的总结。

为了达到课后小结使本次课程内容与学生探讨环节建立联系的目的,笔者在教学中常采用如下方式:首先,像普通教学方式一样,总结本次课程内容;然后,在此基础上,抛出若干问题,这些问题,不需要学生马上解答,而是留给学生课后思考,提供他们选择研讨主题的素材;最后,介绍其他在本次课程中没有涉及到的前沿知识、方法与理论,拓宽学生的视野,从而增加学生选择探讨主题的覆盖面。

通过应用这种方式,笔者发现学生的思维更开阔,在探讨环节,学生往往可以选择一些比较新颖的主题(例如视频中不动点的检测等),而不仅仅局限于教师所讲内容,从而提高了研讨式教学的效果。

五、结论

在“计算机视觉”课程中引入研讨式教学,通过总体设计规划好整门课程内容,课堂讲解注意采用回顾—案例—小结的方式,笔者对如何上好研讨式教学教师讲解这部分课进行了个人经验的总结。通过本次教学改革,笔者体会到如果要提高教学效果,一定要注意教师讲解与学生探讨两个环节的紧密结合。

参考文献:

[1]侯婉莹.我国研究型大学本科生科研研究[D].济南:山东大学,

2009.

[2]张晴,李腾,韦艳,等.研讨式教学模式的理论研究[J].中国科技纵横,2011,(10).

[3]D.H .巴拉德.计算机视觉[M].北京:科学出版社,1987.

篇5

关键词:计算机工程;视觉领域;深度学习技术

引言

计算机视觉简言之即是依靠电子设备成像来代替生物视觉系统,随后依靠提前写好的程序对获取的图像信息实施处理。该技术的短期应用目的在于完成相对简单的智能视觉工作,而深度学习技术在计算机视觉领域的应用,在很大程度上丰富了其功能,提高了识别效率,让其能够在更多行业发挥出自身价值。

1计算机视觉领域的深度学习技术

1.1图像分类中的深度学习技术

基于深度学习技术,卷积神经网络得到了进一步的发展,其应用范围也更为宽泛,例如说在图像分类中的运用。图像分析需要对图像实施扫描分析,随后对其具体类别予以划分,更加注重其整体语义。目前相对普遍进行图像分类的数据集为ImageNet,其中囊括了非常丰富的内容,存储了近1500万个图像的URL并将图像划分为数万余个类型。ImageNet每年组织开展的大规模视觉识别挑战赛(ILSVRC)中,图像分类算法与技术也不断创新,图像分类的准确性也持续提升。ImageNet数据集表现出规模大、类型多的突出特点,所以更加适用于迁移学习,即是把部分核心技术或结构拓展应用到各个领域,对于视觉领域的深度模型来说,能够把模型内的网络结构和参数直接共享到其他数据集,从而对数据实施微调。图像分类属于计算机视觉领域最为基础的环节,对于图像分类模型创建和数据分析处理经验也能够迁移应用到其他领域中。

1.2目标检测中的深度学习技术

目标检测相对于图像分类而言表现出更多的复杂性,主要任务是在囊括多种不同类型物体的图像内精确定位和识别某一物体,恰恰是出于这一目的,深度学习技术在目标检测中的应用更为复杂,要实现更加精准的效果也相对更难。近年来针对目标检测的算法日益更新,如优化后的R-CNN算法,是借助于卷积神经网络思想,对物体进行分类,提取物体特征。而SelectiveSearch算法的出现有了进一步的创新和突破,有效促进了检测准确性的提高,这也给通过卷积神经网络进行目标检测带来了更多可能性,随后的FastR-CNN算法极大地促进了目标检测效率的提升,该算法对提取候选区的问题予以优化,大大减少了候选区提取和目标检测过程的时间。目标检测网络以FastR-CNN算法作为支撑,于输出位置设置滑动窗同时和候选区域网络实施连接,目标检测的关键在于卷积神经网络,依靠它把各个点的特征进行提取,再借助回归算法获得对应范围出现目标的概率[1]。

1.3人脸识别中的深度学习技术

人脸识别主要是借助相应算法对人脸特征实施提取,因为其建立的人脸模型表现出一定的不稳定性,因此模型建立往往也表现出一定的难度,相对于建立刚体模型而言更为困难。人脸识别通常来说涉及人脸检测定位以及特征提取两个方面,人脸检测定位是基于背景图像中将人脸目标分割出来,实施归一化处理,而人脸特征提取算法不变。前者存在的技术难点是人脸目标具有多样性以及背景图像具有复杂性,所以对背景情境实施合理假设并予以简化是十分关键的。与此同时,高维空间人脸模型的建立较为复杂,精确度估算难度较大,人脸特征提取的技术难度是因为人脸属于弹性模型,其难度超过刚体模型。一般来说,较为常见对人脸特征实施提取与识别的方法有几何特征法、特征脸算法以及弹性模型法,CNN算法和过去的特征提取算法比起来表现出更高的稳定性和适用性,同时能够有效抵抗外部干扰,促进人脸识别技术的推广应用。

2应用实例

2.1安防领域的应用

深度学习技术在计算机视觉领域中的应用可以为安防行业提供更佳的解决方案,比如说人脸识别技术的应用,很多大型企业如Facebook、腾讯、阿里巴巴等都将非常关注和重视。作为深度学习技术在计算机视觉领域应用的重要内容,人脸识别在安检以及反恐等领域中也能够发挥出很好的效果。与此同时,对行人角度的REID技术实施研究,依托于深度学习强化目标检测,对目标特征实施提取和刻画,能够为异常行为监控和跟踪带来支持[2]。

2.2无人驾驶领域的应用

对于无人驾驶领域来说,选择激光或雷达这类传感器的成本更高,基于深度学习的计算机视觉技术也能够提供新的解决方案。依靠摄像机对视频画面进行采集,对获取到的图像实施分析,提供类似于前车碰撞预警等功能。在这一过程中,计算机视觉技术可以实现对目标的检测识别、对目标车辆的跟踪分析、对车道线是否偏离进行检测等。基于深度学习技术的检测识别表现出更加强大的优势,现阶段深度学习芯片日益增多,对于无人驾驶技术的发展也带来了更加有力的支持。

2.3智能家居领域的应用

过去的很多智能家居产品一般都是依靠智能手机蓝牙或者WiFi等途径来实现对家居产品的控制,这一方案即便能够做到家居智能化,但其水平依旧有待提高。基于深度学习技术,能够有效促进智能家居行业的更新发展,除开语言、语音识别之外,还能够利用计算机视觉技术实现人际交流与互动,比如说手势识别控制。2.4教育领域和图片搜索领域的应用基于深度学习的计算机视觉技术也能够在智慧教育中得以普及应用,如近年来很多新的拍照解题App,使用者只需要利用手机相机拍照上传即可获得相关题目的分析解答,促进学习者学习效率的提升。此时视觉技术包括了对文字的检测与识别,另外针对个人简历识别、文档识别等方面也能够进行拓展应用。同时计算机视觉技术还可以在图片搜索领域中得以应用,使用者通过拍摄上传相应的图片,即可从数据库中找出与原图相似的图片,深度学习属于一种非常高效的技术手段,能够提供更加快速高效的图像检测功能,结合图像搜索引擎,为用户带来更加便捷的服务[3-5]。

2.5医疗影像数据中的应用

医学影像直接关系到对患者疾病诊断的准确性,对于放射科的医务人员来说,依靠医学影像能够促进诊断效率的提升。现阶段国内外诸多医学专家队伍,在心血管、肿瘤、神经内科以及五官科等都建立了精准深度学习模型,极大地推动医疗水平的提升,为广大患者带来了更加便捷和高效的医疗服务。基于深度学习技术的计算机视觉在医疗影像数据中的应用主要集中在如下几个方面:(1)能够提供临床诊断辅助等医疗服务;(2)依靠数据分析技术,能够在很大程度上促进医疗机构经营管理水平的提升;(3)在医学影像中的应用,能够让医务工作者更加直观便捷地获取患者影像;(4)深度学习技术能够为医疗大数据的可视化带来便利;(5)在药企研发工作中的应用,可以处理好过去一直以来药物研发周期长和成本居高不下的问题;(6)在健康管理领域中的应用,借助于可穿戴设备来对个人健康数据实施监测,进而对疾病风险予以提前预测。

篇6

关键词:数字图像处理;测距;聚焦;频域

中图分类号:TP391.41 文献标识码:A 文章编号:2095-1302(2012)09-0016-03

Images ranging method based on frequency domain analysis

ZHU Xue-yi

(School of Microelectronics and Solid-State Electronics, University of Electronic Science and Technology, Chengdu 610054, China)

Abstract: Using digital image processing theories and methods, the digital image pre-processing mode, the target graphic detection and the ranging model construction are studied and analyzed. Combined with a ranging scheme of single camera, a focusing ranging technique based on frequency domain analysis is given to process images captured by the monocular camera and calculate the distance from target detection image to the camera based on frequency domain image signals. The technique saves lots of complex hardware and reduces the demands of digital image processing, which has the advantages of high ranging precision and fast processing speed.

Keywords: digital image processing; ranging; focusing; frequency domain

0 引 言

视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的。计算机视觉就是人类利用计算机实现人的视觉功能,从而对客观世界三维场景进行感知、识别和理解。计算机视觉是一个相当新而且发展迅速的研究领域。

在对生物视觉系统的研究中,人们早就注意到,几乎所有具有视觉功能的生物都有两只眼睛。用两只眼睛同时观察物体,会有深度或远近的感觉,我们称之为视差。因此,在计算机视觉系统中,也常用两台或多台摄像机从两个或多个视点去观察同一场景,从而获得在不同视角下的一组图像,然后通过同一场景点在不同图像中的视差,推断出场景中目标物体的空间几何形状和位置,这种方法称为立体视觉。它是计算机视觉的一个重要分支,也是计算机视觉的核心研究内容之一。

视频和图像是对物质世界客观事物的形象而生动的描述,是最直接且具体的信息表达形式之一,是人类最重要的信息载体。随着科技的日益发展,人们需要一种更加先进快捷的工作方式,另外,人们对工作环境和工作条件也提出了更新、更高的要求,视频测距系统便在这种背景下应运而生。

视觉测距技术的发展对于距离测量有重要的意义。在基于数字图像处理技术的视觉测距系统中,使用单个CCD(Charge Couple Device)摄像机的系统称为单目摄像系统,而同时使用两台摄像机对同一景物进行摄像,并运用计算机分析两幅图像来确定物体的三维状况的系统称为双目摄像系统。双目摄像系统测量精度高,但计算速度较慢,成本较高。而单目摄像系统方法则比较简洁、快速,因此,本文对采用单目摄像系统检测目标物的测距方法进行研究。

1 测距技术在国内外的研究现状

目前,国内外对视觉测距技术的研究仍在不断的进行之中,还并没有形成国际统一的标准模式,各种数字图像处理技术和算法之间孰优孰劣仍在不断的探讨和比较中。当前,国内外的研究机构主要研究的测距技术包括超声波测距技术、微波雷达测距技术、激光雷达测距技术和视觉测距技术。

1.1 激光雷达测距

激光雷达测距具有测量时间短、量程长、精度高等特点,但激光雷达在恶劣天气环境下或逆光状态下的测距准确性降低,另外,其造价、耗能、对人眼安全等因素也对其进一步应用有一定影响。

1.2 超声波测距

超声波是指振动频率在20 kHz以上的机械波,具有声波传输的基本物理特性。超声波测距是根据超声波反射时间来计算与前方车辆之间的距离。超声波测距原理比较简单,成本低,但超声波的传输速度受天气影响较大,不同天气条件下的传输速度不同。

篇7

【关键词】虚拟多传感器;计算机;视觉检测

一、视觉信息系统模型与实现方法

对于一个通用视觉系统来说,其性能主要取决于两方面的因素:一方面总体上是如何组织的,有哪些模块组成,模块间如何联系;另一方面是每个模块内采用了哪些技术,信息如何被加工的。许多专用的视觉信息系统模型是一种松散的知识库模型。这些以松散的知识库为主的模型都各有特点,但共同的不足就是计算量特别大,对信息处理采取不同的抽象和表达,复杂度也不断增大,难以满足连续工业在线快速检测的要求。针对这些不足,本文提出一种专用的有知识驱动、信息融合的视觉信息系统模型,该模型实现了对图像中被检测目标个数的搜索,用以实现螺纹钢支数工业计算机视觉系统的在线检测。具体实现过程为:

1.训练匹配器模板:用上文提供的方法获取标准匹配器模板。

2.获取特征图:将实时图像灰度图分别用Cnany边缘算子、邻域平均值算子进行变换获得相应的特征图。

3.搜索特征量并确定其基本信度:将上述特征图和灰度图在相同的位置同时扫描,获得相应的特征,根据特征量得到相应检测目标的基本信度。

4.确定模板匹配相似度:利用匹配技术确定匹配器模板和指定区域的相似度及基本信度。

5.合成基本信度并作出判断:权系数D-S证据融合算法计算最终的信度,根据结果判断该区域有无被测目标。

6.优化屏蔽搜索区域:屏蔽搜索到被测目标的区域,避免重复搜索。

7.获得被测目标总支数:依次搜索特征图像,累加有被测目标的总数,即得到原始实时图像中的被测目标总支数。

二、证据理论应用举例

为了说明检测过程,考虑对两个典型区域的检测过程进行说明,其中一个为有检测目标的区域,一个为没有检测目标的区域。在应用过程中,已经训练获得到了匹配器标准模板。对一幅实时图像,分别用Cnany边缘算子和空间均值滤波等变换得到到相应的边缘特征图像和去噪声特征图像,原始图像也作为一个特征图像。用C表示目标,N表示非目标,目标识别框架为U={C,N}。具体实现步骤如下:

(1)传感器基本信度分配确定;

(2)计算加权后各个传感器的基本信度分配;

(3)按照DenlPster组合公式将m1:和m2组合;

(4)将m1:和.m2组合。

由计算结果可知,通过融合后不确定性的基本信度下降到0,在实际应用中,该值可能会大些,在应用中隐含地引入了一个限制条件,即mU(<)0.02时本次决策才有效。采用基本信度分配进行决策,根据公式,即y(x)=m(A)-m_ThV可知,给定阀值m_ThV时,可以根据融合结果确定出被检测区域的类别。在实际应用中,给定经验阀值m_ThV=0.89,则对区域1有y(x)=0.997-0.8>0,可确定出区域1中存在检测目标;而对区域2有y(x)=0.292-0.89<0,故区域2尽管有些特征类似于检测目标端面(如模板匹配程度、区域灰度均值等),但通过融合可以明显地区分出来该区域不存在检测目标。

三、优化屏蔽搜索区域

为了提高搜索效率,避免重复搜索,当确定出所搜索的区域存在被测目标时,如图1中区域1,可以根据所搜索的被测目标直径,计算该截面上的边界,推导出与这些边界相切的另外可能存在的被测目标的模板顶点的轨迹:(x-s)2+(y-t)2=D2口。其中(s,t)为当前模板覆盖区域的顶点坐标,D为被测目标截面半径,(x,y)为另外被测目标截面上覆盖的模板顶点坐标。然后该圆下半部分以点(s,t)为中心垂直分割,其左半部分圆内与半圆的交集部分)全部屏蔽,作为不再搜索区域;右半部分圆内(半圆与区域1的交集部分)给出特殊标志,表示此区域不再作为搜索区域顶点,但该区域的边界、灰度、灰度梯度等信息均保留,以免将有用信息屏蔽。在边缘特征图中,对区域2与半圆交集部分不再搜索支数;而对区域1与半圆交集部分,仅对该区域的特征信息完成搜索仍然需要搜索。

图1

四、试验与结果分析

为验证上述方法,进行了两个方面的试验。

首先是研究了方法的有效性。对于被测试的每一幅图的结果,用程序测试完后将结果同时显示到图像中,并在搜索到被测目标的区域用一个黑色圆标注,表示在该区域已经搜索到一个目标。这样可以完成搜索结果与被检测目标实际位置进行对比,可以判断算法实现、搜索结果的有效性。确定有没有误搜索:在没有目标的位置搜索的被测目标(虚检);而在有目标的地方又没有搜索的被测目标(漏检)。避免了搜索结果与目标真实数目一致而位置不符合实际的情况。并且,在搜索到的检测目标旁边标注浅灰色半圆,表示该区域已经在搜索过程中被屏蔽过。给出几幅对实时图像算法及搜索过程有效性验证结果的实际图像,图像中被测目标为中18的螺纹钢端面。

可见,该方法搜索的钢材在图像中的位置和支数都符合实际位置和支数,表明该方法是有效的。在端面特征中,选择用边缘特征、局部灰度均值特征、梯度分布特征和模板匹配器匹配程度特征等四个特征的信度分配来融合确定目标,实现对图像区域的分类,从而可以实现工业计算机视觉在线检测的任务。

然后用实际在线检测的方法试验所提出的方法的准确性。在实际应用中对φ20的成品钢进行了连续在线检测。系统的准确性还是比较高的,基本实现了在线快速的检测功能。

五、小结

本章通过对螺纹钢生产线上采集的实时图像的特征分析,提出了虚拟多传感器的概念,将实时图像用不同变换得到多幅特征图像,将每一幅特征图像在相同检测区域的特征信息看作是一种传感器获取的信息。这样,将实时图像中被测目标的识别问题归结为非线性二分类问题。利用虚拟多传感器信息,提出了基于加权D-S证据理论信息融合的模式分类方法,将该分类方法应用到计算机视觉检测中,在此基础上,提出了一种工业计算机视觉检测系统的实现方法。

在检测某一区域是否存在检测目标时,在特征图像中相应的区域根据获取特征信息,得到是否存在被测目标的基本信度分配,即:在边缘特征图像中对应的区域获得边缘信息、在去噪特征图像中对应的区域获得区域灰度均值信息和梯度分布信息、在原始图像中对应的区域获得与标准匹配模板相似度的信息;将这些信息量化成基本信度分配,用加权D-S证据理论融合这些基本信度分配;根据融合结果完成对区域分类,确定出是否有检测目标存在;历遍整幅图像即可得到图像中被测目标的总数。

将实现所提出的检测方法的应用程序及其系统应用的某炼钢厂进行了在线检测,结果表明,所研究的方法实现了在不增加传感器数量和对传感器要求的情况下使检测系统的可靠性时得到了保证,并得到了比较高的准确性。该方法的准确性可以达到97%。

参考文献

[1]张婷.计算机图形图像设计与视觉传达设计的研究[J].信息系统工程,2014(2).

篇8

[关键词]自动控制技术 农业自动化

中图分类号:TD823.8 文献标识码:A 文章编号:1009-914X(2014)10-0256-01

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距, 已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术, 如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展, 从而形成了一系列适合我国农业特点的自动化控制技术。

一、已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上, 成功研制出6CRK-55型可编程控制加压茶叶揉捻机, 它利用计算机控制电功加压机构, 能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制, 是机电一体化技术在茶叶机械上的首次成功应用。

1.应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

2.应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

3.应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时, 自动掐断燃料供给的装置。

二、微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年, 全国共有节水灌溉工程面积0.133亿m2, 其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段, 高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况, 对灌溉用水进行动态监测预报, 实现灌溉用水管理的自动化和动态管理。在微灌技术领域, 我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备, 总结出了一套基本适合我国国情的微灌设计参数和计算方法, 建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统, 可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

三、自动控制技术在精准农业中的应用

篇9

关键词:高速铁路 路基 沉降 沉降观测 预测模型

中图分类号:U215

文献标识码:A

文章编号:1007-3973(2012)005-037-02

1 前言

铁路路基暴露在室外,加之我国地域广阔,地形、地质、水文、气候等情况复杂:路基边坡和坡脚受坡面雨水冲刷、日晒雨淋将引起土的干湿循环、气温变化将引起土的冻融变化、河水对边坡或坡脚处地基不断的冲刷和淘刷等,使路基常年处于升降动态循环之中,路基附加应力受其很大影响。路基填料级配不良、排水失效、过渡段碎石级配失效或不养生、路基横向碾压、填料含水率超标等将引起路基沉降。铁路两旁新修建的建筑物尤其是特大型建筑也会对路基产生影响,所以铁路路基沉降在一定意义上讲不可避免。但过大的变形沉降将直接影响旅客舒适度以及行车安全,所以必须对高速铁路路基沉降加以防治。本文着重介绍高速铁路路基沉降观测及预测技术。

2 高速铁路路基沉降测量控制要求

只有做好高速铁路路基沉降测量工作,才能保证沉降控制工作的顺利完成,为接下来的工作提供数据资料。所以工程技术人员要采用科学正确的方法,高效的完成测设工作,要保证测量精度要求,利用配套计算机对所有观测值进行严密平差,保证整个控制精度完全能够符合国家工程测量技术规范和工程设计要求。

2.1 设备要求

高速铁路沉降观测要求高精度,为了精确测量路基的沉降情况,一般规定测量的误差应小于变形值的1/10—1/20。采用一般仪器,会受到周围环境的影响而导致误差过大,所以对观测仪器的精度要求极高。观测时应优选受环境影响小的仪器,比如精密水准仪。

2.2 观测人员要求

高速铁路沉降观测要求高精度,工程技术人员应该有较高的职业技术水平和职业道德。观测人员应该专业、准时、高效的完成测量任务,对观测数据认真负责,坚决杜绝补测或修改数据等恶劣行为。

2.3 实际观测的具体要求

观测前,要对观测地点的地形、地貌、地质、水文以及气候等情况加以调查,联系实际情况选择最适宜的观测方法,既要保证观测的高效,又要保持正精度的要求。

2.4 观测点的选取

高速铁路沉降观测精度高,所以对观测点的选取要求也很高,在保证方便观测的前提下,选择合适的观测点,最好是视野开阔,地势平坦的稳定位置。

2.5 观测周期及观测时间

施工阶段,应随施工进度及时进行。观测次数与时间间隔应视地基与加荷情况而定。在观测过程中,如有路基附近荷载突然增减、长时间连续降雨等情况,均应及时增加观测次数。若路基发生大量沉降、不均匀沉降或严重裂纹时,应该立即进行逐日甚至一天数次的连续观测。

3 路基沉降预测模型的应用

对高速铁路路基沉降进行预测传统的方法有三种:(1)采用分层总和法计算最终沉降量,利用简化固结公式计算固结度,然后推算沉降的发展规律与趋势。(2)根据固结理论,结合室内试验获得土的各种本构模型,利用有限元方法预测最终沉降量以及其发展规律。(3)基于前期沉降量实测资料来建立沉降量与时间关系数学模型的预测方法。

3.1 曲线拟合法

曲线拟合,就是通过实验获得有限对测试数据(xi, yi),利用这些数据来求取近似函数y=f(x)。式中x为输出量,y为被测物理量。即通过分析实测资料与时间的关系,建立适当的沉降与时间的函数关系,进而推测沉降的发展规律。曲线拟合法是将沉降近似看做按照某种规律变化的过程,对实际测量的沉降数据进行拟合,建立某种相适应的曲线模型,采取适宜的优化方法,反推出计算公式所需的参数,在运用于后期的沉降预测。此方法参数较少并且易于确定,所以应用广泛。工程中常用的曲线拟合法包括:双曲线法、星野法、指数曲线法、三点法、沉降速率法、Asaoka法、S形成长曲线模型。

3.2 灰色系统理论

灰色系统理论是20世纪80年代,由中国华中理工大学邓聚龙教授首先提出并创立的一门新兴学科,它是基于数学理论的系统工程学科。灰色系统理论,是一种研究少数据、贫信息不确定性问题的新方法。灰色系统理论以“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。

3.3 人工神经网络

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。利用人工神经网络理论建立预测路基沉降的BP模型和Elman模型,两种模型在预测路基沉降时,不需要建立任何土工模型,只要采集训练网络的样本就可以比较精确的预测路基沉降。

3.4 遗传算法

遗传算法是由美国的J.Holland教授1975年首先提出,是一类借鉴生物界的进化规律(适者生存,优胜劣汰遗传机制)演化而来的随机化搜索方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。

路基沉降预测模型的建立对于高速铁路沉降预测与控制至关重要。适宜的预测模型可以很好地预测路基沉降的发展趋势,对于工程施工以及线路运营阶段的管理都有指导作用。通过路基沉降预测模型与实测数据,推算最终沉降量,若预测沉降超限,应及时采取相应的工程措施。

4 一种新的沉降测量方法:计算机视觉测量技术

计算机视觉测量技术是近年来测量领域中迅速发展起来的崭新技术,它是以现代光学为基础,融合计算机技术、激光技术、图像处理与分析技术等现代科学技术为一体,组成光电一体化的综合测量系统。视觉测量技术的检测仪器设备能够实现智能化、数字化、小型化、网络化和多功能化,具有精度高、非接触、在线检测、实时分析与控制、连续工作等特点。计算机视觉也称为机器视觉,是指利用计算机对采集的图像或者视频进行处理,从而代替人眼的视觉功能,实现对客观世界的三维场景的感知、识别和理解的技术。计算机视觉使用计算机及相关设备对生物视觉进行模拟。其主要任务是通过对采集的图像或视频进行处理,以获得相应场景的三维信息。计算机视觉使用的理论方法主要基于几何、概率、运动学计算和三维重构等视觉计算机理论,其基础包括摄影几何学、刚体运动学、概率论与随机过程、人工智能等理论。运用计算机视觉测量技术,可以实现高速铁路沉降的远程自动化观测,方便、快捷、实时性强,即可以保证测量的精度,又减轻了工程技术人员的负担,是一项有待发展的新兴测量技术。

5 结论

综上所述,高速铁路路基沉降对于工程建设、旅客舒适度、运营安全有着致命影响,所以路基沉降观测是必须采取的。采用正确的观测方法,严格按照基本要求和规范观测,建立正确的陈建预测模型,保证路基沉降在标准的允许范围之内是高速铁路建设的关键。随着新兴技术的发展,沉降观测及防治措施必定越来越多,越来越精确,我国的高速铁路事业也必将更上一层楼。

参考文献:

[1] 仝校涛.试论高速铁路路基沉降控制方法[J].黑龙江科技信息,2011,(27).

[2] 李春光.高铁路基沉降分析及控制[J].建筑科技与管理,2011,(3).

[3] 易思蓉.铁道工程(第二版)[M].中国铁道出版社,2009.

篇10

【关键词】机器视觉;应用研究

机器视觉是一门涉及人工智能、计算机科学、图像处理、模式识别、神经生物学、心理物理学等诸多领域的交叉学科。机器视觉主要利用计算机来模拟人或再现与人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。随着现代计算机技术、现场总线技术与大规模集成电路技术的飞速发展,机器视觉技术也日臻成熟,已经广泛应用在国民经济发展的各行业。

1.机器视觉系统组成

一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块,如图1所示。首先采用CCD摄像机获得被测目标的图像信号,然后通过A/D转换成数字信号传送给专用的图像处理系统,根据像素分布、亮度和色彩等信息,进行各种运算来抽取目标的特征,然后再根据预设的判别标准输出判断结果,去控制驱动执行机构进行相应处理。

总之,随着机器视觉技术自身的成熟和发展,可以预计它将在现代和未来制造企业中得到越来越广泛的应用。

2.机器视觉技术的应用

在国外,机器视觉的应用主要体现在半导体及电子行业,其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路;SMT表面贴装;电子生产加工设备;机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。

而在中国,以上行业本身就属于新兴的领域,再加之机器视觉产品技术的普及不够,导致机器视觉在以上各行业的应用几乎空白。目前随着我国随着配套基础建设的完善,技术、资金的积累,各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现,国内有关大中专院校、研究所和企业近两年在图像和机器视觉技术领域进行了积极思索和大胆的尝试,逐步开始了工业现场和其它领域的应用。

(1)工业中的应用

虽然机器视觉技术从20世纪80年代才开始起步,但由于其突出的优点,在各种工业领域被广泛应用,特别是近几年发展十分迅速,国内外的成果也是层出不穷。

在国外,机器视觉技术广泛应用于机器零部件的装配、非接触测量、产品质量检测、在线过程控制、数控机床加工、过程监控等领域。英国ROVER汽车公司800系列汽车车身轮廓尺寸精度的100%在线检测,是机器视觉系统用于工业检测中的一个较为典型的例子,该系统由62个测量单元组成,每个测量单元包括一台激光器和一个CCD摄像机,用以检测车身外壳上288个测量点。汽车车身置于测量框架下,通过软件校准车身的精确位置。测量单元的校准将会影响检测精度,因而受到特别重视。每个激光器/摄像机单元均在离线状态下经过校准。同时还有一个在离线状态下用三坐标测量机校准过的校准装置,可对摄像顶进行在线校准。检测系统以每40秒检测一个车身的速度,检测三种类型的车身。系统将检测结果与人、从CAD模型中撮出来的合格尺寸相比较,测量精度为±0。1mm。ROVER的质量检测人员用该系统来判别关键部分的尺寸一致性,如车身整体外型、门、玻璃窗口等。实践证明,该系统是成功的,并将用于ROVER公司其它系列汽车的车身检测。

机器视觉在国内的应用主要集中于检测与定位等几个方面,这样的工业产品占据了中国市场的绝大部分。机器视觉在工业检测中的应用最为常见的是对各种机械零件的几何尺寸进行测量,在半导体及电子行业,国内高等院校和科研单位也研究出基于机器视觉的管脚尺寸自动检测装置。此外,机器视觉还被用于对于如刀具等工业设备的检测和数控机床的加工。在很多工业领域存在着高精度定位的问题,如钻床数控系统钻头定位、金属板材数控加工轨迹坐标定位等。目前机器视觉技术由于其高精度的优点在这方面得到广泛的应用。华中科技大学在金属板材数控加工中利用机器视觉技术对加工轨迹坐标定位。提出一种基于机器视觉的非接触式加工轨迹坐标定位方法,完成了金属板材数字化成形中支撑模型的非接触式高精度快速定位。湖南大学进行了钻头视觉定位研究,在视觉定位中采用间接定位方式,间接实现钻头刃磨初始状态的定位。中国计量学院等单位进行了基于机器视觉的PCB数控钻机定位研究。大量的实践证明采用机器视觉系统进行定位并且综合运用数控伺服传动技术以及各种先进控制技术能够有效实现精确定位。利用机器视觉系统节约了大量的人力和物力,降低了产品生产成本。

(2)农业中的应用

计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。在农田作业机械上,机器视觉技术被不断的开发和应用。农药的粗放式喷洒正是农业生产中效率最低、污染最严重的环节。利用机器视觉技术可以实现农药的精量喷洒,近年来,机器视觉技术在播种机械方面的应用主要是检测播种质量;在自动收获机等农田自动作业机械上,更需要依靠机器视觉系统来确定作物行与机械的相对位置,以控制自动作业机械在作物行间自动行进,

机器视觉技术在农业生产上的应用可提高生产的自动化水平,解放劳动力,具有良好的应用前景。同时还应看到,由于农业对象的特点,机器视觉理论和技术的局限性以及硬件条件的限制,机器视觉技术在农业生产的应用距离实用和普及还有相当长的距离。相信随着相关技术的发展,很多问题会得到好的解决,机器视觉技术在农业生产中的应用会极大地加快农业现代化的进程。

(3)医学上的应用

随着药品和医疗器械安全性问题重要性的不断提升,越来越多的生产厂商将机器视觉技术引入实际生产中来,以达到提高生产效率,加强产品品质保障的目的。同样,在医疗系统中机器视觉也得到了越来越多的应用。

机器视觉科技医药领域的应用主要分为医学与药物两部分。机器视觉技术在医学疾病诊断方面的应用主要体现在两个方面:一是对(X射线成像、显微图片、B超、CT、MRI)图像增强、标记、渲染处理,主要利用数字图像处理技术、信息融合技术对X射线透视图、核磁共振图像、CT图像进行适当叠加,然后进行综合分析协助医生诊断;二是利用专家知识和3D重构对物体三维信息与运动参数进行分析并给出形象准确的解释,如诊断与手术等。机器视觉技术的应用不仅节省了人力,而且大大提高了准确率和效率。在药物方面,机器视觉系统对药用瓶的缺陷检测,也包括了药用玻璃瓶范畴,也就是说机器视觉也涉及到了医药领域,其主要检测包括尺寸检测、瓶身外观缺陷检测、瓶肩部缺陷检测、瓶口检测等。除此之外,对药剂杂质的检测、对医学用具质量的检测、对药物外包装泄露的检测等等都在保障着药物的质量安全,保障着人们的生命健康。

(4)交通领域的应用

随着计算机的普及和相关软件的不断更新升级,机器视觉技术在交通领域所发挥的作用愈为重要。机器视觉技术在交通领域的应用范围较广,主要包括视频检测系统、智能车辆的安全保障系统、车牌识别和交通指挥等。

视觉技术应用于视频检测时,视频检测系统的目标就是用数字图像处理和计算机视觉技术,通过分析交通图像序列来对车辆、行人等交通目标的运动进行检测、定位、识别和跟踪,

并对目标的交通行为进行分析、理解和判断,从而完成各种交通流数据的采集、交通事件的检测,并尽快进行相应处理。视频的交通事件和参数检测系统有高度的网络化和智能化,可实现远程监控和设置。视觉技术应用于智能车辆安全保障系统,主要用于路径识别与跟踪、障碍物识别、驾驶员状态监测、驾驶员视觉增强等。德国UBM大学Dick-manns教授领导的智能车辆研究小组一直致力于动态机器视觉领域的研究,研制的EMS-Vision视觉可较好地模拟人眼功能。车牌识别技术(VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。随着图像处理技术的日趋成熟,更多算法的融入综合,使得车牌识别技术逐渐成熟。单一算法很难达到良好的识别效果,只有多种方法结合,才能实现车牌识别的高效性和准确性。过去的10多年里,有些国家已经成功开发了一些基于视觉的道路识别和跟踪系统。其中,具有代表性的系统有:LOIS系统、GOLD系统、RALPH系统、SCARF系统和ALVINN系统等。

机器视觉技术在交通各领域都发挥着越来越重要的不可替代的作用。在取得较大成绩的同时仍有不足。其一应尽快开发出具有高性价比的实用化的激光距离成像系统,能够获取高质量的原始图片至关重要;其二,处理各种交通事件的及时性决定了所有的图像处理的速度应尽可能的快,目前的各种算法都各有优劣,如何能在最短的时间内完成图像的识别工作成为我们下一步要努力的方向。

3.发展趋势

在机器视觉赖以普及发展的诸多因素中,有技术层面的,也有商业层面的,但制造业的需求是决定性的。制造业的发展,带来了对机器视觉需求的提升;也决定了机器视觉将由过去单纯的采集、分析、传递数据,判断动作,逐渐朝着开放性的方向发展,这一趋势也预示着机器视觉将与自动化更进一步的融合。未来,中国机器视觉发展主要表现为以下一些特性:

(l)随着产业化的发展对机器视觉的需求将呈上升趋势。

(2)统一开放的标准是机器视觉发展的原动力。

(3)基于嵌入式的产品将取代板卡产品。

(4)标准化一体化解决方案是机器视觉发展的必经之路。

(5)机器视觉系统价格持续下降、功能逐渐增多。

4.结语

机器视觉技术经过20年的发展,已成为一门新兴的综合技术,在社会诸多领域得到广泛应用。大大提高了装备的智能化、自动化水平,提高了装备的使用效率、可靠性等性能。随着新技术、新理论在机器视觉系统中的应用,机器视觉将在国民经济的各个领域发挥更大的作用。

参考文献

[1]李福建,张元培.机器视觉系统组成研究[J].自动化博览,2004(2):61-63.

[2]范祥,卢道华,王佳.机器视觉在工业领域中的研究应用[J].现代制造工程,2007(6):129-133.

[3]张萍,朱政红.机器视觉技术及其在机械制造自动化中的应用[J].合肥工业大学学报(自然科学版),2007, 30(10):1292-1295.

[4]马彦平.计算机视觉技术在农业生产中的应用与展望[J].中国农业资源与区划,2009,30(4):21-27.

[5]饶秀勤.基于机器视觉的水果品质实时检测与分级生产线的关键技术研究[博士学位论文].杭州:浙江大学,2007.

[6]冯新宇,庞艳辉.车牌识别技术实现方法初探[J].交通科技与经济,200712:50-511.

[7]徐琨,贺昱曜,王夏黎.基于背景模型的运动车辆检测算法究[J].微计算机信息,2007,4-1:120-1211.