计算机视觉方法十篇

时间:2023-12-26 18:01:06

计算机视觉方法

计算机视觉方法篇1

关键词:计算机视觉;定标方法;应用特点

中图分类号:TP319文献标识码:A文章编号:16727800(2012)007014902

作者简介:许志雄(1968-),男,浙江绍兴人,江汉石油钻头股份有限公司工程师,研究方向为计算机多媒体。

0引言

计算机技术的应用在诸多领域占据了主要位置,并得到了人们的极大重视。在此形势下,摄像机的高清晰度亦成为了人们追逐的目标,而在计算机视觉中的定标方法有各种不同的处理方式,从而为摄像机的发展提供了一个绝好的机会。由此,计算机视觉中的摄像机定标方法成为当今世界摄像机研究领域里至关重要的一个方面,以摄像机得到的图像信息作为出发点来计算三维空间中自然场景的几何信息成为计算机视觉的基本任务之一,并且它的应用特点也得到了人们的密切关注。

1摄像机视觉投影原理

透镜成像的原理利用了光的折射现象,而摄像机的视觉投影原理和透镜的成像原理相差无几,只不过在一些细节上进行了相应的改变,使成像更加清晰,以更好地满足人们的需求。摄像机视觉投影原理就是利用镜头的光学原理进行视觉成像,而其中又有许多理论支持,包含镜头与焦距和视角。焦距是指镜头的焦点之间的距离,对于摄像机而言,就是指从镜头的中心位置到摄像管,也可以说是成像的位置之间的距离就是摄像机镜头的焦距,只有调整好了这两者之间的距离,才能保证摄像机的摄像效果,这也是保证摄像机正常工作的首要任务。视角要受到镜头焦距的限制,由镜头焦距对摄像的大小情况而决定,摄影师们就是通过对焦距的不断变换来改变对任务的造型,从而改变人们的视觉效果。对于拍摄相同距离的目标而言,镜头焦距越大,摄像的水平视角就会变得越窄,这样带来的后果就是拍摄到的目标的范围就越小,使得拍摄效果大打折扣,从而给摄像机带来不利的使用效益。因此,必须在两者达到一个较好的组合效果之时,才能够充分发挥摄像机的作用,并将摄像艺术发挥到极致。由此可见,计算机视觉中的摄像机定标方法将会给摄像机的拍摄效果带来巨大的转变。

2计算机视觉中的摄像机定标方法

2.1三维定标法

在人们的平常思维中,凡是物体的影像必定是三维的,本文的理论研究也同样基于这样的想法。在讨论单幅图像的设计标定之时,我们所追求的理论基础就是需要摄像机的定标物是人们所追求的那种三维的效果,在此基础上再进行相关的理论研究,以达到相得益彰的效果。在此过程中,首先要准确定位定标物上一些比较重要的点的三维坐标,这样才能够为后来的工作提供方便;然后在与定标物相对应的成像上找到相应的点的位置,这是至关重要的一步,这也决定了后面成像的具体设计方法;最后在那些比较重要的点的图像上标出其具体的三维坐标,达到定标物的实际成像效果图,这样就可以完全解决摄像机的成像问题了。这种定标方法的基本原理就是充分分析定标物的三维信息,同时与它的具体成像位置相关联,在这两者之间形成一种具体的相对应关系。由此我们可以充分利用计算机的快速运算,实现摄像的功能,并适时进行程序功能改进,优化定标物参数的获取方法,从而达到增加摄像机清晰度的目标。

2.2平面定标法

与上面的定标方法相对立的一种方法就是多幅图像的设计标定。在这样的时代背景下,人们的要求应尽可能得到满足,因而理论研究者会在这个方面下足功夫,弄懂这里面的个中玄机,利用多幅图像对平面的定标物来进行物体的标定工作,以达到摄像机定标的目的。这样的平面定标方法就是充分利用平面物体的运动特性,在它和摄像机之间找到一个平衡点,观察两者的相对运动,这样的定标方法也给拍摄运动中的物体带来了生机。此方法在实施之余也会带给人们不一样的感受,让人们充分体会到摄像的魅力。当然这种考虑运动的平面定标法会受到特征点的增多的影响,随着点的不断增加,定标情况就会越来越好,定标物的精度也会不断提高,于是在定标物相同的前提下,平面定标法自然就可以从定标物上获得更多的数据信息,为准确对定标物进行定位测量提供了更多的依据。因此,这种方法的效果要比前面的方法好很多,得到推广的力度也会大大增加,所得到的经济效益也会增加,设备的成本在原来的基础上还有降低的趋势。所以,理论研究者的研究领域就会逐渐向这一方面进行转变。

2.3两步定标法

有了前面的研究成果作支撑,摄像机定标方法的进一步研究就会显得异常容易,人们的进一步要求也会得到满足,可谓一举两得。理论研究者们在有了丰富的理论和实践基础之后,利用直接线性的定标方法进行摄像机参数的进一步优化提高,通过透视原理来修改以前的参数,然后将修正的参数进行初始值的确认,把它们作为现在研究阶段的起点,在这样的起点之上综合考虑各种外界因素,利用最优化的计算机算法进行摄像机成像程序的改进,把原来的程序进行升级处理,使得定标物的精确度得到进一步的提高,这就是我们所提到的两步定标法。它的基本原理其实很简单,只不过是充分利用了原有的理论,并进行了一定的创新而已。但就是这样的创新步伐的迈出,给计算机视觉中的摄像机定标方法带来了新的生机,也给摄像机镜头的优化带来了很多指导方法。在图像中心到图像点的距离保持不变的前提下,参数的数量会显著减少,这样不仅节省了材料的用量,而且还进一步提高了摄像机的摄像清晰度,有效弥补了以前清晰度不高的缺点。这样一来,摄像机的成像效果大大改进,于是才有了现代摄像机的高清效果,确实让人们享受到了科技带来的福音。

3计算机视觉中的摄像机定标方法的应用特点

3.1建立于主动视觉上的自我标定

由于计算机视觉中摄像机定标方法的不断推广,一些计算机技术在摄像机的制作过程中得到了较好的应用。但是在这之中必不可少地存在一些制作人员或设计人员的主观因素,这样摄像机的标定方法中就会形成形色各异的特点,而且彼此之间可能会出现较大的不同,特别是在主动视觉上的自我标定。在主动视觉中,我们所用到的摄像机可以在一个被控制的平台上被人们固定,利用计算机的高运算能力,计算机可以把平台上所出现的参数精确地读出来,我们只需要利用控制摄像机的运转顺序,让摄像机作一定的周期运动,就可以在这个过程中得到更多的图像,然后再利用所成的图像和固定的摄像机的运动参数来确定摄像机的运动情况。这种自我标定方法比较简单,但是必须为人们提供精确控制摄像机运动的平台,这种以主观意识为主的标定特点强化了个人的主观能动性,让人们更加易于接受。

3.2进行有层次划分的逐步标定

近年来,人们对摄像技术的理论研究已经日趋成熟,并根据自己的意愿进行相关的研究工作,把自己的想法融入到摄像机的设计中,真正做到有层次的逐步标定,把所要的标定物以逐个击破的方式实现有层次的程序算法,从而让人们在逻辑上能够有所认识,并且易于接受,从而达到有层次划分的逐步标定的目的。分层逐步标定法已为标定研究领域中普遍认同的方法之一,在实际的应用中逐渐取代了直接标定的方法。因为进行有层次划分的逐步标定是符合人们的想法的,而且这种方法的特点是以射影标定作为基础,以某一幅图像作为基准图像,进行其它图像的射影对齐工作,从而将摄相机中成像未知参数的数量减少,更易于为人们所接受。可以说,进行有层次划分的逐步标定是人们在实践中得出的一套符合大势所趋的标定方法,为世人所推崇。

4结语

综上所述,计算机视觉中摄像机定标方法在人们的不断认识中得以应用和推广,在时代的不断进步中逐渐向前发展。同时,摄像机标定方法的应用特点也大相径庭,各有千秋,从而实现百家争鸣的态势,进一步推动计算机视觉中的摄像机研究工作的向前发展。

参考文献:

计算机视觉方法篇2

论文摘要 :开发了一种虚拟场景与实时视频之间的合成技术,成功地将该技术应用于虚拟规 划系统中,详细介绍了系统所采用的基于计算机视觉的标识识别和实时、自动摄像机位置、姿态跟踪算法,并给出了系统运行结果。

0  引  言

虚拟现实技术 的最终目的是使用户完全沉浸在一个 由计算机生成的虚拟环境中,该技术已经被成功地应用到军事、教育、娱乐等众多领域。随着应用 的增多 ,虚拟现实技术 的缺陷也逐渐暴露出来,主要表现在如下两个方面:(1)虚拟现实 中的场景完全由计算机生成,随着绘制场景真实程度的提高,对系统硬件配置的要求也相应提高,从而形成了绘制效果和实时性两个同等重要又难以同时解决 的问题 。(2)交互方式受限.鼠标、键盘等传统输入设备并没有提供给用户一种直观 自然的交互方式,而数据手套等较为昂贵的设备不仅使用起来不方便,而且对工作范围也有一定的限制。

混合现实  技术的出现很大程度上解决了以上两个问题,它将计算机生成的虚拟场景、提示信息实时叠加到用户所能观察到的真实世界当中,并以此来增强用户视觉感受 。在混合现实环境中用户所能观察到的主体是来源于真实世界的图像信息,虚拟场景只起到辅助、提示作用,因此不需要真实感图形绘制所需的高端的硬件配置。另一方面,由于图像信息来源于真实世界,这就使得用户本身能够很自然地融合到整个系统中,并且能够 以一种 自然 、直观的方式与系统交互,而不必添加额外的硬件设备。正是由于以上特性,混合现实技术已经被应用到众多领域当中,而且能够比虚拟现实更好地完成某些任务,如交互式规划、动态虚拟展示等。

一个实用的混合现实系统所必须具备的特性之一是几何一致性,即系统必须实时准确地判断摄像机相对于真实世界的位置和姿态.以便将虚拟场景正确地叠加到真实世界的具体位置上,使得用户从感官上认为虚拟场景确实是真实世界的一部分。传统的方法是利用硬件设备(电磁式、机械式跟踪系统)来获取摄像头位置信息,但这些方法不仅工作范围受限,而且求得的结果也不够精确。本文采用当前流行的基于计算机视觉的方法来获取位置信息,事实证明该方法是有效、可行的。

系统结构及工作流程

笔者构建 了一个如图 1所示的混合现实原型系统,主要由如下几个部分组成:(1)平面标识块:一个带有黑色边框的正方形.尺寸、内部图案由用户定义,主要功能是使系统能够根据实际图像中标识的变形来计算虚实配准所需的位置、姿态信息,同时还可以用不同的内部图案代表不同的虚拟场景,以增强系统的实用性。(2)图像采集设备(摄像机):主要完成实时视频采集功能。(3)图形渲染系统:生成与视频合成所需的虚拟场景。(4)虚实合成:利用摄像机位置、姿态信息将视频与虚拟场景相融合。(5)显示设备 :包括头盔式显示器以及桌面台式显示器,用以将虚实合成的影像展现给使用者。

系统运行过程中,首先将采集到的一帧彩色图像转换成一幅二值(黑 白)图像,然后对该二值图像进行连通域分析,找出其中所有的四边形区域作为候选匹配区域,将每一候选区域与模板库中的模板进行匹配,如果产生匹配,则认为找到了一个标识,在生成与该标识对应的虚拟场景的同时利用该标识区域的变形来计算摄像机相对于已知标识的位置和姿态,最后根据得到的变换矩阵实现虚实之间的无缝融合。

2 标识识别与摄像机位置、姿态跟踪算法

由上一节可知,构建该系统有两个关键问题需要解决 ,即如何识别标识内部的不同图案以生成与之对应的虚拟场景 以及如何利用标识的变形计算虚实配准所需的坐标变换关系。以下分别介绍以上两个问题的解决方法。

2.1标识识别

本系统 所采用的标识识别方法可 以分为以下几步。

2.1.1图像二值化

首先对采集到的彩色图像进行二值化,处理成黑白(0,1)图像,如图 2(b)。具体方法为:设定一个 阈值,对图像进行遍历 ,根据该阈值,对图像重新赋值。为了克服光照对识别结果造成的影响,同时采用 了自适应阈值法  来提高系统稳定性,设定当前 阈值 为上一帧图像中标识投影区域像素灰度的平均值,实验证明该方法对改善系统性能有较为明显的效果。

2.1.2连通域分析

连通域分析的 目的是从复杂背景中提取标识的投影区域。分析过程为:查找所有像素值为 1的连通区域,首先根据大小约束对区域进行预筛选,然后利用最小二乘直线拟合法筛选出所有四边形区域 ,结果见图 2(c)。

2.1.3 区域规则化与模板匹配

区域规则化是将图像中经过投影变换的标识区域变换到标准模板空间,本文利用仿射变换  将标识经过投影变形后 的区域直接映射到一个 64×64大小的正方形模板,效果见图2(d)。接下来的工作是将规则化图像与模板库中的模板进行匹配,以返回代表不同虚拟场景的 id值。本文采用相关系数法来完成匹配工作,方法如下:

首先利用以下四式计算规则化图像 i和标准模板图像 p各自的均值和方差。

然后计算两幅图像的相关系数 p,本文选择所有模板中与规则化图像具有最大相关系数 p且 p>0.5的模板作为当前匹配结果,并返回与之对应的 id值

2.2摄像机位置、姿态估计

首先给出系统的坐标变换关系如图 3所示。规定平面标识在世界坐标系中的位置为已知,摄像机位置、姿态计算问题转化为摄像机坐标系与世界坐标系之间三维变换矩阵的求解。

世界坐标 系与摄像机坐标系间的变换关系可以用式(5)表示。其中 w为世界坐标系下某点坐标,c为该点在摄像机坐标系中的位置,t :[r r r:t] 为待求三维变换矩阵,包含三个旋转分量和一个平移分量。

c=t w  (5)

由于规定平面标识与世界坐标系下的z:0平面重合 ,则由式 (5)可得 ,平面标识上的某点在世界坐标系下的坐标 wi=(x ,y wi,0,1) 与其在摄像机坐标系下坐标 c;:(x  y z i,1) 之间的关系可以表示为式(6)。

有 8个待定系数,由标识的 四个角点可得 如下 方程组 ,则完全可以求取以上 8个未知数。

通过上述计算可以确定变换矩阵中的 r ,r ,t,三个分量,由变换矩阵旋转分量的正交性可以求得r :r ×r ,最后需要对所求得的结果作归一化操作以消除比例因子 t 对计算结果的影响,方法是将(1 r l+l r 1)/2去除以上各分量。

事实上由于不可能完全避免成像畸变以及图像处理过程中的误差,上述方法求得的变换矩阵 t 是不够精确的。解决方法是利用上述方法求取第一帧图像对应的 t ,在后续计算过程中采用非线性最小二乘法求取后续帧的对应的变换矩阵。误差逼近计算公式见式 (1 1)。

式中(文  i)(i=0,1,2,3)为根据上一帧t 求得的标识四个角点在像平面坐标系下的位置,(x i,y ;)(i=0,1,2,3)为实时检测到的标识角点在图像中的位置。本 文利用勒温伯格一马阔特方法求解式(11)。

 

3 应用实例——基于混合现实的小区规划系统

传统的住宅小区规划方法之一是制作规划方案模型,但是制作实体模型不仅费时费力,而且修改起来也极为不便。近年来,基于虚拟现实技术的小区规划方法已经逐渐为设计者所接受,它一定程度上解决了实体模型规划方法的缺点,但是由于缺乏高效、自然的人机交互方式,使得规划效果大打折扣。混合现实技术的出现为小区规划提供了新的契机,它既继承了虚拟现实技术卓越的三维表现能力,又具有虚实结合的特点,能够在真实的规划场景中整合设计要素,给设计者和方案评估者以直观的感受。

笔者利用本文方法开发了一套基于混合现实技术的虚拟小区规划系统。系统中不同的标识对应不同的虚拟建筑模型,用户可以在视线范围内随意移动模型.从而实现不 同的规划 方案 。运行效果 如图4该系统满足了小区规划对虚实交互、人机交互的要求,充分体现出混合现实技术在小区规划应用中的优势。

计算机视觉方法篇3

关键词:计算机视觉;课程创新;教学改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02

计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。

2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。

四、结语

在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。

参考文献:

[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).

[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).

[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).

[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).

[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).

[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).

计算机视觉方法篇4

关键词:计算机处理技术;图形图像;视觉传达

中图分类号:TP391.41

计算机技术在多媒体设计领域的应用使得人们的思维与创作理念发生了重大改变,应用计算机相关技术和软件对图形图像构建模型并进行虚拟效果添加与展示极大地提升了科学与艺术之间的沟通,为传统的图形图像设计方式带来了全新的魅力和视觉效果。

相较于传统的平面设计而言,计算机设计出的图形图像所包含的内容和元素更多更丰富,所传达的意思和概念也更全面更突出。其不仅代表着现代图形设计的目的还蕴含着视觉传达的未来发展趋向。

计算机图形图像相关技术可以通过相关的数据分析与信息处理手段呈现出设计者希望的艺术表现力,更为突出的是,计算机能够在很大程度上满足设计者的设计需求,将多种设计细节量化到非常具体的数值,允许其对比和修改,故基于计算机绘制出的图形图像更能够体现作者所希望传达出的设计意图和设计理念。

1 基于计算机的图形图像设计与视觉传达效果概述

1.1 计算机相关技术的作用分析

计算机技术在图形图像领域的设计属于定量式设计,其可以将图形图像中的色彩信息与结构信息分解为若干个相互独立的,可用数值来衡量与评估的元素。因而基于计算机所开展的图形图像设计目的更加明确,各内容之间的搭配更加合理、突出,设计者可以从传统的手工绘制过程中解放出来,将自己的创作灵感转化为具体的可实现的创作流程,让计算机辅助设计师达到和完成传统的创作方式所无法达到的精确度和设计效果。总体来看,基于计算机的图形图像相关内容设计速度更快,定位更精确,配色配图更准确,所带来的视觉冲击力更强。

对图形图像进行设计的目的在于进行有效的视觉传达。图形图像中的任一元素的大小、结构、色泽、外观等不同符号和形式均被赋予了不同属性的传达目的和目标人群。应用计算机进行视觉传达设计可以更加精确的对事物本身的标志、图形以及代表符号等进行组合与搭配,使其更具感染力,从而更能够被潜在受众所认知和接受。

1.2 设计与实现方法分析

计算机是现代图形图像设计与视觉传达设计的主要手段和实现平台,其已经成为设计者必需的工具。目前主要的设计与处理软件有Adobe Photoshop、Photo Impact、Painter以及Corel Draw等。这些工具都支持对图像进行细节设计与调整,以便于更好的传达出作者的设计意图。由上述计算机设计软件所创作的作品可被应用到广告、新闻、电影以及其他大众传媒等多个领域。

2 计算机设计方式对图形图像与视觉传达的影响

2.1 绘图与设计工具的革新

计算机继承了传统的绘画工具所具有的绘画特点,但是在此基础上对可图形图像的艺术风格进行了拓展,可以使用更多的创作方法对图形图像进行处理,诸如Adobe等图像处理软件支持图文混排、图像编辑、图像扫描、特效处理等功能。相较于传统的手工设计方式而言,计算机辅助工具极大的提升了设计实现效率,节约了排版或转换时间。特别地,计算机允许设计者按照个人意愿对图像内容进行修改,甚至达到摄影与手绘所无法达到的视觉感染力。

2.2 视觉传达设计领域拓展

将计算机技术融入到视觉传达设计中可以极大的丰富视觉语言,使受众形成更明显、对比更清晰的视觉感受。计算机设计手段的应用使得视觉传达作品无论是在素材方面还是在应用领域方面都进行了多元化扩展,如图标或符号元素的扁平化设计风格转变、多媒体互动式视觉传达发展、多维化动态化的设计素材转变、虚拟作品与形象的设计与传播等。

在动态交互、新媒体设计等理念地不断推动下,计算机所处理的视觉传达设计同时具有了声、光、动画等内容,覆盖了纸质传媒、包装、网络形象、广告、海报等范围。

2.3 创意与表现技法提升

借助计算机设计者可以更为轻松的完成图形图像处理工作,这就使得设计者可以将更多的时间和经历投入到创意设计与效果评价等工作中。成熟的创意放入相关处理软件中进行修饰、扩展、试验即可确认其是否满足使用需求。

更为重要的是,计算机网络中存在海量的优秀资源和素材,计算机图形图像处理软件可以依照设计者的需求将设计者选取的素材进行组合、调色、添加滤镜等,这种处理方式极大的提升了视觉传达设计的维度和空间,使得所设计出的作品展现更逼真更具创意,所应用的手法更丰富更具冲击。应用计算机对图形图像进行视觉传达设计可以让设计者的理念和信息更为精准的传递到受众。

3 计算机图形图像设计与视觉传达设计的异同比较

3.1 相同点分析

图形图像设计与视觉传达设计相似度很高,很多内容和目的存在交叉性,都需要设计者具有一定的专业知识储备和图形处理软件应用等。在专业学习方面,两者同样都覆盖了绘图与平面设计等相关知识内容,都需要设计者学习和掌握基本的色彩搭配与图形符号搭配等内容。在计算机应用软件方面,图形图像设计还是视觉传达设计所使用的图像处理软件是相同的,如Photoshop、3DMax等。在创意方面,两者均需要设计者具有一定的审美观念,可以灵活组合与运用现有的技术和素材,可以通过作品的创造与再生来与受众进行观念沟通。

3.2 不同点分析

虽然两者之间存在大量的相同点,但是在本质上来说,图形图像设计更多的关注在图像处理方面,而视觉传达设计则更多的关注在创意展示方面。这种设计目标的差异性就决定了两种设计方式在创作法则和技术手段取舍方面存在一定的区分度。这种区分度让两者互为指引,互相推动,最终形成更好更具影响力的设计作品。

首先,视觉传达设计目的在于为所设计的产品树立生动的形象,赋予其更鲜明的美感和更具活力的动感。而计算机图形图像设计的目的在于利用现有素材对图形图像进行动态和静态的处理,使其更具多维性和空间性。

其次,视觉传达设计利用点、面、形、光等设计内容将设计者的观念和思维转化为具体的、可见的、可理解的视觉作品。而计算机图形图像设计则主要是集中在对现有素材的在开发与在创作等方面,其利用计算机软件的数据处理能力将多种效果结合在一起,以更加协调、更具对比度的方式呈现给受众。

再次,视觉传达设计在基本知识体系的基础上更加注重创作者的创作理念的形成、对视觉设计相关历史的理解,即其理论与实践并重,作品实现方式与实践灵活度等方面相对较为枯燥。而计算机图形图像则允许设计者根据自我的审美观念对图形图像进行处理和实现,还可以运用所学的知识到诸如视频编辑、照排印刷等工作中,其实现方式和工作对象更广泛。

4 计算机图形图像设计与视觉传达设计的应用领域分析

计算机图形图像设计与视觉传达设计两者不是独立的,而是相辅相成的。它们的主要应用领域集中在文字设计、包装设计、广告设计与影像创意、绘画设计、功能界面设计等,涵盖了广告、影视、互联网等行业。

4.1 文字设计

文字是现代设计中所使用的最基本元素之一,包含文字位置、色彩、色调、大小、字体等内容,熟练应用计算机处理软件来尝试各种效果搭配可以让文字与图像、符号等内容有机融合。特殊环境中,文字还可以作为整个设计作品的主体向受众传递明确、清晰的信息,让受众感受到强烈的视觉传达内容。

4.2 包装设计

包装已经成为人们生活中接触最频繁、辨识度最高的标识之一。吸引顾客的注意、实现商品的价值、增强物品的传播力和影响力等式包装设计的核心目标。新颖的、定位清晰的、感染力强的包装设计通常可以极大的吸引顾客的注意力,让其对产品产生潜在的兴趣和定位。包装设计领域中的图形图像设计与视觉传达设计包括书籍封面、海报、宣传彩页、大屏幕视频、食品服装包装等。为实现物品的真正价值,都需要利用计算机图像设计与处理软件对其包装进行艺术化、形象化设计,进而吸引受众的注意力,让其对产品内涵形成统一的,更为深刻的认知与定位。

4.3 广告设计与影像创意设计

广告作品的感染力同样离不开计算机图像设计与处理软件的支持。利用计算机处理软件可以将所设计的作品的优点进行合理放大,从而增强对广告内容的宣传与展现力度,具有创意的广告设计方案还能够引起人们共鸣,给人们留下深刻的印象。而影像设计作品的商业目的不高,更多体现为设计者的某种个人意愿,这就为视觉创意设计带来了广阔的发展空间,推动了计算机图像设计的发展与完善。

但是无论哪种设计都需要使用精准的视觉传达设计手段和灵活的图形图像设计手段来将所要展示的内容、理念、风格等整合到一个完整的、统一的形象中,这一过程需要经过反复多次修改才能实现。为呈现最佳的设计效果,就必须依靠计算机图像处理软件进行高速效果模拟与试验。

4.4 绘画设计

计算机图像处理软件的出发点是制作元素更丰富、色调更协调的绘画作品或形象。借助这些软件,作者只需要使用铅笔绘制出草稿即可使用计算机软件完成剩下的工作内容。这种设计方式一方面提升了作者的工作效率,另一方面能够以精准的填色与搭配方式为绘画作品带来更强烈的视觉冲击力。

4.5 交互界面设计

电子终端产品在人们日常生活中的普及使得大量的APP软件或游戏展现在人们眼前,其中人机之间的交流主要是通过交互界面实现的。美观、简洁、高雅的交互界面设计也是计算机图形图像设计与视觉传达设计的主要应用领域之一。合理安排交互界面的呈现方式,如二维、三维等元素处理与搭配可以有效提升交互界面的互动性,让用户形成连续的操作印象,顺利完成操作。

5 总结

借助计算机图像处理软件可以有效提升图形图像设计与视觉传达设计的实现效率,为设计者提供丰富的设计内容,让设计者使用更多的处理技巧和处理手段对所设计的作品进行调整或完善。并且图形图像与视觉传达设计的结合还能够创造出更加震撼、更具感染力的艺术作品,不断推动人们利用现代化工具将自身的思维和创新能力展现在别人面前。

参考文献:

[1]焦翔,段傲霜,孙士兵.用户交互界面设计研究[J].数字技术与应用,2009(10).

[2]金波.数字时代视觉传达设计的构成关系浅释[J].美术大观,2007(4).

[3]邵玉兰,赵昕.关于计算机图形图像设计与视觉传达设计的分析[J].信息与电脑,2013(03).

计算机视觉方法篇5

关键词 计算机;视觉技术;应用研究

中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2013)16-0114-01

计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。

1 计算机视觉技术

计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。

2 计算机视觉技术在各领域的应用分析

随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。

2.1 在工业领域中的应用

工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。

2.2 在农业生产领域中的应用

该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。

2.3 在林业生产中的应用

该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。

2.4 在农产品检测中的应用

农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。

2.5 在电力系统自动化中的应用

计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。

2.6 在图书馆工作中的应用

随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。

3 结束语

通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。

参考文献

计算机视觉方法篇6

关键词:计算机工程;视觉领域;深度学习技术

引言

计算机视觉简言之即是依靠电子设备成像来代替生物视觉系统,随后依靠提前写好的程序对获取的图像信息实施处理。该技术的短期应用目的在于完成相对简单的智能视觉工作,而深度学习技术在计算机视觉领域的应用,在很大程度上丰富了其功能,提高了识别效率,让其能够在更多行业发挥出自身价值。

1计算机视觉领域的深度学习技术

1.1图像分类中的深度学习技术

基于深度学习技术,卷积神经网络得到了进一步的发展,其应用范围也更为宽泛,例如说在图像分类中的运用。图像分析需要对图像实施扫描分析,随后对其具体类别予以划分,更加注重其整体语义。目前相对普遍进行图像分类的数据集为ImageNet,其中囊括了非常丰富的内容,存储了近1500万个图像的URL并将图像划分为数万余个类型。ImageNet每年组织开展的大规模视觉识别挑战赛(ILSVRC)中,图像分类算法与技术也不断创新,图像分类的准确性也持续提升。ImageNet数据集表现出规模大、类型多的突出特点,所以更加适用于迁移学习,即是把部分核心技术或结构拓展应用到各个领域,对于视觉领域的深度模型来说,能够把模型内的网络结构和参数直接共享到其他数据集,从而对数据实施微调。图像分类属于计算机视觉领域最为基础的环节,对于图像分类模型创建和数据分析处理经验也能够迁移应用到其他领域中。

1.2目标检测中的深度学习技术

目标检测相对于图像分类而言表现出更多的复杂性,主要任务是在囊括多种不同类型物体的图像内精确定位和识别某一物体,恰恰是出于这一目的,深度学习技术在目标检测中的应用更为复杂,要实现更加精准的效果也相对更难。近年来针对目标检测的算法日益更新,如优化后的R-CNN算法,是借助于卷积神经网络思想,对物体进行分类,提取物体特征。而SelectiveSearch算法的出现有了进一步的创新和突破,有效促进了检测准确性的提高,这也给通过卷积神经网络进行目标检测带来了更多可能性,随后的FastR-CNN算法极大地促进了目标检测效率的提升,该算法对提取候选区的问题予以优化,大大减少了候选区提取和目标检测过程的时间。目标检测网络以FastR-CNN算法作为支撑,于输出位置设置滑动窗同时和候选区域网络实施连接,目标检测的关键在于卷积神经网络,依靠它把各个点的特征进行提取,再借助回归算法获得对应范围出现目标的概率[1]。

1.3人脸识别中的深度学习技术

人脸识别主要是借助相应算法对人脸特征实施提取,因为其建立的人脸模型表现出一定的不稳定性,因此模型建立往往也表现出一定的难度,相对于建立刚体模型而言更为困难。人脸识别通常来说涉及人脸检测定位以及特征提取两个方面,人脸检测定位是基于背景图像中将人脸目标分割出来,实施归一化处理,而人脸特征提取算法不变。前者存在的技术难点是人脸目标具有多样性以及背景图像具有复杂性,所以对背景情境实施合理假设并予以简化是十分关键的。与此同时,高维空间人脸模型的建立较为复杂,精确度估算难度较大,人脸特征提取的技术难度是因为人脸属于弹性模型,其难度超过刚体模型。一般来说,较为常见对人脸特征实施提取与识别的方法有几何特征法、特征脸算法以及弹性模型法,CNN算法和过去的特征提取算法比起来表现出更高的稳定性和适用性,同时能够有效抵抗外部干扰,促进人脸识别技术的推广应用。

2应用实例

2.1安防领域的应用

深度学习技术在计算机视觉领域中的应用可以为安防行业提供更佳的解决方案,比如说人脸识别技术的应用,很多大型企业如Facebook、腾讯、阿里巴巴等都将非常关注和重视。作为深度学习技术在计算机视觉领域应用的重要内容,人脸识别在安检以及反恐等领域中也能够发挥出很好的效果。与此同时,对行人角度的REID技术实施研究,依托于深度学习强化目标检测,对目标特征实施提取和刻画,能够为异常行为监控和跟踪带来支持[2]。

2.2无人驾驶领域的应用

对于无人驾驶领域来说,选择激光或雷达这类传感器的成本更高,基于深度学习的计算机视觉技术也能够提供新的解决方案。依靠摄像机对视频画面进行采集,对获取到的图像实施分析,提供类似于前车碰撞预警等功能。在这一过程中,计算机视觉技术可以实现对目标的检测识别、对目标车辆的跟踪分析、对车道线是否偏离进行检测等。基于深度学习技术的检测识别表现出更加强大的优势,现阶段深度学习芯片日益增多,对于无人驾驶技术的发展也带来了更加有力的支持。

2.3智能家居领域的应用

过去的很多智能家居产品一般都是依靠智能手机蓝牙或者WiFi等途径来实现对家居产品的控制,这一方案即便能够做到家居智能化,但其水平依旧有待提高。基于深度学习技术,能够有效促进智能家居行业的更新发展,除开语言、语音识别之外,还能够利用计算机视觉技术实现人际交流与互动,比如说手势识别控制。2.4教育领域和图片搜索领域的应用基于深度学习的计算机视觉技术也能够在智慧教育中得以普及应用,如近年来很多新的拍照解题App,使用者只需要利用手机相机拍照上传即可获得相关题目的分析解答,促进学习者学习效率的提升。此时视觉技术包括了对文字的检测与识别,另外针对个人简历识别、文档识别等方面也能够进行拓展应用。同时计算机视觉技术还可以在图片搜索领域中得以应用,使用者通过拍摄上传相应的图片,即可从数据库中找出与原图相似的图片,深度学习属于一种非常高效的技术手段,能够提供更加快速高效的图像检测功能,结合图像搜索引擎,为用户带来更加便捷的服务[3-5]。

2.5医疗影像数据中的应用

医学影像直接关系到对患者疾病诊断的准确性,对于放射科的医务人员来说,依靠医学影像能够促进诊断效率的提升。现阶段国内外诸多医学专家队伍,在心血管、肿瘤、神经内科以及五官科等都建立了精准深度学习模型,极大地推动医疗水平的提升,为广大患者带来了更加便捷和高效的医疗服务。基于深度学习技术的计算机视觉在医疗影像数据中的应用主要集中在如下几个方面:(1)能够提供临床诊断辅助等医疗服务;(2)依靠数据分析技术,能够在很大程度上促进医疗机构经营管理水平的提升;(3)在医学影像中的应用,能够让医务工作者更加直观便捷地获取患者影像;(4)深度学习技术能够为医疗大数据的可视化带来便利;(5)在药企研发工作中的应用,可以处理好过去一直以来药物研发周期长和成本居高不下的问题;(6)在健康管理领域中的应用,借助于可穿戴设备来对个人健康数据实施监测,进而对疾病风险予以提前预测。

计算机视觉方法篇7

关键词:智能视频监控;目标跟踪;运动分割;图像标定

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)35-8499-03

1 概述

在人类的活动所涉及的各种信息中,以视觉信息所占是比重最大。人类主要依靠视觉系统来形成记忆。计算机视觉系统便是模拟人类视觉系统的某些功能,用摄像机和电脑代替人眼对目标进行识别、跟踪、测量,实现计算机对三维景物世界的理解。计算机视觉是计算机科学和人工智能的一个分支,目前既是工程领域也是科学领域里一个极富有挑战性的研究项目,它的实现,将给相关重要应用领域,如制造业、医疗诊断、检验以及军事领域中的智能、自主系统等,带来质的改变。近三十年来,计算机视觉技术已经取得了突飞猛进的进展,它的巨大应用前景将使得这种发展势头继续保持相当长的时期。

计算机视觉是通过运用各种成像系统代替人的视觉器官实现成像输入的,再由计算机来代替大脑完成对视频图像的分析和处理。目前有两种技术途径可以实现计算机的智能视觉效果,一个是仿生学方法,另一个是工程方法。仿生学是从分析人类视觉入手,通过对人类视觉成因原理的了解,参考人类视觉建立一个计算模型,用计算机系统将所有的过程和结果一一重现。由于这种技术方法目前还有许多难题需要破解,进展十分缓慢,因此更多的考虑采用工程方法。工程方法脱离了人类视觉系统的种种条框,从另一个角度寻找各种可行的技术方法实现计算机的视觉功能。

对于人类来讲,视觉系统虽然是获取信息的途径中占比最大的,但是,其他获取信息的通道也是必不可少的。在人类的智能系统中,感知行为是通过各个通道分别获取信息,然后汇集起来,使人类获得一个全面的感知。每个通道所获取的信息对于事物的理解或许是不全面的,但是,将所有的信息通道所获取的信息进行总和后却是可以得到一个相对完整的认识的。以前所研究的比较初级的人工智能系统就犯了以偏概全的毛病,希望通过独立运行一个完美的功能子系统就能获取所有的信息。为了达到这样一个目的,不得不去人为施加种种约束条件,或者造一些脱离实际的理想数据,结果可想而知。我们在研究计算机视觉系统的可行性方法的时候,也要认识到计算机视觉只是人工智能的一部分,它的功能是不能够孤立实现的,必须结合不同的应用背景,与不同的感知通道相互配合,综合达到智能视觉监控系统的目的。例如,计算机视觉系统运用在通信中,应与语言通道想配合;在发现和跟踪目标的应用中就要注意和激光和超声波等非视觉技术配合等。目前,关于计算机视觉的理论还不是太完善,但是相关的应用已经先行一步,该文对计算机视觉系统方面的实际运用方面进行了研究。

2 计算机智能视频健康概述

2.1计算机智能视频监控研究现状

计算机视频监控是通过计算机视觉和图像处理来完成对目标的一系列监控目的,比如运动检测、运动目标跟踪、目标分类以及目标行为的描述与理解等。将这些监控目的进一步划分,其中运动目标的类与跟踪、运动检测是近年来视频监控领域里研究较多的项目,也是属于视觉处理中低级和中级的部分;而高级部分是行为的描述和理解,这也是业内近年来较多受到关注的研究热点,它代表了监控行业未来的发展方向,也是信息产业的未来发展趋势。由于它巨大的应用前景,产业界、学术界和各级管理部门都对它给予了高度重视,其中蕴藏着的巨大商机和所带来的经济效益更为人们津津乐道。

人们可以运用计算机智能视频监控系统对拍录到的图像序列进行自动分析,它特有的计算机视觉和视频分析技术可以自动完成这个过程,不需要人为进行过多干预。这样,就可以在很大程度上解决“他们正在做什么”、“他们将会做什么”的问题,而后,人们通过进一步的决策推理过程对“我们可以采取什么问题”的疑问给出答案。目前,社会上发起的平安城市等大型项目已经给智能视觉系统的应用提供了可供借鉴的方向,同时,还可以扩展到人流量统计、监控偷油行为、入侵行为等,这些需要用到智能识别系统的项目都使得人们逐渐对计算机智能视频监控系统重视起来。

2.2计算机智能视频监控系统与运动目标检测技术

目标的运动检测是一项相当困难的工作,这是因为背景图像中往往还存在一些动态变化的影响,如影子、光照、遮挡、混乱干扰以及天气等。这些因素的干扰使得人们很难将运动变化的区域从背景图像中提取出来。直接影响了对目标的分类、跟踪和行为理解等后期处理。目前,常用了运动目标检测技术有背景减除、时间差分、Rosenblum等。

2.3计算机智能视频监控与运动目标跟踪技术

2.3.1运动分割

动态环境中捕捉到的运动目标图像大多受到各种不确定因素的影响,如影子、物体之间或者与环境之间的遮挡、摄像机的运动、光照条件的变化等,这些都给准确有效的运动分割带来困难。但是,快速准确的运动分割是一个相当重要的环节。就拿影子的干扰来说,若是影子与与检测目标分离,容易引起误会,将影子误认为是场景中的目标;若是影子与目标相连,则会扭曲了目标的形状,使得基于形状的目标识别方法不再可靠。目前主要采用的是背景减除法,这种方法的适用范围有限。人们目前还没有找到对于任何复杂环境中的动态变化均有适应性的处理模型。研究者们试着运用时空统计的方法构建自适应的背景模型,也许对于那些不受限于环境的运动分割而言是个好方法。

2.3.2目标跟踪的分类

2.3.2.1根据目标跟踪与目标检测的时间关系可分为三类

一是先检测后跟踪,而是先跟踪后检测,三是边检测边跟踪。

2.3.2.2根据目标跟踪的所采取的策略来分,有3D和2D两种

3D的方法是在一个由基于坐标系构筑的三维立体世界内进目标进行跟踪,2D则是在一个二维平面内对目标进行锁定跟踪。2D的方法所需处理的数据较少,跟踪操作速度较快,但是,对于遮挡问题无能为力。

2.3.3跟踪方法细分

2.3.3.1基于特征的跟踪方法

不管是刚体运动还是非刚体运动,在一序列图像中,相邻的两帧图像中,由于采样时间间隔十分短,在视觉上差别微小,可以认为是这些个体特征在形式上具有平滑性。

2.3.3.2基于主动轮廓的跟踪方法

用参数表示轮廓线,运用目标的边缘特征提供运动方式、物体形状之外的其他目标信息。

2.3.3.3基于运动估计的跟踪方法

运用运动估计技术对目标进行分割和跟踪是一种常用的做法。

2.4 图像标定

由目标在图像坐标系下的坐标来求得在世界坐标系下的坐标,称之为图像标定。通常是根据摄像机的内外参数来实现的,简称为摄像机标定。这种方法中,需要注意的是摄像机所得到的图像投影容易受到几何形变的影响,这样在建模的时候,导致精度不够。像平面与所拍摄的物平面上的两条平行线,在图像上就可能是两条相交的直线。一个匀速运动人,想要在图像坐标系下计算出其速度。但是,在近距离拍摄时,测得的速度快,远距离拍摄的时候,测出的速度慢。在进行目标跟踪之前,对目标进行良好的图像标定,可以使目标的动态特性建模效果更加精确。

2.5 计算机智能视频监控技术难点

数字化、智能化是视频监控系统的未来发展趋势。目前,视频监控系统系统智能化还需面对许多问题,这些问题大多源于计算机视觉技术方面。

2.5.1从实际情况来看

视频监控系统需要面对一个十分复杂且不断变化的应用环境,这给计算机视觉技术的应用带来了更高的要求,要求能够自动、连续地工作,才能将目标从复杂环境下的分离、结构出来,从而进一步完成其他分析工作。

2.5.2其次,运动目标本身具有多样性的特征

如何使这些目标摆脱客观环境的限制,将目标的变化区域从背景图像中提取出来,从而目标进行运动分析、分类,尤其是对非刚性目标运动进行跟踪、行为理解还是相当困难的,这也是智能视频监控系统领域里近年来研究的重点。

2.5.3若是监控的范围扩大,就需要大量的摄像机进行协同工作

但是,实现多台摄像机对运动目标连续、一致的视觉分析还非容易之事。

2.5.4目前该领域内还产生了建立视频数据库的想法

系统通过这样的方法实现海量视频信息的存储、检索和查询,这方面也是近年来研究的热点,目前还处于起步阶段。距离视频监控系统的智能化目标还有相当长的路要走。

2.6计算机智能视频监控应用前景展望

2.6.1 人数统计

在许多人流量大的地方都有人流量统计的需求,如火车站、广场等。这时候目标以人头为基本计算单位,对人头的检测和跟踪是主要技术要求。实际上这种检测轮廓非常重要。

2.6.2 车流量统计

在许多路口,交通部门对车流量也需要有个大概统计,许多地方的车流量可以通过其他检测手段检测,视频图像是最快和较为准确的一种方式。

2.6.3 遗留物检测

自911事件发生以来,全球对于公共安全的意识日益重视,各国纷纷采取多种措施防范恐怖主义袭击,例如加强出入口管制、随身行李检查、增加警备人员数目、追踪可疑人士的行径等。其中,监控系统扮演了非常重要的角色,特别是在车站、机场、大型商场等人口密集的地区,一旦发生炸弹引爆等恶意袭击事件,后果不堪设想。为了及早防范,监控系统需要采用具备遗留物侦测的智能分析系统,对可疑滞留物品实行及时通报和处理。 另外,遗留物侦测也可以用来解决自动提款机(ATM)的安全问题。部份不法份子会在ATM加设卡片阅读机或贴上误导性信息,达到骗取钱财的目的,设置遗留物侦测系统可以及时发现这些非法架设的物品。 遗留物侦测还可以用于侦测遗规泊车的情形,结合车牌辨识系统更可达到全自动的智能化执法。一旦发现禁止停车区域有车辆停留,便会触发遗留物警报讯号,并启动车牌辨识器记录违规停泊车辆的车牌号码,大大降低交通执法人员的工作量和运作成本。

2.6.4 遗失物检测

在博物馆或公共展览厅贵重物品失窃的情形时有发生,单纯依靠录像做事后处理的消极性做法往往不能解决问题,如果在物品遭窃的瞬间就能马上发现对于防范事件有相当重要的作用。遗失物侦测的作用是可以侦测到画面上物品被移走或是偷走的情形,及时发出警报,同时也能自动分辨出对象属于遗留物还是遗失物。但这类检测对同色物体的分辨分析运算能力有很高的要求,同时对硬件的配套布置也有很严格的要求。

当摄影机被移动或是画面被遮蔽时会造成场景变化,侦测器便可以根据这种情况判断摄影机异常并发出警报。这种应用更加广泛。通产的移动检测都属于此范畴。

在实际应用场景中,日光对监控的影响较大,一般要避免逆光。

3 结束语

综上所述,目标跟踪有非常广泛的应用市场需求,我国还处于起步阶段,研发出具有自主知识产权的、稳定可靠、技术先进、节约成本等特点的智能监控系统,可以有效填补国内空白。随着技术的成熟,硬件的推陈出新,应用产品的大幅降价,使得应用范围不断扩大,将来这方面会有更好的前景,使之成为一个能带动相关产业集体发展的一个新型产业。

3.1 对经济发展的作用

良好的市场前景会促进企业在该产业的科技力量投入,有力促进了智能监控技术革新,使得企业进入了经济发展的快车道,同时带动了电子产业及相关企业的技术革新及经济发展。形成技术革新与资金的一个良性循环。

3.2 对社会发展的作用

增加了对地方经济和就业需求的拉动。产业链的形成,强化实施企业之间的横向经济联合和技术协作,通过企业间技术平台上的横向协作,在特色产业基地内形成合力,打造一条新型的产业链。

3.3 对人才培养推动作用

企业的相关类技术人员之间不断的合作交流,大大提高了企业相关类技术人才一个质的飞跃。达到技术推介和人才培养的目的,为国内,特别是经济发达地区今后在电子科研技术领域的进一步发展奠定人才技术的基础。

参考文献:

计算机视觉方法篇8

关键词: 计算机视觉;快速开发;框架;模块化;模块耦合;底层剥离

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)29-7084-04

在视觉分析实际应用项目中,如何通过建立计算机视觉分析快速开发框架,搭建一个分工明确,快捷有效的图像学应用处理平台,提高开发效率,缩短开发时间,已成为项目开发人员关注的重点内容之一。本框架从项目应用和实际需求出发,将计算机视觉技术的核心算法从底层研究工作中剥离,可极大的缩短开发时间,提高开发效率。

在本框架下,开发人员可各司其职,分工、构成和职能划分明确,框架开发人员只专注于框架接口的定义;算法开发人员只专注于图像处理与识别等算法的开发;上层应用开发人员只负责抽取出一般的处理流程,专注于项目的具体实现和功能模块的组合应用。

1 研究与应用

1.1背景

计算机视觉是用摄像机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉。系统将获取的视频或图像资料,通过计算机处理成为更适合人眼观察或传送给仪器检测的图像,其中包括图像处理、模式识别或图像识别、景物分析、图像理解等相关内容,它们之间既有差别,又有相互重叠。

在计算机视觉分析技术中,对于一些复杂的问题,往往不是某单一学科能够解决的,它需要一系列相关技术的支持。例如:对航道中船舶的识别,获取的视频流往往要经过平滑、去噪等图像处理操作后,便于下一步运用基于直方图分类器的图像识别算法来区分船舶和水面,通过图像分割技术来提取检测目标。而这些方案的实现中,同一个问题的解决又往往需要有一系列的算法来支持。还是以船舶识别为例,图像平滑有领域平均、低通滤波等算法;图像去噪有各种滤波器算法;基于直方图的分类器也存在决策树、贝叶斯、SVM等等算法。虽然上述的算法本身没有优劣之分,但在特定的环境下一定会有某个最佳算法。

因此,在实际应用项目中如何找出其最优路径,除了需要开发者拥有深厚的图像学功底,更需要的是通过大量的对比实验来找出该最优路径的解决方案。即便如此,也只能解决特定环境下的计算机视觉需求,换个应用场景,上述步骤又需要重新进行,此类过程的重复,既增加了开发成本,又延长了开发时间。

本框架从工程化的角度出发,在不同项目中的计算机视觉软件开发中,研究如何提高开发结果的复用性,尽量降低上述各条件间的相互依赖关系,将视觉技术的核心算法从底层研究中剥离,达到缩短开发时间,提高开发效率的目的。

1.2研究目标

1) 框架系统的扁平化、模块化;

2) 完成处理过程的任意组合,使图像处理模块单一化;

3) 理行为在处理模块内部完成,处理结果可通过接口方式进行输出;

4) 处理模块间的数据流动定义在框架之中,框架负责配置数据流;

5) 置好的数据流,通过指定图像处理模块实现对物体的识别、行为的识别。

1.3.5框架的效果演示

从右侧功能区中选取两个输入模块:MediaOpen00和MediaOpen01,分别打开视频文件“.\公司监控视频.avi”和图片“.\Lena.jpg”,任意添加一些图像处理模块或者图像识别模块,这里我们选取了行人检测算法、基本全局阈值二值算法、人脸检测算法、轮廓检测算法,加入输出展示模块用于显示处理结果。最后我们用曲线将模块间的输入输出点连起来,完成数据流向的配置过程。其中一个输出点可以连接多个输入点,但一个输入点只能接入一个输出点。

2 结论

随着计算机视觉技术发展的日新月异,算法的更新和积累将会越来越多。计算机视觉快速开发框架从实际应用工程的角度出发,在不同项目计算机视觉软件的开发过程中,将视觉技术的核心算法从底层研究中剥离,使视觉分析应用项目中的框架开发人员专注于框架接口定义的开发,而项目中的算法、上层应用等开发人员各司其职,分工明确,不但提高了开发结果的复用性,同时,也降低了项目开发中各条件间的相互依赖关系,缩短了开发时间,提高了开发效率。

参考文献:

[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.

[2] 张广军.机器视觉[M].北京:科学出版社,2005.

[3] 张少辉,沈晓蓉,范耀祖.一种基于图像特征点提取及匹配的方法[J].北京航空航天大学学报,2008,34(5).

[4] 刘立,彭复员,赵坤,万亚平.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程,2008,37(1).

[5] 戴斌,方宇强,孙振平,王亮.基于光流技术的运动目标检测和跟踪方法研究[D].国防科学技术大学机电工程与自动化学院.

[6] 陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现[M].科学出版社.

计算机视觉方法篇9

基金项目:陕西省自然科学研究计划项目(2010JK740;2010JM8019);西安理工大学学科联合研究项目(102-210914)。

作者简介:吕林涛(1955-),男,陕西西安人,教授,主要研究方向:网络与信息安全、数据挖掘; 赵呈轩(1982-),男,河南新乡人,硕士研究生,主要研究方向:网络与信息安全; 尚进(1984-),男,河南郑州人,硕士研究生,主要研究方向:网络与信息安全; 杨宇祥(1974-),男,湖南湘潭人,副教授,博士,主要研究方向:生物医学信号检测与处理。

文章编号:1001-9081(2011)07-1847-03doi:10.3724/SP.J.1087.2011.01847

(1.西安理工大学 计算机科学与工程学院,西安 710048; 2.西安理工大学 机械与精密仪器工程学院,西安 710048)

()

摘 要:针对目前色情图像过滤算法对比基尼图像和类肤色图像误检率过高,且不能有效过滤带有动作的多人色情图像的缺点,提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型首先通过改进的SURF算法提取色情场景局部特征点,然后融合视觉单词的上下文和空间相关高层语义特征,从而构建色情图像的高层语义词典。实验结果表明,该模型检测带有动作的多人色情图像准确率可达87.6%,明显高于现有的视觉词袋色情图像过滤算法。

关键词:色情图像;过滤;图像高层语义;语义树;视觉词袋;鲁棒特征加速

中图分类号:TP393.08;TN911.73文献标志码:A

Pornographic images filtering model based on

high-level semantic bag-of-visual-words

LaLin-tao1, ZHAO Cheng-xuan1, SHANG Jin1, YANG Yu-xiang2

(1.School of Computer Science and Engineering, Xi'an University of Technology, Xi'an Shaanxi 710048,China;

2.School of Mechanical and Precision Instrument Engineering, Xi'an University of Technology, Xi'an Shaanxi 710048, China)

Abstract: Current pornographic images filtering algorithms have some shortcomings, such as high false positive rate toward the bikinis images and insufficiency when filtering pornographic images with pornographic actions. The paper proposed a new pornographic image filtering model based on High-level Semantic Bag-of-Visual-Words (BoVW). Firstly, local feature points in sex scene were detected using the Speeded-Up Robust Features (SURF) algorithm and then high-level semantic dictionary was constructed by fusing the context of the visual vocabularies and spatial-related high-level semantic features of pornographic images. The experimental results show that the model has an accuracy up to 87.6% when testing the multi-person pornographic images, which is significantly higher than the existing pornographic images filtering algorithm based on BoVW.

Key words: Pornographic image; filtering; image high-level semantics; semantic tree; Bag-of-Visual-Words (BoVW); Speeded-Up Robust Features (SURF)

0 引言

快速有效地监测和过滤网络色情信息已经成为网络信息安全中的一项重要研究课题。现存的色情图像过滤技术虽然对网络上明显的图像可以实现较好的过滤效果,但不能有效过滤带有动作的多人色情图像,并且对含有比基尼的正常图像误检率较高。

随着视觉词袋(Bag-of-Visual-Words,BoVW)算法在图像检索和场景分类领域的成功应用[1-2],2008年Thoms Deselaers等人[3]首次提出采用视觉词袋算法提取图像高层特征过滤色情图像,该算法大大提高了色情图像的识别效率,但忽略了肤色特征。2009年Ana P.B.Lopes等人[4-5]在此基础上加入色调信息提出了HUE-SIFT特征描述算子,采用固定词汇大小分配,最后使用基于支持向量机(Support Vector Machine,SVM)分类算法进行色情图像的分类。但该算法对词袋算法本身缺乏优化,算法需要付出昂贵的计算时间。2009年YIZHI LIU等人[6]提出了构建SURF(Speeded-Up Robust Features)视觉词汇的方法来提取肤色区域的局部特征算子以减少SIFT算法的计算时间[7],虽然SURF的计算效率较SIFT算法有较大提高,但是视觉词汇聚类过程中采用简单的K-Mean聚类算法,造成语义缺失。2009年王宇石等人[8-9]采用视觉单词和语义映射算法检测色情图像,该算法虽然采用了语义映射模式,但是未能对高层语义视觉词组进行提取,因此算法仍存在一定的局限性。

针对目前色情图像过滤算法误检率过高等问题,本文提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型在传统低层视觉特征基础上,利用语义分析和理解相关技术,提取图像中包含的高层语义特征,从语义层面来识别不良图像,不仅符合机器视觉认知过程,而且可有效弥补现有算法比基尼图像误检率过高、不能有效过滤带有动作的不良图像过滤技术的不足。实验证明,算法可以有效过滤带有动作的多人不良图像,较同类算法识别率高,误检率低。

1 高层语义视觉词袋的色情图像过滤模型

本文提出的基于高层语义视觉词袋的色情图像过滤模型如图1所示。该模型主要包括特征提取、高层语义词典构建和分类器构建三部分。

1)特征提取采用文献[6]中的SURF(4×4)算法提取局部特征;

2)高层语义词典构建通过随机森林算法[1]将提取的视觉基元的进行分类产生底层视觉词汇,并将中级词汇再次分类、融合上下文关系和空间相关特征[10-12],最终构建具有高区分度的高层语义视觉词典;

3)分类器采用文献[1]中的χ2-kernel SVM分类算法。

图1 高层语义视觉词袋的色情图像过滤模型

2 高层语义词典构建算法

高层语义词典构建算法主要通过视觉基元分类和视觉单词分类两阶段完成。视觉基元分类算法主要由随机森林算法和消除干扰词算法完成;视觉单词分类主要由上下文相关视觉词汇分配算法和空间相关视觉词汇分配算法完成。最终完成高层语义视觉词典的构建。高层语义词典构建算法流程如图2所示。

图2 高层语义词典构建算法流程

2.1 空间相关视觉词汇的权重分配算法

色情图像最明显的特点是有大面积的肤色区域和敏感器官的暴露,视觉词汇在分配的过程中如果对色情图像空间相关的视觉词汇加权分配,可以有效识别敏感区域和和提高视觉词汇的区分度。本文采用对色情图像空间相关的视觉词汇加权分配[10]。算法描述如下:

1)从兴趣点集合提取出的视觉词汇集合wl(1

2)计算视觉词汇wl在高斯βi条件下加权频率Tfwlβi,Tfwlβi∑nim1P(βi/Zm);

3)计算视觉词汇wl的平均权重Tfwl,Tfwl∑nwli1(Tfwlβi)/nwl;

4)计算wl的权重Ifwl,Ifwlln;

5)计算视觉词汇wl最终空间权重Swwl,SwwlTfwl×Ifwl。

2.2 人体器官特征的空间拓扑结构算法

传统的视觉词袋算法通过编码局部突出片段的视觉基元获取视觉单词,但是却忽略了图像对象间的空间拓扑结构,本文将利用人体器官特征的空间拓扑结构表达的三角关系提取色情图像高区分度特征。经研究发现,人体器官特征本身具有一定的空间拓扑结构,利用人体器官特征的这一特点可以准确判定图像是否含有人体躯干部位。对于图像中包含单人的色情图像身体倾斜度不大于90°,人体暴露的胸部特征和人脸特征基本成三角形状,如图3所示。

图3 色情图像人体器官特征空间拓扑结构

本文采用简化2D字符串[11]构建高层语义视觉词汇间的空间拓扑结构,假设V是人体器官特征对象集合,集合内每一个对象对应一个高层视觉词组,本文用“

2.3 多人色情图像高层语义树构建算法

对于包含多人的色情图像,除具有大面积的肤色区域信息,更重要的是包含一些特定的动作,主要有亲吻、拥抱以及躯体部位的粘合。亲吻主要涉及嘴部和其他敏感器官,拥抱主要涉及肢体,躯体粘合主要涉及人体躯干和敏感器官。上述三种行为语义基本构成多人色情图像中的行为语义特征,色情图像高层语义树构建过程如图4所示。

图4 色情图像高层语义树构建过程

在图4中,语义模型包括:人体器官对象模型和人体相关行为模型。由于色情图像相关的语义词汇中有些词汇出现的概率较高,因此,本文在文献[12]提出的加权分配语义词汇算法基础上,去除场景语义模型,只对人体器官对象视觉词组和人体行为相关视觉词组加权分配。对于数据集合V中任意一张图像Ci,如果人体器官对象视觉词组概率为PO,人体行为相关视觉词组概率为PA,可以通过公式PCiαPO+βPA,α+β1,计算Ci的敏感系数。当敏感系数大于阈值t时判定此图为色情图像。

3 实验结果分析比对

为了验证高层语义视觉特征在色情图像过滤中的效果,本文通过采用网络收集的色情图像和Pascal VOC2010图像库正常图像作为训练和测试数据集合,并与本领域著名文献[4,6,9]中方法完成实验结果对比。

3.1 实验采样数据集

实验图像来自网络和Pascal VOC2010图像库,其中在网络上收集的色情图像5800张,可以分为A类:包含明显的图像;B类包含比基尼图像;C类:包含带有动作的多人色情图像;正常图像5000张均取自Pascal VOC2010图像库。

训练数据集和测试数据集分别为3000和5560张图像,从三类色情图像中各随机取出1500张进行训练,另外手工标注了2000张色情图像的人体躯干和敏感区域(性器官),用来产生各类低层视觉语义单词。

3.2 实验结果比对

本文采用随机森林算法从1932900个关键点中分类产生了7883个SURF视觉单词,并根据词汇的上下文关系和空间相关特征进行再次分类,产生5120个中级视觉词组,同时将中级词组分为2150个人体器官相关和2980个人体动作相关的高层语义词汇。最后对高层语义词汇编码形成色情图像高层语义词典。

由于色情图像中包含大面积的肤色区域和人体敏感器官,此类局部特征点具有明显的上下文相关和空间相关特性。表1结果表明:加入上下文相关和空间相关特性的视觉词汇分配算法的特征区分度要明显高于传统视觉词汇分配算法;三类图像的过滤正确率本文算法均高于其他算法。视觉词袋算法的时间复杂度主要取决于特征提取和视觉词汇分配算法的时间复杂度,本文采用文献[1]中的随机森林算法对视觉词汇进行分配,缩短了视觉词汇分配的计算时间。实验结果表明,在特征提取和词汇分配两个阶段的总计算时间,本文算法的平均计算时间均低于其他三类算法。四类算法特征提取和词汇分配平均计算时间比对如图5所示。

表1 四类色情图像过滤算法正确率对比

%

4 结语

基于视觉词袋的色情图像检测是一种很有前景的方法,因为通过理解图像表达的高层语义对色情图像进行过滤不仅可以过滤明显的图像和多人色情图像,而且也符合机器视觉和认知理论。本文用具有高区分度的高层语义特征进行分类检测速度和准确度都较现有算法有较大提高,但在过滤90°侧身的色情图像检测方面有待进一步研究。

图5 四类过滤算法特征提取和词汇分配平均计算时间对比

参考文献:

[1] UIJLINGS J R R, SMEULDERS A W H, SCHA R J H. Real-time visual concept classification [J]. IEEE Transactions on Multimedia, 2010,12(7):665-681.

[2] WU LEI, HOI S C H, YU NENGHAI. Semantics-preserving bag-of-words models and applications [J]. IEEE Transactions on Image Processing, 2010,19(7):1908-1920.

[3] DESELAERS T, PIMENIDIS L, NRY H. Bag-of-visual-words models forimage classification and filtering [C]// ICPR 2008: 19th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2008: 1-4.

[4] LOPES A P B, de AVILA S E F, PEIXOTO A N A, et al. A bag-of-features approach based on HUE-SIFT descriptor for nude detection [C]// EUSIPCO 2009: Proceedings of the 17th European Signal Processing Conference. Glasgow,Scotland: Mendeley, 2009:1552-1556.

[5] LOPES A P B, de AVILA S E F, PEIXOTO A N A, et al. Nude detection in video using bag-of-visual-features [C]// SIBGRAPI'09: Proceedings of the 2009 XXII Brazilian Symposium on Computer Graphics and Image Processing. Washington, DC: IEEE Computer Society, 2009: 224-231.

[6] LIU YIZHI, XIE HONGTAO. Constructing SURF visual-words for pornographic images detection [C]// ICCIT'09: 12th International Conference on Computers and Information Technology. Washington, DC: IEEE, 2009:404-407.

[7] LUO JUAN, GWON O. A comparison of SIFT, PCA-SIFT and SURF [J]. International Journal of Image Processing, 2009,3(4):143-152.

[8] 王宇石,李远宁,高文.基于局部视觉单词分布的像检测[J].北京理工大学学报,2008,28(5):410-413.

[9] 王宇石,高文.基于视觉单词和语义映射的色情图像检测算法[J].高技术通讯,2009,19(10):1041-1047.

[10] LI TENG, MEI TAO, KWEON I, et al. Contextual bag-of-words for visual categorization [J]. IEEE Transactions on Circuits and Systems for Video Technology, 2010, 21(4):381-392.

计算机视觉方法篇10

关键词:计算机辅助教学;视觉媒介;综合技能;教学形式

中图分类号:G64文献标识码:A文章编号:1005-5312(2012)11-0215-01

视觉传达设计是通过视觉媒介表现并传达给观众的设计,其领域与其他领域不断相互交叉,高校纷纷加大对艺术类专业的投入。在众多院校中,在课程设置方面也是各有特色,但是有一点是相同的,即计算机辅助课程归纳到各个学校的教学计划之中的,且成为该专业的骨干课程。

一、视觉传达专业计算机辅助设计类课程的设置现状

视觉传达设计是指利用视觉符号来传递各种信息的设计。总的来说,视觉传达专业计算机辅助设计类课程主要分为以下几类:平面设计软件类(Photoshop、Coreldraw、Illustrator、Indesign)、二维动画软件类(Flash)以及影视后期制作软件类课程(Aftereffect、Premire)。Photoshop作为一款图像处理和绘图软件成为该专业学生必须掌握的工具,其强大的作用及功能几乎渗透到视觉类专业的所有科目。Coreldraw、Illustrator软件作为必须掌握的矢量软件,在制作插图、标志、书籍装帧、版式设计、VI设计、包装设计等主干课程中发挥到不可忽视的作用。二者作为基础性软件,容易学习和上手,是学生入门的好软件。Flash软件可以用于二维动画和多媒体创作。Aftereffect是目前世界上最广泛的视频合成软件之一,广泛用于数字电视,视频的后期制作,在PC系统上可以完成较好的合成效果。

二、视觉传达专业计算机辅助设计类课程的设置现状

独立院校教育以市场需要为导向,着重在于培养学生的动手能力。因此,计算机辅助课程相对于其它课程来说实践课时较多,以强化学生运用软件的能力。计算机辅助设计类课程要求学生利用日益增多的各类设计素材库,对图像进行处理,变化出更为丰富的视觉语言。如今软件升级换代十分迅速,这要求学生及教师能不断的更新知识,在学习的过程中,要学会质疑和尝试,触类旁通去学习和寻找不同的操作方法。

三、视觉传达专业计算机辅助设计类课程的教学方法

(一)案例式教学法

学会工具的简单用法,最容易达到。通过了解功能、界面、菜单、面板以及工具的基本使用方法,就大致了解。学生除了在课堂上消化和吸收教学案例以外,学会举一反三,大量的课外钻研也有必要的。

(二)项目式教学法

项目式教学法是通过进行一个完整的“项目”工作而进行的实践教学活动的培训方法。在教学实践中,拿实际项目里的课题研究作为项目,它能为学生日后进入工作岗位积累实践经验,这种过程对学生的学习能力有着极大的提高。

四、 视觉传达专业计算机辅助设计类课程存在的误区

在教学方面:有的教师侧重于工具的教授,然后辅以大量的图例去启发学生。有的教师则完全把软件课变成单独的软件培训班的模式,一味的填鸭式教学,不去培养学生的创新能力。这些情况只会使学生的软件学习能力停留在很低的层次。

在学习方面:学生不动脑筋,不愿意去探讨原理和基础工具运用,只是默默地跟着范例,至于为什么会,不去探究。另外有些同学不善于做笔记,不勤加练习,今天会明天忘,所以说软件的学习过程也是个需要潜心修炼的过程。

五、视觉传达专业计算机辅助设计类课程的有效进行

(一)针对性的设置课程

学校在开展计算机辅助设计类课程的初期,可以尝试着去要求学生对常规软件(例如Photoshop、Coreldraw、Illustrator等),达到创新的运用程度。其它的软件,学生可以根据自身的学习情况和接受能力进行多样性的选修。同时也可以在这三类基础软件上加大课时的投入,以巩固学习成果。

(二)教学与实践相结合

学校与相关单位紧密协作,定期到单位参观实习此外加大投入让学生能参与到国内外的各项比赛中,以赛代练。

(三)加强师资培训,提高教师业务水平