首页资料文库正文

计算机视觉与应用十篇

时间：2023-12-25 17:51:06

计算机视觉与应用

计算机视觉与应用篇1

关键词：计算机视觉；快速开发；框架；模块化；模块耦合；底层剥离

中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2012）29-7084-04

在视觉分析实际应用项目中，如何通过建立计算机视觉分析快速开发框架，搭建一个分工明确，快捷有效的图像学应用处理平台，提高开发效率，缩短开发时间，已成为项目开发人员关注的重点内容之一。本框架从项目应用和实际需求出发，将计算机视觉技术的核心算法从底层研究工作中剥离，可极大的缩短开发时间，提高开发效率。

在本框架下，开发人员可各司其职，分工、构成和职能划分明确，框架开发人员只专注于框架接口的定义；算法开发人员只专注于图像处理与识别等算法的开发；上层应用开发人员只负责抽取出一般的处理流程，专注于项目的具体实现和功能模块的组合应用。

1 研究与应用

1.1背景

计算机视觉是用摄像机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉。系统将获取的视频或图像资料，通过计算机处理成为更适合人眼观察或传送给仪器检测的图像，其中包括图像处理、模式识别或图像识别、景物分析、图像理解等相关内容，它们之间既有差别，又有相互重叠。

在计算机视觉分析技术中，对于一些复杂的问题，往往不是某单一学科能够解决的，它需要一系列相关技术的支持。例如：对航道中船舶的识别，获取的视频流往往要经过平滑、去噪等图像处理操作后，便于下一步运用基于直方图分类器的图像识别算法来区分船舶和水面，通过图像分割技术来提取检测目标。而这些方案的实现中，同一个问题的解决又往往需要有一系列的算法来支持。还是以船舶识别为例，图像平滑有领域平均、低通滤波等算法；图像去噪有各种滤波器算法；基于直方图的分类器也存在决策树、贝叶斯、SVM等等算法。虽然上述的算法本身没有优劣之分，但在特定的环境下一定会有某个最佳算法。

因此，在实际应用项目中如何找出其最优路径，除了需要开发者拥有深厚的图像学功底，更需要的是通过大量的对比实验来找出该最优路径的解决方案。即便如此，也只能解决特定环境下的计算机视觉需求，换个应用场景，上述步骤又需要重新进行，此类过程的重复，既增加了开发成本，又延长了开发时间。

本框架从工程化的角度出发，在不同项目中的计算机视觉软件开发中，研究如何提高开发结果的复用性，尽量降低上述各条件间的相互依赖关系，将视觉技术的核心算法从底层研究中剥离，达到缩短开发时间，提高开发效率的目的。

1.2研究目标

1）框架系统的扁平化、模块化；

2）完成处理过程的任意组合，使图像处理模块单一化；

3）理行为在处理模块内部完成，处理结果可通过接口方式进行输出；

4）处理模块间的数据流动定义在框架之中，框架负责配置数据流；

5）置好的数据流，通过指定图像处理模块实现对物体的识别、行为的识别。

1.3.5框架的效果演示

从右侧功能区中选取两个输入模块：MediaOpen00和MediaOpen01，分别打开视频文件“.＼公司监控视频.avi”和图片“.＼Lena.jpg”，任意添加一些图像处理模块或者图像识别模块，这里我们选取了行人检测算法、基本全局阈值二值算法、人脸检测算法、轮廓检测算法，加入输出展示模块用于显示处理结果。最后我们用曲线将模块间的输入输出点连起来，完成数据流向的配置过程。其中一个输出点可以连接多个输入点，但一个输入点只能接入一个输出点。

2 结论

随着计算机视觉技术发展的日新月异，算法的更新和积累将会越来越多。计算机视觉快速开发框架从实际应用工程的角度出发，在不同项目计算机视觉软件的开发过程中，将视觉技术的核心算法从底层研究中剥离，使视觉分析应用项目中的框架开发人员专注于框架接口定义的开发，而项目中的算法、上层应用等开发人员各司其职，分工明确，不但提高了开发结果的复用性，同时，也降低了项目开发中各条件间的相互依赖关系，缩短了开发时间，提高了开发效率。

参考文献：

[1] Gary bradski，Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc，2008.

[2] 张广军.机器视觉[M].北京：科学出版社，2005.

[3] 张少辉，沈晓蓉，范耀祖.一种基于图像特征点提取及匹配的方法[J].北京航空航天大学学报，2008，34（5）.

[4] 刘立，彭复员，赵坤，万亚平.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程，2008，37（1）.

[5] 戴斌，方宇强，孙振平，王亮.基于光流技术的运动目标检测和跟踪方法研究[D].国防科学技术大学机电工程与自动化学院.

[6] 陈胜勇，刘盛.基于OpenCV的计算机视觉技术实现[M].科学出版社.

计算机视觉与应用篇2

关键词：计算机视觉；课程创新；教学改革

中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2016）20-0118-02

计算机视觉课程是人工智能学科的分支学科，对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁，越来越多的学生对这一领域产生了浓厚的兴趣，计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣，如何培养学生的专业能力和实践能力，是当前高校应该考虑的问题。经过近几年的教学实践后，很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法，在满足学生对计算机视觉应用需求的同时，加深了学生对理论知识的理解，这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来，随着计算机网络的飞速发展，计算机视觉的应用也越来越广泛，成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域，包括人工智能与模式识别、应用数学等，其覆盖范围广，综合性较强。具体来说，计算机视觉课程有以下几个特点：一是内容广泛，理论抽象。计算机视觉是一门新技术，随着时代的变迁，互联网新技术的更新日新月异，这就使得课程内容的更新过快，内容广泛，教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域，并且所涉及的领域知识内容复杂，表达抽象，这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域，操作性极强，学生只有在具有一定的工程项目综合能力后，才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列，其输入资料主要来自usb摄像头或是相机。经过处理后，计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解，在这一方面，计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成，每个多边性有三个顶点，输出的是二维像素数组。在增强现实的应用中，人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率，还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先，计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础，而计算机视觉的研究成果也可以作为数字处理的素材。其次，计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位，而图像则不仅包括图形，有时还包括来自现实世界的信号，并且图形的处理不是一种简单的堆积，计算机视觉的处理要从图像中找到一些统计数据和信息，并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作，因此，在对学生进行培养时，高校一方面要考虑到学生的知识接受度，另一方面要设置以工程应用为导向的课程内容，帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时，首先要创新课程教材，摒弃以往枯燥的理论书籍，多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性，高校应该选择以下两本书作为学生的专用教材：一本是我国著名教授贾云得编纂的《机器学习》，这部教材深刻体现了时展的教学要求，书中不仅详细讲述了计算机视觉中的一些基本知识，包括计算机视觉的基本概念、算法及其应用，还有一些经典的数字图像处理方法和视觉应用分析，对学生了解基础知识和实践内容有着重要的意义；另外一本是国内外十分推崇的计算机视觉著作，它是美国教授Richard Szeliski教授的作品。该书在2010年出版，获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授，也是微软研究院交互视觉与多媒体的主任，他对计算机视觉的发展和未来走向十分清楚，也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此，这本教材面向应用，与当今最新的科技成果紧密相连，综合论述了计算机视觉在各个领域的发展，展示了计算机视觉的最新研究成果和未来的发展趋势。此外，本书中还有详细的国外研究案例和更加深入的应用案例，适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则，对学生开放性思维的培养有着重要的意义。

2.面向科技最新成果的课程定位。计算机视觉是一门新技术，科技创新是其发展的原动力，因此，高校在进行课程安排时，应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程，高校要做到以下两个方面：（1）选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题，学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时，计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容，主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识，包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容，其课时可占总课时的二分之一。其次，视觉部分是近几年来计算机视觉的最新科技成果，内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域，视觉部分将会是该课程后期的重点内容，与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用，学生会更多的涉及到实践操作，更好的培养学生的实践能力。（2）强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一，高校可以在课程项目中引入新技术的探究，在使课程在具有基础性、研究性的同时，具有一定的前沿性，还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中，高校必须要强化学生的自学和调研能力，在调研时给每一个小组安排一位高年级研究生作为指导，每组学生独立完成任务，高年级研究生只做引导和辅助的作用。学生在自我设置调研程序，查找资料，理解和熟悉相关程序的时候，能够更加掌握最新科技成果的内容，同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一，因此在计算机视觉课程的教学过程中，培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法：（1）选取适当的工程实例。对于信息专业的学生而言，计算机视觉课程各个独立的算法和方法较多，彼此没有过多的联系。这对学生来说过于抽象，不易理解，因此教师不应当仅仅限于知识的传授，还应该选取一些适当的工程实例，将知识体系串联在一起，加深学会对教学内容的理解，从而达到良好的教学效果。例如，在教学过程中，教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品，用手机举例更加贴近学生的生活，教师可以详细介绍手机键盘和主板的制造过程，并在这一过程中将所学的算法和理论融合进去，加深学生对知识的理解。其次，教师在手机讲解时，还可以引导学生思考类似的产品制造，从而引出数码相机的制造原理，和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习，还可以让学生拓宽思路，发散思维，不断创新计算机视觉领域。（2）选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科，因此，为了学生更好的学习，教师要将理论工程实践化，选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房，给学生上一堂别开生面的实践课，详细介绍每个制造流程，并向学生不断抛出与课程有关的问题，引发学生的思考，比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中，对学科知识的了解也会逐步加深。其次，高校可以建立专门的实训基地，学生可以在基地里实践操作，将理论转化为实物，亲自尝试做出模型，这种做法可以极大地提高学生的实践能力，使学生更快的将理论转化为实际。

四、结语

在新形势下，高校应不断创新计算机视觉课程的教学模式，并以此展开教学活动，培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式，有利于解决理论和实践相脱节的问题，在增强学生学习兴趣、提高学生独立分析能力的同时，还使学生接触了国际最新的研究成果，拓宽了学生的思路，这对学生未来的发展有着重要的意义。

参考文献：

[1]郭小勤，曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究，2010，（05）.

[2]伦向敏，侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛，2012，（18）.

[3]陈芳林，刘亚东，沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践，2013，（07）.

[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技，2015，（05）.

[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活：中旬刊，2015，（07）.

[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究，2015，（08）.

计算机视觉与应用篇3

1 计算机视觉定义

人类天生具有五感，视觉便是其中之一，而计算机视觉，就是让计算机网络能够睁开眼看世界。让计算机有一定的视觉能力，可以从各个方面帮助人们进行监督、检验检测。利用计算机视觉科学可以使工作变得更加简便。计算机视觉主要应用于对二维码、条形码、照片、视频资料如片段等进行智能处理。

2 计算机视觉研究在医疗、交通中的作用

随着医学成像技术的发展与进步，图像处理在医学研究与临床医学中的应用越来越广泛。最常见的有癌细胞显微图像分割与识别、基于多特征融合的血红细胞识别和乳腺癌细胞计算机的自动识别等。计算机视觉技术的迅猛发展，为医疗诊断带来了很大的方便，同时促进了临床医学的发展。另外，在各大综合医院慢慢发展起的体检体系中，计算机视觉技术起到了决定性因素。随着体检的人数上升，对医院体检的管理、速度、准确性都提出了更高的要求。视觉识别轻而易举的解决了这个问题，只需要去识别体检人员的身份证，就可以将体检人员对号入座，检查过的项目，没有检查的项目一目了然。理化指标的检验，只需要在采血试管或采尿瓶上粘贴与体检者对应的条形码即可，利用视觉技术对号入座，方便而准确的确定每一位体检人员的血样及尿样。及提高了医院的工作效率，又将错误率降到最低。

计算机视觉在交通上同样得到了广泛的应用及发展。交通安全是交通运输中的重大问题，随着近年来机动汽车数量的迅猛增长，交通事故的发生也随之越来越频繁，给人类社会带来的危害也日趋严重，使很多的家庭失去亲人，甚至家破人亡。全国一线城市例如：北京、上海、广州、深圳等交通道路供需的矛盾日趋严重，交通安全、交通堵塞及环境污染已成为困扰我国交通领域的三大难题。基于图像处理的计算机视觉技术是通过摄像机获取场景图像，并借助于计算机软件构建一个自动化或半自动化的图像、视频理解和分析系统，并提供及时准确的图像、视频处理结果，以模仿人的视觉功能。主要功能如下：

一是基于计算机视觉技术的车辆牌照自动识别：车辆牌照是车辆的唯一身份，对车辆牌照的有效检测与识别在车辆违章检测、停车场管理、不停车收费、被盗车辆稽查等方面有着重要的应用价值。尽管针对车牌识别技术的研究相对成熟，然而在实际的应用场景中，受到天气、光照、拍摄视角、车牌扭曲等因素的影响，车牌识别技术仍然有一定的改善空间。

二是基于计算机视觉技术的车辆检测与流量统计：目前城市交通路口的红路灯间隔时间是固定的，而不同路段、不同时间段交通流量是随机变化的。若能根据各个交通路口的交通状况辅以计算机进行自动分析，并判断与预测交通流量，无疑为交通警察出警，红绿灯时间间隔的动态设置等提供技术支持。

三是基于计算机视觉技术的公交专用道路非法占道抓拍：公共交通是每个城市交通的重中之重，城市的公共交通为老百姓提供了便捷的出行方式。公共交通的发展，有利于城市的节能减排，有利于降低城市的空气污染指数。由于城市公共交通具有运量大、相对投资少、人均占有道路少等优点，解决城市交通问题必须优先发展城市公共交通。然而目前拥挤、缓慢的公交出行方式已成诟病，因此发展“快速公交”将是未来公交的一种运行模式。道路畅通则是发展“快速公交”的前提，相应地，公交专用车道的设定必不可少。为防止其他社会车辆的驶入，并对违规驶入的其他社会违规车辆进行抓拍与惩罚是保证公交车道公交车专驶的一种重要手段。因此在公交车前部装置摄像头并辅以其他处理设备，从而可以使得每一辆公交车成为了一个流动的监控设备。

3 计算机视觉在条形码检测中的应用

条形码是将宽度不等的多个黑条和空白，按照一定的编码规则排列，用以表达一组信息的图形标识符。在中国，由中国物品编码中心赋予制造厂商代码。那么最常见的计算机视觉应用与条形码检测就是在超市中。超市中每样产品都有自己的条形码，当人们选择了自己需要的物品后，来到收银台进行结账，我们会看见收银人员会用扫码器对物品的条形码进行扫描，扫描后就会出现产品的信息及价钱。记录以及扫描条形码的技术就是计算机视觉技术。

4 计算机视觉重要技术——智能识别

近年来，基于生物特征的鉴别技术得到了广泛重视，主要集中在对人脸、虹膜、指纹、声音等特征上，这其中大多都与视觉信息有关。指纹、人脸功能已经大范围在生活中应用，其中很多单位的打卡制度就是依据面部识别、指纹识别来实现的。社会飞速发展的今天，很多的单位都实行了上下班打卡制度，这一制度已经被作为单位管理制度中的重要一条。购买的打卡机就是采用计算机视觉的重要技术——智能识别来实现的。利用打卡机的储存功能，记录每个职工的指纹或面部容貌，规定在某一个时间范围内对应识别指纹或面部容貌，视为打卡。在上下班打卡的过程中，员工将面部或指纹对应在打卡机的制定位置上，让打卡机进行识别，当识别的结果与存储结果相同时，打卡成功。这样看起来十分简单的打卡机可以使单位的工作有序化，制度化，而实现这个功能的技术就是计算机视觉技术中的重要技术之一：智能识别。

5 计算机视觉技术的发展过程及未来

计算机视觉技术研究经历了近40年的过程，20世纪50年代的统计模式识别、60年代的Roberts的三围积木世界、70年代的Marr为代表的计算理论、80年代的主动视觉，但是仍然面临许多的问题。主要由于计算机视觉是一个逆问题，视觉信息多种多样，视觉知识的表达很困难，图像数据量巨大，信息存储于检索困难，对生物学、神经生物学等的研究有待深入。

计算机视觉技术的未来必定会朝着高科技发展，航空遥感测控地形地貌、电影特效制作、工业生产自动化检测、医学影像检测，再到天文领域等，在这些科学领域中计算机视觉将无法取代，成为主流的技术之一。

作者简介

计算机视觉与应用篇4

一、计算机视觉检测技术含义

计算机的视觉又叫做机器视觉，通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程，从而进行三维世界的感知活动。计算机的快速发展，离不开神经心理学，心理学和认知科学方面的研究和发展，计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力，计算机不仅能感知到周围的总体环境，而且，还能够具有对物体进行描述，识别理解和储存的能力。

二、计算机视觉检测的基本原理

要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤：图像预处理（去除噪声）、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次：图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉（Computer vision）则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。

作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有：（1）计算出观察点到目标物体的距离；（2）得出观察点到目标物体的运动参数；（3）甚至可以判断出目标物体的内部特性；（4）推断出目标物体的表面特征有时要求形成立体视觉。

三、亚像素检测技术

随着工业检测等应用对精度要求的不断提高，像素级精度已经不能满足实际检测的要求，因此需要更高精度的边缘提取算法，即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的，这些算法一般需要先用经典算法找出边缘像素的位置，然后使用周围像素的灰度值作为判断的补充信息，利用插值、拟合等方法，使边缘定位于更加精确的位置。现在的亚像素提取算法很多，如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同，他们的应用场合也是各不相同的。

边缘是图像的基本特征，所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合，边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程，边缘的定位精度直接影响最终的测量结果。因此，图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中，早期使用的都是像素级边缘检测方法，例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度，即可以判断出边缘位于某个像素内，但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大，就会产生较大的误差，传统的整像素边缘检测方法就不再适用。

四、计算机视觉检测技术在机加工零件检测中的应用要素与过程

（一）曲阵CCD相机

面阵CCD是本项目图像采集系统中的主要设备之一，其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。

（二）工业定焦镜头

在图像测量系统中，镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能，合理选择并安装光学镜头是图像测量系统设计的重要环节。

（三）数字图像采集卡

随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用，使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能，同时还具备部分图像处理功能，因此又可以称之为图像处理卡。

（四）标定板

为提高测量精度，需要进行摄像机标定。标定过程中，采用NANO公司的CBC75mm}.0型高精度标定板，外形尺寸为75mmx75mmx3.0mm，图形为棋盘格，其尺寸为2.0mmx2.0mm，精度为1级，即图形尺寸精度与图形位置精度为。

（五）背光源

背光方式只显示不透明物体的轮廓，所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此，为精确提取轴的图像中的边缘特征，需采用背光源。为使图像边缘更锐利，光源颜色选择红色。

五、结语

随着计算机技术和光电技术的发展，已经出现了一种新的检测技术―基于计算机视觉的检测技术，利用CCD摄像机作为图像传感器，综合运用图像处理等技术进行非接触测量的方法，被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器，研究了零件在线测量的方法，实现了零件尺寸的图像边缘亚像素定位测量，对面阵CCD在高精度测量方面的应用作了进一步的探索和研究，为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。

【参考文献】

计算机视觉与应用篇5

关键词：计算机；交通运输；视觉；信号控制

中图分类号：TP39 文献标识码：A 文章编号：1006-3315（2013）06-175-001

近20年来，随着我国经济社会的快速发展，大家直接的感觉是交通和运输行业呈现出井喷式的发展：在1990年的时候，我国机动车保有量是1476.26万辆，我国公路的总里程102.83万公里；到了2010年，我国汽车的保有量已经达到了2706.13万辆，我国公路总里程已经达到了482万公里。交通运输对经济的发展起着至关重要的作用，高效的运输保障能力是促进经济发展的重要措施；自上世纪计算机技术在交通运输领域应用以来，其高运算性、集成性为交通运输系统的发展提供了充分的技术支持，提高了运输效率，缓解了交通运输压力。随着计算机技术的飞速发展，在交通运输系统中将会有更为广泛的运用。

1.计算机视觉技术在交通运输中的应用

基于图像处理的计算机视觉技术是通过摄像机获取场景图像，并借助于计算机软件构建一个自动化或半自动化的图像/视频理解和分析系统，并提供及时准确的图像/视频处理结果，以模仿人的视觉功能。采用人工值守的方式来处理交通问题是一种劳动力成本高昂且效率极为低下的一种工作模式，为了极大地提高工作效率并降低劳动力成本，计算机视觉技术应用于交通领域则成为了近年来的热点之一，其主要应用于以下几个方面：

①基于计算机视觉技术的车辆牌照自动识别。

②基于计算机视觉技术的车辆检测与流量统计。

③基于计算机视觉技术的公交车辆乘客人数统计。

④基于计算机视觉技术的公交专用道非法占道抓拍。

⑤基于计算机视觉技术的驾驶员工作状态判断。

⑥基于计算机视觉技术的行人检测。

随着图像处理、模式识别与人工智能技术的发展，更多的基于计算机视觉新技术将在智能交通系统中涌现，并以此进一步便利人们的出行方式与交通职能部门管理水平与工作效率。

2.车辆收费系统中计算机技术的应用

在近期我国兴起的不停车收费系统（ETC系统）是一种先进的电子收费系统，它包括自动车辆识别系统、计算机网络、监控系统和车道系统4个部分。与之前人工的收费系统相比，节约资源、减少污染、杜绝票款流失、减少车辆延误、提高通行能力与服务水平；该系统普遍采用非接触式的射频卡，以天线的方式对车辆上卡中信息进行读写，采用高速率的半双工协议来进行车辆识别与数据交换，实现车辆不停车收费，不停车收费系统将是未来收费系统的发展趋势，具有极其广阔的应用前景。

3.在交通信号控制领域计算机技术的应用

随着大、中城市不断增加的车辆和有限的道路空间矛盾日益加剧，交通系统面临着越来越多的问题。合理的运用计算机控制管理技术是缓解城市交通问题的重要措施之一，交通信号自动控制是交通控制的重要组成部分。智能交通中的信号灯控制显示出了越来越多的重要性，采用计算机技术、自动化控制技术和现代网络通讯技术，使车辆行驶和道路导航实现智能化，从而缓解道路交通拥堵，减少交通事故，改善道路交通环境，节约交通能源，减轻驾驶疲劳等功能，最终实现安全、舒适、快速、经济的交通环境。

随着我国交通建设的发展，未来的交通控制将在道路、车辆和驾驶员之间建立快速通讯联系。哪里发生了交通事故，哪里交通拥挤，哪条路最为畅通，会以最快的速度提供给驾驶员和交通管理人员。同时专为外出旅行人员及时提供各种交通信息，提供信息的媒介是多种多样的，如电脑、电视、电话、路标、无线电、车内显示屏等，任何一种方式都可以。无论你是在办公室、大街上、家中、汽车上，只要采用其中任何一种方式，你都能从信息系统中获得所需要的信息。有了该系统，外出旅行者就可以眼观六路、耳听八方了。

4.总结

21世纪将是计算机技术高速发展并更加广泛应用的世纪，也是公路交通智能化的世纪，人们将要利用计算机技术，构建更加智能的交通运输体系。计算机技术在将来的交通运输管理中将发挥更加重要的作用。计算机技术将使未来的车辆靠自己的智能系统和道路交通管理体系在道路上自由行驶；公路交通依靠自身的计算机视频传感技术将交通流量调整至最佳状态。计算机技术使得交通运输的效率更高，更好的为经济飞速发展做好支持。

参考文献：

计算机视觉与应用篇6

关键词计算机；图形设计；视觉传达系统

中图分类号：TP391 文献标识码：A 文章编号：1671-7597（2013）12-0031-01

目前来讲，计算机图形设计并非一个新鲜事物，因为在20世纪80年代，部分国家就利用计算机设计过图形。该设计方式传到我国，并展开了新的历程。而与计算机图形设计相比，视觉传达技术出现的时间更早，然而站在学科视角来讲，视觉传达依然属于较为年轻的范畴。视觉传达就是把视觉符号当作一个传达信息的通道，人类利用视觉符号展开信息共享与沟通，且该方式同样是人类信息资源传播中一种关键手段。根据有关数据统计，利用视觉传达系统传播的信息占人类信息的70%，然而由于在人类感官系统内，对外部环境中所传播的信息，视觉系统占有主要地位。因此，假使信息接收过程中，人类是依靠视觉系统完成的，并利用另一个感官完成其他信息的接收，如果两者之间发生冲突，人类的反应也会随之变化。

1 计算机成图图形设计与视觉传达系统概述

1.1 设计思路

在计算机成图图形设计与视觉传达系统设计过程中，设计人员不但要放开手脚，大胆做，还应该具有一定的弹性，不能被技巧与知识水平所制约，从而创造具有自身特点且与常规不符的作品，这无疑将成为设计的独到之处。通常情况下，人们将视觉传达系统设计当作一个展现思维的方式，尤其是在设计过程中把图形与文字有机结合，互相作用，且呈现出对方的优点，所以，视觉设计在对符号进行设计的过程中，应该尽可能对其进行优化，将符号自身的优点完美展现出来，进而在整体中表达其思想。

1.2 设计技术与方法

设计工作者应该紧随时展的脚步，充分利用计算机这一先进科学工具，将最好的设计思想表达给大众。此外，由于全球信息技术的迅猛发展，在电影制作与广告方面，均要求运用到计算机成图图形设计，而且设计人员在设计时，也能利用不同的工具，对图形的清晰度进行适度的调整，进而让大众获得不错的视觉感受。

1）提炼客体。图形设计的创作来源主要是客体的表现以及对其的观察。然而在设计过程中必须抓住客体主要的特性，忽略不重要的特性，运用最简单的图形将其所包含的意思表达出来。设计人员在对客体进行提炼的过程中，不但要把握物体的共性，还必须注意其个性。图形设计在提炼客体时涵盖了两个方面的思想：提炼设计的任务；提炼和主题思想有关的图形。

2）重组图形。所谓的重组图形就是把图形中的构成部分进行科学有序的结合。图形的素材就好比是产品的原料，还必须对其进行生产加工方能成为最终的成品。其中最具决定性的一个部分就是图形结构的安排。对图形进行不一样的组合能够产生不同的图形，现今最为常见的重组形式有置换、同构以及轮廓线的矛盾、共生等等。所谓的同构就是将两个或两个以上的形象结合为一个统一的整体，其目的就是依托某个图形形象表现出其他图形的特点。在同构的作用，能够使图形形象更为厚重，有内涵，营造更为新奇的感觉。

2 视觉传达系统内图形设计的特征

2.1 明确的主题思想

设计人员在对图形进行设计的过程中，首先就必须对其基本内容进行规划，明确主题思想，也就是确定自身所要体现的核心内容。例如美的冰箱的广告都要求突出一个作用，即保鲜，那么设计人员在图形设计中必须抓住的关键思想就是鲜活，这一特征不但是该广告设计的目标，同时是图形设计的主题。而这个主题必须具备独特性，能和竞争对手区分开来，有助于大众去选择该产品。主题和图形应该相互作用，主题的主要载体就是图形，而图形的灵魂就是主题思想，主题思想通过图形体现出来。主题思想在初期形成过程中有很多因素都是不明确的，例如表达形式的多元化、视觉元素的多样化以及受众喜好的多样化等。以上述中“鲜活”主题来讲，运动场等视觉元素均能表达该特性，但在表达形式上可以采用不一样的方式，例如影构、置换以及同构等。另外，站在目标受众角度来看，家庭主妇是冰箱使用者，因此在设计过程中必须对其进行调查，了解其特征。设计人员将这些因素都结合起来，分析所要设计的主题，最后明确恰当的表达方式。

2.2 图形设计的任务

在进行视觉传达系统设计过程中，每一个图形设计任务的提出均有一定的原因，例如商业广告的设计，它是在经济因素的基础上提出的；包装的设计，其目的是为了宣传企业文化、形象或者是打造产品形象；公益广告的设计，其目的向广大受众传播一种思想与信念。而所处社会的经济状况与大众的接受水平对图形设计任务的提出有一定的影响力。图形传播是在一定的社会背景下进行的，例如当时的风俗、文化等。在对图形进行设计的过程中，必须确保图形的内容和形式与上述客观背景相配合。

2.3 形象生动

图形设计与绘画是不一样的，绘画时必须确保物和物的协调统一，因此画家在绘画过程中必须先了解所画物体的形象。但是图形则并非如此，图形设计必须选取大众所能接受的物体，这就说明图形设计过程必须选取生活中较为常见的物品作为载体，只有这样设计出来的产品方能让大众记住，并且让大众所理解其中的含义。

3 结束语

总而言之，在当前社会，国家快速发展的主要源头在于科学技术的进步。在各行各业的发展当中，计算机成图图形设计与视觉传达系统设计得到了普遍的运用。所以，人们只有不断的对技术进行更新，不断的对视觉传达系统设计进行分析，进而将计算机成图图形设计运用到生活与工作中，促进社会的快速发展。目前各行各业都面临着巨大的压力与挑战，所以计算机图形设计应该与时展相适应，以便寻求更好的发展前景，尤其是在与视觉传达系统设计有机结合时，应该互相作用、互相影响，那么在不远的未来将会出现新的发展。

参考文献

计算机视觉与应用篇7

关键词：计算机辅助环境艺术设计起源现状及发展

随着计算机软硬件的进步，计算机辅助设计逐渐成为建筑效果图表现的主流。所谓计算机辅助环境艺术设计是指设计师通过计算机技术表现设计意图，最终以图像的方式告知客户，使客户清晰地理解设计师的设计意图和创意，它是一种更为直接、有效的表现方式，通常又被人们称为计算机建筑效果图。

一、计算机辅助环境艺术设计的起源

计算机的发展及应用，使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生，计算机辅助设计的研究构想发端于1950年，但使用计算机绘图的最早记录是在1963年，美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文，从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年，这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术，使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。

最初CAD被解释为“计算机辅助绘图”，由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具，但随着后来信息技术的飞速发展，计算机技术在各领域的广泛应用，CAD的含义也在不断变化扩展，随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等，使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形，从而使CAD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品，这也标志着新的视觉艺术形式的诞生得到了社会的承认。

我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似，国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初，随着我国现代化进程的迅速发展以及计算机的进一步普及，在环境艺术设计和创作领域，计算机技术应用的价值，逐渐得到人们的重视。

二、我国计算机辅助环境艺术设计的现状

计算机作为信息时代重要的技术工具，在环境艺术设计领域得到普遍应用。在20世纪90年代前，国内对环境艺术设计效果的表现是使用手工绘制的方法，到了20世纪90年代初期，计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末，计算机辅助设计逐渐成为建筑效果表现的主流。起初，设计师主要运用Auto CAD软件进行施工图的绘制，在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步，它自身的强大优势得以显示，同时对传统手绘表现产生了越来越大的冲击。

随着近十几年来我国计算机辅助环境艺术设计的发展，计算机建筑效果表现的类型己经有了很细致的划分，可以分为：计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSMAX，Lightscape，Photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图，透视点位置及视点角度均可变换，然后再渲染出二维图像，这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSMAX软件的三维动画功能，在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果，使人们能够在未来的建筑物中漫游，因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。

三、计算机辅助环境艺术设计的发展趋势

当前，随着计算机软硬件技术的迅猛发展，计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用，比如各种方案的汇报、投标以及招商广告中随处可见，从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术，想方设法掌握各种绘图软件，在模型、材质、灯光以及各种渲染技法上花费大量的时间，而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术，是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为，从审美主体的角度来看，艺术离不开创造者和欣赏者两个方面，而这两个方面都要通过一定的感官和相应的感性物质媒介，前者创造出审美对象，后者达到审美愉悦。所以说，作为视觉艺术的计算机辅助设计作品既要真实的描绘场景，又要使欣赏者达到审美偷悦。不可否认，人们的欣赏水平在不断提高，求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步，计算机技术的发展对于社会和艺术创造产生了重大的推动作用。

在计算机辅助环境艺术设计发展的初级阶段，设计师的目标是使效果图具有真实感，能够模拟未来场景的真实效果，具有一定的实用性。目前的计算机建筑效果图的风格单一，已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象，筑物内部空间的效果，使人们能够在未来的建筑物中漫游，因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉，采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景，可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案，所以说虚拟现实技术不仅可以使用于建筑表现，而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景，将给环境艺术设计带来革命性的改变。

设计师创造出审美对象，要使欣赏者达到审美愉悦而不是审美疲劳。为此，根据目前我国计算机辅助环境艺术的发展情况，未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。

参考文献：

[1]邓庆尧.环境艺术设计[M].济南：山东美术出版社.

[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[M].北京：中国建筑工业出版社.

[3]张绮受.中央工艺美术学院一环境艺术设计与理论[M].北京：中国建筑工业出版社.

计算机视觉与应用篇8

关键词：计算机视觉技术铁路检测应用

中图分类号：TP391 文献标识码：A 文章编号：1007-3973（2012）002-075-03

1 前言

自1825年世界第一条铁路在英国出现以来，铁路已经成为人们不可或缺的交通工具，越来越多的人在使用铁路出行，由于近年来铁路事故频频发生，促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。

传统的铁路检测一直是靠人工和静态检测，这种检测缺乏实时性和准确性，并且效率低下，根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展，人们就试图将计算机视觉技术应用于铁路检测上，并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性，有效的减轻了人工检测中工作条件恶劣，工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测，并及时的做出预警，防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。

2 计算机视觉技术

计算机视觉，也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像，将图像转换成数字图像，并利用计算机模拟人的判别准则去理解和识别图像，达到分析图像和作出结论的目的。

计算机视觉是多学科的交叉和结合，涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展，计算机视觉在机器人、工业检测、物体识别的应用越来越广，研究方向也从二维到三维，从串行到并行，从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。

一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来，这其实是一个光电传感器，将光学信号转成电信号，图像采集板把采集的电信号转为数字信号，即数字化，一般情况下在摄取图像时都需要一个照明系统提供光照，然后再用专用的图像处理软件对图像进行处理，输出分析结果。

3 计算机视觉技术在铁路信号中的应用

铁路信号灯和现在的交通公路上的红绿灯是一个功能，但铁路和公路不同，铁路有限定的道路，列车必须在限定的股道上行驶，所以一旦与其他车辆相遇的话根本没有办法避让，如果发生车祸将会对国家和人民的生命和财产造成严重的损失，因此列车必须严格按照信号灯的指示行驶。

铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等，结合各种信号灯色调H分量的取值范围得到信号灯区域，然后多次腐蚀直到消除孤立点得到信号灯的边缘，最后填充信号灯区域，从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式，用彩色特征聚类分析法来对图像进行分割，文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法，用Hough变化来提取目标边界，从而提取出特定目标，而后得到指示灯区域所有像素的H，S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间，用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。

为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响，文献[5]提出使用一种利用sift特征的方法，它首先建立已知样本模型的特征集，然后将视频流每帧灰度图像的sift特征与之比较，从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别，而且也明显优于基于边缘检测的算法，在识别准确率上达到了90%。

4 计算机视觉技术在轨道检测中的应用

随着世界铁路运营速度的不断提高，列车在行驶时对轨道的撞击、摩擦加剧，这就会造成轨道的变形、零件松动、磨损乃至缺失等，这些都会对列车的安全性造成严重影响，极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。

随着电子技术和检测技术的发展，轨道检测技术也经历了翻天覆地的变化，其中也有不少研究机构将计算机视觉技术应用于轨道检测上，且取得了若干有效的检测方法。

轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响，文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像，然后用局部归一化法增强轨道图像的对比度，最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快，在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响，但对局部归一化过程中参数的选择有待进一步研究，以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测，但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。

文献[8]利用一排结构光视觉传感器，将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记在参考坐标帧中，最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备，在列车较高速度时仍然能达到良好效果。

5 计算机视觉技术在接触网检测中的应用

接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分，主要为机车提供动力，接触网的连接件由于受外界因素的影响容易产生过热现象，严重时会导致供电中断，引发列车停运事故。

我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的，目前基于计算机视觉技术的接触网磨耗检测主要有两种方案：(1)基于镜面反射，激光照射接触线，线性CCD照相机捕获反射图像；(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦，接触网与受电弓接触部分很少被空气氧化，所以用光进行照射时该部分光反射率明显高于其他部分，因此这也为计算机视觉技术用于接触网检测提供了可能。

基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的，检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展，原有的检测系统已经暴露出了一些问题，已无法满足需求，所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法，如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点，提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置，应用图像分割、剔除干扰线、图像细化等算法，对采集的图像进行处理，然后利用改进的霍夫(Hough)变换检测细化后的图像，对相邻的特征像素点进行聚类并感知编组，最后用随机Hough变换使感知编组后的每条线段更接近直线，进而计算装置中定位器的倾斜度，实验证明该算法精度高、速度快。

6 计算机视觉技术在电力机车检测中的应用

在列车的行进过程中，机车车轮与钢轨接触面不断发生摩擦，也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离，而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命，因此需要对轮缘进行定期的检测和维修。

传统的检测方法需要人工逐项检测，存在费时费力、工作量大、工作环境差、效率低等缺点，所以人们就提出了一种基于计算机视觉技术的检测技术，该技术是一种非接触式检测方法，它能检测出所有关于火车轮缘轮廓的几何参数，从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度，在实验中取得了满意的效果，并且在实际检测中也得到了广泛的应用。

文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术，提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正，用统计均值法对图像进行分割，从而求出车轮踏面的各项参数，通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量，并且可得到相对准确的测量结果。

为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题，文献[11]提出了一种基于三角法测量的在线监测系统，该系统由CCD高速摄像机和结构光发射器完成数据的采集，然后利用三角测量原理导出测量模型和计算模型，根据轮缘高度和宽度的定义完成对高度和宽度的测量，最终对轮缘磨损程度进行量化，实验表明该算法测量精度高，结果稳定可靠。

7 计算机视觉技术在站台环境监测中的应用

近年来铁路交通事业发展迅速，铁路客流量也不断增大，如中国每年的春运期间都有上亿人次通过火车返乡，各种危害乘客安全的事故也时有发生，因此世界各国特别是中国站台监控就显得越来越重要，目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员，这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展，对站台的自动监控也逐渐成为发展趋势。

近年来人们做了许多关于站台人群检测的研究，这些研究大都使用铁路站台中的闭路电视（CCTV）系统，在现代的CCTV系统中基本上使用的是数字化图像，在人群监测过程中大量使用了数字图像处理技术，如边缘检测、细化、像素计算等，通过图像的处理可以轻易的得到想要的结果。

文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象，利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度，该系统在实际的运行中获得了较高的精确度，虽然不能计算人数但却能实时的预测人群的密度。

文献[13]所设计的系统就较为复杂，它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态，如：没有列车、有列车、列车正在出站、列车正在入站等，然后对物体或行人检测及跟踪，最后对所检测的结果综合分析，做出合理的预警或警告。

8 计算机视觉技术在铁路检测上的发展趋势

随着计算机视觉技术的铁路检测中的应用越来越广泛和深入，并且随着计算机视觉技术等关键技术的不断发展，计算机视觉技术在铁路检测上应用发挥更大的作用，它就目前而言在铁路检测的应用上仍然存在技术难题需要研究：

计算机视觉与应用篇9

关键词：计算机辅助平面设计；视觉美学

随着互联网技术的发展，计算机技术在社会各个领域中得到广泛应用，在平面设计领域，计算机也得到越来越广泛的应用，计算机辅助平面设计就是在进行平面作品的设计和测试过程中，利用计算机平台来进行设计与制作，在计算机辅助平面设计中，视觉美学的运用对最终的作品会产生很大的影响，在计算机辅助平面设计中，通过对计算机的巧妙运用可以极大地增强设计的视觉美学效果，为作品增光添彩。

1计算机辅助平面设计的视觉美学综述

平面设计作品可以通过简洁的图形语言把设计者的意图表现出来，而且它的艺术性非常强，传播效果比较好，艺术风格巧妙，由此我们可以看出，在多媒体与3D技术飞速发展的时代，平面设计仍然保持着强大的生命力不是偶然的。平面设计包含的类型多种多样，比如：绘画、摄影、平面广告、招贴画甚至书法等都可以利用计算机辅助来进行平面设计与创作。

在平面设计作品中，秩序美是非常重要的，一个好的平面设计作品必然会遵循一定的视觉表现秩序，比如对称、黄金分割等，这些视觉美学元素运用在计算机辅助平面设计作品中，能够让作品看上去更加和谐，更加符合人们的审美习惯，对一个平面设计作品好坏的评价在很大程度上取决于作品中各个元素之间的位置关系、比例关系以及元素本身的比例关系等的安排，只有在对这些元素进行安排时符合一定的视觉美学标准，才能够为作品增加更多的艺术效果。

目前，很多的图形设计平台都无法为设计者提供设计方面的理论支持与判断，需要用户在进行设计时，提高自身的艺术修养与设计规范，准确把握视觉美学设计要点，把视觉美学的知识准确的运用到设计作品之中，才能够创作出更好的设计作品。很多设计者在进行计算机辅助平面设计时，虽然精通设计软件的使用，但是缺乏视觉美学的相关知识，设计出来的作品混乱不堪，毫无艺术性可言。所以，平面设计工作者在掌握计算机软件基础的前提下，要努力提高自身的视觉美学修养，把计算机辅助平面设计与视觉美学有机结合到一起，创造出更加令人满意的平面设计作品。

2视觉美学中的几何美学

2.1视觉美学中的设计几何美学

自然界中的各种事物都有一定的比例关系，比如人与动物、植物的成长方式都遵循着1：1.618的黄金分割比例，这些自然比例被平面设计师发现并运用于平面设计作品中，为视觉美学的运用提供了最基本的出发点，这种视觉美学的基本原理可以运用在计算机辅助平面设计之中，能够让作品整体看起来更加的和谐、对称与平衡，使平面作品更加符合人们的视觉审美体验。

2.2视觉美学中的黄金分割比例

我们可以利用一条线段来对黄金分割比例进行研究（如图2），黄金分割指的是将一条线段AB分为AC与BC两部分，其中较长部分AC与整条线段AB的比值与较短部分BC与AC的比值相同，都是1：1.618，这个比例就是黄金分割比例，它是自然中一切事物最完美的比例。世界上有很多伟大的艺术品都是采用黄金分割比例制作出来的，比如达・芬奇的作品《维特鲁威人》、《蒙娜丽莎》以及《最后的晚餐》，这些画作都是采用黄金比例进行平面设计的代表作，在其他领域也有不少使用黄金分割比例的经典作品，比如：古希腊著名的雕塑“断臂的维纳斯”、“太阳神阿波罗”、古埃及的“金字塔”、巴黎的“圣母院”、法的“埃菲尔铁塔”等。

在黄金分割的比例下，我们能够得到很多的黄金分割矩形、三角形、椭圆以及螺旋线等，这些图形都具有极大的视觉审美价值，能够在保持原有的特性的前提下融人到更多的图案之中，让这些图案整体画面变得更加自然，更加协调，更具视觉审美特效。

2.3视觉美学中的动态矩形

除了我们上面所说的黄金分割比例，还有其他很多的无理分数比例的动态矩形也能够使人产生类似的令人愉悦的平面设计视觉审美，比如2、3、4、5等，这些矩形可以与黄金分割比例一起被统称为动态矩形，利用这些数值组合产生的图形总是与原始矩形的比例相同。

3平面设计视觉美学中的计算机辅助研究

3.1基于视觉美学的计算机辅助平面设计系统框架图幅分析

我们在进行计算机辅助平面设计时，首先要将图像导入到系统之中，把图像置于系统图层的最底层，保证在对图像进行分析时用到的辅助线、模板都在图像的上层。然后再把图层锁定，防止图像被篡改。在上述几步完成之后，可以对图像的属性进行图幅分析，判断出图像是横向插入还是纵向插人，计算出图像的插人点和长宽值，最终得出图像轮廓的比例。得出图像轮廓的比例之后，将所得到的比例值与2、3、4、5等动态矩形比例进行比较分析，判断是否符合这些动态矩形比例值，可以允许有较小误差，如果得到的比例值在某一个标准值附近，那么就可以计算出这个标准值的长宽值，并且利用这个长宽值对作品进行修改与调整，直到得到符合人们视觉审美习惯的作品为止。

3.2对计算机辅助平面设计作品进行分割线分析

当计算机辅助平面设计作品存在着明显的分割时，我们可以对平面设计作品中存在的直线系元素使用计算机辅助画出平面设计作品的分割线，然后计算出分割线与整幅图片以及分割线与分割线之间的比例关系。在对计算机辅助平面设计作品进行分割线分析时，可以进行连续分割线距离比例分析，求出相邻的两条分割线之间的比例关系，还可以进行连续分割线基准距离比例分析，求出各分割线相对于一个基准距离的相对比例。

如图4中的平面设计作品，我们已经对它进行了分割线的划分，这幅图包括图像轮廓在内一共有六条水平分割线，这六条分割线把这幅作品整体分成了五大部分，然后根据对它的连续分割比例分析，得出这幅作品基本上符合黄金分割比例。

3.3基于视觉美学的计算机辅助平面设计标准辅助线模板

在计算机辅助平面设计作品中，如果不存在分割线，或者需要对作品进行进一步的分割线比例分析，因为动态矩形本身具有一定的复杂性，所以单纯的人工很难判断出如何使用动态矩形的概念来辅助设计，这时我们就可以选择使用标准辅助线模板来寻找作品中蕴含的深层次比例关系。

在计算机辅助平面设计系统中，系统自带的有包括黄金分割2、3、4、5等比例的动态矩形以及很多种网格辅助线模板等，在进行作品设计时，我们可以根据需要选择不同的辅助线辅助进行平面设计。如图5、图6为利用2辅助线进行作品分析的模板，其他类型的辅助线使用方式可以参考此种模板进行使用。

计算机视觉与应用篇10

关键词：计算机视觉注意机制计算机视觉注意模型

1.引言

随着信息技术的不断发展，数据处理量剧增，以及用户不断扩大的个性化需求，对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息，即物体选择与识别，已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展，将注意机制引入信息处理领域来解决物体识别问题，已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时，总是迅速选择少数几个显著对象进行优先处理，忽略或舍弃其他的非显著对象。进入人类视野的海量信息，通过注意选择机制进行筛选，就能使我们有选择地分配有限的视觉处理资源，保证视觉信息处理的效率，这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理，开发能够进行智能图像信息处理的计算机系统，就成为一大任务。我们研究的主要方向是使计算机处理对象时，能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题，目前多个领域的研究人员都取得了研究成果，并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上（自下而上）的图像数据驱动的，也可以是安自顶向下（自上而下）的任务驱动的。其中，自下而上的研究主要来自图像中物体数据本身的显著性。例如，在视觉搜索实验中，显著的物体会自动跳出，如图1中的圆点通过特征对比，以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务，以及场景的快速认证结果，即我们可以“故意”去注意任何一个“不起眼”的物体，如我们可以在图书馆浩如烟海的藏书中，找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点，注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动，视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动，而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制，建立视觉注意的计算模型。通过“注意点”的选择与转移，实现对复杂场景中任务的搜索与定位，最终来实现实时信息的响应处理。在计算机视觉的研究中，显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看，人类视觉系统通过视觉，选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看，场景中的某些内容比其他内容更能引起观察者的注意，我们称之为视觉显著性，两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA（Focus of Attention）。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段，各种视觉特征在前注意阶段被以并行的方式提取出来，并在注意阶段以串行方式整合为视觉客体，即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上，Koch［2］进行了深入的研究，他提出注意焦点FOA的变化具有四个特征，即单焦点性：同一时刻只能存在一个FOA；缩放性：FOA的空间范围可以扩大或者缩小；焦点转移性：FOA能够由一个位置向另一个位置转移；邻近优先性：FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点，即FOA转移时抑制返回最近被选择过的注视区域。在此基础上，视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面：一方面是对自下而上的初级视觉特征的加工，另一方面是由自上而下的任务的指导，两方面结合，共同完成了视觉的选择性注意。与此对应，当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下，视觉注意的目标选择主要是由场景中自下而上的数据驱动的，目标是否被关注，由它的显著性决定。现在，自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型，Itti、satoh等人均在此基础上提出了自己的研究模型，并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究，形成各个特征对应的显著图。另外，一些研究者采用基于局部或全局对比度的方法，来得到图中每个像素的显著性，进而得到显著图。

现有的自下而上的视觉注意计算模型中，Itti的显著图模型（简称Itti模型）最具代表性。该模型主要包含3个模块：特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取，将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制，选出唯一的注意目标，其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点，如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中，由于Itti模型很难满足实时性的要求，科研工作者们正在努力研究动态场景的特性，并建立相应的动态模型。如Wolfe［1］指出，影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状，等等，其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型，该模型假设当场景中存在全局运动时，视觉注意对象将极少做运动。然而，许多真实的场景并不能满足这个假设，限制了模型的适用范围。Hang等人提出了一种运动图的计算方法，并把运动图作为特征之一，与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响，但是均存在一定的局限性，对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型，形成了一些理论成果。如曾志宏［2］等人提出注意焦点计算模型，郑雅羽［3］等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意，通过目标和任务的抽象知识，在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面，Laar（1997）提出了一个用于隐式视觉注意的模型，该模型通过任务学习，将注意集中于重要的特征。Rabak［4］提出了基于注意机制的视觉感知识别模型，该模型在定义目标显著性时，通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中，并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多，而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关，同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作，其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制，两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法，才能有效地实现视觉选择注意的目的。

实践证明，把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程，实现主动的视觉选择注意的目的，采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合，实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献：

［1］Wolf J M，Cave K R.Deploying visual attention：the guided search model.In：Troscianko T，Blake A，eds.AI and the Eye.Chichester，UK：Wiley press，1990.

［2］曾志宏，周昌乐，林坤辉，曲延云，陈嘉威.目标跟踪的视觉注意计算模型［J］.计算机工程，2008，（23）.

［3］郑雅羽，田翔，陈耀武.基于时空特征融合的视觉注意模型［J］.吉林大学学报，2009，（11）.

［4］Rabak I A，Gusakova V I，Golovan A V，et al.A model of attention-guided vision perception and recognition.Vision Research，1998，38.