首页资料文库正文

计算机视觉的核心十篇

时间：2023-12-28 17:40:31

计算机视觉的核心

计算机视觉的核心篇1

关键词：ICA-HMAX模型；视觉相似度；卷积核；语义相似度

中图分类号：TP317 文献标识码：A 文章编号：1009-3044（2016）08-0177-05

Abstract： This paper firstly introduces a multi-level convolutional ICA-HMAX model； then propose visualization methods of the convolution kernel convolution kernel to achieve different levels of understanding. Proposed using S3 layer feature of the ICA-HMAX model to achieve visual similarity calculation of different categories. By implementing different categories of visual similarity between calculated on Caltech 101 datasets， and compared with the semantic similarity between categories and further explore the relationship between semantic similarity and visual similarity between.

Key words： ICA-HMAX model ；visual similarity； kernel convolution kernel； semantic similarity

1 概述

21世纪以来，数字成像技术和存储技术得到了空前的发展；使得每天有数量巨大的数字图像进入人们的生活，成为人类生活、工作、娱乐中的组成部分。另一方面，互联网技术的发展给图像的迅速传播提供了有利的条件。此外，图像是视觉信息的重要来源之一，蕴含丰富的语义信息。图像理解是人工智能领域中的一个新的方向，其核心问题是研究如何使计算机能够像人脑一样有效正确理解图像中所表达的高层语义信息。

仿生多层模型在计算机视觉和人工智能邻域取得了显著的成果。20世纪末，Poggio和Riesenhuber根据IT皮层的生理学数据提出了标准HMAX模型[1]，该模型模拟视皮层中腹侧通路中简单细胞（Simple Cell）和复杂细胞（Complex Cell）的交替处理的功能，实现多层次特征提取。在此基础上，Serre等人提出一种具有随着层次的增加复杂度和不变性逐渐增强的图像特征表达[2]，并将其应用到真实场景的目标识别中，其识别性能明显优于传统的特征表达（如SIFT特征[3]）；Hu等人根据大脑神经元响应的稀疏特性进一步扩展HMAX模型，提出了Sparse-HMAX模型[4]，在分类性能上远远优于HMAX模型，同时较好模拟和解释神经元对视觉信号的稀疏响应。

本文内容章节安排如下：第2节首先简要描述了本文的ICA-HMAX模型；然后介绍卷积核的可视化方法；第3节介绍基于WordNet的语义相似度计算和基于ICA-HMAX的视觉相似度计算方法。第4节实验结果和分析。第5节总结与展望。

2 ICA-HMAX模型与卷积核可视化

2.1 ICA-HMAX模型简介

前馈ICA-HMAX模型由五层构成如图1所示。自底向上依次为S1C1S2C2S3五层，其中S1层卷积核（W1、V1）由独立成分析（Independent Component Analysis，ICA）方法从彩色图像的数据块中学习获得，为了使得C1层具有局部空间平移不变性，在S1层的每个二维平面响应图上进行局部最大值汇聚（max pooling）操作；同理，S2层卷积核（W2、V2）也是采用ICA方法从C1层采样块中学习获得；同样，为了使得C2层也具有局部空间平移不变性，在S2层的每个二维平面响应图上进行最大值汇聚（max pooling）操作；同理可以获得S3层的卷积核（W3、V3）以及S3层的特征表达。值得注意的是该前馈模型的卷积核均为单尺度。

2.2 卷积核的可视化

若要实现对多层模型ICA-HMAX的深入的了解，需要知道不同层次的卷积核编码的图像信息。由于S1层特征卷积核是在彩色图像的原始像素层上学习，可以在像素空间上直接观察S1层卷积核编码的图像信息。而S2、S3层的卷积核是在图像C1、C2层的响应图上经过ICA学习获得高维数据，因此不能直接观察其卷积核编码的图像信息。为了观察S2、S3层的卷积核所编码的图像信息，当给定一个某个类别的卷积核的条件下，本文提出在该类别的图像上找出使得该卷积核的刺激最大的前50个感受野区域，并将这些区域与其刺激的响应值进行加权求和，然后取平均；所得结果具有表示S2、S3层卷积核所编码的图像信息从而作为S2、S3层的卷积核可视化。

3 相似度计算

3.1 基于WordNet的语义相似度计算

WordNet是由普林斯顿大学心理学家，语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列，而且按照单词的意义组成一个“单词的网络”。一般来讲，国内外的研究学者将经典的基于语义的相似度的计算方法分为三个类型[6，7]：基于距离的相似度计算（Path Counting Measures）、基于信息内容的相似度计算（Information Content Measures）和基于特性的相似度计算（Feature-based Measures）。本文主要介绍基于距离的相似度计算方法――Shortest Path算法和Leacock and Chodorow算法。

3.2 基于视觉的类别相似度

众所周知，不同类别之间存在部分外观相似性，比如山猫和豹、狼和哈士奇、浣熊和果子狸等等。可见，分别在两个类别的训练集上训练ICA-HMAX模型，若两个类别视觉相似度越高，则这两个类别的S3层卷积核相似的基元个数越多；反之，两类别的S3层卷积核中的相似的基元个数越多，两个类别的视觉相似度越高。

我们知道两个类别的相似度越高，则两个类别的ICA-HMAX模型越能较好地实现对异类图像的相互表达。因此采用配对字典的方法[10]实现对S3特征表达的重构。然后，将重构图像与输入图的结构相似度[11]（SSIM）作为衡量S3层特征对输入图像描述的好坏。若重构图像与输入图的结构相似度越高，则两个类别的视觉语义相似度越高，反之亦然。基于目标类别的视觉语义相似度算法流程如表1所示：

4 实验结果与分析

实验设置：实验所使用的PC机配置为Intel（R） Core（TM） i7-4770、CPU 3.4GHz × 8 cores、RAM 16 GB、Windows 7操作系统。为了探索不同类别之间的语义相似度和基于ICA-HMAX模型S3层的特征描述子的视觉语义相似度之间的关系，本文选择了Caltech 101数据集[12]进行实验，该数据集以彩色自然场景图像为主（包含一定数量的人造图像）。包括动物、花、人脸等101个目标类别以及一个背景类别。除背景类别之外，每个类别中的每张图片只包括一个类别中的一个实例，这有利于本实验进行。在进行实验之前，首先对数据集中每张图像做如下预测处理：统一图像高度为140个像素，保持图像的长宽比不变，采用双三次插值对其进行缩放。将每个类别中的图片按照4：1的比例分成训练集和测试集，在训练上训练各个类别的ICA-HMAX模型，采用3.2节介绍的视觉语义相似度方法在测试集上测试不同类别之间的视觉相似度。

4.1卷积核的可视化

图3（b）、（c）、（d）分别给出了S1、S2和S3层卷积核的可视化结果。结果表明，不同层次的卷积核编码了图像不同类型的特征。图3（b）中的S1层卷积核均编码了图像底层特征（如彩色边缘、彩色表面、拐角等结构信息等），并且不同类别的底层特征具有相似的结构特征；值得注意的是，通过ICA在彩色图像上的学习，获得了重要的颜色信息如彩色边缘、彩色表面等。S2层卷积核编码了各类别的中层部件特征，例如face_easy类别的S2层编码了人脸的眼睛、嘴巴、鼻子等信息，如图3（c）所示。由图3（d）可以看出，由于S3层卷积核的感受野比S2层大，编码信息更趋于类别信息。研究表明：这符合图像理解的层次特性[13]。

4.2 相似度

数据集Caltech101图像部分类别之间的基于路径的Shortest Path算法和Leacock and Chodorow的相似度矩阵分别如图4和图5所示。由图4和图5可以看出这两个矩阵都是对称矩阵。与一个类别最相似的类别有的不止一个，如与ant类别最相近的类别是butterfly、dragonfly、mayfly。值得注意的是图5中基于路径的Leacock and Chodorow算法的类别相似度数据是经过归一化处理后的数据。

本文采用基于ICA-HMAX模型的S3层的特征计算视觉相似，其视觉相似度矩阵的结果如图6所示。在该相似度矩阵中，把同一类别之间的视觉相似度设置为1作参考，来衡量不同类别之间的视觉相对度。在图6中横轴表示ICA-HMAX模型的类别。纵轴表示测试图像的类别。由图6可见，不同类别之间的视觉相似度矩阵不是对称。比如用airplane的ICA-HMAX模型对helicopter类别的图像进行表达，并计算其视觉相似度其值为0.506；而当用helicopter的ICA-HMAX模型对airplane类别的图像进行表达，并计算其视觉相似度其值为0.253。且与一个类别最相似的类别只有一个。在Caltech101数据集中helicopter类别的直升机的实例图片上都存在较为明显的螺旋桨。在airplane类别的飞机图像没有明显的螺旋桨。而在忽略helicopter类别的直升机螺旋桨后，直升机的机体形状与airplane类别的机体在视觉上存在相似。基于语义和视觉的相似度统计如表2所示。

两种相似度之间的差异性分析：由表2可知，基于语言的语义的相似度与基于视觉的相似度之间存在一致性和差异性。一致性：由表2可知，20个类别中基于语义和视觉的相似度一致有5对，分别sunflower和bonsai、rhino和llama、airplane和helicopter、ant和mayfly、hedgehog和llama。比如airplane和helicopter这两个类别的实例如图7所示。由图可见，不同类别之间存在视觉相似，两个类别实例在的某些局部形状、颜色、纹理等方面具有视觉上的相似性。差异性：由表2可知：20个类别中基于语义和视觉的相似度不一致的较多。如图8所示，ant、butterfly和dragonfly这三个类别的语义相对度很高但是它们的视觉相似度相差较大。原因在于：语义即语言意义，是人脑对客观上事物的认识和理解，它具有高度的概括性和抽象性。类别之间的语义往往根据类别所属范畴、关系、属性、功能等综合特性来进行划分。而仅仅从事物的视觉外观上无法体现出上述种种关系。

5 结论与展望

通过ICA-HMAX不同层次卷积核的可视化分析可知：自底层到高层不同层次的卷积编码规律如下：不同层次的卷积核编码了图像不同类型的特征。模型的层次越高，卷积核编码的信息越趋向于反映目标类别的特性，S1层卷积核编码体现底层共享特征（如拐角、彩色边缘、彩色表面等）。S2层卷积核编码中层部件特征，比如face_easy类别的S2层编码了人脸的眼睛、嘴巴、鼻子等局部信息。S3层编码信息更趋于类别的全局信息。研究表明：这符合图像理解的层次特性。

通过视觉的相似和语义的相似度分析可知，基于ICA-HMAX模型的S3层特性的视觉相似度与语义相似之间存在一致性和差异性。这种一致性和差异性在计算机视觉和人工智能领域具有互补性。比如对于那些语义和视觉的相似度一致的类别，尤其是视觉相似度较高的类别之间可以进行迁移学习，使得计算机实现人类的类比学习能力。对于语义和视觉的相似度差异性在图像的检索和图像理解等方面可以实现互补。通过语义的相似度我们可以检索到较多的相似类别，如与ant语义相似的有ant、dragonfly、butterfly。这样我们可以实现大范围的查找。然后在通过视觉的相似度进一步筛选正确的类别图片。反之，通过语义可以指导基于视觉的机器学习。

参考文献：

[1] Riesenhuber M， Poggio T. Hierarchical models of object recognition in cortex [J]. Nature neuroscience， 1999， 2（11）： 1019-1025.

[2] Serre T， Wolf L， Bileschi S， et al. Robust object recognition with cortex-like mechanisms [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence，2007， 29（3）： 411-426.

[3] Lowe D G. Distinctive image features from scale-invariant keypoints [J]. International journal of computer vision， 2004， 60（2）： 91-110.

[4] Hu X， Zhang J， Li J， et al. Sparsity-regularized HMAX for visual recognition [J]. PloS one， 2013， 9（1）： e81813-e81813

[5] Nair V， Hinton G E. Rectified linear units improve restricted boltzmann machines [C] //Proceedings of the 27th International Conference on Machine Learning （ICML-10）. 2010： 807-814.

[6] Hliaoutakis A. Semantic Similarity Measures in MeSH Ontology and their application to Information Retrieval on Medline [J]. 2005.

[7] Raftopoulou P， Petrakis E. Semantic similarity measures： A comparison study [J]. Technical University of Crete， Department of Electronic and Computer Engineering， Tech. Rep. TR-TUC-ISL-04-2005， 2005.

[8] R. Rada， H. Mili， E. Bicknell and M. Blettner， “Development and Application of a Metric on Semantic Nets”， IEEE Transactions on Systems， Man and Cybernetics， vol. 19， Issue 1，（1989） January-February， pp. 17 - 30.

[9] H. Bulskov， R. Knappe and T. Andreasen， “On Measuring Similarity for Conceptual Querying”， Proceedings of the 5th International Conference on Flexible Query Answering Systems，（2002） October 27-29， Copenhagen， Denmark.

[10] Vondrick C， Khosla A， Malisiewicz T， et al. HOGgles： Visualizing Object Detection Features[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013： 1-8.

[11] Wang Z， Bovik A C， Sheikh H R， et al. Image quality assessment： from error visibility to structural similarity [J]. IEEE Transactions on Image Processing， 2004， 13（4）： 600-612.

计算机视觉的核心篇2

近几年，信息技术和网络技术突飞猛进，改变了人们的工作形式和生活习惯。同时信息技术也带动了世界民族文化复兴，在高科技应用的形式下人们越来越重视民族文化的发掘和应用，将传统文化渗入到各行各业的发展中。而视觉传达设计教育方面对传统文化的应用主要表现在现代技术和传统文化内涵的融合发展。本文主要分析视觉传达设计教育回归传统文化的发展。

【关键词】

视觉传达；设计教育；传统文化

视觉传达设计是一种以“图”作为载体的一种信息传递艺术，属于艺术设计范畴，视觉传达设计已经渗入到我们生活的各行各业中。过去对视觉传达设计的过程中一般多考虑西方时尚元素，而中国传统文化很少应用在这个领域[1]。而近几年，随着我国传统文化的发展，人们逐渐意识到传统文化元素应用到视觉传达设计中具有很好的效果，能够大大提高视觉传达设计创新意发展，提高视觉传达设计美感。

一、视觉传达设计教育在发展中存在的问题

（一）视觉传达设计教育创造力不足。

在科学技术的推动下，设计数字化已经成为一种发展趋势，数字化科技的额迅速发展推动了视觉传达设计课程的进一步完善和发展[2]。特别是计算机技术的普及改变了设计的面貌，计算机辅助设计逐渐进入到设计课程中。目前，我国现阶段的设计教育在课程安排过程中对计算机设计的依赖性比较大，相应的学生计算机水平和技能也得到较大水平的提高，但是学生手绘能力比较低。这种现象说明学生偏好计算机设计，另一方面也表现出了学校教学对传统课程不是很重视。所以，在数字化科技指导到设计教育虽然培养出了一些硬件和软件技术较高的学生，但是这些人才缺乏独立思考和创造力能力，导致这些人才仅仅算是“执行机器”。

（二）视觉传达设计教育缺乏文化素养。

视觉传达设计过程中需要借助图案、信息和色彩等元素传达创作者所要表达的设计意图，通过设计给人一种知觉感受，让人能够领会到设计的成果。视觉设计要从追求以“文化”为基础的设计理念实施设计，使视觉设计不仅从视觉上给人们以享受，而且将设计层次提升到以语意理念为基础的设计，注意引导人们对于感知和心灵的体会。但是，目前的视觉传达设计教育缺少人文关怀设计教育，也就是说现代设计教育培养出的人才缺乏人文素养。

（三）视觉传达设计教育缺乏视觉素养。

视觉素养是一种以视觉实施沟通的能力，也可以说是一种视觉传达，它使用视觉对象对人们实施沟通和交流，做好视觉传达设计教育工作的前提就是教育和被教育者都具有一定的视觉素养。一个人设计者如果具有较高的视觉素养，就能够从理论作品中蕴含的深层文化含义感知文化元素，从而分析出作品中的文化内涵，并形成自己的设计风格，提高设计艺术价值。

二、视觉传达设计教育回归传统文化的措施

中国传统文化元素是我国文化传承和文化艺术的母体，当今国际视觉、艺术发展的过程中传统文化的应用能够带我们回归民族文化，重新整合文化元素和精神元素，促进多元化民族文化艺术的发展。视觉创达设计过程中创意比较受重视，而回归中国传统文化视觉创达设计教育的核心就是培养学生具有创意的设计思维，在视觉创达设计中融入传统文化，激发学生创造力，创作出较高价值的核心创意思想作品。

（一）在设计过程中把握议题核心素养的应用。

议题在视觉创达设计中具有重要的作用，首先实施设计定位思考，设计定位的目的是寻找一个具有创意的表达观点。一般情况下，一个设计诉求就是一段叙述语句，将这个语句转化成创意的理念需要经过一段时间的磨合。同样设计表达也需要从多角度进行选择，在目前的设计定位中，创意感的强弱决定了设计作品的好坏。所以设计定位是创意设计的开始，而做好设计定位首先必须掌握议题核心。在教学过程中可以借助营销学中的SWOT分析法以信息传达为主，确保信息完整的传达，并且保证信息的传达的过程中不会出现“歧义”。视觉传达设计目的是通过视觉媒介传达意念设计，教学的过程中可以从策略方面入手，提出传达的主体，然后研究沟通动机，“为什么要传达”没然后掌握文化的机会，并指导传达的是什么，最后找出传达的目的和对象，在此基础上采取行动策略，确定传达的方式。这个设计过程中要考虑传承问阿虎中美学素养和视觉因素的融合，将设计的议题核心反映到设计案例中，同时要注意设计过程必须建立在传统文化上，切记凭空捏造，赋予视觉传达设计传统文化素养。

（二）注重创意切入点的寻找。

视觉传达设计过程中必须要注重创意切入点的寻找，从文化和社会双层层面找到影响个人设计的因素。在设计教育过程中纠正学生习惯用主管态度看事情的方式，特别是对于传统文化的应用，必须开发自我，接受过去、积极创新，重新认识生活中的事物，建立自我知觉的敏感度。从传统文化方面寻找创意切入点，将设计中的各种事物自由的连接和转化，连接个人和社会、目的和方法、视觉和心灵等等，从连接的事物中寻找事物发展的新意涵。

（三）传统文化融入到视觉设计中的设计策略。

我国传统文化博大精深，在进行视觉传达设计之前，必须要教育学生选择于设计议题相关的内容，对设计方案的构思、背景、场地、预算等进行整理和分析，并掌握这些信息从而有效的引导设计。从传统文化方面构思发展设计的概念，考虑设计的限制因素，形成落实的设计策略，视觉传达设计必须要从传统文化方面经过研究、构思和发展形成一个具有创意的设计，从而促进视觉传达设计水平的进一步提高。

结语

目前，视觉传达设计教育工作中存在的最大问题就是确实传统文化素养的培养，仅仅重视学生技术的培养，只能让学生成为制图的机器。所以在平时的教育过程中必须要重视培养学生具有文化素养，将传统文化融入到视觉传达设计教育中，提高学生创新意识，促进视觉传达设计教育创意事业的发展。

作者：孙薇卿单位：无锡科技职业学院

参考文献：

计算机视觉的核心篇3

CPU，即中央处理器。CPU是一块超大规模的集成电路，是一台计算机的运算核心和控制核心。它的功能主要是解释计算机指令以及处理计算机软件中的数据。中央处理器主要包括运算器和高速缓冲存储器及实现它们之间联系的数据、控制及状态的总线。它与内部存储器和输入设备合称为电子计算机三大核心部件。

VPU，即视频处理单元。VPU是用于区别于传统图形处理芯片的概念，拥有强大的视频处理能力，全面优化电视的图像，提升画面细节，让动态画面无比顺畅，使计算机在同等分辨率下，给用户带来不一样的视觉体验。

（来源：文章屋网）

计算机视觉的核心篇4

关键词：计算机网络专业教学模式改革方案

0 引言

随着科学技术的不断发展，通信技术与计算机技术相互结合进而形成计算机网络技术，这种技术具有较强的技能性。对于高职院校来说，其办学宗旨是培养应用型人才，因此在教学过程中，必须坚持理论与实践并重，同时对理论进行优化，并且突出实践。为此，本文从这一思路出发进行阐述，全方位改革计算机网络课程现有的教学内容、教学和实践方法、考核方法等。实践证明，这种教学模式取得良好的教学效果。通过网络进行网络教学，利用网络学习网络，借助网络将教学场所一直延伸到宿舍，一方面增加了理论的学时，另一方面增加了实践的学时。同时，将传统的试卷考核转变为项目考核，进而在一定程度上提高了学生对技能与工作的融合。

1 计算机网络教学的现状

随着计算机网络的不断普及与推广，已经逐渐深入人们日常工作和生活中。对于不同层次高等院校来说，计算机网络逐渐成为核心专业。国家大力发展高速网络，每年网络人才的需求量居高不下。所以，计算机网络专业人才的质量在一定程度上受计算机网络专业的课程优化程度的影响。对于传统的教学模式、教学内容来说，早已不能满足高素质、应用型专业人才的培养需要。主要表现为：

①教学过程中，采用“填鸭式”进行教学，按照这种教学模式，学生往往都是被动地接受知识，其学习的积极性和主动性难以激发。②虽然使用多媒体进行教学，但是没有充分挖掘多媒体器材功能，多媒体形式单一，多媒体教学成了“光影的讲稿”，进一步浪费了教学资源。③教学资源的局限性。学校机房设施有限，必须容纳大量的教学工作。课程的学习分课堂理论课和机房实践课两部分，上课时间的非连续性给学生的学习带来了断层。④实验环节薄弱。目前高职院校开展计算机网络实验，基本上属于验证性实验，与工程实际严重脱钩，进而制约了应用型人才的培养。⑤网络技术发展迅速，在有限的时间内对新内容进行补充，这时需要对落后的内容进行淘汰，专业教师受到教学内容取舍的影响。⑥传统的教学，课程区分专业基础课和专业技术课，专业方向包含网站建设和网络工程。在课程的教学上，专业基础课的教学在一、二学期进行，专业技术课教学安排在三、四学期进行，实践部分安排在第五学期进行，且比例非常小。并且，一味的区分课程性质，而没有顾忌专业方向课程的连贯性，导致学生学习起来没有知识的连贯性。

2 计算机网络专业就业情况

目前，网络专业人才市场的人才结构分三层，即网络高端人才，进行网络的科学研究；网络中端人才，进行网络的开发；网络基层人才，进行网络的建设和应用。现在网络基层人才缺口较大，市场各需求量持续增长。

在计算机专业传统的应用型人才培养方面，客观来说高职教育具有一定的优势，但是在培养应用型人才方面存在层次的单一性，教学内容严重滞后，进而使得理论与实践出现脱钩，课程设置和教学设施严重落后，在一定程度上使得大多数毕业生理论知识与岗位所需的专业应用技术严重不符。许多毕业生经过长时间的培训才能胜任相应的工作，在应用技能方面，有些毕业生还不如短期培训的人员。在这种情况下，直接导致很多计算机专业的专科、本科毕业生找不到工作，进一步出现计算机专业就业橄榄型结构：毕业生无法胜任网络管理职位与基础操作职位，此类人才对于企业来说极为短缺，中端职位由于竞争比较激烈，进而增加了找工作的难度。网络基层人才因为教学内容与市场脱轨，技能不过硬而一度落选各场招聘会。为改变这一现状，计算机网络专业教学必须进行必要的改革。

3 计算机网络教学的改革

3.1 教学内容的优化

计算机网络课程教学内容的选择应遵循“教学内容应具有一定的实用性和市场性”这条原则。传统的计算机网络课程均以windows server操作系统作为网络服务器版本进行常规教学。实际上，在目前市场上的主流服务器操作系统是linux。不仅向网络用户提供各项服务，且要进行各种硬件资源的优化整合，融入虚拟化技术。因此，在规划计算机网络课程教学内容的过程中应将重点放在实用性和市场性上。

另外，还需要不断地跟踪先进的网络技术。计算机网络技术的发展日新月异，新的网络应用不断涌现。因此，在制订人才培养方案和课程体系中应将比较前沿的网络技术引进其教学内容中，删除一些已经过时的知识。随着物联网概念的提出，云计算的不断开发和应用，我们已经进入大数据时代，这些作为附加内容供学生课外学习和参考。

3.2 教学方法的革新

3.2.1 积极推广微课教学。随着信息技术的飞速发展，教育信息化的步伐也日益加快。网络、卫星、移动终端、平板电脑等现代信息设备及通讯手段，正在基础教育领域广泛应用，“微课”、“慕课”等崭新的教学形式正在取代传统的网络专业教学模式。“微课”是指以视频为主要载体记录教师围绕某个知识点或教学环节开展的简短、完整的教学活动。翻转课堂作为信息时代的产物，使得现代计算机网络专业教学方式发生了质的改变。微课资源是计算机网络专业翻转课堂的主要载体，也是能否实施好的主要载体。

3.2.2 三觉合一。三觉合一即视觉、听觉、触觉同时启动于学生的学习过程。以往的教学过程会将“三觉”分开进行，先进行听觉于课堂老师的理论教学，其次进行视觉于电子课件中的图片或各种形式的实物，如有条件，最后进行触觉于实践课堂的实物验证试验。当进行网络工程实践时，经常接触到交换机、路由器、防火墙这样的网络设备，还有光纤、双绞线、水晶头、信息模块、配线架这样的布线组件。以上都属于硬件设备，看得见摸得着，易于进行实物教学。教育心理学研究表明，学生在学习时视觉的作用大于听觉，视觉与听觉的交叉作用更有利于提高学生的学习效率，而触觉更能强化物体在学生脑海中的认知，利于学生消化所学的知识。

3.2.3 网络教学。目前学生的生活习惯是“机不离手”。手机、电脑都是使用网络的工具，根据这一情况，可以将微课教学网络化。借助校园网将课堂延伸到宿舍，进而在一定程度上将有限的课内学时延伸到无限的课外学时中去。具体措施为：第一，建立教学资源网站，学生进行在线学习，通过论坛实现师生之间的在线交流，同时借助网站教师可以布置作业，学生可以提交作业；第二，建立QQ群，学生通过QQ流学习心得。

4 改革课程考核方法

平时出勤、平时作业加期末考试这是传统课程考核的主要方法，其中，平时成绩的主观成分比较多，每一名学生对专业知识的掌握情况难以通过期末考试进行很好地考查，并且，闭卷的书面考试很难避免作弊情况的出现。因此，我们在这方面进行了大胆尝试，将传统的试卷考核改为工程项目式考核。考核方式为将一个相对独立的项目交由学生处理。由学生自组团队，进行工作任务的分配，通过信息的收集，方案的设计，项目实施及最终运行。目前我们在网站建设课程考核中采用了该种方式，效果良好。通过给学生规定一种类型的网站建设项目作为考核题目，学生自组团队，对团队成员进行分工，分别负责网站规划、网页设计、网站美工等多项工作内容。考核内容既融入了理论知识，同时重点考核了学生的实践操作能力和团队合作能力。另外，借用校园网为平台，链接学生完成的项目，实行网站点击率和老师打分相结合的考核机制。在这个过程中，学生一方面可以获得成就感，另一方面可以激发学生的求知欲，进而在一定程度上形成良性循环，同时能够培养学生独立探索、开拓进取的能力。

5 结论

对于学校来说，教学改革是一个过程。通过教学改革，丰富教学内容，完善教学方法和教学手段，进而在一定程度上提高教师的教学水平。同时在教学改革的过程中，学生可以获取更多的知识，并且能锻炼自身的能力。在改革的过程中，学校的整体教学质量不断提高，同时受到社会的认可。因此，教学改革是一举多得的事情，应该常抓不懈。在已有的成果的基础上，笔者和各位同仁也会再接再厉，把教学改革推向深入。

参考文献：

[1]曹红玲.《计算机网络》课程教学改革之我见[J].科技信息（科学教研），2008（07）.

[2]刘彦保.计算机网络课程教学改革探讨[J].高等理科教育，2007（03）.

[3]赵秀兰.计算机网络课程的教学研究与探索[J].常熟理工学院学报，2009（12）.

计算机视觉的核心篇5

众核计算项目

落户中国

日前，“英特尔中国并行计算中心”（ICCPC，下称中心）正式宣布启动众核应用研究社区（Many-core Applications Research Community，MARC）中国项目，该项目将基于英特尔目前在实验室中研究的48核单芯片云计算平台（Single-chip Cloud Computer，SCC），为华为、清华大学等中国研究机构和人员提供并行计算研究方面相应的支持。据悉，MARC已经在全球23个国家、92所大学开展了相应的合作研究。

英特尔研究院并行编程资深技术专家Tim Mattson向记者表示，SCC平台首先要解决的问题就是如何能够使并行编程更容易。SCC对于研究人员的吸引之处有两点，一点是它具有很强的功耗管理能力，而且这个过程完全通过软件来进行操作；另外就是它具有非常高效的通信机制，并且具有很强的扩展性能。

在谈到创立MARC项目的初衷时，英特尔研究院技术战略总监Robert Noradki表示，MARC的目标就是促进参与该社区的人员围绕共同的目标进行创新。“MARC最初在欧洲和美国启动时，是一些独立的研究人员在参与，但是慢慢地他们打破界限进行共同创新，带来了不少有趣的成果，所以我们希望在中国也有更多的研究人员能打破界限共同合作创新。”Robert Noradki说。

实验平台服务

创新应用

2011年6月20日，在德国汉堡国际超级计算机大会（ISC）上，英特尔推出了全新的基于英特尔集成众核架构（MIC）的开发平台。对此，Robert Noradki表示，和MIC相比，SCC没有固定的商业目标和特定的研究方向，英特尔更多的是把一些概念性的研究计划放到这样一个研究性的验证平台上。

“随着SCC的发展，它的高带宽、低延迟的特点越来越显现，慢慢地我们看到这个平台可以延伸到各种不同的应用领域。例如，从传统的高性能计算扩展到云计算。”Robert Noradki说，未来SCC可以扩展到100个核以上，甚至更多，那时在诸如视觉计算这样的应用上SCC将会大有作为。

计算机视觉的核心篇6

关键词：机器视觉；图像检测；航空轮胎；表面质量

中图分类号： TP 23文献标识码： A

引言近年来，随着生产工艺飞速发展，人们开始关注产品的外观质量，比如印刷品、包装、工艺品等以外观质量为重要附加价值的产品，又比如航空轮胎等表面缺陷会直接影响到使用效果甚至会给使用者的生命财产安全带来无可挽回的损失的产品。众所周知，机器视觉已经发展成为重要的工业生产加工手段之一，在中国成为全球重要的制造中心之一的背景下，中国成为继美国、欧洲和日本后的全球第四大机器视觉市场，同时也是最具发展潜力的市场。一方面外国企业积极入驻中国带来了巨大的视觉系统需求，另一方面国内企业不断扩大生产规模，加大了对视觉系统的需求，以航空轮胎为例，未来十年，国家将在大飞机项目中投入500～600亿资金，大飞机项目的发展，必将会带动航空轮胎行业大规模的发展，对航空轮胎的质量要求也会更加严格。1国内外相关技术研究国外对机器视觉技术的研究，由于开展的比较早，而且具有资金、技术以及硬件方面的优势，已经走在了国内的前面。国外的机器视觉系统的应用领域涉及到了社会生产的各个方面，有原始的在线监视，也有外观检测以及动作、行为控制，许多工业加工成套生产设备都集成了机器视觉系统，成为加工生产线的标配，比如印刷生产线上的机器视觉质量控制系统，又比如汽车制造业中的移动三坐标测量系统[1]。由于经济和技术原因，国内绝大多数图像处理技术公司都以国外产品为主，没有或者很少涉足拥有自主知识产权的机器视觉在线检测设备，对视觉技术的开发应用停留在比较低端的小系统集成上，对需要进行大数据量的实时在线检测的研究很少，也很少有成功案例。但是，随着国内经济发展和技术手段不断提高，对产品质量检测要求就更高，对在线检测设备的需求也就更大，具有巨大的市场潜力。计算机、摄像机等电子技术的飞速发展大大提高了机器视觉系统的硬件水平，同时图像处理理论和算法的快速发展也给机器视觉系统提供了强大的软件支持。但是，仍然伴随着一些问题，主要有以下两点：光学仪器第35卷

第3期谢，等：机器视觉在轮胎检测领域的应用研究

（1）算法的精确性提高伴随着计算量的成倍增加，处理时间就成为了实时检测的软肋；（2）硬件的分辨率提高了，图像的分辨率、精度也随之提高了，但是数据量计算量都因此成倍增加。因此，如何保证检测的实时性和准确性，是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术

2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品（即图像摄取装置，分CMOS和CCD两种）将被摄取目标转换成图像信号，传送给专用的图像处理系统，根据像素分布和亮度、颜色等信息，转变成数字化信号；图像系统对这些信号进行各种运算来抽取目标的特征，进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论，其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论，以及Richard Hartley的《Multiple View Geometry in Computer Vision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法，主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后，输出图像的质量得到相当程度的改善，既优化了图像的视觉效果，又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域，是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点，经过分析处理以后，转换成坐标数据，然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域，机器视觉技术的应用还仅仅停留在理论之上，还没有可实际应用的商品化的设备，更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。

2.2嵌入式技术嵌入式系统一般指非PC系统，有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心，软硬件可裁减的，适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备，如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点[56]：（1）嵌入式系统通常是面向特定应用的，它通常都具有低功耗、体积小，集成度高等特点；（2）嵌入式系统和具体应用有机地结合在一起，它的升级换代也是和具体产品同步进行的，因此嵌入式系统产品一旦进入市场，就具有较长的生命周期；（3）由于空间和各种资源相对不足，嵌入式系统的硬件和软件都必须设计，量体裁衣、去除冗余，力争在同样的硅片面积上实现更高的性能，这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSP（数字信号处理器）来进行开发，具体型号为TI公司的TMS320。它具有很高的编译效率和执行速度，在信号处理方面具有优势，它的特点如下：（1）程序和数据具有独立的存储空间，有着各自独立的程序总线与数据总线，可以同时对数据和程序进行寻址，大大提高了数据处理能力；（2）由于广泛采用了流水线操作，减少了指令的执行时间，可以同时运行8条指令；（3）与一般计算机不同，乘法（除法）不由加法和移位实现，它具有硬件乘法器，乘法运算可以在一个指令周期内完成；（4）指令周期降到了1.67 ns。随着工作频率进一步提高，指令周期将进一步缩短；（5）拥有自己独特的专门为数字信号处理而设计的指令系统；（6）相比传统的处理芯片，它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成

3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题：（1）数据处理量非常庞大；（2）如何快读匹配图像；（3）如何快速实现缺陷分割并剔除伪缺陷；（4）如何选取缺陷特征，用以实现缺陷识别。以具体产品为例，相对其他轮胎产品，航空轮胎对质量检测的要求较为严格，只要航空轮胎的检测技术到位，其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例，根据GB/T 9747-2008《航空轮胎试验方法》、GB/T 13652-2004 《航空轮胎表面质量》和GB 15323-1994 《航空轮胎内胎》等标准的要求，研究表面缺陷在线检测的图像处理方案；开发一套基于机器视觉的产品表面缺陷的在线检测设备，同时根据GB/T 13653-2004 《航空轮胎X射线检测方法》所述，配合X射线发射仪，利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷，如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标：（1）能检测出最小直径0.3 mm的轮胎内部缺陷（即横向纵向最小均为0.3 mm）并能对缺陷进行分类识别，主要包括结构类、气泡类和夹杂物类，对缺陷的检出率要求大于90%；（2）对缺陷部位进行定量和定位分析：读出缺陷的尺寸（误差0.5 mm），测出缺陷距离轮胎表面的深度，决定缺陷在轮胎内部的位置；（3）在线检测设备的检测检测速度与X射线管旋转速度同步，X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。

3.2研究内容和技术路线

3.2.1确定机器视觉检测系统的基本框架在数据量大时，采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中，由于航空轮胎的圆周面比较大，数据量也就比较大，通常采用的机器视觉单摄像机方式，很难满足圆周面检测分辨率高、数据量大的要求，而多台摄像机能满足分辨率和数据量的要求，却又相应带来实时性差的问题。若采用多台摄像机的方式，就需要配备多套成像系统，一套成像系统造价在10万元左右，基于成本和计算数据量的考虑，本研究选用一对一方式，利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说，就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测，该结构主要由四部分组成：服务器（嵌入式系统）、客户端（图像处理子系统）、信号模块（PLC）、输出单元。系统框架如图1所示。每隔一定的时间（系统初步设定为5 s），服务器通过PLC控制步进电机驱动轮胎做圆周转动，每转过一个固定角度（系统定为120°），服务器就调动客户端完成此区域内相对独立的视觉检测任务，一次间隔只检测轮胎的三分之一（120/360），经过3个时间间隔，客户端即完成了整个轮胎360°的全面检测，然后利用拼接原理把各部分拼接起来，统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同，然后消除不同，统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互，本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口，服务器不仅要完成检测任务的调度，还要可以设定检测参数，接收和实时显示客户端上传的图像数据和处理结果（缺陷等），并将信息存入数据库中。此外，服务器还接收PLC传来的位置检测信号，用于与客户端的同步，并且根据检测结果中的位置信号，对执行机构发出动作信号，标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡，接收服务器设置的参数和任务调度，控制采集卡和摄像机完成图像实时采集，利用图像处理算法处理和分析图像数据，将最终得到的缺陷位置和分类信息上传给服务器，保存缺陷图像以备查。

3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中，根据图像数据的特点，本研究提出以下图像处理过程：缺陷分割、特征提取及缺陷分类。首先是缺陷分割：在表面缺陷检测的时候，利用图像处理算法，处理采集到的产品表面图像，将缺陷从复杂的背景图像中分离出来。接着是特征提取：提取缺陷后，对缺陷的各种标识性属性进行提取，主要是几何特征和灰度统计特征，以保证后续的缺陷分类和识别。几何特征指的是轮廓特征，比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类：本研究采用改进的BP算法[7]对网络进行训练，构建神经网络分类器来实现轮胎缺陷分类，为了提高检测系统对伪缺陷的适应性，本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法，为避免编程中出现内存泄露进而造成计算机内存资源流失的现象，决定采用对内存进行托管的C#语言进行编程。

3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点，它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题，包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性，采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。

4结论实际测量结果证明，应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势，设备简单、易用，克服了传统测量仪器的许多误差来源，具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分（如图3所示），与传统的测量方法相比，原先需要15 min的测量时间，现在只需要15～30 s就可完成，操作也更加简单便捷。该系统可检测出最小直径0.3 mm的轮胎内部缺陷（即横向纵向最小均为0.3 mm）并能对缺陷进行分类识别，主要包括结构类、气泡类和夹杂物类，对缺陷的检出率为96%。

参考文献：

[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉：华中科技大学，2008.

[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision，1998，27（2）：161-195.

[3]章毓晋.图像处理和分析[M].北京：清华大学出版社，1999.

[4]朱方文.基于LAP方法的机器人灵巧手控制[D].上海：上海大学，2006.

[5]张嘉琪.基于嵌入式系统图像处理平台的万寿菊水分状态检测系统的研究[D].重庆：西南大学，2009.

计算机视觉的核心篇7

关键词：课程特点　学生素质　教学模式　教学策略

在《计算机组装与维护》的教学过程中，我们经常会碰到这样几个十分突出的矛盾。一是课程地位的特殊性强，但学习的内驱力弱。根据就业市场的信息表明：计算机组装与维修是各项工作的基础，无论从事软件开发还是从事软件维护，该技术都占较重要的份量，尤其是就业前景较好的计算机维修师、网络管理、软件维护人员等，业内该课程所占的技术份量都在70％以上，甚至达到100％。但相当部分学生对这种重要性、特殊性的认识并不充分，并不把其作为主课看待，学习的主动性积极性不够。二是课程技术的外显性强，学习的韧性不足。《计算机组装与维护》课程主要内容有计算机硬件设备的外观、性能指标、组装、测试、维护、常见故障及诊断等。对此，学生容易产生轻视思想，容易满足于"眼见为实"，钻研不深，一知半解。三是课程内容的综合性强，学习的运用能力弱。《计算机组装与维护》是一门理论性、基础性、应用性相统一的课程，要学好，需要多方面的理论与技能素质的支撑。但由于种种原因，学生从基本理论素养到动手能力都不相适应，知识运用能力弱。

因此，立足知识运用能力的提高，树立“学教并重”“学为主体”的教学思想，以新的实践性教学模式为突破口，对《计算机组装与维护》进行教学改革，具有很强的指导意义。

一、发挥现代教学手段优势，增强教学的直观性

从信息论角度看，人的信道特性触觉信道带宽为1，听觉为100，视觉为10000，所以要交换信息，就要充分利用视觉信息。因此，计算机辅助教学以它直观、形象、生动的演示功能，给学生带来多感官、多种类型的刺激，而且能充分调动学生学习的自主性，具有与传统的教学手段无法比拟的优势，是一种适应21世纪素质教育要求的信息化教育教学模式。在《计算机组装与维护》课程改革中，制作交互性强、操作性强、生动活泼的多媒体课件，结合展示台、vcd、录像机等设备进行知识和技术的讲解和示范，既丰富了课堂教学内容，又加大了传递信息容量；通过图文并茂、视频动画以直观教学的形式，提高学生的学习兴趣，使其处于一种积极主动的精神状态；利用人机交互，可以即时获得信息反馈，灵活控制教学内容，使其更加直观形象，更易于理解，提高讲课的效率和教学效果；弥补传统教学中语言、文字描述、实验器材的局限性，打破单一的教学模式，实现教与学的多元化。其核心是通过媒体的作用，实现教学信息在教师与学生之间的联动和互动；通过学习环境的创设和利用，实现教学相长。 二、引入先进的教学策略，增强学习的主动性

针对学生抽象思维能力、逻辑推理能力和综合归纳能力较弱的现状，在《计算机组装与维护》教学中，运用建构主义的抛锚式教学法，尝试进行建构性的教学设计，效果十分理想。这抛锚式教学要求建立在有感染力的真实事件或真实问题的基础上，让学习者到现实世界的真实环境中去感受、去体验(即通过获取直接经验来学习)，而不是仅仅聆听别人(例如教师)关于这种经验的介绍和讲解。如在“软件系统安装前的准备及硬件系统检查”这一章节中，我设计了以下几个教学环节：

⑴创设情境——开机启动中常遇到的故障：如插头插座、配件接触、致命性的硬件故障、非致命性的硬件故障。

⑵确定问题——引导学生遵循“由表及里、由简到繁、先软后硬”的原则，通过“看一看”（计算机显示的错误信息判断致命性的故障）、“听一听”（计算机发出的声音判断非致命性故障）的方法来确定故障的存在。

⑶自主学习——由学生通过掌握的故障信息，结合所学知识和信息资料，运用技术设备判断故障存在的原因，与同学或教师确诊并着手解决问题。

⑷协作学习——将“安装准备及系统检查”过程中发现的问题及解决方法汇总，展开讨论、交流，充分发表自己的意见，通过不同观点的交锋，补充、修正、加深每个学生对当前问题的理解。

⑸效果评价——教师针对学生解决故障的方法给予检测、评价和记录，然后归纳出最简单直接易行的方法，总结本次实验的学习效果。

三、加强教材建设，增强教学内容的先进性

计算机业界有一摩尔定律“芯片所集成的晶体管数目与功效每18个月翻一番”，说明了硬件发展之快。而我们所使用的教材的更新周期往往需要三至五年甚至更长时间，与计算机技术发展相比严重滞后。因此，必须及时增补最新的硬件知识和装机技术，来提高学生职业技术能力和学习兴趣与积极性。在选择教材上首先应选择适合培养目标、教学现状和发展方向，在内容组突出实用性和可操作性的教材。其次，对于《计算机组装与维护》教材内容明显滞后、与现实脱节的问题，应尽量选择最新出版，内容最前沿，最实用、最贴近现实生活的教材。另外，课程责任教师或任课老师必须经常通过上网查询、翻阅其他最新文献等方式自行编写新教材，以计算机硬件和技术的发展为依据，确保教材内容的知识性、新颖性和开发性。

四、加强实践教学，增强教学的实用性

该课程的教学目标是，完成计算机硬件的组装、软件的安装和处理各种微机故障，增强学生解决实际问题的动手能力。要实现这一目标，只能通过大量的实践环节教学去实现。因此，必须建立专门的计算机硬件实验室，制定实验单元的目标、内容和能力测评标准，使学生在专业理论、专业技能方面真正受到职业化的、全方位的培养和锻炼，为最终具备计算机维修技术员的职业核心能力打下坚实的基础。近几年来，我们把计算机组装与维护作为学生进厂、进企业开"工助学"的主要内容，让学生代岗实习，对培养学生的学习兴趣，提高动手能力和解决问题的能力，作用十分明显。

五、改革考核方式，增强教学目标的职业性

在考核时，应侧重采用职业技能鉴定、完成课程项目、编写项目计划等形式代替课程的考核。这样做既有利于提高学生的综合素质，又有利于学生适应不同的需求、增加工作经验。考核内容必须结合最新的计算机技术发展和职业岗位能力的新要求，涉及该职业岗位技术所必需的核心能力、关键能力、基础能力，可进行专项技术或综合技术要求考核，为学生观念的更新、继续学习的方向、职业定位和选择提供保障。如组织学生参加全国计算机信息高新技术考试（citt）和职业工种鉴定等，取得相应的职业资格证书，实现“双证”或“多证”毕业，以此引导教、学双方按培养职业核心能力的需要，突出操作技能和实用技术的训练，全面实现人才培训目标。

参考文献：

［1］张屹，祝智庭　建构主义理论指导下的信息化教育［j］电化教育研究　2002，（1）：

［2］罗集学赵斯宁中职生学习方法情况调查［j］中国职业技术教育2002，（10）

［3］何克抗建构主义——革新传统教学的理论基础［j］电化教育研究1997，（3、4）

［4］何克抗建构主义学习理论与建构主义学习环境［j］教育传播与技术 1996，（3）

计算机视觉的核心篇8

关键词计算机图形学第三方演示课程群分组实践

Abstract At present， computer graphics has become an important part of undergraduate computer education， and it is also plays an important role to cultivate innovative talents to adapt to the information age. Based on the teaching of computer graphics course by the author as an example， analyzes the existing problems in the teaching of computer graphics， and put forward improvement ideas from three aspects： according to the different needs of students utilizing the third party demonstration teaching and cross curriculum interpretation， introducing course group to replace single course， employing group practice examination instead of individual， and other forms to improve the quality of teaching.

Keywords computer graphics； third party demonstration； course group； group practic

计算机图形学是一门介绍显示、生成和处理计算机图形的原理和方法的课程。它在计算机总体教学体系中属内容综合性较强且发展迅速的方向之一。该课程既有具体的图形软硬件实现，又有抽象的理论和算法，旨在为学生从事相关工作打下坚实基础。学生须以高等数学和线性代数的基本理论和较熟练的程序设计能力作为本课程学习的基础。课程的难点在于计算机图形学研究范围广，与其他学科交叉性强，且知识不断更新变化。在教学实施过程中，难点是理解和掌握相应的基础理论和算法，以及利用计算机图形学相关工具进行图形学实际问题的解决。

本课程对学生的培养学生围绕以下三个方面展开：（1）建立对计算机图形学的基本认识，理解图形的表示与数据结构、曲线曲面的基本概念。（2）理解并掌握基本图形的生成算法，并能对现有的算法进行改进，理解图形的变换和裁减算法。（3）面向算机图形的程序设计能力，以底层图形生成算法为核心构建应用程序。相应的考查方式由理论授课、上机实习和课外作业三个单元构成。从近年的授课实践和考试情况分析，该教学内容难度设置合理，深入浅出且相互承接成为体系，学生总体反馈良好。但也存在一些矛盾和问题。以下将对几个问题进行重点阐述与思考，并提出课程改革思路。

1 计算机图形学与计算机辅助设计衔接问题

笔者所在院校是具有航空航天背景的工科院校，“CAD计算机辅助设计”是飞行器设计、机械设计与制造等多学科的重要课程。相关学科学生期望通过对计算机图形学知识的深入理解，促进CAD设计工具诸如Catia、Solidwork和Rhino等先进工具的运用能力。然而，目前的计算机图形学课程的教学和考察环节倚重低层算法讲解与基于OPENGL等的程序设计，除综述外并未具体引入CAD相关内容。产生的问题是，一方面，飞行器设计及机械设计与制造等专业的学生由于程序设计能力不足，难以驾驭较复杂的程序设计任务，在学习过程中心理压力较大；另一方面，由于授课均为教师为计算机相关专业背景，该课程的讲授并未衔接CAD相关技术，学生难以构建二者之间的联系。

解决方案：

本质上，该问题是由于选课学生的学习动机和基础不同造成的。以单一的教学和考查方式难以兼顾这类面向具体应用的学习需求。在教学方法上，采用第三方案例教学法和交叉讲解法相结合以解决此问题。具体的，将CAD等应用场合以具体案例形式讲解，授课教师邀请飞行器、机械设计相关教研组研究生以4～6学时的讲台演示的形式呈现CAD工具完整设计过程。授课教师则以交叉讲解方式为学生讲解运用到的计算机图形学知识点，同时与学生交互式的问答和探讨。在考查形式上，考虑到不同的学习动机和基础，采用多样化实践环节考查。计算机专业学生以OPENGL程序设计为考点，而外专业学生以CAD等面向应用的实践工具为考点，以兼顾各专业的学习需求。

2 计算机图形学与计算机视觉相结合的问题

当前，虚拟现实技术（VR）和人工智能技术（AI）两个最重要最热门的研究领域。虚拟现实的基础理论支撑是计算机图形学，例如三维场景的生成与显示。而人工智能的一个重要应用场景是计算机视觉，例如基于图像智能识别的自动驾驶技术和场景理解技术。很多学生对以计算机视觉为代表的人工智能技术怀有浓厚兴趣，同时，学生又难以区分计算机图形学和计算机视觉的关系。同时，二者在近年来的研究中呈现相互融合的趋势。如基于三维立体视觉的机器人与场景实时定位与重建。如何在计算机图形学课程中，很好地体现两门课程的不同，避免学生的混淆，拓展学生的知识面，都是具有现实意义的课题。

解决方案：

实际上，计算机图形学和计算机视觉可不失一般性的概括为互逆的关系：计算机图形学是由概念设计到模型生成，最终绘制图形图像的过程；而计算机视觉则是从原始图像中再加工并分析理解、以产生新图像（如二维到三维）或输出语义信息（如图像自动标注与理解、目标检测与识别）。将计算机图形学纳入“视觉处理课程群”框架，使学生首先掌握课程群中各课程的侧重点，着重理解图形学在课程群中的作用。精心选取2～3个计算机视觉和图形学交叉的当前主流研究方向，展开概念层面的演示讲解，不深究具体算法，着重阐述两种技术的相互依赖关系并对比二者的区别。相关领域的演示还包括增强现实、人机交互、计算机辅助诊断等等。鼓励学生自主学习，最终使学生在做中学、用中学，提高独立分析新问题和综合运用知识解决问题的能力。

3 如何平衡算法讲解和程序应用技能

计算机图形学涉及的算法多，核心算法是该课程的必讲内容，在算法细节的讲解过程中学生容易产生畏难厌学情绪，注意教学方法以调动学生的兴趣尤为重要。另一方面，对学生的考察方式最终是通过编程实践完成。学生在编程实践中常常遇到大量调试问题，同时要阅读大量文档以了解OPENGL接口函数的调用方法，这个过程占用了很大工作量。

解决方案：

在理论教学部分，着重讲清计算机图形学原理和概念、全面解析经典算法思想。课程强调对理论核心思想的阐述，用通俗易懂的语言，条例清晰的逻辑，进行简明透彻的阐述，附以直观、形象的动态演示系统，力图使学生在较短的时间内、有效地掌握基本理论。分析图形学各种经典算法的原理、可行性及几何复杂性，尽可能多地比较算法之间的思想差异，分别指出它们的优缺点和应用场合，并促进学生思考如何在保证算法的准确性、可靠性的前提下，提高算法的效率。同时注重接近国际前沿的研究内容，注重讲授经典知识和最新进展相结合，以激发学生的学习兴趣，提高课堂效率和活跃度，力争以较少的课时阐述计算机图形学的基本原理、基本方法，加大实践环节比重。通过往年学生完成的优秀课程作业作品的展示，激发学生的创造热情。改革实践环节的考查方式，以项目小组形式取代对个体的考查。原则上每组3～5人，自由组合。在课程结束前，采用小组现场演示讲解的方式，展示小组成员通过编程实践环节完成的一个项目。学生在项目小M中锻炼了团队协作能力，降低了个人工作强度，同时互相学习和督促的氛围使课程作业的质量得以大幅提高。以基础实验――目标性重建实验――自主性训练的层次化实践框架模式，逐步培养学生自主研究，独立解决问题、分析问题，确定解决方案的能力，树立正确的科学研究习惯，培养学生的科学研究能力。

总之，合理设计实践教学案例，进一步实现课程体系和实践内容的统一，建立一个多层次、立体化的实践教学体系，注重学生的参与性与实践性，引导和鼓励学生进行创新实践和课外研学。改革考核方式和考试形式，加大实践环节在成绩中的比重，强化实践能力培养，寓教于乐的同时引导学生追求卓越。此外，计算机图形学技术是发展非常快的一个研究及应用领域，且对编程要求较高，应注重实验室机房投入更新必要硬件，并保障软件编程环境的正常运行。

L鼙疚氖苤泄┦亢蠡YBA15035，江苏省教改项目JGLX13_008资助

参考文献

[1] 孙家广，胡事民.计算机图形学基础教程.北京：清华大学出版社，2005.2.

[2] 唐荣锡，汪嘉业，彭群生等.计算机图形学教程（修订版）.北京：科学出版社，2000.

[3] LIU Hailan.On development and application of computer graphics[J].Computer Knowledge and Technology，2010（3）：9551-9552.

[4] 娄凤伟.创造性思维与计算机基础教学[J].教育探索，2002.

计算机视觉的核心篇9

关键词：计算机自动化视觉检测制造业

中图分类号：TP274.4 文献标识码：A 文章编号：1007-9416（2014）05-0014-01

在精密测试技术领域，自动化视觉技术具有最大的发展潜力，它将电子学、图像处理、光学探测和计算机自动化技术综合起来进行运用，在工业检测中引入机器视觉，能够快速测量物品平面或三维位置尺寸，其主要特点有：柔性好、速度快和非接触性，在现代制造业中有着非常广阔的应用前景。

目前，国内视觉检测领域所需要的视觉检测设备大多是进口的，国内生产的设备缺乏较高的检验精度和较强的实时性；但是进口设备大大增加了检测成本，不少中小企业无力承担。面对国内检测需求日益增加的情况，积极进行成本较低，精度较高的检测设备的开发，成为一个亟需解决的问题，需要引起重视。

1 检测系统的工作原理

自动化视觉检测系统工作流程分为三个部分，分别是图像信息获取、图像信息处理以及机电系统执行检测结果。如果系统有需求，能够借助人机界面对参数进行实时的设置与调整。当被检测对象移动到特定的位置时，位置传感器就会发现它，会将探测到被检测物体的电脉冲信号发送给PLC控制器，经过计算，PLC控制器将物体移动到CCD相机采集位置的时间的出来，然后将触发信号准确的发送给图像采集卡，采集卡检测到此信号后，会要求CCD相机立即进行图像采集。被采集到的物体图像会以BMP文件的形式发送到工控机，运用专门的分析工具软件分析处理图像，分析检测对象是否与设计要求相符合，执行机会依据合格或者不合格的信号对被检测物体进行相应处理。经过这样的反复的工作，系统对被检测物体进行队列连续处理。如（图1）。

2 自动化视觉检测系统的组成

在工业检测领域，计算机自动化检测系统可以在尺寸测量、工件定位、特征检测、图形图像以及字符识别等方面进行运用。自动化视觉检测系统按照功能模块可以划分为，图像信息获取模块、图像信息处理模块、人机交互模块、机电执行模块以及系统控制模块五部分。其中处于核心位置的是系统控制模块，系统控制不论是在被检测物置信息的触发，还是机电执行模块所需检测结果信息的获取等等各个方面，都必须参与其中，否则无法完成；而人际交互模块更是与核心模块有着之间联系，通过与其直接通信，以便实时更新检测系统参数以及执行指令等。

3 自动化视觉检测技术在制造业上的应用

3.1 应用于汽车车身检测的视觉检测技术

现代汽车制造业的生产周期日益缩短，生产日益集团化，原材料和零部件供应呈现大宗化，而这正是给运用自动化视觉检测技术提供了客观环境。该系统包括三维视觉传感器系统、电器控制与接口系统、机械及定位系统、标定系统以及计算机自动化等部分，其测量步骤如下：首先在电气控制系统下初步定位运送车身；然后借助专门的控制系统准确定位待测位置；借着用计算机自动化进行检查点图像的采集与处理；最后，将被监测点的坐标参数计算出来。检测系统应该能够实时控制单光条、多光条、双目立体视觉以及十字叉丝等传感器的动作；按照要求顺序，全部视觉传感器进行测量，然后转换测量结果，将其放置于测量坐标中；经过自动识别，能够地装配结果进行判断。这一视觉检测方法具有非得用地、效率高、自动化、精度好的特点，能够很好的满足汽车工作的需求。

3.2 为智能焊接的实现解决核心难题

在焊接领域，对智能焊接机器人的研究已经成为关注的重点，智能焊接机器人要求能够识别环境目标，对焊接参数进行调整，并实时精确跟踪轨迹。比如在潜艇、大型轮船的制造中，焊接是十分重要的环节，焊接质量直接关系到后续的制造环节以及潜艇、轮船的强度和安全性。智能焊接机器人在红外摄像仪、高速摄像机以及CCD摄像机等高精度图像传感设备的辅助下，采用智能化图像处理方法能够进行图像焊接，检测焊接空间位置，规划焊炬姿态，对焊接熔池特征参数进行实时提取，对焊接组织、机构和性能进行预测等，能够在很多人类难以进行作业的场合完成焊接工作，在焊接过程中，通过数个光电接收阵列对检测组建进行多维视觉传感，并综合处理所获取的信息。目前国外KUKA，Motoman，GMF，Adept等厂家已经开发出智能焊接机器人，其装配了自动化视觉检测功能，并且已经广泛应用于潜艇与航天器的生产中。

3.3 提高手机生产检测速度

随着手机设计精密程度的日益提高，人工检验已经难以适应大规模生产，这是因为其需要的测量投影仪较多，检测速度慢。而采用自动化视觉检测系统能够自动检测电路板组建中的连接器以及内部零件等，检测速度快、测量结果准确，具有较强的扩展性和较高的性价比。检测系统主要就是测量计算机自动化接口电路板组件中各个连接器特定位置的几何尺寸，这里面包括连接器内部零件的尺寸、间距以及连机器与PCB底板的相对位置；另外还要对连接器与标准是否相符以及内部零件被损坏与否。系统可以将质量检验的效率大大提升，而且也能够使产品质量得到保障，实现降低检验成本的目的。

4 结语

作为一种新兴的检测技术，自动化视觉检测技术对我国自动化视觉检测产品的发展起到了很大的推动作用，使其不断向更高层次迈进，同时也为我国制造业的发展做出了贡献，具有广阔的发展前景。

参考文献

[1]伍健.基于PDE和全变分滤波方法的研究及在多种噪声中的应用[D].天津大学，2012.

计算机视觉的核心篇10

(1)会计核算信息不够准确。实行会计集中核算之后，各个医疗单位的财务管理和会计核算是分开进行的，会计核算信息的人员并不了解单位的资金往来和开支情况，而且每个部门都有自己部门的专项经费，各不相同，这也就增加了核算人员的工作难度，导致会计核算信息的精确度不够，从而影响到整个医疗单位的财务管理的进行。

(2)频繁出现信息的造假现象。进行集中核算之后，卫生局的会计核算中心面临着很大的工作量，有很多的会计信息需要进行处理，因此，只能对各个单位上交的票据进行做账、报账，而对于票据中资金的准确性、来源以及去向并没有进行一一检查。这也就让基层的医疗单位开始钻空子，甚至开始造假，上交假的核算信息。如果基层出现了造假行为，就不能准确反映这个单位的财务状况，也就失去了进行集中核算的意义，只能是流于形式。

(3)基层医疗单位会计责任弱化。进行会计的集中核算，由卫生局统一组织核算中心，乡镇卫生医院等各个基层医疗单位只需要到卫生局核算中心进行报账，而不需要进行单独的会计核算。因此，各个基层的医疗单位自认为不进行会计核算，就不需要承担相应的会计责任，责任意识逐渐减弱。不再关注会计核算信息的完整性和真实性，甚至有些人员还会产生严重的抵触，认为集中核算是变相的取消了基层单位的会计岗位，就不需要再进行会计监督了。

(4)财务人员业务水平严重下滑。实行集中核算以后，单位的财务人员不再需要进行核算业务，只是单独的从事财务方面的管理工作，长时间不做账导致财务人员对常用的会计科目已经淡忘了，也不能灵活运用了，发生涉及多个会计科目的业务事项时工作起来会觉得吃力。集中核算给单位财务人员提供便利的同时，也降低了他们学习、运用会计科目及其他会计知识的热情，从而导致了业务水平的下降，工作能力大不如从前。

(5)缺乏对基层财务管理的引导。卫生局对会计集中核算的具体流程、规章制度都给出了明确的规定，但是对于采用集中核算之后，基层医疗单位如何进行财务管理并没有提出明确的规定，也没有给出指导性的建议，导致基层单位的财务管理缺乏引导，没有统一的标准，只能自己凭感觉进行管理。

(6)增加了审计监督的困难。由于核算中心是个中间部门，将被审计单位上交的核算信息进行核算之后，再上交给审计部门。审计部门最终得到的是卫生局核算中心上交的核算信息，如果审计部门想要了解被审计单位的具体财务状况，往往核算中心回答不上来，因为核算中心本来就不清楚，它自己都不了解的事情，怎么可能再向上级汇报呢。这样的结果是导致了被审计单位的核算资料上交不及时、不完整、不准确，不止影响了审计部门对被审部门信息的了解程度，还造成了被审计部门和核算中心之间的责任纠纷，这样的错误到底该谁负责呢，这确实是一个值得讨论的问题。

二、加强基层医疗单位财务管理的对策

(1)加强对固定资产的监管，保证账实相符。基层医疗单位在进行会计的集中核算之后，要建立对固定资产的监督制度，要保证单位的固定资产和上报的会计信息对应起来。对于固定资产的管理，要设立专门的保管人员，保管人员要负责固定资产的记账、检查工作，有部门领取时，要负责记录好，并让领用人签字确认;对于不能使用，需要报废的资产，要执行严格的报废审批工作，如实上报、记录，不能马虎。此外，还要对固定资产进行定期的盘点、清算，不能完全任由保管人员反映，得对其进行监督，可以定期或者不定期地进行抽查，核对是否账实相符，保证记录的准确性。

(2)在基层单位建立监督机制。由于进行了会计的集中核算，很多财务人员可能有了天高皇帝远的想法，反正交上会计核算信息就行了，也不会有人进行账目的检查。因此，在基层也要建立监督机制，定期或不定期地对上报人员上交的会计信息进行核验，查看对应的凭证，追踪到原始凭证，保证会计人员上报的信息是真实准确的，而没有出现作假、伪造信息的行为。如果出现了造假的行为，对于相关的会计人员一定要严惩，必须要从基层保证会计信息的精确，这样上报到会计核算中心的会计信息才有参考的价值。

(3)加强基层单位负责人的责任意识。基层医疗单位的财务工作做的是否合理，很大程度上取决于领导人的责任意识，领导人重视财务管理，底下的员工才能更加努力地去执行领导的指示，如果领导都不重视，那员工也会懈怠。因此，单位的负责人要提高自己的责任意识，不只是口头，而要从行动上重视财务管理，还可以制定出相关的规章制度，形成明文规定。上级的卫生部门也可以定期给基层的单位负责人开会，不断的宣传财务工作的重要性，时刻的提醒他们，不能松懈。

(4)重视对单位财务人员业务水平的提升。集中核算之后，减少了财务人员的做账工作，但是，财务人员并不是完全从会计工作中解放出来了，在年终还需要做单位的各种报表，因此，财务人员不能放松对会计的学习，得时刻练习，要不然单位年底的报表会因为财务人员不熟悉会计科目而失去参考价值。上级的卫生部门应该定期组织基层单位财务人员参加会计的学习，进行定期或者不定期的业务考核，通过考核，对不合格的财务人员进行培训，让他们重新掌握会计的知识。重视单位的报账工作，也是对财务人员业务水平的一种提升。从拿到凭证开始，将凭证整理好，让报账会计上报给会计核算中心的过程就是报账的过程，财务人员应该认真对待报账工作，从而保证提供会计信息的准确性。