图像分析论文十篇

时间:2023-03-21 14:54:12

图像分析论文

图像分析论文篇1

配合重要新闻播出的口播评论:这是最早出现的一种口播评论形式。多数不署名,即以本台的名义阐述对有关事物的看法和见解;一般配合当天某一重要新闻播发,没有固定播出周期;篇幅短小,议论力求集中、切中要害。初期多数是按照报刊评论的模式撰写的,以“短评”或“编后语”的名目播出。以后逐渐注意体现电视的传播特点,有时插播与内容相关的图片,日渐重视语言的规范化、通俗化、口语化;同时播音员也越来越注意利用出图像的条件,调动表情、动作等非语言符号强化表达效果。这种配合新闻播出的口播评论,无论对于观众理解重要新闻还是及时引导社会舆论、指导社会实践仍然具有图像评论不可取代的存在价值和社会意义。

常设栏目播出的口播评论:中央电视台《东方时空·面对面》,开了这种口播评论的先河,并把它定位为“纯谈话类”栏目。这个栏目每天播出一个话题,题材多为观众关注的社会现象、社会问题,多数运用夹叙夹议的表现方法,具有相当鲜明的谈话特点。在《东方时空》的影响和带动下,不少省市的电视台都相继开办了类似的口播评论栏目。下面的例子来自重庆电视台的《记者观察》,是围绕着“明星该不该做广告”而展开议论的。评论者由此提出:明星屡屡参与做虚假广告,大肆坑害消费者,除开他们的道德和法制意识存在严重的缺陷外,问题到底出在谁身上?请看评论者是如何进行生动而犀利的评论的:

明星能不能给药品做广告?这个问题的提出,是因为近年来明星广告激增,而老百姓对他们的夸张、不实之词和误导多有怨言的缘故。药品和食品都不是闹着玩的,吃错了会出人命。即使吃不死,也没有人愿意白花钱吃没用的东西。可是这玩艺儿被明星现身说法一吹,大家就难免上当,上当的次数多了,就要骂明星缺德坑人。有些明星异口同声在广告上说,服了一种药之后、“腰不酸了,背不疼了,腿也不抽筋了”。是不是这么“神”?人们上当过后,又回过味儿来,就怀疑那些明星是不是真的吃过这种药——难道那么巧,他们一个个都曾不约而同地腰酸、背疼、腿抽筋来着?有的受害者还把明星告上法庭,说他们有意弄虚作假,利用自己的知名度和影响骗人——官司自然都不了了之。

评论者紧接着指出:明星们之所以肆无忌惮地以假患者的身份出现在广告上,与商家一道疯狂行骗,其根本原因是尚无一部能管住明星胡作非为的法规出台。然后,继续评论道:

其实人们在这个问题上不应该一味将矛头对着明星。广告总是要人去做的,明星和非明星都有权利受雇做广告。赵本山说:“明星为企业做广告是应该的。药品毕竟是为病人治病的,不是,而且有国家颁发的产品合格证,为什么不能做?”不无道理。但是问题在于,你没有病,你凭什么、又有什么资格以“患者”的身份来“证明”一种药的疗效?更严重的问题在于,劣质的产品、虚假的广告内容以及明星建立在虚假之上的夸张煽情表演,不但坑害了消费者,而且毒化了社会风气。所以,在产品质量和广告内容的源头上把好关,明星们就是想钱想得发疯,赶着做广告,也危害不到老百姓。新的广告审查办法最关键的问题是,要从内容和形式上保证广告的“真”。

在这篇口播评论中,尽管不时有明星做虚假广告的画面出现,但是这些生动、具体的画面并没有喧宾夺主,更没有让人误以为这是图像评论,而始终将注意力集中到评论者,即播报者的口播评论的精彩评析上,尤其是论证者的声调和表情,情和理交融而产生的感染力和说服力。使这台口播评论充满了吸引受众的魅力。

图像评论的概念是相对于口播评论而言。与口播评论最显著的区别是:图像评论必须同时运用画面、声音和屏幕文字多种符号来表现评论的理性与情感。因此这种独特的电视评论形式有两个方面必须提请注意。这两个方面是:第一,图像评论以声画兼备、视听结合区别于口播评论。它虽然集中地体现了电视评论的基本特点,但不是电视评论的唯一形式,而是同口播评论并列的一类评论形式。明确这一点,防止把图像与电视评论等同起来,或者同口播评论对立起来,无论对于图像评论还是整个电视评论的健康发展,都是值得注意的问题。第二、图像评论作为一类电视评论的总称,既涵盖了已有的具体形式,也随时吸纳新的形式,是一个生生不息的开放性系统。虽然目前新闻述评和访谈式评论占居主导地位,但完全可以预料着实践、探索的深化,还将有新的形式出现,已有的形式也将有新的发展。

除此之外,还必须了解,图像评论的表现优势。图像评论除了形诸声音的论述语言以外,还可以调动画面、同期声、屏幕文字等为表现内容服务。符号及符号组合的多样性,给这类评论带来其他媒介的评论、电视播评论难以企及的表现优势。这种表现优势主要集中在两个方面:第一是画面的传真功能,使图像评论对于作为论据的新闻事实的“转述”,能够达到具体、形象、绘形绘色的境界,让人产生有如身临现场、直接面对客观事实的感受;这种以直接再现的方式提供的论据,无疑比任何语言、文字的的描述具有更强的实证性和雄辩的说服力。第二是多种符号的相互配合,既原原本本地把客观事物之“象”呈现于观众面前,又从中引出相应的看法和见解;这样融画面、声音和屏幕文字于一体,比单纯的语言、文字论述,更有利也更方便观众经由具体事物理解抽象内容。

在图像评论中,画面、论述语言、访问同期声、屏幕文字相互必须配合,才能收到强化评论说服力的良好效果,给群从众留下深刻的印象。运用图像的传真功能,使其再现新闻事实论据,从而有力地为评论的论点服务。在两者的关系构成当中,图像与评论间是以一种使人信服的逻辑推理作为关系构成的桥梁的。

在此例举《尊重农民,爱护农民》的几个片断;以帮助我们具体了解图像和评论之间是怎样建立起这种逻辑关系:

第一组:(画面):河南某县农业局办公室,几个机关干部模样的人正在喝茶、聊天,放肆地大笑,办公室角落,一个干部正在伸懒腰……

(解说词——论述语言):农村地域广大,农村的事情千头万绪,如果光坐在城里,是一定做不好农村工作的。现在一些地方决策之所以脱离实际,往往与我们的干部深入基层不够有关。

第二组:(画面):陕西某县农业局旁边,农业局下属的“股份有限公司”的招牌赫然;马路对面几幢醒目的建筑,一是局办的摩配市场,二是下属的一个很大的加油站……

(解说词——论述语言):农业是国民经济的基础,但是在一些干部的思想和实际工作中忽视农业的现象还比较普遍。要真正解决这个问题,还必须加深对农业重要性的认识。不能因为农产品出现了阶段性的供大于求,就以为我国农业已经过关了。农业是关联全社会的产业,解决农业中的问题,光靠农业部门是远远不够的。各部门都要把支持农业作为自己义不容辞的责任,增强服务意识,采取切实措施,支持农业和农村的发展,农业的效益不仅体现在农民收入上,还体现在对整个国民经济发展的支撑上;不仅体现在经济效益上,还体现在社会效益上,不能因为农业的比较效益低,就忽视对农业的投入和支持。

第三组:(画面):安徽某县县政府大楼,几名县级领导干部正在制定本县农村经济发展“腾飞计划”,县中心广场上树立的巨幅标语牌上写着“上台阶争速度,一年建成小康县”的字样格外醒目……

(解说词——论述语言):当前要特别强调在干部中加强坚持实事求是的思想路线教育,坚决反对形式主义和虚报浮夸。这里有一个正确估计农村经济发展水平和农民富裕程度的问题。一些地方随意向基层下达各种“达标升级”任务,一些干部为了个人政绩,盲目上项目、铺摊子,造成乡村负债累累,农民负担沉重。这都与过高估计农村经济发展水平和农民富裕程度有关。要教育基层干部,既要对上负责,更要对下负责。即使是上级布置的任务,如果不符合当地农村实际,没有条件完成,也要主动向上反映,做到量力而行,珍惜民力。必须指出,农村基层干部作风中存在的许多问题,同上级机关的和形式主义有很大关系,有些就是上面逼出来的。领导机关和领导干部要结合贯彻落实六中全会决定,解决好自身存在的问题。上级部门在给基层布置任务时,一定要从农村实际出发,体谅基层的困难。要关心和爱护农村基层干部,为他们创造良好的工作条件,保护好他们的积极性。

由此可见,图像表现的效果优势是十分明显的。像这样恰当地运用图像符号,按照图像符号自身的表现功能和规律来突出这种优势,可以收到事半功倍的奇效。试看,第一组画面里,农业干部们的无所事事具有很强的讽刺意味;第二组画面里,农业局不重视农业、农村、农民,反映出一些农业部门的撒手放任,不仅服务意识缺乏,措施缺乏。第三组画面里,形式主义泛滥,反映出他们缺乏尊重农民,爱护农村的意识和感情。正是在充分发挥图像符号优势的基础上,评论才得以大显身手,使观众获得强烈的视听功能效果。

图像分析论文篇2

关键词:系统功能语法;再现意义;互动意义;构图意义;平面广告

一.引言

平面广告,若从空间概念界定,泛指现有的以长、宽两维形态传达视觉信息的各种广告媒体的广告;若从制作方式界定,可分为印刷类、非印刷类和光电类三种形态;若从使用场所界定,又可分为户外、户内及可携带式三种形态;若从设计的角度来看,它包含着文案、图形、线条、色彩、编排诸要素。对平面广告的多模态分析模式是建立在多模态理论的基础上的,由于平面广告一般包括的模态有图像模态和文字模态,所以平面广告的多模态分析主要包括对这两个模态的分析。

之前对于平面广告的多模态分析基本是根据多模态分析理论上对于个案的分析,而没有一个系统的完整的平面广告多模态分析方法和结构。这样在遇到新的案例或者素材时就没有可供使用的分析框架,分析者往往要进行各方面的知识学习和概括才能进行多模态分析。本文试图通过构建一个适合大多素平面广告的多模态分析的框架,使分析更加简洁和清晰,并且能够为一些分析者提供研究的切入点。

二.理论基础

克瑞斯和勒文的理论是建立在韩礼德系统功能语言学的基础上,系统功能语言学把语言功能分为三个方面,即概念功能、人际功能和语篇功能。概念功能是指我们利用语言来认识世界的功能;人际功能是讲话者运用语言参加社会活动的功能;语篇功能指语言用于组织信息的功能。而根据克瑞斯和勒文的理论模式图像的意义可以分为三个模块,即分析图像的再现意义,互动意义和构图意义。因此我们在研究图像模态时可以根据这三个模块来分析图像模态的意义和特点。

平面广告包含有图像和文字两种模态,Barthes认为,图象和文字说明是关联的,然而由于图象本身的意义飘忽不定,必须借助文字说明才能确定(Barthes1967, 1977)这种观点认为图像依赖于文字,而克瑞斯和勒文却认为,图象和文字说明是有联系的,但并不依赖文字说明,因为它本身既是有组织的(organized) ,又是有结构的( structured) ( Kress & Leeuwen 2006 )。虽然两种观点在文字和图像的关系上有所不同,但是他们都认为对于图像模态的分析,要结合文字模态,对于文字模态的分析,需要结合图像模块。

三.分析步骤

平面广告的多模态分析分为两个方面,第一是图像模态的分析,第二是文字模态的分析。

3.1图像模态的分析

图像模态的分析可以从三个方面着手:再现意义、互动意义和构图意义。

3.1.1图像模态的再现意义

系统功能语言学中指出,概念功能指语言对人们在现实世界(包括内心世界)中各种经历加以表达的功能。而克瑞斯和勒文提出的再现意义是在概念功能的理论上建立的,他们将再现意义区分为叙事和概念两大类。其中叙事的再现包括行动过程、反应过程及言语和心理过程三类。而概念的再现对应功能语法中的语义关系的关系过程和存在过程。

区分叙事再现和概念再现的方法是看图中有没有矢量的存在。有矢量的图属于叙事再现图像,而没有矢量的图则属于概念再现图像。

矢量是叙事图像的标志。在图片中,图像中的元素形成斜线, 通常是强烈的对角线,形成矢量。当参与者被矢量连接起来时,他们之间的关系被再现为相互作用,表现为行动过程和反应过程。在叙事再现的行动过程中,动作者(actor)即为发出矢量的参与者。在图像中,动作者通常是最为突出。而没有矢量的图则属于概念图像,概念图像的再现意义通过分类过程、分析过程和象征意义来实现。

在确定了图像模块属于何种再现图像之后,我们就可以根据两类图像的特点和结构来进行分析。如果图像中包含矢量,即属于叙事图像,那么就要按照分析叙事图像的方法,首先要分清图像中的动作者,参与者和反映者,然后再分析他们之间的相互关系以及是如何相互作用的。各方的相互作用也是通过矢量连接的。叙事图像的在现分为行动过程、反应过程及言语和心理过程。行动过程的元素和人物可以看作动作者,反应过程的元素和人物可以看作参与者,心理过程的元素和人物可以看作反映者。世博会的会徽可以被看做是一个叙事图像,可以明显的看到由图像中的元素构成的强烈的对角线而形成的向量。动作者并不是具体的某个人或者某些人,而是一个由图像构造出来的具有象征意义的整个群体。

如果图像中不包含矢量,即属于概念图像,那么就要按照概念图像的模式来进行分析。概念图像的再现意义通过分类过程、分析过程和象征意义来实现。分类过程即把图像中的各个元素按照一定的标准进行分类,将属于同一类的元素归纳到一起,而分析过程则是把已经归类的元素进行信息处理,将元素中的有效信息提取出来,象征意义是将从元素中提取的有效信息再处理,并且归纳总结出深刻的内涵概念。

3.1.2 图像模态的互动意义

互动意义对应于系统功能语言学中的人际意义。"互动意义是关于图像的制作者、图像所表征的事物(包括人)和图像的观看者之间的关系,同时提示观看者对表征事物应持的态度。"跟语言的人际功能类似,人际功能是指语言用来维持社会和人际关系的功能,而互动意义是用图像语言进行交流,使交流的各方能够有效的沟通。互动意义由四个要素构成,它们是接触、社会距离、态度和情态。我们可以从这四个方面来分析图像模态的互动意义。接触:很多图像表现画框中的人直接看着观看者,即他们与观看者"接触",从而与他们建立起(想象中的)关系。根据图像与观看者之间的接触关系,可以分为"索取"类图像和"提供"类图像。距离:图像可以使观看者靠近人物地点和事件,也可以将观看者挡在一臂之外。图像的距离要素类似于电影和摄影中的镜头距离,根据距离的长短,图像可以给观看者不同的感觉,例如近距离的特写可以让观看者身临其境,而长距离的画面则是强调的整体感觉。态度:当仰视/俯视/平视某物时,我们会对物体产生象征性的权势,平等的和不平等的,这之间还有很多不同程度的卷人或超脱的介人。最后分析的一项是情态,情态指的是"某种图画表达手段(色彩、再现的细节、深度、色调等)使用的程度,其中的每一个方面都可以看作是一个尺度,从没有细节到对细节最大量的再现,或者从没有深度到最大深度"。分析情态就是分析图像中的色彩运用,图像中的情态分为高、中、低三类:(1)高感官情态:图像自然主义地使用了高饱和度的色彩;(2)中感官情态:图像色彩不太饱和,如"水洗"的或飘逸的水粉;(3)低感官情态:图像只是黑白的。克瑞斯和勒文从色彩饱和度、色彩区分度、色彩调和度、语境化、再现、深度、照明和亮度等八个视觉标记探讨了图像中情态的现实意义量值的高低。所以在分析图像时,要结合美学对色彩的研究来分析图像色彩的运用及包含的意义。

3.1.3 图像模态的构图意义

构图意义对应的是系统功能语法中的语篇意义,正如对于语篇意义的分析一样,多模态分析把整个图片看做是一个语篇,而不同的是多模态分析注重的是图片内部结构和整体的关系。构图意义包含三种资源:信息值、取景和显著性。分析图片的构图意义就是对这三种资源的分析,同样的也需要借助美学的知识。信息值是通过元素在构图中的放置实现的。元素在图中的不同位置代表了不同的意义,在图像上方的元素是"理想的",而被放在下面的元素则是"真实的";放在图像左边的元素是已知的,而右边的元素则是新的信息。在功能语法中,已知信息是常识性的或显而易见的,而新信息则是补充到认知环境中的,可供讨论和争议的。取景指的是用取景手段(可通过造成分割线条、或实际分割框架的线条来实现)割断或连接图像中的元素,表示它们在某种意义上是属于还是不属于的。显著性值得是元素吸引观看者注意力的程度。显著性可以通过图片的前景或背景、相对尺寸、色调值的对比、鲜明度的不同等来实现。此外,文化因素也可以影响显著性,例如女人体现在图像中总是具有显著性。而很多的平面广告大多是借助人物来表现产品的,所以其中的各种因素所表现出来的显著性会有很大差别。

3.2文字模态的分析

广告中的文字部分通常对整个广告起到画龙点睛的作用,在广告中往往是必不可少的,文字模态和图像模态相互照应,共同作用以展示产品或宣传品。因此我们在分析完图像之后还要对文字进行分析,并且要结合图像的意义和特点来分析文字。

文字模态的分析主要是从两方面来进行。一方面要分析文字的构图模式,排版和色彩运用。像图像模态一样,文字模态也有其自身的构图原则和目的,我们在分析时要把握好作者的意图以便更好的结合文字来对整个广告分析。在平面广告中,文字说明能够更好的帮助把产品的精华和特点展示出来,让观看者更准确的把握住广告的意图。这种分析是把文字看做图像来分析的,与图像模态的分析有类似之处。

另一方面,要利用传统的系统语言学的方法来对纯文字部分进行分析。在分析完文字模态的构图方面的特点和意义之后,我们还要对文字模态进行再分析。因为传统的系统功能语言学分析的是单模态的文字语篇,所以我们在利用此理论来分析文字模态时要对语言的三大功能进行分析,即概念功能、人际功能和语篇功能。同时,要结合广告语的形式和特点分析语篇。广告语中包含有大量的转喻和隐喻,在分析时要把其中的隐含意义解释出来从而方便读者对整个语篇的理解。

四.结语

多模态的分析不仅仅依赖语言学这一门学科的知识,因为多模态不可避免的包含有图像或者视频,所以对于这些模态的分析还要借助于其他方面的知识,例如美学和社会学。多模态分析发展到现阶段,缺点还存在很多,最明显的一个,由于分析者在分析各个模态时虽然根据相同的理论和结构,但是分析仍然带有强烈的主观性。不同的人对于同一个图片分析的结果和侧重点就会有很大的差别。而对于文字模态和图片模态之间的互动关系和互补作用仍然难以确定,因此在对这两个模态分析时就难以准确全面的将二者结合。

平面广告只是多模态语篇的一种,并且是一般仅包含有两种模态的语篇,所以在分析的内容相对较少,结构相对较简单。但是分析要抓住图像所表达意义的本质却不是那么简单的,在分析者利用理论来进行实际分析时,往往无法把握好图像的各个元素的重要性顺序以及背后所隐藏的含义,这就会造成一种分析的失误,导致分析太流于表面,而无法深层次的挖掘其中的精髓。并且多模态分析往往要求分析者掌握多方面的理论和背景知识,仅仅通过一些简单的知识进行似懂非懂的分析结果会给人一种空洞和言之无物的感觉。

参考文献:

[1]Kress G. and T.Van Leeuwen. Multimodal Discourse Analysis. London:[2]Arnold, 2001

[3]Kress,G. and T.Van Leeuwen. Reading Images.1996. London: Routledge, 2006.

[4]Halliday, M. A. K. An Introduction to Functional Grammar.1985. London: Arnold, 1994.

[5]T.van Leeuwen Introducing Social Semiotics. London: Routledge, 2005.

[6]Hodge, R. and G. Kress. Social Semiotics. Cambridge: Polity Press, 1988

[7]胡壮麟,"社会符号学研究中的多模态化",《语言教学与研究》, 2007年第1期,1-10。

图像分析论文篇3

【关键词】数字图像处理;SAR图像;矩特征;目标识别

1.绪论

在概率论中,矩用来呈现概率密度函数的特性,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,那么矩方法即可用于图像分析领域并用作图像特征的提取。本文主要分析讨论SAR图像的几何矩特征。由于不变矩方法能构造出旋转、平移、比例不变量而形成一组重要的反映目标形状的特征集,这种方法被广泛应用于文字识别、目标识别、场景匹配与图像配准等领域。针对SAR图像常常带有明显的几何形变的特点,用矩的良好的几何不变性进行对目标的提取可以取得较好的识别效果。

本文对用MATLAB环境下对一幅经过初步预处理的SAR图像进行仿真分析。本文分析了目标的七个不高于三阶的几何矩在图像旋转过程时的特性,对其不变性做了具体的分析,在不变的整体趋势情况下讨论其特性。主要使用了MATLAB的IMAGE PROCESSING TOOLBOX的相关图像处理函数,如图像的显示、滤波、旋转、插值和形态学处理的相关函数对一副图像进行分析。在旋转过程中,为了尽量减小图像旋转造成的图像模糊和灰度较大的变化,每次旋转后进行双线性插值运算和维纳滤波。

2.不变矩原理

矩特征主要表征了图像区域的几何特征,又称为几何矩,由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。在图像处理中,几何不变矩可以作为一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。

2.1 矩的定义

在概率论中,对于连续函数f(x,y),其p+q阶矩(moment)定义为:

式中分别为x、y的期望。

在概率论中,矩用来呈现概率密度函数的特性,例如,期望值是一阶矩,方差及协方差是二阶中心矩等。推广到力学中,它被用作刻画空间物体的质量分布。同样的道理,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,那么矩方法即可用于图像分析领域并用作图像特征的提取。

2.2 二维图像的矩

一个与平面区域有关的几何特性如大小、位置、方向及形状等,其中很多特点与矩这个参数有关。故可设二维离散图像的灰度函数用f

式中,,y0是图像亮度的矩心,零阶几何矩m00代表一幅图像的总亮度,表示图像灰度在水平方向上的灰度重心,y0表示图像灰度在垂直方向上的灰度重心。

2.3 不变矩

不变矩是指物体经过平移、旋转以及比例变换仍保持不变的矩特征量,沿用相同的定义,在二维图像中,Hu提出了7个几何矩的不变量,这些不变量满足于图像平移、伸缩和旋转不变。

若一般矩为已知,则中心矩的计算可以通过一般矩来表达,且中心矩是与图像的平移无关的。

3.实验仿真

3.1 实验仿真思路

对一幅经过去噪等初步预处理的SAR图像首先进行目标的提取。目标提取函数见附录一。对原图的7个不高于三阶的几何矩进行编程计算,把原图像进行以5°步长进行360°的双线性次插值旋转,提取每次旋转后图像的目标,计算目标的矩。通过对每幅图矩值的绘图,分析其变化规律。作为不变矩,在理想情况下,预测将具有一定范围内的稳定性。

3.2 编程流程图

如图1所示,仿真编程中,采样了单循环,每次图像旋转比上次多5度,总共旋转355度,并显示旋转出的图像。对每幅图像,调用子函数invmoments函数进行矩计算。为了便于数据的比较分析,将所以的矩建立成一个72*7的矩阵。在invmoments函数中,由于对求取的中心矩原点矩都做了归一化,故算的的矩的值会很小,为了便于表示和分析,所求得的值都是经过对原始值做了求常熟对数的计算的。

3.3 仿真结果及分析

3.3.1 目标提取

3.3.2 原图旋转和目标提取目标

3.3.3 旋转目标的矩的数值分析

a.变化幅度分析

通过对矩值矩阵的每列分别减去第一行,即原图像的对应矩,得到各矩的变化曲线如图10。

取其中变化值的绝对值最大的,并计算其变化比例,结果如表1:

观察以上数值,可以发现,在旋转过程中矩发生的变化比较小,最大的变化达到1.5%,多数集中在1%以内。

b.周期性分析

从仿真获得的旋转图上初步观察,可以发现其具有一定的周期性。我们从数值上稍做分析。由图示的周期性特点,对矩一、二、三、四、五、七用19行后没18行与前18行做差,对矩第六用后三十六行与前三十六行做差,即观察这种周期性的每个周期所具有的波动特性。用plot函数绘图如图10。

同时,对结果的绝对值统计发现,在504个数值中有65个为零,有346个数值是小于0.02,只有93个数值大于0.02。

总体观察可以发现,如果减去所有的第一周期内的数值,其余的部分具有很好的周期性,只有小部分点与周期性应具数值有微小的差别。故完全可以认为对于七个几何矩的微小范围内的变化,有较好的周期性,其中矩一到五和七具有九十度的周期,矩六具有180度的周期。

c.对整幅图像做类似的处理

对原始图像在包含较较多的背景信息的时候做旋转求矩运算,同样具有以上分析获得的类似目标的这种特性,不同的是对原图某些变化规律性不如仅对目标分析时的理想,存在一些偏离较大的点,分析其原因为由过多的背景信息在旋转等过程中带来的计算上的误差累积和较多的噪声导致。

4.结论

通过以上仿真和分析可以得出,SAR图像的七个几何矩的具有以下性质:

(1)对旋转波动变换比较小,主要集中在1%左右,即具有很好的不变形和稳定性;

(2)波动变化都有着明显的周期性。其中,矩一至五和矩七总体上都是以90度为一个周期,矩六每180度一个变化周期。这种周期说明目标图像在90到180、180到270、270到360三个范围内旋转时,矩的变化与0到90度的旋转有着基本完全相同的变化规律。对于个别的不规律点,包括矩值比其他周期同位置点理论值存在些许差别,及出现的少数偏离较大的点,可以归结为是由图像各种类型的噪声的存在导致的,这种现象都是合理的,并不影响矩的以上规律。

图像几何矩的这些特点对雷达从不同方位获取目标图像时进行目标的识别与匹配及其他很多领域的应用提供了很好的理论基础,具有广泛的应用。

参考文献

[1]Hu M K.Visual pattern recognition by moment invarints[J].IRE Trans,Ifn.Theory.1962.IT:179-187.

[2]金敏,徐守时,王行.不变矩在模式识别中的应用研究[J].计算机工程与应用,2004,40(25):65-76.

图像分析论文篇4

关键词:新闻图像;视觉说服;ACTS模式

中图分类号:G20 文献标识码:A 文章编号:1000-2731(2012)03-0163-05

图像在现代传播中发挥越来越重要的作用。它能吸引全社会的注意,影响公众的舆论,甚至有时能改变国家政策、行为。越南美莱村大屠杀等照片的公布改变了美国公众对越南战争的看法,并促使美国停止了那场战争;美国士兵在伊拉克的虐俘照片公布后,使美国政府颜面扫地;2009年《华商报》刊登的《挟尸要价》照片,该照片夺得了2010年中国新闻摄影最高荣誉“金镜头”奖,也在全国引起了轩然大波,引起了人们对社会良知的反思。总体来说,传播从过去以文字为主时展到今天图文并重的多媒体时代,一场视觉革命正在蔓延。图像作为传播的一种重要方式,正潜移默化地影响着人们的思维模式和行为方式。本文将图像作为文本,基于符号学理论和阿恩海姆视知觉形式动力理论,提出视觉传播机制ACTS模式,即从吸引注意(Attention)、引向内容(content)、展现主题(Theme)和积淀为符号(Symbolic)四个层面来解析图像的视觉说服机制。本文以新闻图像为例,一方面向传播者揭示成功的视觉传播效能是如何实现的、可以怎样实现;另一方面也向受传者揭示视觉传播是如何影响人的态度、行为的。

一、新闻图像:从表征到说服

新闻图像是以视觉符号为载体对新闻事实进行的视觉报道。按照其表现形态可以分为静态新闻图像和动态新闻图像两种。前者主要是指新闻照片和新闻漫画、图表等,也被统称为新闻图片;而后者则包括电视图像和网络视频等动态影像。在新闻图像的生产过程中,无论是摄影(像)师还是观者,总是有意或无意地将自己的观念、情感、经验融入其中,从而使图像体现了权力和意识形态等社会文化内涵。因此,新闻图像是一种文化表征。在新闻图像形象性、纪实性、真实性的背后,隐藏的是视觉符号语言逻辑和文化意义。那么人们不仅要问,新闻图像的话语、权力以及意识形态等是如何通过视觉符号建构的?能不能为观者提供一种解读新闻图像的方法论?

英国伯明翰学派领军人物斯图尔特·霍尔引用罗兰·巴尔特《今日神话》中“一黑人士兵向法国国旗敬礼”的一个例子,运用符号学理论分析了视觉表象建构意义的方法。对我们分析新闻图像的意义建构有一定的借鉴价值。

有一天巴尔特去理发店,看到一本法国杂志《巴黎竞赛》封面上有张照片,照片上一个身穿法国军服的黑人青年正在敬礼,双眼上扬,可能注视着一面三色旗(法国国旗)。在第一层次上,……这产生了带有简单的字面信息或意义的一系列符号:一个黑人士兵正向法国国旗敬礼(直接意指)。但是,巴尔特论证道,这形象还具有更广泛的文化意义。……“法国是一个伟大的帝国,她的所有子民,没有任何肤色歧视,都忠实地在她的旗帜下服务,对于那些提出所谓的殖民主义的诽谤者,没有什么比这个黑人服务于他的所谓压迫者时所显示的热情更好的回答了。”……在第一个过程中,各种能指(形象的各种要素)和所指(概念——士兵、国旗等等)联合构成一个带有单纯的直接意指的符号:一个黑人士兵正向法国国旗敬礼。第二阶段,这个完成的信息或符号被联系到第二层所指——有关法国殖民主义的一个广义的意识形态主题。

之所以这样引用,是因为这个例子是我们接下来要探讨问题的起点。符号学方法是分析视觉表征的一个有效方法,其一层层有条理的分析,展现了意义的建构过程。但是,从第一层的“直接意指的符号”到第二层的所指是如何实现的?也就是说,对是什么让巴尔特从“一个黑人士兵正向法国国旗敬礼”产生了“法国是一个伟大的帝国,她的所有子民,没有任何肤色歧视,都忠实地在她的旗帜下服务”这种意识形态的?巴尔特和霍尔等符号学家认为这两者之间是自明的,没有对这个问题进行进一步阐释,这也许是符号学需要进一步拓展的方面。实际上,在第一层的直接意指和第二层的所指之间还有一个环节——视觉传播机制,即在这两者之间有个视觉传播机制在起作用。也就是说,从新闻图像的编码到其解码的过程中,或者说从视知觉形式层面到文化意义层面有一个视觉传播机制在起作用。下面将运用基于符号学理论和阿恩海姆视知觉形式动力理论的ACTS模式来剖析新闻图像的视觉传播机制。

二、阿恩海姆的视知觉形式动力理论简介

在介绍视觉传播机制ACTS模式之前,需要了解一下阿恩海姆视知觉形式动力理论(Visual Per-ception Form Dynamics),作者已经对此进行过较为详细论述。概括地说,该理论认为,视知觉形式动力一方面是视觉形式建构的动力机制,完形倾向是一种动力机制;另一方面表现为动态形式。从表现形式上看,视知觉形式动力就是我们在图像中感觉到的那种视觉力,是一种心理力,比如人们常说的“视觉冲击力”。我们在一张纸中随便画一个小圆圈,会发现它有向某方向运动的趋势,它有作用点、方向和强度,因此被阿恩海姆冠称为“视知觉形式动力”。该理论对于视觉传播机制主要有以下三个方面的应用价值:第一,只有视知觉形式动力才能被视觉所把握,视知觉形式动力是探寻表征(现)之门径;第二,运用视知觉形式动力把视觉形式与情感统一起来,从大脑的生理机制上讲,情感表现也是视知觉形式动力的活动,而且视知觉形式动力具有最自然、最深刻的象征意义;第三,揭示了生成视知觉形式动力的方法。它们是视觉传播机制ACTS模式的主要支撑理论。

图像分析论文篇5

关键词: 社会符号学 多模态话语分析 视觉语法 第16届广州亚运会会徽

1.引言

随着数字化时代的到来,语篇日益凸显多模态化,多模态话语分析成为了国内外语言学家研究的热点之一。胡壮麟指出,在人类进入社会符号学的多模态化的新世纪,对多模态识读能力的培养应引起重视[1]。李战子说:“图像时态的到来,特别是图像在媒体,教育和儿童文学中的大量生产,使我们无法忽视多模态,也不应该认为它比单一模式的话语低下而置之不理。”[2]Kress提出,所有模态都具有表达意义的潜势[3]。

第16届亚洲运动会在我国广州举行,此届亚运会会徽以柔美上升的线条,构成了一个造型酷似火炬的五羊外形轮廓,构图以抽象和具象相合,在灵动中不失稳重,象征着亚运会的火炬熊熊燃烧、永不熄灭,既体现了广州的城市象征,又表达了广州人民的美好愿望,还表现了运动会应有的动感。

本文从多模态话语分析的角度,以第16届广州亚运会会徽为例,运用视觉语法的研究方法进行分析,进而解读图像作为一种社会符号是如何产生意义的,并且揭示图像和文字的表意功能。

2.理论背景

2.1多模态话语的普遍性

话语的多模态并非是一个新现象,而是人们一直以来在实践甚至理论研究中总是趋向于关注一种模式而忽略其他模式,例如,朱永生认为话语分析基本上局限在语言本身,即只注重语言系统和语义结构本身及其社会文化和心理认知之间的关系,忽视了诸如图像、声音、颜色、动漫等其他意义表现形式[4]。图像建构的意义,以及只有通过两种模式共同作用才能表达的意义就被置于边缘地带或者完全被忽略。实际上,各种符号模式也参与意义表达,只是它们属于意义构建的不同层次。例如,“一图抵千言”的俗语就侧重单独图像意义的构建,新闻报道中文字与图片的结合则强调文字与图片的互补性。“语言使用,不管是口语还是书面语,总是不可避免地由多种交际模态构建”[5],所以,“所有的文本都是多模式的”[6]。随着社会的发展和科技的进步,特别是随着数字、网络和多媒体技术的广泛使用,传统语法认为是副语言的图像、颜色、声音和动作等符号在现代交流中不再处于辅助位置,而是正在和语言符号一起形成更为宽泛的符号资源共同参与构建意义。

2.2多模态话语分析的社会符号学理论基础

首先提出“多模态话语”的是克瑞斯和赖文。理论基础是韩礼德系统语法功能中的相关理论。韩礼德在其《功能语法介绍》一书中主张语言是社会符号系统,提出了三大元功能,即表示概念意义的概念功能,表示说话人和听话人之间的关系和说话人对说话内容态度的人际功能,以及表示语篇构建意义的语篇功能。因此,多模态话语分析理论的社会符号学基础即是把语言作为社会符号所具有的三大元功能延伸到除语言之外的其他符号,并把包括语言在内的各种符号看作是各自独立而又相互作用的符号资源,在分析语言特征的同时强调图像、颜色、声音和动作等视觉、听觉和行为方面的符号模态在话语中的作用。Hodge和克瑞斯归纳出用以指导阐释多模态话语两个理论前提,并进一步强调社会符号在社会实践中的应用,强调符号的动态表意功能[7]。由此可见,社会符号学为理解视觉化语篇提供了一个总的描述的语法。

2.3视觉语法

克瑞斯和赖文基本接受了韩礼德的系统功能语言学观点,并且进一步发展了自己的理论。克瑞斯和赖文指出多模态话语分析也是一个符号系统,每种模态(文字、图像、声音)在语篇中作为独立的部分存在并产生意义;所有的模态系统组合,作为一个整体产生语篇意义[6]。克瑞斯和赖文在韩礼德三大元功能基础上,主张图像的社会符号性,认为:“正如语言的语法决定词如何组成小句、句子和语篇,视觉语法将描写所描绘的人物、地点和事物如何组成具有不同复杂程度的视觉‘陈述’。”[6]他们将韩礼德的语法功能延伸到图像分析,建立了以“再现意义”、“互动意义”、“构图意义”为中心的视觉语法理论框架,与韩礼德三大元功能一一对应。

3.1会徽的图像解读

第16届亚运会会徽可以看作是一个由图像、文字、颜色构成的多模态语篇。整个语篇由意象、文字、颜色构成,以红色为主要基调,黄色和黑色搭配而成。意象的创作来自“五羊的传说”,在会徽的意象中“五羊”被设计成四条跑道,又作火焰状,意喻亚运火炬,一直延伸向天空中的太阳。图像下方是“16th Asian Games”和“Guangzhou 2010”,中西合璧;两行文字均采用黑色,但是“Guangzhou 2010”采用粗体汉字字体,突出我国文化底蕴的深厚。

3.2会徽的多模态话语分析

3.2.1再现意义

克瑞斯和赖文认为再现意义包括叙事和概念两大类,其中叙事的再现包括行动过程、反应过程、言语和心理过程。概念的再现包括分类过程、分析过程和象征过程。李战子[2]指出在图片中,使图中的元素形成斜线就形成矢量。矢量是叙事图像的表示。叙事再现指图像中参与者被连接起来后对相互做某件事。行动过程中最为突出的参与者可以通过尺寸、位置、颜色等判断。克瑞斯和赖文认为概念再现中分类过程是将参与者分为主从的过程;分析过程是分析显性和隐性的过程;象征过程是关于参与者是什么或者意味着什么。

会徽中的主要意象基于广州“五羊的传说”,五只羊演化成了燃烧的火焰,一直伸向天空的太阳,隐含着行动过程的参与者;五只羊又可以理解成四条跑道,一直延伸到世界的尽头,寓意了亚运会的发展将永无止境;火焰、跑道的“目光”投向天空中的太阳,形成了反应过程。在整个图像中,“五只羊”是图像中最突出的参与者,扮演者“主角”,用红黄这种高饱和的颜色填充,强调了五只羊的化身――广州人民将以最热情的态度、最友好的方式传递亚运社火的精神。

3.2.2互动意义

克瑞斯和赖文认为图像中包含图像的制作者、图像表征的事物、图像的观看者之间的关系,并提示观看者对所再现的事物应持的态度。在此过程中,有接触、距离、视点和情态四大要素。克瑞斯和赖文将图像的参与者直接看着观看者的过程叫做“索取”,将图像人物的展示叫做“提供”;距离主要包括亲密、非个人、社会距离的展现;通过仰视、俯视、平视等不同视点展现权势;情态与图像的真实度和可信度有关,通过色彩饱和度、色彩、区分度、色彩调谐度、再现、深刻、照明和亮度标志反应图像的“现实主义”。

此图像是一幅“提供”类图像,将亚运会的理念通过会徽传递给观看者。这是一幅近景图像,观看者可以清楚看到整幅图像。会徽图像以红色为主色调,文字以黑色为主色调。在中国传统色彩中,红色表示喜庆、热烈等情感;黑色表示庄重、肃穆等意思。使用红和黑这两种高情态的色彩,充分体现了广州人民将以热情的、严肃的、饱满的精神状态迎接亚运会的到来。图像下方的两行文字直接告诉观看者此会徽的用意,采用中英文的形式直接说明了亚运会将在中国广州举办,并且突出了亚运会的国际性。舞动的广州体现出亚运会的动感。

3.2.3构图意义

“构图意义”对应功能语法中的语篇意义,克瑞斯和赖文提出了构图意义中的三种资源:信息值、取景和显著性。信息值是通过元素在构图中的放置实现的即空间位置。在克瑞斯和赖文看来,左边的信息是已知的,右边的是新的;上方的是“理想的”,下方的是“真实的”。中心与边缘的差异与文化差异相关。取景指的是是否采用取景手段,用于变现图像元素的有无。显著值指元素吸引观看者注意力的不同程度,通过被放置的前景或者后景,相对尺寸,色调值对比和鲜明度的不同来实现。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

“理想的”是指它的信息是理想化的或概括性的实质,它的信息是最显著的部分;“真实的”是指更特定的信息,如细节等。在广州亚运会会徽中,被再现为火焰、跑道的五羊在图像的上方,象征广州人民奋发向前愿为亚运会作出最大努力;“16th Asian Games”和“Guangzhou 2010”被放置在下方,它提供的信息细致、真实、可信。

4.结语

数字化时代下的语篇不再以语言为唯一的意义产生方式,各种符号资源(图像、声音、颜色等)都被广泛用于语篇之中,因此,语篇呈现多模态化,对语篇进行多模态话语分析显得日益必要。本文通过利用社会符号学视角下的视觉语法理论,对第16届广州亚运会会徽进行多模态话语分析,发现图像从“再现意义”、“互动意义”和“构图意义”三个方面构建意义,意象、文字、颜色等各种符号资源共同产生意义,验证了各种符号资源都是意义产生的源泉。

参考文献:

[1]胡壮麟.社会符号学研究中的多模态化[J].语言教学与研究,2007,(1):1-10.

[2]李战子.多模态话语的社会符号学分析[J].外语研究,2003,(5):1-8.

[3]Kress,G.Sociolinguistics and Social Semiotic[SA].In Sobley,P.ed,London & New York:Routledge,2001.

[4]朱永生.多模态话语分析的理论基础和研究方法[J].外语学刊,2007,(5):82-86.

[5]Scollon,R.&Levine,P.Multimadol Discourse Analysis as the Con-fluence of Discourse and Technology[SA].In Levine,P.&Scollon,R.(eds).Discourse and Technology[C].Washington,DC:Gergetown University Press,2004.

[6]Kress,G.& Van Leeuwen,T.Reading Images.The Grammar of Visual Design[M],London:Routledge,1996.

图像分析论文篇6

关键词:多模态话语;社会符号学;视觉语法;多元智能

中图分类号:J524 文献标识码:A 文章编号:1006-026X(2014)01-0000-02

1.引言

20世纪50年代初,美国语言学家Harris率先提出话语分析研究,随后各地语言学家作出了很大的努力,大量关于话语分析的理论相继问世。其中大部分话语分析的理论只注重分析语言符号系统和语义结构本身,忽略了对其他符号系统,如图像、声音、颜色、动漫等的探究。然而,随着多媒体技术和计算机技术的飞速发展,人类交际活动中出现的多种符号现象越来越突出,多媒体化(multimediality)体现社会实践的常态,而多模态化(multimodality)也成为当今社会文化系统的固有特性[4]。多模态在传递信息时体现的高效和有趣性使其已经成为现代交际过程的常惯模式。这对人们的多模态识读能力的要求大大提高,胡壮麟[9]把这种能力称之为多元智能。20世纪90年代后,多模态话语研究在语言学界得到越来越多的关注,语言学家们尝试着寻找合适的理论来解释多模态话语。早在1977年,R.Barthes在论文《图像的修辞》(Rhetoric of the Image)中探讨了图像在表达意义上与语言的相互作用;Kress,G.& van Leeuwen,T.[1]研究模态与媒体的关系,专门探讨了多模态规则地表达意义的现象,包括视觉图像、颜色语法以及报纸的版面设计和不同媒介的作用等[1]。以Kress和van Leeuwen为代表的语言学家们,以系统功能语言学理论为基础,尝试把系统功能语言学中的语言研究方法应用于其它的符号资源研究上,如图像、声音、颜色、动漫等。因为多模态话语最合适的理论模式是系统功能语言学理论,它不需要为适应新的目的而对理论框架本身进行改造,可以直接为其提供理论支持[6]。本文将以Kress&Leeuwen的视觉语法[1]为理论依托,从再现意义、互动意义以及构图意义三个方面对世界文化遗产西湖景区的新图标进行多模态话语解读。

2.多模态话语的社会符号学分析框架

Lemke认为符号系统实际上是符号资源(semiotic resource)系统,通过可识别的、多半是习惯性的(有时是原创的)方法采用这些资源,人们从而得以进行有意义的活动;社会符号构造则指包括语言在内的其他符号表达的社会意义,如讲话时的姿势、写作时的图形等。[7]Kress从分析幼儿对语言文字和图像的反应和创造的过程入手研究社会符号学,完成著作《作为意识形态的语言》, 随后发现纯粹语言符号研究对解释社会问题具有很大局限性,认为在语言系统之外的其他系统(如视觉、听觉、行为等其他信号编码)也同样存在意义,仅仅探讨语言符号的意义远远不能解释社会实践中存在的问题[5]。语言符号和其他符号系统如何生成意义、传播和接受的过程有什么特性,Kress提出的社会语言学理论给与了描述和解释。Hodge&Kress归纳出用以指导阐释多模态话语的两个理论前提:(1)社会层面是理解话语结构和过程的首要前提,也就是把社会结构和过程当作出发点来分析意义。从该前提出发,仅关注语词是不够的,因为意义不仅存在于语言系统,也存在于其他符号系统。(2)语言理论必须看作是社会实践的诸多符号理论的一种,因为多模式是语篇的内在本质。如果单种语码不与其他符号体系相联系就得不到充分的理解。[2]

功能语法的主要出发点是把语法看成是制造意义的资源(Haliday,1985),语言为我们对社会行动的经验和形式的阐释编码。在克瑞斯和勒文的研究中,语法被延伸到视觉模式,他们认为:“正如语言的语法决定词如何组成小句、句子和语篇,视觉语法将描写所描绘的人物、地点和事物如何组成具有不同复杂程度的视觉的‘陈述’。”[1]具体地说,“正如系统功能语言学构建了旨在解释语言如何表达意义的‘功能语法’,多模态符号学也关注非语言符号的语法,因为符号不是一堆无规则的乱码,而是具有一定结构、关系的系统”[4]。

国外不乏学者对图画与语言组成的多模态话语进行研究,并得出一个分析框架。张德禄[6]详细分析了这个框架,得出:“语言和图画作为交际模态共有意识形态、体裁、语域和话语意义四个层面。在内容层面,图画具有视觉语法,而语言则有语言语法;在表达层面,语言由印刷符号体现,图形由图形符号体现。在这里最主要的研究领域是把两者在内容层面和表达层面整合为一体,特别是在内容层面的研究任务最重。”张德禄根据Halliday的系统功能语言学理论和以上研究结果,提出了多模态话语分析综合理论框架。这个框架分为四个层面:文化层面、语境层面、内容层面和表达层面。文化层面是使多模态交际成为可能的关键;在具体的语境中,交际要受到语境因素的制约,包括话语范围、话语基调、话语方式所决定的语境因素;在话语意义层面,有由话语范围、话语基调和话语方式所制约的概念意义、人际意义和谋篇意义;在形式层面上,不同模态的形式特征相互关联,共同体现话语意义[6]本文将从该框架中的内容层面也即话语意义层面出发,对西湖景区新图标进行多模态话语分析。

3.西湖新图标的多模态话语分析

西湖在世界上留下了深深的痕迹,这归功于聪明的杭州人。2002年西湖实现免费开放,继这一创举之后,2011年西湖申遗成功,成为世界文化遗产之一,接着专门为西湖量身定做的歌曲《人间西湖》诞生。2012年“西湖LOGO全球海选活动”无疑赚足了全世界的眼球。在来自全球的参赛作品中脱颖而出的西湖新图标,既生动形象又富深意。人们只需乍看一眼便能明白它是三潭印月、圆月印潭,有人调侃它如此圆满,极像一张光碟跌进了西湖,但仔细琢磨将会发现整件作品以圆月印潭为设计主要出发点,融入一湖一月一潭一印四要素,象征三生万物、大气包容。2012年5月20日钱江晚报在报道中称“有关专家则评论:‘西湖LOGO是有形的歌,《人间西湖》是有声的LOGO。西湖LOGO是继西湖之歌《人间西湖》之后,世界遗产西湖的又一大文化创意。’”[3]

3.1 再现意义

对应于功能语法的概念意义,克瑞斯和勒文提出了多模态话语的再现意义,他们将再现意义区分为叙事的再现和概念的再现两大类,其中叙事的再现包括行动过程、反应过程及言语和心理过程三类,概念的再现则相当于功能语法中所描述的关系过程和存在过程。

李战子[8]认为:“在图片中,使图中的元素形成斜线,通常是强烈的对角线,就形成矢量。矢量就是叙事图像的标志(叙事图像相当于一个命题)。”在叙事再现的行动过程中,动作者即为发出矢量的参与者,在图像中,他们通常最为突出。“这可以从尺寸构图中的位置,与背景的对比、色彩饱和或显著性、聚焦程度以及‘心理凸显程度’(如人形,尤其是人脸对观看者来说都具有心理凸显性)等方面来判断。”[8]

我国古代道家有言:道生一,一生二,二生三,三生万物。在西湖新图标中,一轮圆月印入湖水,便成天上湖中两轮圆月。再将视角拉成平面,圆月和它的倒影幻化成两潭静水,和画面中间的一潭水组合成了三潭静水,加上之前高空中的明月和湖中的月影,有西湖第一胜境之称的“三潭印月”油然而生。圆月置于图标的上方,比较显著,以书法特殊手法飞白描以白色,于周围蓝色相比,非常突出,在三潭形成的矢量图中作为行动过程中的动作发出者,隐喻生命的美好伊始,继而不断循环反复,最后呈现生生不息的宇宙万物。空中的圆月似人将柔和的“目光”投向三潭代表的自然万物,这又形成了反应过程,暗示人与自然和谐相处,人类的命运和自然发展定律水融。

3.2 互动意义

对应于功能语法的人际意义,在多模态话语中体现为互动意义。李战子(2003)指出:“图像可以造成观看者和图像中的世界之间特定的关系。它们以此和观看者互动,并提示观看者对所再现的景物应持的态度。在实现这种互动意义 时,有三个要素:距离、接触和视点。……同时,和在语言中一样,情态也是互动意义的重要部分,只是实现情态的资源在图像中极为丰富。”情态可以被定义为对图像的“现实主义”的再现,以感官的编码倾向为出发点,基于色彩的饱和程度。“某种图画表达手段(色彩、再现的细节、深度、色调等)使用的程度,其中的每一个方面都可以看作是一个尺度,从没有细节到对细节最大量的再现,或者从没有深度到最大深度。在每一个尺度中,都有一个点,代表了特定的图像中标准的自然主义。在这个标准上减一分,则至少在这个方面‘不太真实’了,增一分,则‘比真的还真’,我们把这和‘感官编码倾向’联系起来,强调的是感官的愉悦(或不愉悦,如在‘比真的还真’的恐怖图像中)”。[8]

西湖新图标包含蓝、白、红三种颜色,其中蓝、白两色饱和度较高,感官情态较高。白色的潭和月,置于画面中央的凸显位置,蓝色的湖水渐渐荡漾开来,湖水边界模糊,向四周延伸,象征杭州人民张开广阔的胸怀热情迎接世界各地的游客。画面中形成潭中印月、月中印潭的景致,体现出“天人合一、湖天一碧”的意境,彰显杭州东方品质之城的内涵,又有幸福和谐之湖的直观感受。两种颜色相得益彰,象征着自然生态的平衡。而西湖两字以红色的中国印盖于画面左下角,感官情态最高,体现出了西湖文化景观历史的源远流长。

3.3 构图意义

如果将多模态话语对应于功能语法,则构图意义即对应于语篇意义。构图意义体现在三种资源:信息值、取景和显著性。

信息值是通过元素在构图中的位置实现的。任何特定的元素在整体中的角色取决于它是被放置在左边还是右边,中间还是边缘,或者图片空间的上方还是下方。根据西湖新图标的构图方式,我们很容易看出三潭位于画面的中央,成为画面的焦点,传达三生万物融洽相处,天人合一等“理想”而“概括”的理念。英文字母“HANGZHOU WEST LAKE”位于边缘,而刻有“西湖”两字的中国印位于左下方,此两者直白地展现西湖景点的中英文名称和景区所属地,传达了杭州人民敞开胸怀,热忱欢迎世界各地的人们前来西湖欣赏美景的“真实”状态。

4.结语

随着数字时代的来临,视觉技术和图像体现出其前所未有的重要性,交际和再现意义经常需要各种符号,如图像、声音和身体语言等共同实现。语言只是众多交际模式中的一种,语篇研究也日益多模态化。本文首先概述了在数字化时代出现的多模态话语,然后借鉴在系统功能语言学的基础上发展起来的多模态话语的社会符号学分析理论,以西湖新图标为例,分析了构图、颜色和文字等多种符号资源如何共同实现表意。分析证明除文字以外的符号在现代交流中不再处于辅助地位,他们也是意义的源泉。

参考文献

[1] Kress,G.&van Leeuwen,T.Reading Images:The Grammar of Visual Design[M].London:Routledge,2006:1.

[2] Hodge,R.&G.Kress.Social Semiotics[M].Cambridge:Polity Press.1988:437-442.

[3] 《钱江晚报》.《西湖LOGO,就是你了》[N].2012年5月30日.

[4] 李战子,陆丹云.多模态符号学:理论基础,研究途径与发展前景[J].外语研究,2012,(2):1-2.

[5] 汪燕华.多模态语篇分析的社会符号学理据[J].外语学刊,2010,(6):146

[6] 张德禄.多模态话语分析综合理论框架探索[J].中国外语,2009,(6):25-28.

[7] 胡壮麟.社会符号学研究中的多模态化[J].语言教学与研究,2007,(1):5

图像分析论文篇7

[关键词]多模态话语分析 元功能 意义构建

一、多模态话语

模态(modality)是指交流的渠道和媒介,包括语言、技术、图像、颜色、音乐等符号系统,只使用一种模态的话语叫做“单模态话语(monomodal discourse),同时使用两种或两种以上模态的话语叫做“多模态话语”(multimodal discourse)(朱,2007)。多模态话语分析兴起于上世纪90年代,但是多模态话语的存在由来已久,例如中国古代的诗画作品,诗词与图画配合,语言符号和图像符号相得益彰,共同表达作者的意图;再如说话打手势,语言符号和动作符号相互配合。严格来说,所有的交流都是多模态的,因为人们的日常交流并不仅仅通过单一模态进行传递,而是语言、视觉图像等多种模态共同作用的结果。随着数字、网络和多媒体技术的广泛使用,图像、声音和动作等符号在现代交流中不再处于辅助地位,而是和语言符号一起共同参与构建意义(韦,2008)。

二、多模态话语分析的理论基础

多模态话语分析的主要理论基础是Halliday创立的系统功能语言学。系统功能语言学认为语言作为一种社会符号,具有三大元功能:表征客观世界和内心世界的概念功能;体现语言使用者的交际参与和交际角色的人际功能;以及组织成语篇的语篇功能(辛,2008)。系统功能语言学把话语的意义和功能放在首位,意义的实现是以多模态形式进行的,语言只是这些形式中最有效的一种。

适用于语言模态的系统功能语言学理论也适用于其他符号系统。Kress & Leeuwen(2003)认为,图像中的视觉符号不仅可以反映客观世界和主观世界发生的各种事件,而且可以表现各种各样的人际关系,而且视觉符号内部也是一个有机的连贯的整体,因此可以借用Halliday的语言三大功能假说,分别从概念功能、人际功能和语篇功能三个层面分析图像等视觉符号的语义关系。

三、多模态语篇的元功能的实现

下面我们就以系统功能语言学为理论基础,分析一个包含图像的多模态语篇是如何实现符号系统的三大元功能的。

图1刊登在2014年2月27日中国日报网站的地区版(http://.cn/regional/),这个由图像和文字结合在一起的语篇是一个多模态语篇。该报道由两个语篇组成,一个是在地区版首页的多模态语篇,点击文字标题,可以进入该新闻的详细报道――文字语篇。我们来看一下这个图文多模态语篇的社会功能和意义是如何构建的。

图像的概念功能体现了一种再现(representation)。Kress & Leeuwen(2006:59)将图像区分为叙事性和概念性两类:叙事图像表达的是展开的动作和事件、变化的过程和瞬间的空间安排,而概念图像表示的是图像的类别、结构和意义。从概念功能来看,这是一个叙事图像。在这个图像中,反应者(reactor)是一个戴着防尘面罩的男士,也可以将他视为表征参与者(represented participant),而与他的视线相对的读者是互动参与者(interactive participant)。连接表征参与者和互动参与者之间的向量是图像中这位男士的视线,他的视线直接对着读者,眼神中有一丝无奈,呈现了他希望与读者交流的概念意义。

图像的人际功能体现为一种互动 (interaction),体现为接触、社会距离和态度三方面。语篇的互动功能通过男士的眼神与读者见的互动、男士与读者的距离和男士被拍摄的角度来实现。Kress & Leeuwen(2006:117)认为图像在传达意义时都有一个图像行为(image act),这种图像行为由表征参与者的凝视系统(system of gaze)来实现,这个系统表达的要么是索求,要么是提供。在这个语篇中,男士凝视读者,直接与读者建立了一种视线交流,他表达了一个索求行为,即希望获得读者的同情和理解。这位男士正对读者,表征参与者和互动参与者的近距离接触体现了两者之间的紧密关系;而水平的拍摄角度也使得男士与读者处于同一水平线,在态度上实现了表征参与者与互动参与者之间的对等关系。读者很容易产生移情心理,对于男士面戴夸张的防尘面具这个行为产生理解同情心理。而标题文字采用红色,突显了根治雾霾的重要性和严峻性,传递给读者一种人际意义。

语篇功能在多模态语篇中体现为页面上构图成分的布局 (composition),构图成分的位置不是任意的,而是涉及信息价值、视觉突显和阅读途径等,而阅读途径又是通过中心和边缘、上下、左右等选择来构建的(杨,2009)。该语篇分为上下两个框架,上面为图像部分,下面为文字标题部分。标题和图像紧密连接,标题文字是图像部分的延伸;图像渲染加强标题文字;两者相互补充和延伸,在意义上体现了一种逻辑衔接,从而实现了这个语篇文字和图像的信息衔接。而男士脸上的防尘面具占据了图片的中心位置,造成视觉突显,旨在引起人们的共鸣:雾霾已经严重影响人们的日常生活,必须要痛下决心,进行根治。

四、结论

综上所述,在这个多模态语篇中,图像、文字、颜色等各种符号系统都参与了意义的构建和交流。这些符号系统共同作用,使得该多模态语篇表达的意义远远超过了单纯的文字符号表达的意义,产生了强度大的言外力量,表达了强烈的社会意义。这也就是为什么现代媒体在报道重大新闻时,往往采用图文结合的多模态语篇,而非单纯的文字语篇。

[参考文献]

[1]Kress G. & T. van Leeuwen. Multimodal Discourse: The Modes and Media of Contemporary Communication [M]. London: Arnold, 2003.

[2]Kress G. & T. van Leeuwen. Reading Images [M]. London: Rouledge,2006.

[3]韦琴红. 论多模态话语的整体意义构建 [J]. 天津外国语学院学报,2008,(6):16-21.

[4]辛志英. 话语分析的新发展――多模态话语分析 [J]. 社会科学辑刊,2008,(5):208-211.

[5]杨信彰. 多模态话语分析和系统功能语言学 [J]. 外语教学,2009,(4):11-14.

图像分析论文篇8

由於在现今资讯流通普遍的社会中,影像的需求量越来越大,影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大,在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式,在压缩率及还原度皆有不错的表现,为其尚未有一标准的格式,故在应用上尚未普及。但在不久的未来,其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波(WAVELET)转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。

壹、前言

由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。

贰、WAVELET的历史起源

WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。

1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。

三、WAVELET影像压缩简介及基础理论介绍

一、WAVELET的压缩概念

WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。

WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。

WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。

以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。

二、影像压缩过程

原始图形资料色彩模式转换&n

bsp;DCT转换量化器编码器编码结束

三、编码的基本要素有三点

(一)一种压缩/还原的转换可表现在影像上的。

(二)其转换的系数是可以量化的。

(三)其量化的系数是可以用函数编码的。

四、现有WAVELET影像压缩工具主要的部份

(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。

(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。

(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。

(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。

(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。

(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。

肆、WAVELET影像压缩未来的发展趋势

一、在其结构上加强完备性。

二、修改程式,使其可以处理不同模式比率的影像。

三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。

四、加强运算的能力,使其可支援更多的影像格式。

五、使用WAVELET转换藉由消除高频率资料增加速率。

六、增加多种的WAVELET。如:离散、零元树等。

七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。

八、增加8X8格的DCT模式,使其能做JPEG的压缩。

九、增加8X8格的DCT模式,使其能重叠。

十、增加trelliscoding。

十一、增加零元树。

现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。

伍、影像压缩研究的方向

1.输入装置如何捕捉真实的影像而将其数位化。

2.如何将数位化的影像资料转换成利於编码的资料型态。

3.如何控制解码影像的品质。

4.如何选择适当的编码法。

5.人的视觉系统对影像的反应机制。

小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。

陆、在印刷输出的应用

WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。

有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。

在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。

图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。

柒、结论

WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。

参考文献:

1.Geoff&nb

sp;Davis,1997,WaveletImageCompressionConstructionKit,。

2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。

3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。

4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。

5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。

6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。

7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。

附录:

嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送

目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。

阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。

基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。

LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。

LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。

图像分析论文篇9

关键词 Lorenz系统 密码学 混沌加密 数字图像

中图分类号:TP393.08 文献标识码:A

随着数字多媒体技术和计算机网络技术的迅速发展,数字多媒体的安全性和保密性就越来越重要。数字图像的加密和解密在信息安全技术中尤其重要,希望加密后的图像类似于现实世界的白噪声,这样,未授权者就无法得到图像的有效信息,实现了数字图像信息的安全和保密。而传统的对文本加密的方法无法适应数字图像自身的特点,所以不适合应用于数字图像加密。混沌理论是一种新兴的非线性理论,它具有以下几个特征:对初值敏感性、不可预测性、非线性、伪随机性。这些特性非常适合于数字图像信息的加密。但是混沌序列是一种高度依赖迭代精度的序列,当理论精度是无穷大时,混沌序列可以看作是理想的随机序列,近似于现实世界的白噪声。实际应用中,由于计算部件精度的限制和实现成本的制约,都无法达到无穷的计算精度,这样得到的混沌序列就是一种有周期的伪随机序列。

1 Lorenz系统介绍

Lorenz混沌系统是美国著名的气象学家洛伦兹在1963年研究大气运动时提出的,其方程组表达式如下:

其中表示对流运动的振幅,与运动强度成正比;表示上升流与下降流的温度差;表示垂直温度分布与线性温度廓线的偏差,即垂直温度分布的非线性度;表示流体分子的粘性系数;为瑞利数;为几何因子,没有直接的物理意义。

1.1 加密算法的密钥设计

混沌模型用于加密算法中的时候,这些混沌模型的参数和系统初始值理论上都可以作为加密算法的初始密钥。但是为了使得加密算法有良好的安全性能,必须保证这些超混沌模型能够进入超混沌状态,因此,在算法中,仅仅把这三个模型中每一个模型的初始值,作为算法的初始密钥,由用户输入,而把这些模型中的所有系统参数都按照上面给出的进入超混沌状态时的取值在算法中固定下来。

另外,为了区分不同模型的初始值,将这三个模型中的初始值,分别记作M,N;A,B;U,V。即混沌模型的两个初始值在加密算法中记为M,N;超混沌模型的两个初始值在加密算法中记为A,B;混沌模型的两个初始值在加密算法中记为U,V。

所以初始密钥K是一个6元组,包含6个子密钥:

K=(M,N,A,B,U,V)。

1.2 加密算法原理

利用图像像素值替换算法,对置换后的图形进行像素值的修改,得到最终的密文图像。解密的过程与加密相似,采用相同的初始密钥,对超混沌模型进行迭代,分别生成置换矩阵、密钥流矩阵和替换次序矩阵。先将密钥矩阵与密文按位进行异或操作,再把结果根据置换矩阵进行逆向置换,既可以解密为初始明文。

2 算法的安全性分析及实验结果

对256*256大小的灰度lena图像,采用Matlab工具对优化后的多级混沌加密算法进行实验,并对实验结果进行安全性分析。

2.1 实验结果

对原始图像进行加密,输入的初始密钥(未经字符化处理)K(M,N,A,B,U,V)=(4.32,0.25,0.17,0.66,1.67,2.05)。

可以看出,利用该多级混沌图像加密算法,使得原始图像被充分的置乱与替换,直观上无法看出原始图像的痕迹。

2.2 密钥空间和密钥敏感性分析

本算法的初始密钥未经字符化处理前,为实数,由6个子密钥构成。若计算机的精度为1015,则密钥空间远远大于1090,完全可以抵抗穷举法的攻击。密钥经字符化处理后,密钥空间为位字符(≥6),所以密钥空间为256n,当足够大时,可以抵抗穷举攻击;另外,由于算法加入了时间戳,实际密钥空间也极大增加。利用正确的初始密钥,可以对加密图像进行解密,解密后的图象质量良好。另外,当解密密钥发生微小的错误(0.001)时,不能正确还原图像,解密图像混乱无序,没有意义。这说明,解密过程对密钥非常敏感,算法的安全性较高。

2.3 相关性分析

从加密图像中随机抽取1000对垂直相邻的像素,对它们的相关性进行分析。图中横坐标表示像素点()的像素值,纵坐标表示像素点( +1)的像素值。

可以看出加密后图像的相邻像素值较为均匀得分布到了整个像素值空间。相邻像素值不仅仅在低值空间均匀分布,在高值空间也同样均匀分布。这说明,加密后的图像灰度分层现象消失,因而图像的相关性大大减弱。

采用相关性计算公式,对算法的加密图像计算相关系数,结果如表1所示。

表1 加密图像的相关系数

说明加密算法使图像的相关性降低,具有较高的抗攻击能力。

图像分析论文篇10

关键词:地理信息系统;遥感数字图像处理;教学改革

作者简介:刘春国(1973-),男,河南上蔡人,河南理工大学测绘与国土信息工程学院,讲师;卢晓峰(1981-),女,河南洛阳人,河南理工大学测绘与国土信息工程学院,讲师。(河南焦作454000)

基金项目:本文系河南理工大学教育教学改革研究项目(项目编号:2008JG035)的研究成果。

中图分类号:G642.0     文献标识码:A     文章编号:1007-0079(2012)10-0081-02

当前,遥感已经或正在走向全面应用阶段。国际遥感应用发展的实用化、业务化、产业化、精细化特征明显,但我国遥感应用水平还不高,根本原因是基础研究薄弱,缺乏多学科人才共同努力。[1]培养一大批经过系统知识培训、熟练掌握遥感科学理论和应用技能的地理信息科学人才,满足社会对地理遥感信息高技术人才的迫切需求,是高等教育的责任所在。

1998年教育部新增地理信息系统本科专业后,我国GIS教育发展形势空前活跃。经过10余年的教学实践和探索,逐步形成了比较稳定的GIS专业课程体系与课程设置方案。[2-5]遥感系列课程(遥感物理与技术、遥感数字图像处理、遥感地学分析与应用)成为GIS专业课程体系中的重要模块,说明GIS学科建设的负责人已认识到培养掌握遥感技术的GIS人才的重要性。遥感数字图像处理是遥感过程的重要一环。充分利用各种图像处理算法从遥感数据中获取各种生物物理参数和土地覆被/利用信息,可以为自然和人文生态系统的空间分布式模型提供输入参数,在遥感技术应用中占有十分重要的地位。近几年河南理工大学(以下简称“我校”)GIS专业开设了“遥感数字图像处理”课程。围绕如何提高“遥感数字图像处理”课程教学质量,笔者从革新课程体系、协同教学、优化教学内容、丰富实践教学手段等方面进行了一系列探索。

一、革新遥感课程体系,突出“遥感数字图像处理”课程地位

随着遥感技术及其应用的迅速发展,很多专业开设了“遥感原理与应用”课程,内容分为三大模块:遥感基础、遥感图像处理及分析方法和遥感专题应用。这种课程设置模式比较适合早期GIS专业遥感课程教学或选修遥感科学技术的某些专业,对于当前GIS专业遥感教学则存在明显缺点。主要问题是对“遥感数字图像处理”教学重视程度不够,对数字图像处理在整个遥感过程中的重要性体现不足,与遥感地理信息系统融合集成的一体化趋势不相适应,与国民经济各部门遥感业务日益普及的态势不相适应,与社会信息化深入发展的状况不相适应。人才培养滞后于社会需要,不能满足对高素质地理遥感科技人才的需求。

我校GIS专业总结多年遥感课程教学实践经验,革新了遥感课程体系,设置了“遥感概论”、“遥感数字图像处理”、“遥感应用分析”、“遥感数字图像处理实验”等遥感相关课程,规划了遥感系列课程的主体教学内容。“遥感概论”要求学生掌握遥感及其应用的基本科学工程背景知识,重点内容是电磁波与地表物质相互作用的基本原理、遥感数据采集、传输和成像机理,从可见光-近红外、热红外、微波(主动方式和被动方式)波谱段介绍遥感信息的获取特点和技术发展,适当涉及大气遥感、海洋遥感等应用领域和典型案例。“遥感数字图像处理”要求学生掌握基于数字图像处理方法获取地球资源有用信息的科学与技术。由于学科交叉融合,数字图像处理方法众多,新理论、新方法不断推出,课程重点主要着眼于图像处理基本知识和遥感图像处理常用算法,对一些探索性、前沿性和跨学科的内容从原理上予以概括介绍,如图像亚像元分类、模糊分类和面向对象图像处理等等。“遥感应用分析”采用理论、方法和实例相结合,选择不同遥感应用领域的典型案例介绍,培养学生遥感专题分析技能,深化学生对于遥感科学技术应用现状和广阔前景的认识。“遥感数字图像处理实验”课程着眼于培养学生图像处理技能,巩固和深化理论课程教学内容,提高动手能力和理论联系实际解决问题的能力。

我校GIS遥感系列课程设置方案把“遥感数字图像处理”与“遥感数字图像处理实验”单独设课,提升课程地位,加大课程学时,强化实践技能训练,对提高“遥感数字图像处理”课程的教学成效很有益处。这种课程设置模式有助于培养GIS专业学生采用图像分析方法解决遥感应用问题的能力,比较契合我国GIS专业本科教育遥感课程设置的发展态势。

二、培育遥感系列课程教学群体,分工协作提高“遥感数字图像处理”课程教学质量

GIS专业遥感系列课程设置要求具备一定规模的师资力量。遥感是多学科的综合,交叉性强,研究方法不断补充和更新,课程教学内容丰富。遥感系列课程的设置决定了课程之间存在密切的内部联系。要提高“遥感数字图像处理”课程教学质量,必须打破教师个人单兵作战的惯常做法,加强与相关课程教师之间的协调和交流。培育组建了承担遥感系列课程教学任务的教学群体。遥感课程教学组围绕课程建设,整合优化课程体系,充实更新教学内容,保证了课程之间教学内容的连贯性和相关性。课程教学组成员互相学习、借鉴、交流,协同规划各课程教学环节的教学要求和学时分布,课程内容更加先进,课程结构更加协调,教学方法更加有效,教学手段更加丰富,实践教学得以充实,教学科研联系更加密切。遥感课程教学组的建立和协作对提高“遥感数字图像处理”课程教学质量起了明显的作用。

三、汇聚国内外优秀教材成果,整合优化教学内容体系

教学内容和课程体系涉及高等教育人才培养的模式,决定了高等学校人才培养的规格,在很大程度决定了人才培养的质量和水平。[6]教学中适度引进世界著名高校的名牌课程教材和教学参考用书,是高等教育国际化的重要举措。[7]遥感课程教学组重视遥感数字图像处理课程教材和教学内容建设,收集了国内近些年出版的如戴昌达、章孝灿、汤国安、韦玉春、朱述龙等编写的遥感数字图像处理教材教参,注意引用吸收国外著名高校的遥感图像处理相关教材教参,参考了John R. Jensen、John A. Richards、Robert A. Schowengerdt、Jay Gao、John R. Schott、Brandt Tso等人的遥感数字图像处理著作,认真研讨不同教材特点及其开课对象,针对遥感数字图像处理理论性强、概念抽象、方法多样、实践性强的特点,根据教学对象和课程学时,按照系统性和前瞻性结合、理论与应用结合的要求,制订了教学主体内容。课程内容分为11个部分:图像基本知识、遥感图像成像过程与数据特征、遥感图像辐射校正、遥感图像几何变换与校正、遥感图像增强、遥感图像变换、遥感图像分割、遥感图像融合、遥感图像分类、数字变化检测、遥感图像应用处理。优化后的课程教学内容注意了与“遥感概论”、“遥感应用分析”等课程内容的有机衔接。对于与“遥感概论”课程有重叠的内容只做简单回顾,如遥感成像过程、机理与数据特征,以少数典型应用案例揭示遥感数字图像处理方法在遥感应用分析中的作用和地位;避免与先开课程内容重复,为后续课程做适度铺垫。数字图像处理方法多样,课程重点介绍常用算法,使学生能掌握数字图像处理原理,夯实基础。对一些发展中的、前沿性的算法着重介绍算法的思想和原理,教导学生注重算法但不应局限于具体算法,培养学生发散思维、学习能力和创新思维。教学中适当区分遥感数字图像系统处理和应用处理的差别。

四、重视实践教学,多手段丰富实践教学内容

实践教学是创新人才培养中的重要环节,对于培养学生专业技能和理论实践结合能力、激发学生的创新思维和探索精神、提升科研能力,有着重要意义。GIS专业“遥感数字图像处理”教学高度重视实践教学环节,从课程体系设置、实验课程内容设计、实验室开放项目、毕业设计、大学生科研训练计划和教师科研课题等几个方面为学生提供多样化的实践途径,丰富了实践教学体系。

从课程设置体系上,“遥感数字图像处理”单独设课,紧密联系课程理论教学内容附设6个单元的基础验证性课堂实验(见表1),增强学生对各种遥感图像处理算法及其效果的感性认识。“遥感数字图像处理”实验课程单独设课,结合“遥感数字图像处理”课程和“遥感应用分析”课程知识,设置综合设计型实验6个模块,培养和提高学生对知识与技能的综合运用、自主学习的能力。

积极利用各种平台,提供实践课题,培养学生创新能力。我校为了培养大学生的创新能力和实践能力,促进实验室开放,设置了实验室开放基金。在实验室开放基金平台支持下,设计了一些探索研究型实验课题,鼓励学生组团选择实验课题、查阅文献、拟定实验方案、实施实验过程、撰写实验论文。大学生科研训练计划和本科毕业设计(论文)也是培养本科生创新能力的平台。在实施学校大学生科研训练计划的年度,遥感课程组每年设计几个遥感应用分析研究小课题,供学生参与大学生科研训练,并从科研课题中提炼一些问题作为大学生毕业设计选题,引导学生参与到教师科研课题中。学生通过参与实验室开放基金课题、大学生科研训练计划项目和教师科研课题,检验了专业知识,培养了探索精神、创造思维和合作能力。

五、结束语

本文总结了我校遥感课程教学组围绕GIS专业“遥感数字图像处理”课程教学实施的一系列教学改革措施。这些措施已经取得较好的成效,有不少GIS学生积极参与校实验室开放基金项目、大学生科研训练计划项目和教师科研项目,每年GIS专业有近1/3的学生选择与遥感图像处理及遥感应用分析有关的毕业设计题目。人才培养是项长期复杂的系统工程,需要从师资、设备、教学等一系列软硬件教学条件上予以保障。

参考文献:

[1]李小文.定量遥感的发展与创新[J].河南大学学报(自然科学版),2005,(4):49-56.

[2]秦其明.中国高校GIS专业核心课程设置问题的探讨[J].地理信息世界,2003,(4):1-7.

[3]钱乐祥.GIS专业课程体系改革思路与实践[J].高等理科教育,2006,(6):95-98.

[4]谈树成,刘恒,夏既胜,等.关于地理信息系统(GIS)本科专业课程设置的思考[J].高等理科教育,2008,(4):47-50.

[5]李天文,王林刚,李庚泽,等.地理信息系统专业课程体系建设研究[J].中国大学教学,2011,(1)3-5.