数字图像范文10篇

时间:2023-03-19 22:14:25

数字图像

数字图像范文篇1

关键词:嵌入式系统,图像采集,电路设计

Abstract:Inthispaper,wepresenttwodifferentinterfacesbetweendigitalaimagesensorsandaprocessorforembedsystems,I/OmodeandDMW(DirectMemoryWrite)mode.InI/Omode,processorcanreadimagedatathroughI/Oport,andtheinterfaceissimple.InDMWmode,imagedatacanbewriteintoRAMdirectlywhileaprocessorissuspended.

Keywords:EmbedSystem,ImageCapture,ElectronicCircuit

一、引言

随着半导体技术的飞速发展,具有图像功能的嵌入式应用愈来愈多。从数码相机、可视电话、多功能移动电话等消费产品到门禁、数字视频监视等工业控制及安防产品,图像采集和处理已成为重要的组成部分之一。图像采集需要进行同步信号的处理,比通常的A/D数据采集过程复杂,电路的设计也较为困难。传统PC上的图像采集卡都是在Philips、Brooktree等半导体公司提供的接口芯片基础上,由专业公司开发生产。在嵌入式系统中不同的处理器和图像传感器的信号定义及接口方式不同,没有通用的接口芯片。另外,利用系统中的现有资源设计图像采集电路,可以减少器件数量、缩小产品体积和降低系统成本。所以,通常嵌入式系统中要求自行设计图像采集接口电路。本文针对不同采集速度的要求,提出了两种图像采集接口电路的设计方法。

目前市场上主流的图像传感器有CCD、CMOS两种器件,其中CMOS器件上世纪90年代产生,近年来得到了迅速发展。传感器的输出有模拟和数字两种。由于CMOS器件功耗小、使用方便,具有直接数字图像输出功能,作者在设计时选用了CMOS数字输出图像传感器件。其他方式器件的接口设计与此类似,将在讨论中说明。

本文内容做如下安排:第二部分简述图像信号的特点;第三、四部分分别介绍I/O和内存直接写入两种接口设计方法;最后部分是讨论。

二、图像信号介绍

图1给出了采样时钟(PCLK)和输出数据(D)之间的时序关系。在读取图像数据时用PCLK锁存输出数据。除采样时钟(PCLK)和数据输出(D)外,还有水平方向的行同步信号(HSYNC))和垂直方向的场同步信号(VSYNC)。对于隔行扫描器件,还有帧同步信号(FRAME)。如图2,一帧包括两场。图2中窄的矩形条是同步脉冲,同步脉冲期间数据端口输出的数据无效。

PLCK存在时,图像数据端口连续不断地输出数据。由于行之间以及场之间输出数据无效,在采集图像数据必须考虑同步信号,读取有效数据才能保证图像的完整性。

三、I/O接口设计

对于MCU、DSP处理器,I/O是最方便的访问方式之一。以I/O方式读取图像数据不仅可以简化电路设计,而且程序也很简单。但由于读取每一个像素都要检测状态,在处理器速度低的情况下,读取图像慢。在处理器速度快或图像采集速度要求不高的应用中,I/O接口方式是一个较好的选择。

1、电路原理和结构

在图像传感器和处理器之间,利用两个锁存器分别锁存状态和图像数据,处理器通过两个I/O端口分别读取。图3中,在采样时钟的上升沿数据锁存器保存传感器输出的图像数据,当处理器通过I/O口读取图像时,数据锁存器输出数据。其它情况下,锁存器输出处于高阻状态。处理器通过状态锁存器读取同步信号和图像就绪(Ready)指示信号。在数据锁存器保存图像数据的同时,状态锁存器产生Ready信号(从‘0’到‘1’)。处理器读取图像数据时,Ready信号自动清除(从‘1’到‘0’)。处理器读取状态时锁存器驱动总线,其他情况下输出处于高阻状态。

2、图像读取流程

要保证图像的完整性就必须从一场图像的第一行开始读取,对于隔行扫描输出的图像则必须从一帧的第一行开始读取。读取每行图像数据时,则从该行的第一个像素开始。因此,在读取图像数据前应先判断场和行的起始位置。图4是通过I/O接口方式读取图像数据的流程。读取每个像素数据前先查询数据状态,如果数据已准备好则读取数据。

3、同步信号检测

为了简化电路设计,用处理器直接读取同步信号,然后找出场和行的起始位置。

从图2可以看出,处理器读取同步信号时,信号可能处在同步脉冲状态(‘1’)或正常状态(‘0‘)。对于那些同步信号反向的器件,则分别为‘0’和‘1’。如果信号处于同步脉冲状态,第一次检测到的正常状态就起始位置。如果信号处于正常状态,则首先检测到脉冲状态,然后用同样的方法确定起始位置。

通过上述方法可以检测出场的起始位置和行起始位置。

4、用VHDL设计锁存器

在应用中,以上两个锁存器的功能和其他逻辑集中在一起,用可编程逻辑器件实现。下面分别为它们的VHDL表示。

设DO(0-7)是锁存器输出端,DI(0-7)是锁存器输入端,DM(0-7)是中间状态,Data_R是数据读信号(低电平时有效),则数据锁存器的VHDL描述为:

Process(reset,PCLK)--锁存图像数据

Begin

Ifreset=''''0''''then

DM<="00000000";--清除数据

ElseifPCLK''''eventandPCLK=''''1''''then

DM<=DI;--锁存数据

Endif;

Endprocess;

Process(DM,Data_R)--读取图像数据

Begin

IfData_R=''''0''''then

DO<=DM;--输出图像数据

Else

DO<="ZZZZZZZZ"--输出高阻

Endif;

Endprocess;

进一步设数据有效状态为Dstatus,状态读写信号为Status_R(低点平时有效),则状态锁存器的VHDL描述为:

Process(reset,PCLK,Data_R)--数据有效状态控制

Begin

Ifreset=''''0''''orData_R=''''0''''then

Dstatus<=''''0'''';--清除状态

ElseifPCLK''''enentandPCLK=''''1''''then

Dstatus<=''''1'''';--设置状态

Endif;

Endprocess;

Process(Dstatus,Status_R)--读取状态和同步信号

Begin

IfStatus_R=''''0''''then

DO0<=Dstatus;

DO1<=VSYNC;

DO2<=HSYNC;

DO3<=FRAME;

Else

DO<="ZZZZZZZZ";--高阻状态

Endif;

Endprocess;

四、内存直接写入接口设计

在处理器速度较慢且图像数据输出的频率不能降低的情况下,采用上述I/O接口方法不能得到完整的图像。另外,有些应用中要求能够实时采集图像。为此,我们设计了高速数据图像采集方法―内存直接写入法。由于SRAM访问控制简单,电路设计方便,被大量嵌入式系统采用,本文以SRAM作为存储器。

1、电路原理和结构

内存直接写入方法通过设计的图像采集控制器(以下简称控制器)不需处理器参与,直接将图像数据写入系统中的内存中,实现高速图像采集。

图5是接口结构图,当需要采集图像时,处理器向控制器发出采集请求,请求信号capture_r从高到低。控制器接到请求脉冲后,发出处理器挂起请求信号HOLD,使处理器的外总线处于高阻状态,释放出总线。控制器收到处理器应答HOLDA后管理总线,同时检测图像同步信号。当检测到图像开始位置时,控制器自动产生地址和读写控制信号将图像数据直接写入内存中。图像采集完成后,控制器自动将总线控制权交还处理器,处理器继续运行,控制器中与采集相关的状态复位。控制器可以根据同步信号或设定的采集图像大小确定采集是否完成。

在图5中,控制器包括同步信号检测、地址发生器、SRAM写控制器、总线控制器和处理器握手电路等主要部分。同步信号检测确定每一场(帧)和每一行的起始位置;地址发生器产生写SRAM所需的地址;SRAM写控制器产生写入时序;总线控制器在采集图像时管理总线,采集完成后自动释放;处理器握手电路接受处理器命令、发总线管理请求和应答处理器。

2、SRAM写控制时序

采集图像过程中,控制器自动将数据写入到硬件设定的内存中。写内存时,控制器产生RAM地址(A)、片选信号(/CS)、读信号(/RD)和写信号(/WD),同时锁存传感器输出的数据并送到数据总线(D)上。每写入一个数据后,地址(A)自动增1。采集时/CS保持有效(‘0’)状态而/RD处于无效状态(‘1’)。地址A的变化必须与/WD和数据锁存器协调好才能保证图像数据的有效性。

图6是控制器产生的SRAM信号时序图。用PCLK作为地址发生器的输入时钟,且在其上升沿更新地址值。同样,在PCLK的上沿锁存数据并输出到总线上。将PCLK反相,作为/WD信号,使得在/WD的上升沿地址和数据稳定,确保写入数据的有效性。

3、控制器主要功能的VHDL描述

描述控制器中全部功能的VHDL代码较长,而且有些部分是常用的(如计数器等)。图像采集状态产生和同步信号的检测是其中重要的部分。下面介绍这两部分的VHDL描述。

图像采集状态capture_s:

处理器的采集请求信号capture_r使capture_s从‘0’到‘1’,场地址发生器(计数器)的溢出位vcount_o,清除capture_s。

process(capture_r,reset,vcount_o)

begin

ifreset=''''0''''orvcount_o=''''1''''then

capture_s<=''''0'''';--清除

elseifcapture_r''''eventandcapture_r=''''0''''then

capture_s<=''''1'''';--置状态位

endif;

endprocess;

同步信号检测:

只有在采集状态capture_s有效时(‘1’)才检测场同步信号,场同步信号下降沿置场有效状态(vsync_s),场地址发生器溢出位vcount_o清除场有效状态。只有在vsync_s有效情况下才检测行同步信号,行同步信号下降沿置行有效状态(hsync_s),行计数器溢出信号hcount_o清除行状态。只有在行状态有效的情况下计数器才工作,且将数据写入RAM。

Process(capture_s,reset,vcount_o,vsync)

Begin

Ifreset=''''0''''orvcount_o=''''1''''orcapture_s=''''0''''then

Vsync_s<=''''0'''';--清除

Elseifvsync''''eventandvsync=''''0''''then

Vsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

Process(vsync_s,reset,hcount_o,hsync)

Begin

Ifvsync_s=''''0''''orreset=''''0''''orhcount_o=''''1''''then

Hsync_s<=''''0'''';--清除

Elseifhsync''''eventandhsync=''''0''''then

Hsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

五、讨论

我们在基于TI公司的TMS320C3X系列DSP开发的嵌入式指纹图像处理模块中分别用上述两种方法成功实现了指纹图像的采集。

采用I/O接口方式最关键的是要求处理器的频率远高于图像数据输出的频率。例如,如果处理的指令周期为20ns,读取每个数据需要10个指令周期,则数据的输出频率不能超过5MHz,它低于一般的CMOS图像传感器件最快的数据输出频率。例如国内使用较多的OV7610和OV7620,其正常输出数据频率为13.5MHz。在应用过程中,通常改变传感器中寄存器的设置值,降低其数据输出频率。

本文选用的是CMOS数字输出图像传感器。对于模拟视频信号,在设计时应加同步分离和A/D转换电路。图像采集的数字接口和逻辑控制与本文相同。

数字图像范文篇2

【关键词】数字图像;分析软件;应用

数字技术的进一步发展,使得数字相机进入到了亿像素的时代,通过数字成像的方法应用就成为了主流,数字的成像质量优劣就对印刷品复制图像质量有着直接影响,而对图像质量的分析,就要使用专业的分析软件。在对数字图像质量分析软件计量技术应用研究下,就能有助于对技术有更深的认识。

1数字图像质量分析软件计量的现状及计量误差分析

1.1数字图像质量分析软件计量的现状

数字技术的迅速发展下,一些软件的数量也开始增多,各种软件在人们的生产生活当中都得到了广泛应用,并发挥着积极作用。软件系统功能的多样化,以及软件的准确可靠的运行成为重要考虑的要素。软件的应用一旦出现了故障,就会造成很大的损失。加强软件的应用准确计量就显得比较重要[1]。当前的国内国外对软件计量的技术研究方面都在不断的努力,如美国方面对软件计量的任务实施,就是通过模型的建立以及程序和测量等来保障润软件的安全可靠性。我国的计量院一些研究人员,对软件的计量技术也进行了相应研究,在对源代码以及可执行代码文本状态等层面进行展开的研究分析。当前的软件计量技术主要还是测试为主。通过软件的测试就能对软件当中所存在的问题有明确认识,从而对软件的功能性能能否满足用户实际需求进行验证。而在对软件的验证过程中,对软件的评审以及测评并不能完全说明软件计量的准确性,不能对软件中不存在的缺陷进行确认。

1.2数字图像质量分析软件计量误差

数字图像质量分析软件的计量技术应用中,受到多方面因素的影响就存在着一些误差,而对这些误差的来源能详细分析加以明确,对提高软件计量技术的水平就比较有利。通过软件计量就和物理计量有着很大差别。软件计量当中的溯源源头是什么要能明确。具体的软件测量过程中,较为常用的单位有像素以及比特等,还有就是由这些单位导出的单位,所导出的单位就不属国际单位制,在当前是不是能用来源头要和怎样素养是需要讨论的[2]。在对软件的计量过程中,对于不确定度进行定义也是比较重要的。有计算机系统以及软件的结构上比较复杂,在对代码查找问题和原理研究不确定度就有着超大工作量,也是不太现实的。软件自由的特征,在偶然误差方面可为零,在这一过程中不确定度评估以及有无还没有标准的结论。根据相应的研究分析工作实施,对软件的应用中所存在的误差主要体现在手段引起的近似值以及精确值的误差[3]。通过对有限位数浮点数进行对实数表示的时候,就会产生舍入的误差,而在一定情况下,这一误差也会随着运算次数逐渐的扩大,所造成的偏差就会比较大。在这一层面的误差出现就比较容易是软件的定义差错。较为常见的就是阿里安娜5号火箭软件系统想将64位浮点数转变成16浮点数,结果就造成了溢出差错。但是也有可能是软件通过平台中的一些核心芯片应用,由于性能比较差,这就会造成计算的精度受到很大的限制。除此之外,还有一类的软件计量误差就是不确定性造成的。由于神经网络的复杂算法,在模型上有着内在不确定性,在具体的计算过程中就比较容易出现差错。而模型的确定算大在同样功能函数不同实现也会带来误差。比较常见的高斯-牛顿,最小二乘法等数值的优化算法选取方面,对于不同的起始位置以及边界条件设定,对计算的结果也可能带来相应的误差。就算是同功能以及模型软件,计算的结果也会可能出现误差[4]。这些误差的存在是软件计量当中所出现的不确定度的来源,对软件计量技术应用中的误差减小,在当前仍是一个比较重要的研究课题,相信在未来的发展过程中,这一问题就能得到有效解决。

2数字图像质量分析软件校准方法及应用效果

加强对数字图像质量分析软件计量的校准就是当前比较重要的工作,在通过对软件计量通用体系提出之后,对软件计量过程中存在的不确定度来源进行了简要分析,通过和数字图像质量分析算法作为标准来实施分析,通过这一有着代表性的软件计量技术应用,在高质量数字图像方面于遥感以及探月等系统的结合度比较紧密,所以将其作为研究的标准就有着现实意义。对软件功能的实现,不一样的厂商所提出的实现方案也有着不同,在对软件的应用中也会带来相应误差,对算法优劣评估就要注重标准案例集,在经过了对比之后,就能够对软件系统的不确定因素加强分析。对于相对比较简单化的软件来说可能没有误差,但相对复杂的应用软件就比较容易出现误差[5]。在对软件的测试评估过程中,就要能构建足够的有漏洞的测试案例集,对数字图像质量分析算法进行评估。当前比较常用的图像数据库进行对图像质量分析算法优劣进行评估,较为突出的就是LIVE等等。对存在的测试方案进行了参考之后,就可提出数字图像质量分析软件校准的方法实施。通过校准方法中所构建的图像库作为标准器,在这一图像库中所涉及到的内容比较多,有参考图像以及不同质量损伤失真图像,在对国际高跟算法对图像质量实施标定,这样就能够对被测图像质量分析软件分析相应参考图像以及失真图像,在经过了对比之后就能给出相应计算机结果,在和标定值对比后就能对图片质量准确性得以明确。在对这一方法的应用过程中,要能抓住重点,对标准库的选择以及算法标定中,对误差的估计要加强重视。通过结构相似度算法作为最优算法,结构相似度能够把对比度以及亮度从图像结构信息当中进行分离,然后结合结构信息对图像质量加以评价,将其作为图像质量评价指标在视频输码标准当中的校验模型中应用。设x和y分别是参考图像和失真图像,结构相似度指标由亮度比较函数l(x,y)、对比度比较函数c(x,y)以及结构比较函数s(x,y)合并加权得到,在经过了计算之后就能够得到结果[5]。部分内容中对结构相似度算法的应用,会存在相应误差,结构相似度模型相对来说是比较确定的,影响变量主要敞亮。在计算中通过输入图像方式,就能直接选取有代表性图像。设计中可能会受到一些因素影响产生少许的波动,软件当中存在着不确定的因素所致[6]。在此次的研究中,在通过例子的算法比较简单,方法的应用是相通的,对于不确定因素在对蒙特卡罗的方法应用下会对实际计算结果产生误差,这就需要按照相应标准进行评估。

3结语

总而言之,对于软件计量技术的应用,在随着技术的进一步优化下,就能有助于计量的准确性提高。在此次对软件计量技术的应用下,主要是将数字图像质量分析作为主要的标准实施的,希望能通过此次研究,能对软件计量的作用发挥起到积极作用,从而保障数字图像质量分析结果的准确性,这对软件计量的进一步水平提高也有着积极意义。

作者:姜萍 单位:江西省计量测试研究院

参考文献

[1]赵真非.数字图像秘密分享技术的研究[J].中小企业管理与科技(下旬刊),2016(12).

[2]胡晶.数字图像的优势及设计应用[J].美术教育研究,2015(05).

[3]黄崑,杨梽永,李一平,白雅楠.个人数字图像管理行为初探[J].情报探索,2014(02).

[4]王刚.数字图像的快速与科学识别研究[J].艺术与设计(理论),2015(12).

数字图像范文篇3

关键词:数字图像;图像压缩;压缩技术;任意形状可视对象编码

Abstract:Digitalimagecompressiontechnologyisofspecialintrestforthefasttransmissionandreal-timeprocesssingofdigitalimageinformationontheinternet.Thepaperintroducesseveralkindsofthemostimportantimagecompressionalgorithmsatpresent:JPEG,JPEG2000,fractalimagecompressionandwavelettransformationimagecompression,andsummarizestheiradvantageanddisadvantageanddevelopmentprospect.Thenitintroducessimplythepresentdevelopmentofcodingalgorithmsaboutarbitraryshapevideoobject,andindicatesthealgorithmshaveahighcompressionrate.

Keyword:Digitalimage;Imagecompression;Compresstechnique;Arbitraryshapevisibleobjectcode

一、引言

随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。

二、JPEG压缩

负责开发静止图像压缩标准的“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。

1.JPEG压缩原理及特点

JPEG算法中首先对图像进行分块处理,一般分成互不重叠的大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点如下:

优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。

缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50[2]。

JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的[3]。

2.JPEG压缩的研究状况及其前景[2]

针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:

(1)DCT零树编码

DCT零树编码把DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。

(2)层式DCT零树编码

此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。

JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。

三、JEPG2000压缩

JPEG2000是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。

1.JPEG2000压缩原理及特点

JPEG2000编解码系统的编码器和解码器的框图如图1所示[4]。

编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。

JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作[4]。

图1JPEG2000压缩编码与解压缩的总体流程

2.JPEG2000压缩的前景

JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等[5]。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。

四、小波变换图像压缩

1.小波变换图像压缩原理

小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的JPEG2000标准[2]。

2.小波变换图像压缩的发展现状及前景

目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。

(1)EZW编码器[6]

1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。

(2)EBCOT编码器[8]

优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。

小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点[2]。

(3)SPIHT编码器[7]

由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。

五、分形图像压缩

1988年,Barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的学生A.E.Jacquin提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。

1.分形图像压缩的原理

分形压缩主要利用自相似的特点,通过迭代函数系统(IteratedFunctionSystem,IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。

分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像[9]。

2.几种主要分形图像编码技术[9]

随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。

(1)尺码编码方法

尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度随着图像各个组成部分复杂性的不同而改变。

(2)迭代函数系统方法

迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。

(3)A-E-Jacquin的分形方案

A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。

3.分形图像压缩的前景[2]

虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。

六、其它压缩算法

除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~[13]。

(1)形状自适应DCT(SA-DCT)算法

SA-DCT把一个任意形状可视对象分成的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应GilgeDCT[10][11]变换的有效变换,但它比GilgeDCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。

(2)形状自适应离散小波变换(SA-DWT)

Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。

在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。

(3)Egger方法

Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。

七、总结

图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

参考文献:

[1]田青.图像压缩技术[J].警察技术,2002,(1):30-31.

[2]张海燕,王东木等.图像压缩技术[J].系统仿真学报,2002,14(7):831-835.

[3]张宗平,刘贵忠.基于小波的视频图像压缩研究进展[J].电子学报,2002,30(6):883-889.

[4]周宁,汤晓军,徐维朴.JPEG2000图像压缩标准及其关键算法[J].现代电子技术,2002,(12):1-5.

[5]吴永辉,俞建新.JPEG2000图像压缩算法概述及网络应用前景[J].计算机工程,2003,29(3):7-10.

[6]JMShaprio.Embeddedimagecodingusingzerotreeofwaveletcoefficients[J].IEEETrans.onSignalProcessing,1993,41(12):3445-3462.

[7]ASaid,WAPearlman.Anewfastandefficientimagecodecbasedonsetpartitioninginhierarchicaltrees[J].IEEETrans.onCircuitsandSystemsforVideoTech.1996,6(3):243-250.

[8]DTaubman.HighperformancescalableimagecompressionwithEBCOT[J].IEEETransactionsonImageProcessing,2000,9(7):1158–1170.

[9]徐林静,孟利民,朱建军.小波与分行在图像压缩中的比较及应用.中国有线电视,2003,03/04:26-29.

[10]MGilge,TEngelhardt,RMehlan.Codingofarbitrarilyshapedimagesegmentsbasedonageneralizedorthogonaltransform[J].SignalProcessing:ImageCommun.,1989,1(10):153–180.

[11]TSikora,BMakai.Shape-adaptiveDCTforgenericcodingofvideo[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(1):59–62.

[12]TSikora,SBauer,BMakai.Efficiencyofshape-adaptive2-Dtransformsforcodingofarbitrarilyshapedimagesegments[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(3):254–258.

[13]EJensen,KRijk,etal.Codingofarbitrarilyshapedimagesegments[C].Proc.WorkshopImageAnalysisandSynthesisinImageCoding,Berlin,Germany,1994:E2.1–E2.4.

[14]MBi,SHOng,menton“Shape-adaptiveDCTforgenericcodingofvideo”[J].IEEETrans.CircuitsSyst.VideoTechnol.,1996,6(6):686–688.

[15]PKauff,KSchuur.Shape-adaptiveDCTwithblock-basedDCseparationandDeltaDCcorrection[J].IEEETrans.CircuitsSyst.VideoTechnol.,1998,8(3):237–242.

[16]OEgger,PFleury,TEbrahimi.Shape-adaptivewavelettransformforzerotreecoding[C].Proc.Eur.WorkshopImageAnalysisandCodingforTV,HDTVandMultimediaApplication,Rennes,France,1996:201–208.

[17]OEgger.Regionrepresentationusingnonlineartechniqueswithapplicationstoimageandvideocoding[D].Ph.D.dissertation,SwissFederalInstituteofTechnology(EPFL),Lausanne,Switzerland,1997.

[18]SLi,WLi,etal.Shapeadaptivevectorwaveletcodingofarbitrarilyshapedtexture[S].ISO/IECJTC/SC29/WG11,MPEG-96-m1027,1996.

[19]WLi,FLing,HSun.ReportoncoreexperimentO3(Shapeadaptivewaveletcodingofarbitrarilyshapedtexture)[S].ISO/IECJTC/SC29/WG11,MPEG-97-m2385,1997.

[20]SLi,WLi.Shapeadaptivediscretewavelettransformforcodingarbitrarilyshapedtexture[C].Proc.SPIEVCIP’97,1997,3024:1046–1056.

数字图像范文篇4

关键词:数字图像修复;文物保护;应用

作为人类活动与文化的重要产物,文物对于文化传承、遗产留存具有重要意义。但是在过去很长一段时间,因为技术有限,所以许多珍贵文物不仅难以有效保存,还会因为相关人员操作不当,加快文物损坏速度。而在信息化时代,在计算机技术高速发展下,数字图像修复技术进入文物保护领域中。利用数字图像修复技术可以提高文物复原效果,对于文物保护具有重要意义。

1数字图像修复技术概述

作为利用计算机技术与数字技术,对以往数字图像进行信息数据修复的现代科学技术,数字图像修复技术基于过去数字图像在处理、压缩过程中出现局部信息缺失的问题,对待修复物体进行专项修复。在获取图像的过程中,会受到外界或数据信息传递影响,造成图像部分或全部区域出现质量退化问题。数字图像修复技术将质量退化区域进行噪声去除,同时降低区域图像清晰度,利用滤波或参数等手段分析图像数据,构建相应集合模型,完成图像修复工作①。目前常用数字图像修复技术主要有基于变分PDE(Partial…Differential…Equation)图像修复技术,与基于快纹理合成图像补全技术。数字图像修复技术应用逐渐广泛,应用趋势也从数字图像破损区域自动识别,向信息缺失自动处理与修复方向发展。在各类计算机软件逐渐普及的环境下,数字图像修复技术也逐渐以智能化、简易化为主要发展趋势。而文物保护工作有对图像处理的需求,所以在文物保护方面,数字图像修复技术能够得到更为精准的应用。

2数字图像修复技术在文物保护应用中的意义

2.1文物保护现状

作为文化遗产的重要组成内容,文物具备较高的收藏价值,还可以在文化传统、历史见证等方面起到载体作用。研究人员可以通过研究文物,分析历史发展,在完善人类发展史方面具有较高的参考价值。但是因为保存不当或许多文物在搬运、保护等操作不规范时,会出现文物损坏问题,对于完整传承优秀文化,研究人类文明发展与更迭等都会带来严重损失。文物损坏也会对文化事业发展造成负面影响,降低文化可信度与真实性。但是文物保护也会受到多种因素影响,如理化反应、操作不当等,都极易造成文物损毁,造成巨大经济与文化损失②。尤其是文物修复主要以人工修复文物,需要从业人员拥有极高的专业技术,还需要有耐心、细心,导致文物修复无法量产化。但是文物修复领域极广,仅凭借人工修复远远无法满足文物修复的实际需求。尤其是从事文物修复的工作人员,专业素质无法采用制式考核,导致专业素质水平差异较大,难以对文物修复做到精准处理,人工修复方法会不可避免对文物造成损伤,这也是为什么文物保护需求技术更迭,寻求新方法、新手段进行文物保护。但是因为文物保护存在一定技术门槛,即使在过去计算机快速发展,各行各业都得到了不同程度的技术支撑,让原有工作迸发出新活力,文物保护领域仍因缺少相契合的技术手段,长时间陷入技术停滞状态。

2.2数字图像修复技术应用意义

在计算机技术快速发展的当下,数字图像修复技术的实用价值与修复效果逐渐被社会认可。相较于传统图像处理,数字图像修复技术利用计算机与相应软件、硬件作为技术载体,比纸张或胶片载体在保存方面更简单,图像内容可以得到有效保护。如果保存环境温度与湿度过高,纸张与胶片对于图像保存质量会大幅度下降,无法有效保证信息完整性,图像存储与使用上比数字图像修复技术更麻烦。在文物保护工作中,数字图像修复技术可以利用计算机,对需要修复文物进行全面的数据采集,给出公正客观的信息评价。技术人员可以利用评价结果选择文物修复最佳方式,缩减文物修复所需时间,提高修复工作的效率与质量。对于文物修复中可能会受到的负面影响,数字图像修复技术也能提供一定的抗感染能力,避免文物修复受到严重影响,提高文物综合利用价值。数字图像修复技术也为文物保护提供全新思路,并不局限于文物修复从业人员从业经验与个人艺术素质,对文物修复方法与技术选择、应用,而是以大量同类型文物数据信息作为参考,隔离文物的损毁部分,将文物完整部分与文物数据信息相匹配,以文物损毁原因加入考察因素,重新审视文物修复工作。在修复作业中规避经验主义,以实际数据为修复依据,完整呈现文物真实面貌,为恢复历史文化、研究文物技术提供更加真实的依据。

3数字图像修复技术在文物保护中的发展历史

图像修复技术在欧洲文艺复兴时期就已经有应用雏形,但是大多是艺术家在保持原图像完整时,对艺术作品损坏部位进行二次创作,使艺术作品恢复“原样”。但是受限于当时的技术手段,文艺复兴时图像修复需要由专业艺术家处理,且极容易对珍贵艺术作品产生二次损伤。而在工业时代,世界格局发生改变之后,图像修复技术也伴随计算机技术的广泛应用产生技术方面的革新。在美国与苏联竞相开展空间项目作业时,因为宇宙空间成像条件不佳,加上仪器与飞行器会对成像效果造成不同程度的损坏,需要使用计算机技术对图像进行修复,加快数字图像修复技术更新换代,但是也需要专业技术较强的技术人员操作,保障数据信息的安全性①。在如今互联网快速发展,扫描仪等设备及数字技术更新,数字信息数量以海量形式爆发,人们急需一种计算机技术处理照片信息。在这种需求背景下,数字图像修复技术从概念到实际应用,再到快速发展,迅速完成技术更迭。而文物保护需要稳定有效的技术对图像进行高质量修复,数字图像修复技术与文物保护融合也逐渐加深。两者相互促进、相互融合,提高数字图像修复技术的精准度,提高文物保护质量。

4数字图像修复技术在文物保护中的应用

4.1基于数字图像修复技术的文物虚拟修复技术

在文物保护工作中,将现有计算机技术与数字图像修复技术相融合,构建虚拟数据信息,完成对现存图像的提取与修复工作,从而达到修复图像满足视觉需求,恢复图像原有视觉效果的目的。图像修复是针对图像信息损失,采用科学技术对损失区域进行虚拟修复,对需要修复的图像的周边区域进行图像预估,并借助专业人员从业经验,对待修复区域进行技术模拟,寻找适合的修复方案,达到恢复图像原有状态的目的。而在文物保护领域,因为历史、环境等多种因素影响,导致现有出土或保留文物存在霉变、裂缝等多种病害。这不仅对文物欣赏造成一定障碍,对于研究文物相关信息也会造成信息丢失、研究方向误导等多种问题。在过去很长一段时间,都是利用清洗、补色等手段修复文物,力求维持作品完整度②。文物修复从业人员利用丰富的修复经验、艺术鉴赏经验,直接在文物本体进行修复。这种方法不仅需要从业人员有较高艺术水平,也需要扎实的从业经验,不同从业人员的专业素质会造成文物修复效果存在巨大差异。而利用数字图像修复技术,可以借助计算机技术对待修复文物进行数据信息分析,利用统计学等多种学科技术原理,构建完成文物预测模型,并使用已有图像数据估算残缺图像区域,达到文物数字图像虚拟修复,能够缩短原本耗时较长的文物修复工作周期,并避免人工修复出现失误,对文物产生更为严重的二次损伤。

4.2基于数字图像修复技术的文物虚拟修复技术路线

虽然数字图像修复技术在文物保护方面应用时间较晚,但是因为自身存在低风险、低成本消耗,修复效果甚至比部分文物修复从业人员还要好的优良特性,得到了文物保护从业人员的专业认可,在文物保护领域被广泛接受。而基于数字图像修复技术的文物虚拟修复技术路线,主要有以下几个:将待修复文物放置在数据采集的装置上,预先对待修复文物基本类型进行划分,例如瓷器、金属制品等,再从相应分类中根据文物年代、时期等特征设置为搜索关键词,寻找类似文物数据,完成文物虚拟数字图像基本资料数据采集。应用数字图像修复技术,构建完整的文物数字图像,提取没有被人为或自然影响的完好部分,将图像信息存在缺陷、破坏的部分隔离③。利用数字图像修复技术算法,使用有基于变分PDE图像修复技术,或基于快纹理合成图像补全技术,对文物进行虚拟修补,使虚拟数据构建完成内容,呈现文物的完整状态。最后对文物虚拟修复结果进行评估,并将其作为文物实际修复使用,对文化与艺术价值进行分析,进行后续工作内容。

4.3案例分析

在2001年被炸毁的阿富汗巴米扬大佛,德国修复团队收集了巴米亚大佛的残留石块,利用数字图像修复,对佛像重新进行测绘工作,以虚拟数字模型方式重塑佛像。而由我国北京大学与美国芝加哥大学、美国华盛顿特区赛克勒博物馆,收集了响堂山石窟佛像断手、断脚,将其与博物馆现存佛像进行对比,利用数字图像修复技术对佛像各个部件进行拼接,成为目前文物保护主流方式,即以部分实物对照完整实物,利用数字信息补全文物全部内容。2002年大都会博物馆亚当像摔碎,技术人员利用数字化技术扫描了所有碎片,并利用三维显像方式对大理石雕像重新进行受力分析,使用数字图像修复及其他技术,在12年后的2014年,再次展出了完整的亚当像。另外,大都会博物馆还将修复全过程整理为技术文档,是目前文物修复最具有影响效果的经典案例。

4.4修复工作注意事项

在数字图像修复过程中,技术人员应该保持严谨认真的态度,判断可能会影响文物修复的各种因素,采用适当手段进行规避,保障文物保护工作稳步落实。在修复工作开展前,需要从网络收集文物相关信息,也可以与行业专家交流,明确文物类别、年代等信息以及文物性质①。并且,文物损毁原因也要查明,方便数字图像修复技术精准判断修复方式,为快速完成文物修复工作提供有力保障。而图像丢失或损毁部分,一定要根据文物完整部分,或同类型文物的相关信息,进行细致的文物修复工作,增强提高文物保护效果,避免文物修复出现不契合问题。在文物修复阶段,也要对多种技术灵活应用,整合多种修复技术,帮助文物复原工作稳步落实。

4.5应用前景

当前数字图像修复从电子商务到社交网络,已经融入社会各个领域。在文物保护领域,数字图像修复技术对残缺文物进行修复是未来文物保护的发展趋势。而且,近些年数字图像修复技术在文物信息数据采集、处理等方面累积了大量技术经验,相应处理算法也趋近完善,传统人工修复技术不足问题,可以得到有效弥补。针对文物残缺部分,通过相关素材采集整体,以文物现存的部分,构建贴近实际情况的完成部分。另外,数字图像修复技术的指令算法也在智能化发展方向得到技术突破,未来文物保护中文物修复这一领域,将会以高效、高质量的形式呈现。

5结论

数字图像范文篇5

关键词:人工智能;数字图像处理;创新能力;任务驱动

1引言

目前,人工智能发展飞速,并深刻地改变着人类的社会生活。人工智能技术的开发和利用,已为人类创造出巨大的社会和经济效益,几乎渗透到包括移动互联网、智能终端、工业制造、医疗辅助诊断、自动化控制、智能机器人等在内的各个领域,正有力地促进着经济社会的发展。在教育部倡导大力发展新工科、新医科的背景下,人工智能与各个学科的融合起着重要的作用[1]。因此,在人工智能新视域下,如何在课程教学改革中突破传统教学内容与方法的局限,优化课程内容与创新实践人才教学模式,满足人工智能创新性、跨学科、复合型人才培养的需求,是目前课程教学改革过程中面临的关键问题。《数字图像处理》是通信工程、计算机、医学影像技术等多个专业的专业选修课。数字图像处理是信息科学领域的一项高新技术,是对图像进行去噪、增强、复原、分割、压缩等处理的基本方法、技术和手段,以及对图像信息的表示、内在联系和本质规律进行研究的技术。随着科技进步与人工智能技术的发展,数字图像技术被逐渐应用于医学、农业、制造业、航天航空、军事等诸多领域,呈现出与多个学科交叉融合的特点,并成为计算机视觉研究领域的核心基础。由此可见,数字图像处理技术的发展与人工智能密不可分。因此,在《数字图像处理》课程教学过程中,应该高度结合人工智能学科背景,融入前沿理论技术,与计算机视觉现实应用场景相结合,培养创新实践人才。然而,目前《数字图像处理》课堂教学中大多采用传统教学模式,较难满足培养学生创新实践能力的需求,体现在以下几个方面:(1)教材内容大多比较陈旧。一些基础的算法在实际应用中早已过时,未能体现最新技术发展的动态,也缺少人工智能领域的前沿应用场景讲解。(2)理论教学知识点过于分散化。在传统的教学中,教师通常对单个知识点进行逐一讲解,从数学背景到公式推导,理论性较强。这让学生理解困难,且使他们失去了对知识模块之间联系性的掌握,尤其在面对实际复杂应用场景时束手无策。(3)实验教学薄弱,实验工具单一化。目前《数字图像处理》实验教学多以验证性或演示性实验为主,难以培养学生创新思维与解决实际问题的能力。实验工具大多采用MATLAB编程。MATLAB虽然编程环境简单、图像处理功能完善,但它在人工智能算法研发上与Python编程相比尚有许多不足之处。(4)课程教学未体现学科交叉融合的特点。数字图像处理技术课程涉及学科高度交叉融合,在课堂教学中应充分融合医学影像、地理遥感等领域知识,培养学生交叉学科知识的融合应用能力。鉴于此,本文主要从课程教学内容优化、教学方法改革、实验教学实施等方面探讨结合人工智能学科背景的《数字图像处理》课程的教学改革,并提升学生的创新与实践能力,优化课程内容,强化以人工智能应用场景为指导的实践教学,多向融合交叉学科,以期解决现有教学过程中存在的不足。

2研究现状分析

2.1数字图像处理关键技术发展现状。数字图像处理技术主要包括图像数字化、图像增强与复原、图像压缩与分割、图像特征提取以及图像识别等一系列图像处理高级应用。随着人工智能的发展,许多数字图像基础理论已更新,并呈现出新的发展势态。在人工智能背景下,总结数字图像处理技术发展趋势,大致可分为三个方面:一是新方法与新理论层出不穷,迭代更新的速度很快。例如,大量的视觉特征描述算子被提出、卷积神经网络等深度学习方法日益流行。二是应用场景向多元化和智能化发展。数字图像处理技术的应用场景不仅深入到智能手机、随身设备等日常生活领域,而且与医学、遥感、军事等领域的应用结合也日益广泛。图像处理技术与智能化的融合是发展的新趋势。三是硬件设备下移以及机器人视角。自动驾驶汽车、智能机器人等软硬件结合的人工智能对数字图像处理技术提出了更高的要求,需要同时兼顾算法在嵌入式设备下移的效率。通过上述现状分析可知,数字图像处理技术已得到飞速发展,而《数字图像处理》课程还停留在传统模式,难以体现理论技术的应用性与先进性,也无法满足行业对人工智能人才的需要。2.2数字图像处理课程教学改革研究现状。部分国内外学者已对《数字图像处理》课程教学改革进行了颇有成效的探索。S.Kiraly研究了一种融合了教学项目、评估系统和教学案例的信息化教学工具,以提高数字图像处理课程的教学效率[2]。王忠芝等探讨了动态教学演示法、启发式教学方法等多种教学方法,以增强理论教学效果[3]。杜号军结合了LabView虚拟平台的情景教学模式和MATLAB的语言编程优势,提出了数字图像处理实验教学的新方法[4]。王云峰进行了基于PBL(Problem-BasedLearning)教学模式的数字图像处理实践教学改革方案的探索,并设计了相关教学方案[5]。孙曾国等基于Blackboard网络教学平台探讨了项目小组教学模式在数字图像处理课程中的应用,从项目分组、教学过程、考核评价等方面提出了教学改革方案[6]。目前教学改革方法大多是从教学方法和教学工具上进行改革,对教学内容进行优化的探索较少,相对缺少融合人工智能新概念的课程内容优化,亦未能体现学科交叉融合的特点。

3教学改革探讨

3.1课程教学内容优化。《数字图像处理》课程教学普遍存在理论性偏重、许多教学内容陈旧、不少算法已过时的问题,无法与时俱进,也没有涉及人工智能和图像处理领域的最新研究成果。在面临真实的人工智能及图像处理应用场景时,学生难以将在课程中学到的知识应用到实践中。这在很大程度上限制了学生理论联系实际的能力以及创新思维的发展。下面从基础理论更新与优化、前沿研究成果扩充两方面探讨《数字图像处理》课程理论教学内容的优化。首先,在基础理论方面,删减部分陈旧的、在实际应用中效率低下的图像处理方法,引入时下流行的、高效的方法作为更新,完善教学内容,使其符合人工智能发展的特点。如表1所示,以图像特征表示章节为例,拟对颜色、形状、纹理、区域描述方法等知识模块进行教学内容优化,引入时下高效的、流行的算法替换部分陈旧的算法,使教学内容符合人工智能技术应用发展的需要。例如,现有教学内容中多数将灰度差分统计等作为纹理特征的主要知识点,但该方法因其性能低下而难以满足实际需求,早已不被现实应用所采纳。而目前人工智能领域广泛使用的局部二值模式(Localbinarypattern,LBP)系列纹理描述方法[7],因其计算简单、鲁棒性强等特点被成功应用人脸识别、医学图像分析诸多场景中。因此,选择局部二值模式及其改进方法作为优化后的纹理描述方法,既从理论方面介绍纹理特征经典描述方法、存在的缺陷以及改进动机,激发学生的创新思维;又在应用层面可直接应用于图像识别等人工智能应用场景,培养学生的实践能力,同时为学生参加各项学科竞赛、从事科学研究工作奠定基础。表1还展示了其他优化后的部分知识模块。这些知识模块都是目前实际应用场景中广泛流行的基础理论,难度适中,完全适用于本科阶段教学。其次,引入图像处理与计算机视觉领域最新的研究成果,形成以图像预处理、图像增强、图像分割、图像特征提取、经典高层应用等为基础授课内容,以新算法、新思想、新应用为创新授课内容。其中经典高层应用包括图像检索与分类;新算法包括视觉词袋模型、卷积神经网络等目前流行的方法;新思想包括大数据与深度学习的思想;新应用包括智能HDR、图像去雾等与现实生活联系紧密的实际应用。以此优化教学大纲,兼顾基础,联系实际,突出前沿,提升学生的人工智能视野与水平,为培养实践创新能力奠定基础。3.2教学方法改革。传统《数字图像处理》课程注重基础理论的讲解,许多知识点理论性较强,公式推导复杂,学生常常难以理解。此外,传统教学过程中,常常将多个理论内容拆分讲解,彼此独立。这种方式虽然针对性较强,但缺乏对知识模块之间关联性的理解,学生难以形成以应用驱动为导向的知识网络,使得教学效果不理想。而事实上,在现实应用场景中,往往需要对数字图像处理技术中的多个知识模块进行综合应用,而不只是某个单一理论知识的使用。例如,在经典的人脸识别案例中,不仅涉及图像预处理、目标分割、特征提取、目标识别等多个环节,而且后一个环节还依赖于前一个环节的处理结果。为此,本文探讨一种基于任务驱动和交叉融合的课堂教学方法,鼓励学生转变被动学习的模式,使其有目的性、针对性地去解决一些与专业方向及人工智能领域相关的课题任务。具体来说,任务驱动模式是以实际应用场景或者人工智能任务需求为驱动,以发展探究思维为目标,以学科的基本结构为内容,促使学生构建自主思考、探究实践的学习体系。而交叉融合教学方法是指,在具体的任务驱动设置中,注重前沿学术成果与课程内容的融合、课内教学与课外实践的融合、创新性实验与学科竞赛的融合、跨学科领域任务的融合等,旨在充分融合前沿科学技术与交叉学科领域,充分调动学生主观能动性和探究实践欲望,开展一系列卓有成效的技术课题探究。具体实施要点包括:(1)通过结合课程知识点,创设课题情景,选择与当前学习主题密切相关的应用问题,引导学生带着真实的“任务”进入学习情境,使得学习更为直观和形象化。(2)以任务为主线,在老师的充分讲解与指导下,强调自主学习与协作学习,老师对任务驱动的学习过程进行把关。(3)充分挖掘与本课程紧密关联的医学影像、遥感图像、工业图像等交叉领域问题,进行有机融合,实现人工智能技术创新的问题分析、模型构建、设计和解决,实现基于任务驱动的多学科交叉知识融合应用。如表2所示,本文给出通信电子类《数字图像处理》课程的部分任务驱动技术课题。其中涉及图像增强、复原、分割、特征提取等多个核心章节,并在一个任务中实现了多个知识点的关联,并且任务均来自遥感、医学、农业、工业等领域的具体人工智能应用场景。3.3实验教学实施。实验教学是培养学生实践与创新能力的重要组成部分。在实验设置、工具使用、实验数据、嵌入式下移教学、第二课堂等方面对实验教学进行优化。具体实施要点如下:(1)在实验设置方面,除了保留部分少数验证性实验,还增加设计综合性实验、开放性实验。设计综合性实验主要为图像分割、图像检索、手写字识别等数字图像处理与计算机视觉领域的经典应用,旨在锻炼学生利用核心算法,融会贯通、解决问题的能力。开放性实验,以当前人工智能领域的热点任务为内容,结合教学单位的科研优势与生产实践,进行创新性专题实验,鼓励学生学习和挖掘授课内容以外的新方法,培养学生的创新能力。(2)在实验工具方面,主要以MATLAB作为验证性实验工具,主要以Python作为设计综合性与开放性实验工具,同时鼓励学生在实验实训过程中使用Tensorflow、Keras等深度学习算法开发工具。(3)在实验教学数据方面,充分体现《数字图像处理》课程学科交叉的特点。例如,借助教学单位附属医院影像科大量的真实医学数据,融入实验教学项目,开展交叉学科实验教学与实验实训。(4)开展嵌入式下移实验教学,形成人工智能新视域下数字图像处理软件+硬件的应用技术教学闭环。以通信电子类专业培养方案为例,通常来说,《数字图像处理》的前驱课程包含了诸多硬件类的课程,可充分满足嵌入式下移实验的知识储备。例如,可通过嵌入式设备下移图像分割等算法,连接摄像头,实现“实时图像分割”等应用场景。通过开展嵌入式下移实验教学,形成专业培养的系统知识网络,培养学生软硬兼备的实践创新能力。(5)开展第二课堂实验教学,使得对本学科感兴趣的优秀学生能够得到进一步的发展机会。利用开放实验室、人工智能兴趣小组、参与指导老师科研项目等多种形式,挖掘创新课题,提出解决问题的思路、方案,设计相应算法,完成创新性实验作品,从而让学生在这个过程中得到创新与实践能力的提升。

4总结

数字图像范文篇6

关键词:数字图像;图像压缩;压缩技术;任意形状可视对象编码

Abstract:Digitalimagecompressiontechnologyisofspecialintrestforthefasttransmissionandreal-timeprocesssingofdigitalimageinformationontheinternet.Thepaperintroducesseveralkindsofthemostimportantimagecompressionalgorithmsatpresent:JPEG,JPEG2000,fractalimagecompressionandwavelettransformationimagecompression,andsummarizestheiradvantageanddisadvantageanddevelopmentprospect.Thenitintroducessimplythepresentdevelopmentofcodingalgorithmsaboutarbitraryshapevideoobject,andindicatesthealgorithmshaveahighcompressionrate.

Keyword:Digitalimage;Imagecompression;Compresstechnique;Arbitraryshapevisibleobjectcode

一、引言

随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。

二、JPEG压缩

负责开发静止图像压缩标准的“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。

1.JPEG压缩原理及特点

JPEG算法中首先对图像进行分块处理,一般分成互不重叠的大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点如下:

优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。

缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50[2]。

JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的[3]。

2.JPEG压缩的研究状况及其前景[2]

针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:

(1)DCT零树编码

DCT零树编码把DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。

(2)层式DCT零树编码

此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。

JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。

三、JEPG2000压缩

JPEG2000是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。

1.JPEG2000压缩原理及特点

JPEG2000编解码系统的编码器和解码器的框图如图1所示[4]。

编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。

JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作[4]。

图1JPEG2000压缩编码与解压缩的总体流程

2.JPEG2000压缩的前景

JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等[5]。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。

四、小波变换图像压缩

1.小波变换图像压缩原理

小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的JPEG2000标准[2]。

2.小波变换图像压缩的发展现状及前景

目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。

(1)EZW编码器[6]

1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。

(2)EBCOT编码器[8]

优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。

小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点[2]。

(3)SPIHT编码器[7]

由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。

五、分形图像压缩

1988年,Barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的学生A.E.Jacquin提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。

1.分形图像压缩的原理

分形压缩主要利用自相似的特点,通过迭代函数系统(IteratedFunctionSystem,IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。

分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像[9]。

2.几种主要分形图像编码技术[9]

随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。

(1)尺码编码方法

尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度随着图像各个组成部分复杂性的不同而改变。

(2)迭代函数系统方法

迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。

(3)A-E-Jacquin的分形方案

A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。

3.分形图像压缩的前景[2]

虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。

六、其它压缩算法

除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~[13]。

(1)形状自适应DCT(SA-DCT)算法

SA-DCT把一个任意形状可视对象分成的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应GilgeDCT[10][11]变换的有效变换,但它比GilgeDCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。

(2)形状自适应离散小波变换(SA-DWT)

Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。

在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。

(3)Egger方法

Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。

七、总结

图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

参考文献:

[1]田青.图像压缩技术[J].警察技术,2002,(1):30-31.

[2]张海燕,王东木等.图像压缩技术[J].系统仿真学报,2002,14(7):831-835.

[3]张宗平,刘贵忠.基于小波的视频图像压缩研究进展[J].电子学报,2002,30(6):883-889.

[4]周宁,汤晓军,徐维朴.JPEG2000图像压缩标准及其关键算法[J].现代电子技术,2002,(12):1-5.

[5]吴永辉,俞建新.JPEG2000图像压缩算法概述及网络应用前景[J].计算机工程,2003,29(3):7-10.

[6]JMShaprio.Embeddedimagecodingusingzerotreeofwaveletcoefficients[J].IEEETrans.onSignalProcessing,1993,41(12):3445-3462.

[7]ASaid,WAPearlman.Anewfastandefficientimagecodecbasedonsetpartitioninginhierarchicaltrees[J].IEEETrans.onCircuitsandSystemsforVideoTech.1996,6(3):243-250.

[8]DTaubman.HighperformancescalableimagecompressionwithEBCOT[J].IEEETransactionsonImageProcessing,2000,9(7):1158–1170.

[9]徐林静,孟利民,朱建军.小波与分行在图像压缩中的比较及应用.中国有线电视,2003,03/04:26-29.

[10]MGilge,TEngelhardt,RMehlan.Codingofarbitrarilyshapedimagesegmentsbasedonageneralizedorthogonaltransform[J].SignalProcessing:ImageCommun.,1989,1(10):153–180.

[11]TSikora,BMakai.Shape-adaptiveDCTforgenericcodingofvideo[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(1):59–62.

[12]TSikora,SBauer,BMakai.Efficiencyofshape-adaptive2-Dtransformsforcodingofarbitrarilyshapedimagesegments[J].IEEETrans.CircuitsSyst.VideoTechnol.,1995,5(3):254–258.

[13]EJensen,KRijk,etal.Codingofarbitrarilyshapedimagesegments[C].Proc.WorkshopImageAnalysisandSynthesisinImageCoding,Berlin,Germany,1994:E2.1–E2.4.

[14]MBi,SHOng,menton“Shape-adaptiveDCTforgenericcodingofvideo”[J].IEEETrans.CircuitsSyst.VideoTechnol.,1996,6(6):686–688.

[15]PKauff,KSchuur.Shape-adaptiveDCTwithblock-basedDCseparationandDeltaDCcorrection[J].IEEETrans.CircuitsSyst.VideoTechnol.,1998,8(3):237–242.

[16]OEgger,PFleury,TEbrahimi.Shape-adaptivewavelettransformforzerotreecoding[C].Proc.Eur.WorkshopImageAnalysisandCodingforTV,HDTVandMultimediaApplication,Rennes,France,1996:201–208.

[17]OEgger.Regionrepresentationusingnonlineartechniqueswithapplicationstoimageandvideocoding[D].Ph.D.dissertation,SwissFederalInstituteofTechnology(EPFL),Lausanne,Switzerland,1997.

[18]SLi,WLi,etal.Shapeadaptivevectorwaveletcodingofarbitrarilyshapedtexture[S].ISO/IECJTC/SC29/WG11,MPEG-96-m1027,1996.

[19]WLi,FLing,HSun.ReportoncoreexperimentO3(Shapeadaptivewaveletcodingofarbitrarilyshapedtexture)[S].ISO/IECJTC/SC29/WG11,MPEG-97-m2385,1997.

[20]SLi,WLi.Shapeadaptivediscretewavelettransformforcodingarbitrarilyshapedtexture[C].Proc.SPIEVCIP’97,1997,3024:1046–1056.

数字图像范文篇7

关键词:I2C总线数字图像传感器

1功能描述

1.1性能特点

PB-0300系列CMOS型有源像素数字图像传感器,内置模数转换8、位并行数据输出、64个内部寄存器,采用I2C总线控制,可编程控制;可以在彩色和黑白两种模式下工作。当外接24MHz时钟晶振时,可以获得30帧/s的图像输出。在上电期间,自动调入缺省参数设置,包括自动曝光功能,所以可以不编程情况下使用传感器。主要性能指标如表1。

表1主要性能指标

阵列格局640×487(311680像素)

VGA参考:640×480(307200像素)

像素大小和类型有源光电二极管,空间分辨力:7.9μm×7.9μm

帧速率/(帧/s)0~39

最大数据传输速度/(MB/s)24(在24MHz时钟下)

功率/mW300(最大数据速度下)

数字信噪比(1lux条件下)大于20dB(10:1)(对绿色像素,30Hz的以照明度)

数字敏感度红色:950bit/lux-second,绿色:650bit/lux-second,

蓝色:750bit/lux-second,(增益为10,ADC参考为+5.0V)

工作电压/V+5.0

工作电流/mA060

工作温度/℃-5~70

输出8位彩色(单色)数字输出

快门电子旋转抓拍

可编程控制项窗口尺寸和位置、信号增益、曝光参数、自动曝光参数、ADC参考、帧速率、DAC偏置

1.2内部结构

PB-0300由五大部分组成:数字逻辑模块、像素阵列、列平行的增益电路和读出电路、8位ADC、偏置DACs,如图1所示。

主要引脚功能如表2。

表2主要引脚功能描述

引脚名称工作方式功能描述

LINE_VALID输出行有效信号--图像数据在数据输出总线上时有效

FRAME_VALID输出帧有效信号

SDATA输入/输出I2C数据通道

SCLK输入I2C时钟

PIX_CLOCK输出像素时钟,下降沿有效

CLOCK_OUT输出主时钟输出

CLOCK_IN输入时钟输入,标称主时钟为24MHz

DOUT0~7输出8位并行数据输出

SADDR输入器件连线地址脚,SADDR=5V:写地址=BA,读地址=BB;SADDR=0V:写地址=92,读地址=93

VREF1输出ADC参考偏置

STANDBY输入关闭模拟偏置电路和内部时钟(省电)

RESET_BAR输入复位键,低电平有效

PB-0300有三种分开的供电电源:数字电源、模拟电源和传感器阵列电源。使用时要特别注意各电源间的相互影响。

2图像输出格式与时序

PB-0300控制像素数据输出的信号有:帧有效(FRAME-VALID)信号、行有效(LINE-VALID)信号、像素时钟(PIXCLK)信号。FRAME-VALID信号控制一帧有效图像的输出,高电平有效;LINE-VALID信号控制每行有效信号的输出,高电平有效;PIXCLK信号控制每个像素的输出,当FRAME-VALID和LINE-VALID均为高电平时,每个像素时钟周期输出一个8位像素信号;并行的DOUT0~DOUT7是像素数据的8位输出,它们始终和像素时钟同步。在PIXCLK处于下降沿时,数据输出和LINE-VALID都不能改变。在默认的VGA(640×480)下,当每行640个有效像素信号输出之后,LINE-VALID变为低电平,PB-0300按一定编码方式向外输出982个无效信号,然后再输出像素信号。当480行有效像素和无效信号完全输出之后,传感器再输出9行空白信号。这期间FRAME-VALID为低电平,标志着当前帧的结构和下一帧的开始;同时,读入寄存器的最新值,通过对寄存器编程而改变的图像参数在下一帧生效。信号输出时序如图2所示。

3寄存器设置

PB-0300共有64个寄存器(R0-R63),地址依次为00H~3FH,在缺省情况下有自动曝光功能;可以改变输出图像的大小、位置和速度;通过调节像素累积时间、ADC参考和增益值可以控制采集到的图像亮度。下面介绍几个主要寄存器的功能。

*复位控制寄存器(R13)

R13能够使PB-0300复位到上电后的缺省状态。首先向R13的最低位写入“1”,使PB-0300处于复位状态,然后再写入“0”继续工作。

*窗口位置与大小控制寄存器(R1,R2,R3,R4)

控制采集图像窗口的位置与大小。只有在此窗口内的像素才能有效地读出。窗口的像素个数最大值为640×480。R1为行起始坐标,R2为列起始坐标,(1024-R3)为有效行数,(1024-R4)为有效列数;窗口大小的默认值为VGA(640×480),右上角坐标为(0,0),左下角坐标为(639,479)。

*像素累积控制寄存器(R8,R9)

控制像素的采光时间,R8为累积帧数,R9为累积行数,实际总的累积时间,即实际处理完一帧图像的时间为:Tint=[(R8×(1024-R3)+R9)×Trow,其中,Trow为处理完一行有效像素所用的时间。一般的R8设置为0,R9的最大值为有效图像窗口的行数。Tint的值应该能信号避免由于光闪烁使图像产生条纹。在60Hz光闪烁频率下,Tint必须为1/120s的整数倍;50Hz频率下,Tint必须为1/100的整数倍。

*帧速率控制寄存器(R5,R6,R10)

控制每行和每帧有效像素信号之间的无效信号时间。当其它图像参数改变时,通过改变上帧速度控制寄存器的值为调节帧速率。若通过R4减小有效像素列数后,处理一行有效像素的时间将变短,帧速率将增加。这时可以调节R5的值来增加每行元效信号的输出数量和时间,从而使帧速率保持不变;同理,若改变有效像素行数时,调节R6来保持帧速率。R10是通过控制PIXCLK的输出来改变像素输出时间的。

图2信号输出时序

*增益设置寄存器(R43,R44,R45,R46,R53)

设置输出像素的各种颜色的增益值。像素信号在模数转换前经过增益放大电路,分别对各种颜色进行处理,R43、R46分别对应蓝色和红色,R44、R45都对应绿色,R53是全局设置。一般的照明情况下(100~1000lx),增益值为1~8,编程的值是多少,对应的增益值就是多少。从R53可以读出自动曝光模式下的增益值。

*模数转换参考(ADC)控制寄存器(R25)

通过改变模数转换参考值,改变图像的数字输出,从而调节图像亮度。当图像亮度大时,增加ADC值,得到的图像将变暗;当图像较暗时,减小ADC值,得到的图像将变亮。在非自动曝光模式下,R25控制ADC的最大参考值(最小参考值为0),其典型值在24~38之间。在自动曝光模式下,ADC参考值不能改变。

*信号漂移值设置寄存器(R32)

设置信号漂移值,调节图像的亮度,可以设置正负两种值。当图像太暗时,给R32加一个正值,像素信号变大,使得图像变亮;当图像太亮时,给R32加一个负值,使图像变暗。

4PB-0300与单片机的接口

当PB-0300复位至默认状态下时,能够自动工作,此时采用自动曝光功能,输出的图像为640×480像素,输出速率为30帧/s。也可以通过修改寄存器的值来改变传感器的工作方式和提高图像的输出质量。在MCS-51系列单片上,可以使用虚拟I2C总线软件包VIIC模拟I2C总线,对PB-0300的寄存器进行读写。接口电路如图3所示。

PB-0300采用16位寄存器,需要写入2个字节,写满之后寄存器地址自动增加。所以对连接寄存器进行写操作时,只需写入第一个寄存器的地址;进行读操作时,先对控制寄存器空写一次,以明确操作对象,然后进行读数。子程序WRITE是将默认状态下R5的值(510)修改为340(0214H),使图像输出为VGA(640×480),输出速率为25帧/s。子程序READ是以读R9、R10为例的典型程序。子程序清单如下:

VSDAEQUP1.7

VSCLEQUP1.6

SLAEQU50H

NUMBYTEQU51H

MTDEQU30H

MRDEQU40H

WRITE:MOV30H,#05H;寄存器R5地址

MOV31H,#02H;寄存器值(0214H)

MOV32H,#14H

MOVSLA,#0BAH;寻址并为写操作

MOVNUMBYT,#03H;写入字节数

LCALLWRNBYT

RET

READ:MOV30H,#09H;寄存器的R9地址

MOVNUMBYT,#01H;写入字节数

MOVSLA,#0BAH;寻址并为写操作

LCALLWRNBYT

MOVSLA,#0BBH;寻址并为读操作

MOVNUMBYT,#04H;读出字节数

LCALLRDNBYT

RET

数字图像范文篇8

关键词:嵌入式系统,图像采集,电路设计

Abstract:Inthispaper,wepresenttwodifferentinterfacesbetweendigitalaimagesensorsandaprocessorforembedsystems,I/OmodeandDMW(DirectMemoryWrite)mode.InI/Omode,processorcanreadimagedatathroughI/Oport,andtheinterfaceissimple.InDMWmode,imagedatacanbewriteintoRAMdirectlywhileaprocessorissuspended.

Keywords:EmbedSystem,ImageCapture,ElectronicCircuit

一、引言

随着半导体技术的飞速发展,具有图像功能的嵌入式应用愈来愈多。从数码相机、可视电话、多功能移动电话等消费产品到门禁、数字视频监视等工业控制及安防产品,图像采集和处理已成为重要的组成部分之一。图像采集需要进行同步信号的处理,比通常的A/D数据采集过程复杂,电路的设计也较为困难。传统PC上的图像采集卡都是在Philips、Brooktree等半导体公司提供的接口芯片基础上,由专业公司开发生产。在嵌入式系统中不同的处理器和图像传感器的信号定义及接口方式不同,没有通用的接口芯片。另外,利用系统中的现有资源设计图像采集电路,可以减少器件数量、缩小产品体积和降低系统成本。所以,通常嵌入式系统中要求自行设计图像采集接口电路。本文针对不同采集速度的要求,提出了两种图像采集接口电路的设计方法。

目前市场上主流的图像传感器有CCD、CMOS两种器件,其中CMOS器件上世纪90年代产生,近年来得到了迅速发展。传感器的输出有模拟和数字两种。由于CMOS器件功耗小、使用方便,具有直接数字图像输出功能,作者在设计时选用了CMOS数字输出图像传感器件。其他方式器件的接口设计与此类似,将在讨论中说明。

本文内容做如下安排:第二部分简述图像信号的特点;第三、四部分分别介绍I/O和内存直接写入两种接口设计方法;最后部分是讨论。

二、图像信号介绍

图1给出了采样时钟(PCLK)和输出数据(D)之间的时序关系。在读取图像数据时用PCLK锁存输出数据。除采样时钟(PCLK)和数据输出(D)外,还有水平方向的行同步信号(HSYNC))和垂直方向的场同步信号(VSYNC)。对于隔行扫描器件,还有帧同步信号(FRAME)。如图2,一帧包括两场。图2中窄的矩形条是同步脉冲,同步脉冲期间数据端口输出的数据无效。

PLCK存在时,图像数据端口连续不断地输出数据。由于行之间以及场之间输出数据无效,在采集图像数据必须考虑同步信号,读取有效数据才能保证图像的完整性。

三、I/O接口设计

对于MCU、DSP处理器,I/O是最方便的访问方式之一。以I/O方式读取图像数据不仅可以简化电路设计,而且程序也很简单。但由于读取每一个像素都要检测状态,在处理器速度低的情况下,读取图像慢。在处理器速度快或图像采集速度要求不高的应用中,I/O接口方式是一个较好的选择。

1、电路原理和结构

在图像传感器和处理器之间,利用两个锁存器分别锁存状态和图像数据,处理器通过两个I/O端口分别读取。图3中,在采样时钟的上升沿数据锁存器保存传感器输出的图像数据,当处理器通过I/O口读取图像时,数据锁存器输出数据。其它情况下,锁存器输出处于高阻状态。处理器通过状态锁存器读取同步信号和图像就绪(Ready)指示信号。在数据锁存器保存图像数据的同时,状态锁存器产生Ready信号(从‘0’到‘1’)。处理器读取图像数据时,Ready信号自动清除(从‘1’到‘0’)。处理器读取状态时锁存器驱动总线,其他情况下输出处于高阻状态。

2、图像读取流程

要保证图像的完整性就必须从一场图像的第一行开始读取,对于隔行扫描输出的图像则必须从一帧的第一行开始读取。读取每行图像数据时,则从该行的第一个像素开始。因此,在读取图像数据前应先判断场和行的起始位置。图4是通过I/O接口方式读取图像数据的流程。读取每个像素数据前先查询数据状态,如果数据已准备好则读取数据。

3、同步信号检测

为了简化电路设计,用处理器直接读取同步信号,然后找出场和行的起始位置。

从图2可以看出,处理器读取同步信号时,信号可能处在同步脉冲状态(‘1’)或正常状态(‘0‘)。对于那些同步信号反向的器件,则分别为‘0’和‘1’。如果信号处于同步脉冲状态,第一次检测到的正常状态就起始位置。如果信号处于正常状态,则首先检测到脉冲状态,然后用同样的方法确定起始位置。

通过上述方法可以检测出场的起始位置和行起始位置。

4、用VHDL设计锁存器

在应用中,以上两个锁存器的功能和其他逻辑集中在一起,用可编程逻辑器件实现。下面分别为它们的VHDL表示。

设DO(0-7)是锁存器输出端,DI(0-7)是锁存器输入端,DM(0-7)是中间状态,Data_R是数据读信号(低电平时有效),则数据锁存器的VHDL描述为:

Process(reset,PCLK)--锁存图像数据

Begin

Ifreset=''''0''''then

DM<="00000000";--清除数据

ElseifPCLK''''eventandPCLK=''''1''''then

DM<=DI;--锁存数据

Endif;

Endprocess;

Process(DM,Data_R)--读取图像数据

Begin

IfData_R=''''0''''then

DO<=DM;--输出图像数据

Else

DO<="ZZZZZZZZ"--输出高阻

Endif;

Endprocess;

进一步设数据有效状态为Dstatus,状态读写信号为Status_R(低点平时有效),则状态锁存器的VHDL描述为:

Process(reset,PCLK,Data_R)--数据有效状态控制

Begin

Ifreset=''''0''''orData_R=''''0''''then

Dstatus<=''''0'''';--清除状态

ElseifPCLK''''enentandPCLK=''''1''''then

Dstatus<=''''1'''';--设置状态

Endif;

Endprocess;

Process(Dstatus,Status_R)--读取状态和同步信号

Begin

IfStatus_R=''''0''''then

DO0<=Dstatus;

DO1<=VSYNC;

DO2<=HSYNC;

DO3<=FRAME;

Else

DO<="ZZZZZZZZ";--高阻状态

Endif;

Endprocess;

四、内存直接写入接口设计

在处理器速度较慢且图像数据输出的频率不能降低的情况下,采用上述I/O接口方法不能得到完整的图像。另外,有些应用中要求能够实时采集图像。为此,我们设计了高速数据图像采集方法―内存直接写入法。由于SRAM访问控制简单,电路设计方便,被大量嵌入式系统采用,本文以SRAM作为存储器。

1、电路原理和结构

内存直接写入方法通过设计的图像采集控制器(以下简称控制器)不需处理器参与,直接将图像数据写入系统中的内存中,实现高速图像采集。

图5是接口结构图,当需要采集图像时,处理器向控制器发出采集请求,请求信号capture_r从高到低。控制器接到请求脉冲后,发出处理器挂起请求信号HOLD,使处理器的外总线处于高阻状态,释放出总线。控制器收到处理器应答HOLDA后管理总线,同时检测图像同步信号。当检测到图像开始位置时,控制器自动产生地址和读写控制信号将图像数据直接写入内存中。图像采集完成后,控制器自动将总线控制权交还处理器,处理器继续运行,控制器中与采集相关的状态复位。控制器可以根据同步信号或设定的采集图像大小确定采集是否完成。

在图5中,控制器包括同步信号检测、地址发生器、SRAM写控制器、总线控制器和处理器握手电路等主要部分。同步信号检测确定每一场(帧)和每一行的起始位置;地址发生器产生写SRAM所需的地址;SRAM写控制器产生写入时序;总线控制器在采集图像时管理总线,采集完成后自动释放;处理器握手电路接受处理器命令、发总线管理请求和应答处理器。

2、SRAM写控制时序

采集图像过程中,控制器自动将数据写入到硬件设定的内存中。写内存时,控制器产生RAM地址(A)、片选信号(/CS)、读信号(/RD)和写信号(/WD),同时锁存传感器输出的数据并送到数据总线(D)上。每写入一个数据后,地址(A)自动增1。采集时/CS保持有效(‘0’)状态而/RD处于无效状态(‘1’)。地址A的变化必须与/WD和数据锁存器协调好才能保证图像数据的有效性。

图6是控制器产生的SRAM信号时序图。用PCLK作为地址发生器的输入时钟,且在其上升沿更新地址值。同样,在PCLK的上沿锁存数据并输出到总线上。将PCLK反相,作为/WD信号,使得在/WD的上升沿地址和数据稳定,确保写入数据的有效性。

3、控制器主要功能的VHDL描述

描述控制器中全部功能的VHDL代码较长,而且有些部分是常用的(如计数器等)。图像采集状态产生和同步信号的检测是其中重要的部分。下面介绍这两部分的VHDL描述。

图像采集状态capture_s:

处理器的采集请求信号capture_r使capture_s从‘0’到‘1’,场地址发生器(计数器)的溢出位vcount_o,清除capture_s。

process(capture_r,reset,vcount_o)

begin

ifreset=''''0''''orvcount_o=''''1''''then

capture_s<=''''0'''';--清除

elseifcapture_r''''eventandcapture_r=''''0''''then

capture_s<=''''1'''';--置状态位

endif;

endprocess;

同步信号检测:

只有在采集状态capture_s有效时(‘1’)才检测场同步信号,场同步信号下降沿置场有效状态(vsync_s),场地址发生器溢出位vcount_o清除场有效状态。只有在vsync_s有效情况下才检测行同步信号,行同步信号下降沿置行有效状态(hsync_s),行计数器溢出信号hcount_o清除行状态。只有在行状态有效的情况下计数器才工作,且将数据写入RAM。

Process(capture_s,reset,vcount_o,vsync)

Begin

Ifreset=''''0''''orvcount_o=''''1''''orcapture_s=''''0''''then

Vsync_s<=''''0'''';--清除

Elseifvsync''''eventandvsync=''''0''''then

Vsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

Process(vsync_s,reset,hcount_o,hsync)

Begin

Ifvsync_s=''''0''''orreset=''''0''''orhcount_o=''''1''''then

Hsync_s<=''''0'''';--清除

Elseifhsync''''eventandhsync=''''0''''then

Hsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

五、讨论

我们在基于TI公司的TMS320C3X系列DSP开发的嵌入式指纹图像处理模块中分别用上述两种方法成功实现了指纹图像的采集。

采用I/O接口方式最关键的是要求处理器的频率远高于图像数据输出的频率。例如,如果处理的指令周期为20ns,读取每个数据需要10个指令周期,则数据的输出频率不能超过5MHz,它低于一般的CMOS图像传感器件最快的数据输出频率。例如国内使用较多的OV7610和OV7620,其正常输出数据频率为13.5MHz。在应用过程中,通常改变传感器中寄存器的设置值,降低其数据输出频率。

本文选用的是CMOS数字输出图像传感器。对于模拟视频信号,在设计时应加同步分离和A/D转换电路。图像采集的数字接口和逻辑控制与本文相同。

数字图像范文篇9

【关键词】证据发现;司法取证;证明力;图像增强;图像复原

引言

智能设备的兴起和网络传输的便利,使得数字图像和视频成为记录各种场景的大众化选择。自《刑事诉讼法》将视听资料、电子数据列为法定证据种类以来,数字图像以其直观、稳定和高度针对的特性,为司法活动各个环节的顺利进行提供着证据支撑,数字图像的质量成为影响其证明力的关键因素。数字图像的质量受人工操作、设备性能和拍摄环境的综合影响,不可避免会出现变形、模糊、低分辨率、噪声、雾霾等现象,进而导致图像失真、细节特征不明显,影响数字图像的证据能力。基于证据发现的数字图像司法取证以寻找和发现证据为目的,依照法定的技术规范,通过对图像进行增强、降噪、复原、几何变换等处理,还原图像所记载的原始信息,凸显图像细节特征,为后期的证据评估奠定基础。本文从证据发现的视角出发,通过理论研究,结合实际操作规范,论证数字图像司法取证的可行性方法。

1基于证据发现的司法取证

司法取证是一种证据调查活动,指司法机关、权利主体及其人在计算机网络环境下从多样化、动态传输中的数据源中以科学可证实的技术来获取、融合、识别、检查、关联、分析以及归档数字证据,其目标是发现与案情相关或企图关联的事实,恶意非授权的行为及为重构事件提供信息和依据。按照性质不同,计算机司法取证可以分为基于证据发现的司法取证和基于证据评估的司法鉴定。在基于证据发现的司法取证中,委托人希望通过专门的司法取证活动,找出能够证明案件事实的某种证据。从这一角度看,它就是一种寻找和发现证据的活动。从实践操作看,基于证据发现的司法取证主要出现在视听资料和电子数据领域,由具有专门知识的人依据相关技术规范进行操作,所发现的证据才具有证明力。在刑事诉讼中的侦查阶段,当侦查机关依靠自身力量无法从现有证据中深入挖掘犯罪线索和事实时,往往指派、聘请有专门知识的人开展基于证据发现的司法取证活动。根据采用的技术手段和措施以及期望目标不同,基于证据发现的司法取证可以分为数据内容分析、数据恢复、数据检索与固定、数据来源分析等。

1.1数据内容分析

数据内容分析是指对隐藏的、未知内容的数据进行发现和分析,确定数据所表达的信息内容的技术。在司法取证中,数据内容分析不仅是证据发现的重要内容之一,也是证据评估的重要手段和前提。常见的数据内容分析主要包括:乱码分析:由于不同的国家和地区有不一样的标准,计算机通过网络进行数据交换时,需要选择正确的编码去翻译相关数据。当对文件数据采用了错误的解释方式,如错误的字符编码、文件格式、解码程序等,就无法完整、客观地了解文件所包含的信息内容,从而出现乱码、文件不可读、视频或图像文件降质、失真等情况。加密信息分析:当文件或数据的信息进行加密后,其信息内容将不可读取。常用的破解加密信息的途径一是通过技术手段找到加密使用的秘钥或者解密密钥,另一种方式是直接推理或者强力破解加密信息的内容。隐藏数据发现:电子数据往往需要依赖计算机系统或网络进行存储和传输,有些数据被人为隐藏,非专业人员无法发现其存在的位置及其具体的信息内容。通过专业知识和专业设备,可以定位隐藏数据,并理解其信息内容。

1.2数据恢复

数据恢复是指被系统删除或被破坏的、不能被系统正确识别和处理的数据信息,通过特殊手段恢复到可被系统识别的技术。数据恢复技术主要针对存储设备因硬件损坏、删除和格式化操作等行为所导致的通过系统正常访问途径无法访问或读取的数据。根据数据恢复技术采用的技术手段差异,数据恢复可分为物理层面的修复,主要解决存储设备因物理故障导致数据读写困难甚至不能读取数据时,排除故障并正常读取数据的技术;软件层面的修复,主要是按照存储的二进制数据的结构和格式,恢复所需的数据,包括基于文件系统的数据恢复和基于文件特征的数据恢复。

1.3数据检索与固定

在电子数据的司法取证中,需要通过专业技术手段,在计算机存储设备和网络中,检索与案件有关的数据并按法定操作规范将其固定存储,为电子数据提升为证据提供法律依据。按照所使用的技术手段分类,可分为数据过滤技术,数据挖掘技术等,从司法取证鉴定实务中常使用的检索方法看,包括基于数据内容的检索技术、基于指纹信息的检索技术、基于痕迹信息的检索技术等。

2数字图像证据的困境

自被列为法定证据种类以来,数字图像就议。一方面,数字图像以其获取和传播的便捷和展现事实的直观,广受司法机关的欢迎;另一方面,图像处理软件的兴起,使得数字图像面临着越来越严重的“信任危机”,“有图有真相”的传统观念受到挑战。证据具有客观真实性、关联性和合法性三个属性。作为证据,数字图像首先要考虑的就是真实性。因为数字图像可以被越来越多的图像处理软件很轻易地进行修改和编辑,数字照片甚至可以按照修改者的意图被“拍摄”出来。在这种情况下,解决数字图像“从何而来”、“怎样产生”、“是否被修改”及“怎样被修改”就成为衡量数字图像证明力的关键。目前关于数字图像的真实性鉴定还停留在理论研究层面,在具体的实践操作中主要依靠经验完成。关于数字图像真实性鉴定的理论研究,在针对多重JPEG压缩的篡改鉴定方面,通过可变分块的方法,可以实现对图像篡改经历的快速检测和篡改定位的有机结合;利用滑窗的方式,可以以细粒度检测图像的篡改历史。在计算机视觉与图像篡改鉴定结合方面,通过深度结合,降低基于计算机视觉的算法的假设强度,增强算法的适用性,并提出基于消隐点、相机外部旋转矩阵等计算机视觉工具的图像鉴定方案。在图像中文字篡改鉴定技术方面,提出利用映射特征对汉字进行鉴定,对怀疑的文字笔画区域提取每个颜色通道图像的笔画边缘点特征。在基于光源信息的篡改鉴定技术方面,通过搜边算子对图像中物体进行边缘提取,进而选取边缘点拟合,再利用K-K-T条件求解关于光照方向的凸规划,实现对物体光照方向的较准确的估计。图像真实性鉴定的主要法律依据是《图像真实性鉴定技术规范》(SF/ZJD0302001—2015),在对图像做真实性鉴定时,其主要评价依据为图像的关联性、一致性,EXIF及图像的数据结构,图像的成像合理性,图像是否存在异常区域或像素分布,数字水印的内容及完整性。上述评价依据主观及经验居多,可量化的数据指标少,给图像的真实性鉴定留下一定人为空间。因此,在数字图像领域,基于证据发现的数字图像司法取证成为数字图像证明力的评价指标之一。

3基于证据发现的数字图像司法取证

根据《图像资料处理技术规范》(SF/ZJD0302002—2015),对图像资料的处理,需在遵守妥善保管、详细记录及保持图像内容真实性原则的基础上,开展图像采集、图像分析和图像处理工作。

3.1图像采集

图像采集工作是数字图像司法取证的首要步骤,图像采集的质量影响着司法取证工作的顺利进行。对于原始检材为模拟图像的,应当使用扫描仪、照相机等图像采集设备,选择适当参数,在保证图像质量的前提下将模拟图像转换为数字图像。数字图像的采集,相对模拟图像较为便捷,但要求完整采集且不能对原始图像有修改,主要采集方式为采集原始图像的镜像文件及写保护复制。当采集图像格式不被图像处理系统读取而出现图像失真时,可以通过格式转换,将采集图像转换为图像处理系统支持的文件格式,便于后续工作的开展。

3.2图像分析

图像分析是结合司法取证的要求,对采集图像的整体或局部进行分析,为后期的图像处理指明正确的方向。从整体上看,需要分析导致图像不清晰的原因,如噪声、运动模糊、离散焦模糊、雾霾天气等;从局部上看,应结合实际要求,明确需要凸显图像细节特征的区域及预期效果。最后,需要结合待处理图像状况和处理目的,选择适当的处理方法、处理顺序和处理工具。

3.3图像处理

图像处理是基于证据发现的数字图像司法取证的关键环节,通过图像处理,凸显图像的细节特征,从而提升数字图像的证明力。从发现证据的角度出发,图像处理技术包括增强处理、降噪处理、复原处理和几何变换。

3.3.1增强处理

图像增强是指在不增加图像数据相关信息的基础上,针对整幅图像或选定区域的细节特征进行强调或锐化,目的是增加所选特征的动态范围,提升图像特征的辨识度。在增强处理中,可以通过调节亮度、对比度等参数,对图像的明暗进行调整,通过调节色调、饱和度等参数,对图像色彩进行调整。除此之外,使用锐化、强化边缘等滤波方式,通过逐步调节参数,可以达到增强特定区域图像细节的效果。

3.3.2降噪处理

数字图像中的噪声是图像在获取和传输过程中,受到的随机信号的干扰,妨碍人们识别和理解图像的重要因素之一。为便于对图像进行理解和分析,常常需要对图像进行去噪处理。图像去噪方法一般分为空间域去噪和变换域去噪。空间域去噪的方法主要是利用各种滤波器对图像进行去噪,变换域去噪是将原图像转换到变换域进行处理,然后反变换回空间域,以达到去噪的目的。不同的变换方法在变换域得到的变换系数具有不同的特点,根据这些特点合理处理变换系数,就可以达到消除和减轻噪声的目的。在基于证据发现的数字图像司法取证中,根据图像的噪声类型选择适当的降噪滤波器,并通过调节降噪参数,达到较佳的视觉效果,可以为凸显图像细节特征,提高证据发现提供有力支撑。

3.3.3复原处理

在图像的摄取、传输、存储和处理过程中不可避免要引入某些失真因素而导致图像退化。从成像系统的各个环节看,造成图像退化的原因大致可分为太阳辐射、大气湍流、云雾遮挡造成的图像失真;摄像装置与景物的相对运动造成的运动模糊;聚焦不良造成的散焦模糊等。图像复原的主要目的是去除影响图像正常显示的各种因素,使复原后的图像具有最大的保真度。在对图像进行复原处理时,需要根据图像的退化原因选择适当的去模糊滤波器,并调节处理参数,使复原图像达到较佳的视觉效果,以充分显示出图像的细节特征。

3.3.4几何变换

成像系统光轴和景物之间存在一定倾斜角度所拍摄的图像,是图像几何畸变最常见的情况。除此之外,由光学成像系统或电子扫描系统的限制而产生的枕形或桶形失真也是图像几何畸变的常见情况。在图像的几何变换中,应根据图像的变形情况选择适当的校正工具,并调节控制参数,达到较佳的校正效果。图像处理的结果直接影响着证据的发现与证据的证明力。由于图像降质的原因往往不是单一原因,在图像处理中,应根据案件需要,选择合适的处理顺序,综合使用多种处理方式和工具,调解处理参数,对整幅图像或者特定区域进行处理,以达到最佳的处理效果。

4结语

数字图像范文篇10

为了突破肉眼在色彩识别能力方面的局限性,在不影响图像内容真实性的情况下,应用图像处理软件对图像进行增强处理,平衡调整色阶以增强色彩饱和度、灰度、对比度、γ值,增强图像的对比效果,化腐朽为神奇,使肉眼难以察觉的细微色彩变化无所遁形、直接呈现在检验人员面前;另外对于刮擦残余的文字痕迹,还可以应用软件进行自动匹配识别,对图像文字进行综合分析,最大程度的还原被破坏的文字信息,为还原案件事实提供可靠的科学依据。

2、计算机技术在笔迹检验中的应用

如果在工作中使用传统的笔迹鉴定的方法就要受到鉴定人员自身的专业知识以及业务水平等多种因素的影响,同时,使用传统的方法进行文件检验鉴定工作的流程相对比较复杂,工作效率也并不是很高,无法适应当前办公自动化的发展趋势。如果在这项工作中引入计算机技术,可以更好的提高其可靠性,为特征比对提供更为有利的检验环境。利用扫描技术对检材进行数字化采集后,可以对数字图像进行局部处理和编辑,形成数字图像形式的特征比对表,超高分辨率的数字图像将笔划细节展露无遗。有条件的机构还可以应用高清视频会议技术,组织专家进行远程会鉴,分享得到的高清数字图文,进一步巩固鉴定结论的准确性。

3、计算机技术在印章印文检验中的应用

使用传统的检验方法需要检验人员应用三角尺、圆规等测量工具进行多角度测试,寻找特征总结规律,检验效率相对较低,通过计算机图像处理中相关技术的应用可以很好的对多个图像进行拼接,同时还可以对其进行重新的排序和处理,半透明重叠比对法可以在印文的检验和套摹笔迹检验当中体现出非常好的应用效果,这样也就使得对比的效果更加直观显著。在检案的过程中经常会遇到文字和印文重叠覆盖或者是纸张自身因素影响肉眼直接观察的不利影响,以往的工作中一般是采用滤色镜对其进行处理,但是这种方法并不能解决全部问题,同时操作的过程中也略嫌复杂。而使用计算机图像处理技术就可以很好的对纸张的背景信息进行过滤,这样一来就给检验工作提供了良好的条件,同时在一些反差不明显,甚至是用肉眼不容易被察觉的印文检验当中,可以使用前面介绍的色阶和色彩平衡等技术来使得图像的反差进一步加大,但是图像增强的本质是对图像信息的改变,检验人员应当避免由于增强过度导致的信息丢失,只要能够满足肉眼分辨即可,切不可调整过度而适得其反。此外,采用计算机图像增强技术进行辅助文书司法检验还具有着以下优势:首先是检验人员不必进暗房,计算机的图像处理软件几乎包括了所有暗房操作技巧,可以很容易进行密度、反差调整、画面裁切等处理。其次是数字图像文件由于其信息的保存介质不同,不会产生传统照片不可逆转的老化失真现象,这样一来也就为图像的长期保存提供了很好的条件,图像在记录和复制、传递、转存等环节都十分的快捷可靠,在进入到信息网络之后,就可以有效的改善工作的质量和水平,此外还可以使得工作的效率得到明显的提升。

4、结束语