首页 > 论文发表知识库 > 图像盲恢复的算法研究论文

图像盲恢复的算法研究论文

发布时间:

图像盲恢复的算法研究论文

张玉君

(地质矿产部航空物探遥感中心研究所北京)

摘要:本文介绍一种独特的航放数据图像复原方法。该方法的主要技术关键是:提出航放数据图像复原原理和理论基础;建立航放数据图像复原处理流程;制定重建数据网格文件的途径;进行航放数据图像复原效果及误差评价。

关键词:航放数据,大气本底,图像处理,图像复原技术。

一、引言

自20世纪70年代初期方柱形NaI晶体进入机载综合航空站以来,航放测量的灵敏度和有效性显著提高,地质及地球物理勘探界对于航空放射性测量的需求产生了根本变化。

在近20年的应用实际中,大气氡本底(简称大气本底)的改正很难准确,它始终是困扰该方法应用效果的主要难点;其后果是在图面上造成条带现象,从而严重地影响着图件的可用性及方法的效果。其原因[1]可概括为:空中所测放射性不仅仅来源于地下,而且受飞机硬件环境、宇宙射线、大气中氡及其子体的影响。后者称之为大气本底干扰,它又受气候、风力、风向、温度、季节及一天中何时测量等因素的影响。大气本底干扰的主要表现形式是架次与架次间本底水平不同。受干扰最大的是铀道,钾道次之,钍道和总道虽较小,但也不可忽视,(见彩版附图7中的图3、图4)。由于这种噪声的存在,来源于地质体的信息常常淹没于噪声之中。图3a(彩版附图7)为哈密土墩测区K(红)、Th(绿)、U(蓝)三元素复原图像,图3b为该测区航放原始数据合成图像,图4a(彩版附图7)表示各架次早、晚校准读数,图4b为总道原始数据图像。条带噪声的存在,可以形象地比喻为挂在有用信息图像前面的彩条窗帘,条带的严重性使得该工区原始航放数据无法绘制等值线图。

航放图面条带问题是一个“世界性”的问题[2]。解决得较好的是加拿大,靠星罗棋布的湖泊河流等水域上空测量结果改正本底,取得较好的效果,而且不使用向上探头[1]。美国Geometrics公司及其他航空物探公司则是靠向上探头测量,作为本底改正的依据[3]。1986年Grasty[4]提出当测区内没有湖泊时,可用测线上无异常区的平均值代替本底。

本文介绍的方法与国际上已采用的各种方法全然不同,该方法在数字图像处理学中可称之为航放图像复原技术。图像复原技术的主要目的,是要改善给定的图像。复原是一个过程,它试图利用蜕化现象的某种先验知识,把已经蜕化了的图像加以重建或恢复。因此,复原技术是把蜕化模型化,并运用相反的过程在某种程度上恢复原来的图像。

Cannon博士[5]研究了一种图像复原技术或称图案去除技术,它适用于:从规则图案(如纺织品)上提取指纹图形,改善散焦图像,消除卫片图像探测器与探测器间的噪声,使在曝光过程中相机或物体平移造成模糊的图像清晰化等。Srinivasan也报道了这类研究[6]。张玉君等研究了深海锰结核照片光照不均匀等蜕化现象的图像复原问题[7]。航放数据图像复原处理是数字图像复原技术在地学界成功应用的又一实例,但航放数据图像所存在的蜕化问题与上述各例均不相同。该方法研究成功后,曾在6个测区得到验证。

二、航放数据图像复原技术原理和理论基础

航放所测到的是一幅蜕化了的图像G(x,y)它可视为由真实图像F(x,y)与干扰图像η(x,y)叠加而成,简化了的蜕化过程,见图1。航放图像蜕化现象的先验知识来自对航放测量过程及原始图像的分析。在测量过程中,来自地质体的有用信息是不随时间为转移的。而干扰在本质上是随时间变化的,但在图像上干扰已变为(x,y)的函数,因为:

张玉君地质勘查新方法研究论文集

图1航放数据图像蜕化示意图

η的变化可分为架次之间的跳变及架次之内的渐变,见图4(彩版附图7),在每一测线上此干扰大致为一个常数,如果将x(即图像上的列)表示垂直测线的方向,则η(x,y)简化为η(x),则有

张玉君地质勘查新方法研究论文集

航放图像复原的目的,就在于设法近似地求出η(x),从而近似地得到F(x,y)。为此,沿测线方向对原始图像进行多次单列

多行窄长窗口褶积:

张玉君地质勘查新方法研究论文集

式中W为褶积模板,是由加权因子组成的矩阵。褶积过程是一种线性运算,其算子H不随空间变化。因为算子为线性的,则两个输入之和的响应等于两个响应之和。

张玉君地质勘查新方法研究论文集

由于假定了η仅与x有关,又由于褶积窗口为单列,则有:

张玉君地质勘查新方法研究论文集

现在分析HF(x,y)的性质,由于沿y方向的多次滑动平均,局部异常“淹没”于近区域特征之中,这种近区域特征表现为沿测线方向的低缓变化;如果用f(x,y)表示局部异常,用L(x,y)表示近区域场,于是:

张玉君地质勘查新方法研究论文集

再经如下处理

张玉君地质勘查新方法研究论文集

由(9)式可见,从原始图像中减去噪声图像后,所得复原图像f(x,y),它从局部异常角度是接近真实图像的,误差取决于所减去的“近区域背景值”在测线方向起伏变化的幅度。

三、航放数据图像复原处理过程

航放数据图像复原技术的研究是以多元统计为理论基础,以图像处理为工具来完成的,并体现了图像处理快速直观的特点,其流程如图2所示。

图2航放数据图像复原处理流程

此方法假定航放噪声本底沿测线方向不变或呈线性变化。通过沿测线方向的多次滑动平均,使局部异常逐渐淹没在噪声本底之中,得出一幅与噪声本底线性相关的噪声图像。噪声图像尚需进行边缘影响补偿;对去除噪声后的图像,经中值滤波和空间变量反差增强,达到最终复原的效果。这一复原过程集中表示于图2的左半部。

图2的右半部为数据网格文件的重建过程,它是实际应用所必不可少的。经过分类分区,求得各类别在复原前后的均值向量,经最小二乘拟合求出复原图像的元素含量或计数率值,重新建立为在主计算机上绘制等值线图用的网格文件。

本研究曾试验通过沿测线方向取平均值做为噪声水平,结果不及上述方法理想。

四、效果及误差评价

1.航放数据图像复原的效果

(1)图面直观效果的改善。

可以形象地说,航放图像复原好比揭去一层条带窗帘,使原来透过此窗帘隐约可见的图像显示出了真面目,见图3a(彩版附图7)。图面直观效果的改善还表现在由于定位问题所引起的岩体边界上的锯齿状噪声得以消除,见图5(彩版附图7)。图5为总道对比图像,5a为原始数据,5b表示噪声图像,5c为去噪声后的图像,5d为复原图像。

(2)用复原数据所做等值线图真实可信。

以哈密土墩测区为例,原始资料由于条带干扰,在主计算机上,钾、钍、铀道都无法绘等值线图,仅提供了平剖图;只有总道提供了等值线图,但仍可看到条带的影响。

经图像复原、重建网格文件,反馈回主计算机后绘制了TC、K、Th和U等值线图,现以K道经复原后数据等值线图为例示于图6(彩版附图7),与地质图对比,表明异常和地质体对应良好,各类岩性的放射性趋势也都吻合,证实这些等值线图的可靠性。利用复原图像所做分类图也证实了这一点,见图7(彩版附图7),图7中数字分别为:①超基性岩;②基性岩;③花岗岩;④闪长岩;⑤变质岩;⑥混合岩;⑦第四纪沉积;⑧第三、四纪沉积;⑨第三纪沉积。

(3)有用信息增加。

本研究利用多元统计的方法,对航放图像复原的效果给出定量评价。可用一幅图像有用信息构成的变异值的大小来对它做定量评价。为此应计算全图面总变异对于一个象素的平均值,即平均变异值。用C、C´和C"分别表示原始图像中有用信息平均变异值、原始图像中干扰信息平均变异值和最终复原图像有用信息平均变异值。统计时以G´(x,y)近似代表η(x);以[G(x,y)-G´(x,y)]近似代表F(x,y);以P(x,y)表示最终复原图像,并假定它已无干扰存在。

张玉君地质勘查新方法研究论文集

式中,字母上加“—”表示平均值;M、N为图像的行、列数。

表1为哈密土墩测区航放数据图像按上述各式所做定量评价的统计结果。

表1

从表1可见,K、Th、U、TC经图像复原后,有用信息都有十分显著的增长;就此工区而论,TC和K原始图像相对质量较好,Th和U较差。

2.复原图像的准确度及误差评价

复原图像的主要误差来源是“近区域背景值”L(x,y),它是在多次滑动平均时形成的。通过对干扰图像剖面数据的统计,得到以下准确度评价:

K±(绝对含量);Th+ pp m;

U± ppm;TC±计数。

五、结论

(1)本文介绍的方法是在国内外首次提出的方法独特的航放数据图像的复原技术,并在多个工区验证了其可靠性和实用性。

(2)本技术可以基本上消除由于大气本底及阈值变动所造成的图面条带现象,基本复原航放图像的真面目,为进一步图像处理(诸如:求导、增强、分类、逻辑运算等)做了准备,因此本技术也是一种快速预处理方法。

(3)本方法改善了由于飞行往返定位位移所引起的某些地质体边缘呈锯齿状的图像噪声问题。

(4)本研究建立了“有用信息平均变异值”做为定量评价航放数据图像复原效果的尺度。还讨论了图像复原做为一种预处理过程,对于元素含量值可能导入的绝对误差或称为方法的准确度。

参考文献

[1]Grasty, ., Gamma ray spectrometric methods in uranium exploration—Thcory and operational procedures, Geophysics and Geochemistry in the Search for Metallic Ores,GSC,Ottawa,147-162,1977.

[2]Creen, airborne gamma-radiation data using between-channel correlation information,Geophysics,52,1557-1562,1987.

[3]Foote, ., Improvement in airborne gamma-radiation data analysis by removal of environmental and pedologic radiation changes, in the Use of Nuclear Techniques in Prospecting and Developmcnt of Mineral Resources: Energy Agency Mtg.,Buenos Aires,187-196,1968.

[4]Grasty, system for computing on-line atmospheric backgrounds,GSC paper,1-52,1987.

[5]Cannon,M.,Lehar, Preston,F.,Background pattern removal by power spectral filtering,Applied Optics,22,777-779,1983.

[6]Srinivasan,R.,Software image restoration techniques,Digital Design, 16,4,27-34, 1986.

[7]张玉君,史鉴文.深海多金属结核照片的图像复原和图像处理技术研究.物探与化探,1989,(13):435~441.

致谢林振民同志对本文提出了宝贵的意见,史鉴文同志参加了重复工区试验,张志民和谢欣同志分别编制了网格文件转换和最小二乘拟合程序,杨星虹同志拍摄了屏幕图片,水恩海同志搜集了试验工区校准资料,在此一并致谢。

A STUDY ON IMAGE RESTORATION TECHNIQUES FOR AERORADIOMETRIC DATA

Zhang Yu jun

(Research Institute, Center of Aero-Gcophysics and Remote Sensing,Ministry of Geology and Mineral Resources, Beijing)

Abstract

This paper represents a specific methodfor restoration of images of airborne radiometric main technical keys involved in this study are;the advancementof the principles and theory;the establishment of the flow-diagram for processing;the formulation of the means for reestablishment of the gridded data file;the evaluation of the restoration results and the errors, involved by the restoration processing.

Key words Aeroradiometric data, Atmospheric background, Image processing, Image restoration techniques.

原载《地球物理学报》,1990,。

论文简介: 利用图像传输理论测量海水的点扩散函数和调制传递函数并且使用维纳滤波器复原模糊的图像。退化方程H(u,v)在水槽中测量得到。在实验中利用狭缝图像和光源,第一步:一维光照射到水中从而得到不同距离下的狭缝图像数据,这样一维的海水点扩散函数就可以通过去卷积得到。又因为点扩散函数的对称性二维的函数模型也可以通过数学方法得到。利用相似的方法调制传递函数也可以得到。这样传输方程便可以得到:

图像可以由下式获得:

论文简介: 论文中提出自然光照下的水下图像退化效果与光偏振相关,而场景有效箱射则与光偏振无关。在相机镜头端安装可调偏振器,使用不同偏振角度对同一场景成两幅图像,所得到的图像中的背景光会有明显不同。通过对成像物理模型的分析,利用这两幅图像和估计出的偏振度,就能恢复出有效场景辐射。他还提出了一个计算机视觉方法水下视频中的退化效应。分析清晰度退化的物理原因发现主要与光的部分偏振有关。然后提出一个逆成像方法来复原能见度。该方法基于几张通过不同偏振方向的偏振片采集图像。

论文简介: 论文提出了一种自适应滤波的水下图像复原方法。通过最优化图像局部对比度质量判决函数,可以估计出滤波器中所使用的参数值。 论文提出一种基于简化的Jaffe-McGlamery水下成像模型的自调谐图像复原滤波器。滤波器的最优参数值是针对每幅图像通过优化一个基于全局对比度的质量准则自动估算的。(对一幅图像滤波器能根据全局对比度自动估计最优参数值),简化的模型理想地适合后向散射较少的漫射光成像.1.首先简化Jaffe-McGlamery水下成像模型:假设光照均匀(浅水区阳光直射),并且忽略后向散射部分.然后基于简化后的成像模型设计一个简单的反滤波器2.将滤波器设计成自适应滤波器。

论文简介: 论文对于调制传递函数给出了详细准确的系统函数信息,水下图像可以用它或点扩散函数进行复原.作者进行实验测量了水质参数得出了这些函数,并用得出的函数进行了图像复原。同时他还建立了一个框架来最大限度复原水下图像,在这个框架下传统的图像复原方法得到了拓展,水下光学参数被包含了进去,尤其时域的点扩散函数和频域的调制传递函数。设计了一个根据环境光学特性进行调整的客观图像质量度量标准来测量复原的有效性。

论文简介: 调制传递函数给出了详细准确的系统函数信息,水下图像可以用它或点扩散函数进行复原.作者进行实验测量了水质参数得出了这些函数,并用得出的函数进行了图像复原。(这一部分在王子韬的论文中有比较详细介绍)

论文简介: 在散射媒介中的正则化图像复原。论文在基于物理原因的复原方法难以去除噪声以及透射率低的基础上,提出一种自适应的过滤方法,即能明显的改善可见性,又能抑制噪声放大。本质上,恢复方法的正规化,是适合变化媒介的透射率,因此这个正则化不会模糊近距离的目标。

论文简介: 论文提出一种基于对边缘进行GSA(灰度规范角度)加权的测量图像清晰度的方法。图像首先被小波变换分解,去除部分随机噪声,增加真实边缘检测的可能性。每个边缘锐度由回归分析方法基于灰度的一个角的正切来确定边缘像素的灰度值之间的斜率和位置。整个图像的清晰度是平均每个测量的GSA的比例加权的第一级分解细节的量,作为图像的总功率,最后通过图像噪声方差自适应的边缘宽度。

论文简介: 论文提出了基于主动偏振的人工光照下水下图像处理技术。在宽场人工光照下的水下成像中,在光源端或相机端安装可调偏振器。通过调整光源或相机端的偏振器,同时拍摄两幅或多幅同一场景的图像,从两幅图像中可估计出背景光的偏振度。结合水下成像物理模型,就可以进行图像复原和场景3D信息估计。该方法操作简单,设备筒易,适用于水下画定目标的成像。 大范围人工照明条件下研究成像过程,基于该成像模型,提出一种恢复object signal的方法,同时能获得粗糙的3D scene structure.相机配备检偏振器,瞬间获取同一场景的两帧图片with different states of the analyzer or light-source polarizer,然后用算法处理获取的图片.它统一并推广了以前提出的基于偏振的方法.后向散射可以用偏振技术降低,作者在此基础上又用图像后处理去除剩余的后向散射,同时粗糙估测出3D场景结构.创新:之前的方法有的认为目标物反射光的偏振度可以忽略(即认为只有后向散射是偏振的);另外还有的认为后向散射的偏振度可以忽略(即认为只有目标物反射光是偏振的)。本文作者认为两者都是部分偏振光。

论文简介: 论文在没有应用任何标准模式、图像先验、多视点或主动照明的条件下同时估算了水面形状和恢复水下二维场景。重点是应用水面波动方程建立紧凑的空间扭曲模型,基于这个模型,提出一个新的跟踪技术,该技术主要是解决对象模型的缺失以及水的波动存在的复杂的外观变化。在模拟的和真实的场景中,文本和纹理信息得到了有效的复原。

论文简介: 论文提出暗通道先验算法复原有雾图像。暗通道先验是一系列户外无雾图像的数理统计,基于观察户外无雾图像的大部分补丁补丁中包含至少一个颜色通道中低强度的像素点。在有雾图像中应用这些先验,我们可以直接的估算雾的厚度,复原成高质量的无雾图像,同时还能获得高质量的深度图。

论文简介: 论文比较研究了盲反卷积算法中的:R-L算法(Richardson-Lucy)、最小二乘法以及乘法迭代法。并且应用了水下图像去噪和威尔斯小角度近似理论推导出点分布函数。通过执行威尔斯的小角度散射理论和模糊度量方法对三种盲反卷积算法进行比较,确定总迭代次数和最佳图像复原结果。通过比较得出:最小二乘算法的复原率最高,但是乘法迭代的速度最好。

论文简介: 论文提出点扩算函数(PSF)和调制解调函数(MFT)的方法用于水下图像复原,应用基于威尔斯小角度近似理论来进行图像增强。在本文中作者分析了水下图像退化的原因,在强化超快激光成像系统中采用了距离选通脉冲的方法,降低了反向散射中的加性噪声。本文对图像的基本噪声模式进行了分析,并使用算术平均滤波首先对图像进行去噪,然后,使用执行迭代盲反褶积方法的去噪图像的初始点扩散函数的理想值,来获得更好的恢复结果。本文通过比较得出,盲反褶积算法中,正确使用点扩散函数和调制解调函数对于水下图像复原的重要性。

论文简介: 本文提出一种图像复原的新方法,该方法不需要专门的硬件、水下条件或现在知识结构只是一个与小波变换的融合框架支持相邻帧之间的时间相干性进行一个有效的边缘保留噪声的方法。该图像增强的特点是降低噪声水平、更好的暴露黑暗区域、改善全局对比、增强细节和边缘显著性。此算法不使用补充信息,只处理未去噪的输入退化图像,三个输入主要来源于计算输入图像的白平衡和min-max增强版本。结论证明,融合和小波变换方法的复原结果优于直接对水下退化图像进行去雾得到的结果。

论文简介: 本文是一篇综述性质的论文。介绍了:1、水下光学成像系统 2、图像复原的方法(对各种图像复原方法的总结) 3、图像增强和颜色校正的方法总结 4、光学问题总结。

论文简介: 论文针对普通水下图像处理的方法不适用于水下非均匀光场中的问题,提出一种基于专业区域的水下非均匀光场图像复原方法,在该算法中,考虑去除噪声和颜色补偿,相对于普通的水下图像复原和增强算法,该方法获得的复原复原的清晰度和色彩保真度通过视觉评估,质量评估的分数也很高。

论文简介: 论文基于水下图像的衰减与光的波长的关系,提出一种R通道复原方法,复原与短波长的颜色,作为水下图像的预期,可以对低对比度进行复原。这个R通道复原的方法可以看做大气中有雾图像的暗通道先验方法的变体。实验表明,该方法在人工照明领域应用良好,颜色校正和可见性得到提高。

论文简介: 作者对各种水下图像增强和复原的算法做了调查和综述,然后对自己的提高水下质量的方法做了介绍。作者依次用到了过滤技术中的同态滤波、小波去噪、双边过滤和对比度均衡。相比于其他方法,该方法有效的提高了水下目标物的可见性。

论文简介: 论文应用湍流退化模型以质量标准为导向复原因水下湍流退化的图像。参考大气湍流图像复原的算法,省略了盐分的影响,只考虑水中波动引起的湍流对水下成像的影响,应用一种自适应的平均各向异性的度量标准进行水下图像复原。经过验证,使用STOIQ的方法优于双频谱的复原方法。

论文简介: 本文提出了一种新的方法来提高对比度和降低图像噪声,该方法将修改后的图像直方图合并入RGB和HSV颜色模型。在RGB通道中,占主导地位的直方图中的蓝色通道以95%的最大限度延伸向低水平通道,RGB通道中的低水平通道即红色通道以5%的最低限度向上层延伸且RGB颜色模型中的所有处理都满足瑞利分布。将RGB颜色模型转化为HSV颜色模型,S和V的参数以最大限度和最小限度的1%进行修改。这种方法降低了输出图像的欠拟合和过拟合,提高了水下图像的对比度。

论文简介: 论文根据简化的J-M模型提出一种水下图像复原的有效算法。在论文中定义了R通道,推导估算得到背景光和变换。场景可见度被深度补偿,背景与目标物之间的颜色得到恢复。通过分析PSF的物理特性,提出一种简单、有效的低通滤波器来去模糊。论文框架如下:1.重新定义暗通道先验,来估算背景光和变化,在RGB的每个通道中通过标准化变换来复原扭曲颜色。2.根据PSF的性能,选择没有被散射的光,用低通滤波器进行处理来提高图片的对比度和可见度。

论文简介: 论文中对当代水下图像处理的复原与增强做了综述,作者阐明了两种方法的模型的假设和分类,同时分析了优缺点以及适用的场景。

参考:

单片机图像恢复毕业论文

单片机毕业论文答辩陈述

难忘的大学生活将要结束,毕业生都要通过最后的毕业论文,毕业论文是一种有计划的检验大学学习成果的形式,那么毕业论文应该怎么写才合适呢?以下是我为大家收集的单片机毕业论文答辩陈述,仅供参考,希望能够帮助到大家。

单片机毕业论文答辩陈述

各位老师好!我叫刘天一,来自**,我的论文题目是《基于AVR单片机的GSM—R基站天线倾角测量系统》。在这里,请允许我向宁提纲老师的悉心指导表示深深的谢意,向各位老师不辞劳苦参加我的论文答辩表示衷心的感谢。

下面我将从论文的背景意义、结构内容、不足之处三个方面向各位老师作一大概介绍,恳请各位老师批评指导。

首先,在背景和意义上,移动通信网络建设初期,基站站间距大、数量少、站型也不大,并且频率资源相对比较丰富。在这一阶段的网络规划时很少对天线的倾角做详细的规划,基站功率常常以满功率发射。对于越区覆盖则主要通过增加邻区的办法予以解决。

但随着网络的迅速发展,城市中的基站越来越密集,在一个中等城市通常分布着数十个基站,在省会城市更是达到了数百个基站之多,并且基站的密度越来越高,站型也越来越大,如果对越区覆盖的问题仍然釆用老办法解决,那么网络质量将难以保证。因此有必要在规划阶段就对基站天线的倾角、基站静态发射功率等进行更加细化合理的规划,从而减轻优化阶段的工作量。

合理设置天线下倾角不但可以降低同频干扰的影响,有效控制基站的覆盖范围,而且可以加强本基站覆盖区内的信号强度。通常天线下倾角的设定有两方面侧重,一方面侧重于干扰抑制,另一方面侧重于加强覆盖。这两方面侧重分别对应不同的下倾角算法。一般而言,对基站分布密集的地区应该侧重于考虑干扰抑制(大下倾角);而基站分布比较稀疏的地方则侧重于考虑加强覆盖(小下倾角)。

规划阶段进行的倾角设计,在实际施工过程中会出现一定的偏差,在使用的过程中,由于季节变化或风、雨、雪、温度、湿度等自然条件影响,基站天线倾角会发生变化,进而影响场强质量。而移动通信已经是人类日常生活中不可或缺的一部分,正常的通信离不开基站的建设与维护,因此,基站天线倾角的实时、精确测量就显得尤为重要了。但现阶段移动通信基站的天线方位角、下倾角等基本是依靠人工现场通过罗盘、坡度仪等仪器进行测量得到的,而且由于基站的数量巨大,因而测量耗费了大量的时间、人力、物力,并且存在较大的测量人员人身安全隐患。因此,实现一种省时、省力的自动化测量仪器是非常亟需的。

为此,拟研发GSM—R基站天线倾角测量系统,实现不登塔作业即可完成基站天线倾角的测量工作,并可对各基站测试点进行联网,实现对基站天线倾角的实时监测。本系统可以大大降低GSM—R系统现场维护作业的人身安全风险和作业难度、强度,具有很高的实用性和安全性。

其次,在结构内容上,论文主要对基站倾角测量系统进行设计,主要研宄内容为:

(1)根据控制要求,选用倾角测量模块;学会使用并通过使用手册深入学习其特性及原理。

(2)采用ATmegal62作为控制芯片,进行倾角测量系统的硬件电路设计。整个系统分为主板和从板,通过芯片内置的TWI串行总线传输接口进行通信,由主板将数据通过无线模块发送给手持终端。

(3)采用JZ863数传模块,将其与上位机控制芯片、下位机控制芯片的异步串行接收/发送器USART连接,进行上位机与下位机的无线数据通信。

(4)在硬件平台基础上根据模块化思想进行倾角测量系统的软件程序设计。

(5)在设计好的软硬件平台上进行相关实验,实现控制系统设计目标和要求。

本文各章节安排如下:

第1章“引言”,对倾角测量系统进行了简要概述,介绍了研宄背景,并对本文的内容作了简介。

第2章“倾角测量传感器”,主要分析了本系统比较重要的倾角测量模块的原理以及SCA100T—D01倾角测量芯片,对其各个引脚的功能以及通信协议等进行了阐述,为后面的具体实现打下了基础。

第3章“ATmegal62微处理器结构及原理”,分析了本毕设使用的核心单片机芯片ATmegal62,包括它的各个引脚以及I/O端口,并且分析了本论文主要使用的通信协议,即同步串行SPI接口和USART串行口。

第4章“倾角测量系统软硬件实现”,本章首先对系统的总体设计进行了实现,包括主要的技术指标、主要的功能模块等。接着进行了本系统的硬件实现和软件实现。硬件实现包括各个功能模块的具体电路设计以及最后的PCB电路板制作,软件实现包括各个功能模块的程序设计。

第5章“倾角测量系统调试及实验”,本章主要进行了硬件电路的调试,并介绍了通过AVR Studio进行软件仿真以及下载,最后在搭建的系统软硬件平台的基础上,进行调试和实验,以此来验证基站倾角测量系统的硬件与软件设计。

第6章“结论”,本章主要总结了本论文的研究结果,并阐述了系统的不足之处和对以后工作的展望。

最后,在不足之处上,这篇论文的写作以及修改的过程,也是我越来越认识到自己知识与经验缺乏的过程。虽然,我尽可能地收集材料,竭尽所能运用自己所学的知识进行论文写作,但论文还是存在许多不足之处,有待改进。请各位评委老师多批评指正,让我在今后的学习中学到更多。

[知识拓展]

论文答辩提问方式

在毕业论文答辩会上,主答辩老师的提问方式会影响到组织答辩会目的的实现以及学员答辩水平的发挥。主答辩老师有必要讲究自己的提问方式。

1、提问要贯彻先易后难原则。主答辩老师给每位答辩者一般要提三个或三个以上的问题,这些要提的问题以按先易后难的次序提问为好。所提的第一个问题一般应该考虑到是学员答得出并且答得好的问题。学员第一个问题答好,就会放松紧张心理,增强“我”能答好的信心,从而有利于在以后几个问题的答辩中发挥出正常水平。反之,如果提问的第一个问题就答不上来,学员就会背上心理包袱,加剧紧张,产生慌乱,这势必会影响到对后面几个问题的答辩,因而也难以正确检查出学员的答辩能力和学术水平。

2、提问要实行逐步深入的方法。为了正确地检测学员的专业基础知识掌握的情况,有时需要把一个大问题分成若干个小问题,并采取逐步深入的提问方法。如有一篇《浅论科学技术是第一生产力》的论文,主答辩老师出的探测水平题,是由以下四个小问题组成的。

(1)什么是科学技术?

(2)科学技术是不是生产力的一个独立要素?在学员作出正确回答以后,紧接着提出第三个小问题:

(3)科学技术不是生产力的一个独立要素,为什么说它也是生产力呢?

(4)你是怎样理解科学技术是第一生产力的?通过这样的提问,根据学员的答辩情况,就能比较正确地测量出学员掌握基础知识的扎实程度。如果这四个小问题,一个也答不上,说明该学员专业基础知识没有掌握好;如果四个问题都能正确地回答出来,说明该学员基础知识掌握得很扎实;如果能回答出其中的2—3个,或每个小问题都能答一点,但答得不全面,或不很正确,说明该学员基础知识掌握得一般。倘若不是采取这种逐步深入的提问法,就很难把一个学员掌握专业基础知识的情况准确测量出来。假如上述问题采用这样提问法:请你谈谈为什么科学技术是第一生产力?学员很可能把论文中的主要内容重述一遍。这样就很难确切知道该学员掌握基础知识的情况是好、是差、还是一般。

3、当答辩者的观点与自己的观点相左时,应以温和的态度,商讨的语气与之开展讨论,即要有“长者”风度,施行善术,切忌居高临下,出言不逊。不要以“真理”掌握者自居,轻易使用“不对”、“错了”、“谬论”等否定的断语。要记住“是者可能非,非者可能有是”的格言,要有从善如流的掂量。如果作者的观点言之有理,持之有据,即使与自己的观点截然对立,也应认可并乐意接受。倘若作者的观点并不成熟、完善,也要善意地、平和地进行探讨,并给学员有辩护或反驳的平等权利。当自己的观点不能为作者接受时,也不能以势欺人,以权压理,更不要出言不逊。虽然在答辩过程中,答辩老师与学员的地位是不平等的(一方是审查考核者,一方是被考核者),但在人格上是完全平等的。在答辩中要体现互相尊重,做到豁达大度,观点一时难以统一,也属正常。不必将自己的观点强加于人,只要把自己的观点亮出来,供对方参考就行。事实上,只要答辩老师讲得客气、平和,学员倒愈容易接受、考虑你的观点,愈容易重新审视自己的观点,达到共同探索真理的目的。

4、当学员的回答答不到点子上或者一时答不上来的问题,应采用启发式、引导式的提问方法。参加过论文答辩委员会的老师可能都遇到过这样的情况:学员对你所提的问题答不上来,有的就无可奈何地“呆”着;有的是东拉西扯,与你绕圈子,其实他也是不知道答案。碰到这种情况,答辩老师既不能让学员尴尬地“呆”在那里,也不能听凭其神聊,而应当及时加以启发或引导。学员答不上来有多种原因,其中有的是原本掌握这方面的知识只是由于问题完全出乎他的意料而显得心慌意乱,或者是出现一时的“知觉盲点”而答不上来。这时只要稍加引导和启发,就能使学员“召回”知识,把问题答好。只有通过启发和引导仍然答不出或答不到点子上的,才可判定他确实不具备这方面的知识。

【拓展】

单片机毕业论文开题报告参考

1. 课题名称:

数字钟的设计

近年来,随着单片机档次的不断提高,功能的不断完善,其应用日趋成熟、应用领域日趋广泛,特别是工业测控、尖端武器和日常家用电器等领域更是因为有了单片机而生辉增色,不少设备、仪器已经把单片机作为核心部分。单片机应用技术已经成为一项新的工程应用技术。尤其是Intel公司生产的MCS-51系列单片机,由于其具有集成度高、处理功能强、可靠性高、系统结构简单、价格低廉等优点,在我国得到了广泛的`应用,在智能仪器仪表机电一体化等方面取得了令人瞩目的成果。现在单片机可以说是百花齐放,百家争鸣,世界上各大芯片制造公司都推出了自己的单片机,从8位,16位,到32位,数不胜数,应有尽有由于主流C51兼容的,也有不兼容的,但他们各具特色,互成互补,为单片机的应用提供了广泛的天地。在高节奏发展的现代社会,以单片机技术为核心的数字钟越来越彰显出它的重要性。

3. 设计目的和意义:

单片机的出现具有划时代的意义。它的出现使得许多原本花费很高的复杂电路以及繁多的电气元器件都被取缔,取而代之的是一块小小的芯片。伴随着计算机技术的不断发展,单片机也得到了相应的发展,而且其应用的领域也得到更好的扩展。在民用,工用,医用以及军用等众多领域上都有所应用。为了,能够更好的适应这日新月异的社会,我们应当充实我们的知识面,方能不被时代的潮流踩在脚下。

介于单片机的重要性,我们应当对单片机的原理,发展以及应用有着一定的了解。所以,我们应当查阅相关资料,从而能够对单片机有个全方位的了解。进而将探讨的领域指向具体的国内,从而能够在科技与经济飞速发展的当今社会更好的应用这项技术。事实上,该项技术在国内有着极为广泛的发展前景,因此,通过对本课题的研究,我们因当能够充分认识到单片机技术的重要性,对单片机未来的发展趋势有所展望。

单片机的形成背景:

1.随着微电子技术的不断创新和发展,大规模集成电路的集成度和工艺水平不断提高。硅材料与人类智慧的结合,生产出大批量的低成本、高可靠性和高精度的微电子结构模块,推动了一个全新的技术领域和产业的发展。在此基础上发展起来的器件可编程思想和微处理(器)技术可以用软件来改变和实现硬件的功能。微处理器和各种可编程大规模集成专用电路、半定制器件的大量应用,开创了一个崭新的应用世界,以至广泛影响着并在逐步改变着人类的生产、生活和学习等社会活动。

2.计算机硬件平台性能的大幅度提高,使很多复杂算法和方便使用的界面得以实现,大大提高了工作效率,给复杂嵌入式系统辅助设计提供了物理基础。

3.高性能的EDA综合开发工具(平台)得到长足发展,而且其自动化和智能化程度不断提高,为复杂的嵌入式系统设计提供了不同用途和不同级别集编辑、布局、布线、编译、综合、模拟、测试、验证和器件编程等一体化的易于学习和方便使用的开发集成环境。

4.硬件描述语言HDL(Hardware Description Language)的发展为复杂电子系统设计提供了建立各种硬件模型的工作媒介。它的描述能力和抽象能力强,给硬件电路,特别是半定制大规模集成电路设计带来了重大的变革。

5.软件技术的进步,特别是嵌入式实时操作系统EOS(Embedded Operation System)的推出,为开发复杂嵌入式系统应用软件提供了底层支持和高效率开发平台。EOS是一种功能强大、应用广泛的实时多任务系统软件。它一般都具有操作系统所具有的各种系统资源管理功能,用户可以通过应用程序接口API调用函数形式来实现各种资源管理。用户程序可以在EOS的基础上开发并运行。

单片机的发展历史:20世纪70年代,微电子技术正处于发展阶段,集成电路属于中规模发展时期,各种新材料新工艺尚未成熟,单片机仍处在初级的发展阶段,元件集成规模还比较小,功能比较简单,一般均把CPU、RAM有的还包括了一些简单的I/O口集成到芯片上,它还需配上外围的其他处理电路方才构成完整的计算系统。类似的单片机还有Z80微处理器。

1976年INTEL公司推出了MCS-48单片机,这个时期的单片机才是真正的8位单片微型计算机,并推向市场。它以体积小,功能全,价格低赢得了广泛的应用,为单片机的发展奠定了基础,成为单片机发展史上重要的里程碑。

在MCS-48的带领下,其后,各大半导体公司相继研制和发展了自己的单片机。到了80年代初,单片机已发展到了高性能阶段,象INTEL公司的MCS-51系列,Motorola公司的6801和6802系列等等,此外,日本的著名电气公司NEC和HITACHI都相继开发了具有自己特色的专用单片机。

80年代,世界各大公司均竞相研制出品种多功能强的单片机,约有几十个系列,300多个品种,此时的单片机均属于真正的单片化,大多集成了CPU、RAM、ROM、数目繁多的I/O接口、多种中断系统,甚至还有一些带A/D转换器的单片机,功能越来越强大,RAM和ROM的容量也越来越大,寻址空间甚至可达64kB,可以说,单片机发展到了一个全新阶段,应用领域更广泛,许多家用电器均走向利用单片机控制的智能化发展道路。

1982年以后,16位单片机问世,代表产品是INTEL公司的MCS-96系列,16位单片机比起8位机,数据宽度增加了一倍,实时处理能力更强,主频更高,集成度达到了12万只晶体管,RAM增加到了232字节,ROM则达到了8kB,并且有8个中断源,同时配置了多路的A/D转换通道,高速的I/O处理单元,适用于更复杂的控制系统。

九十年代以后,单片机获得了飞速的发展,世界各大半导体公司相继开发了功能更为强大的单片机。美国Microchip公司发布了一种完全不兼容MCS-51的新一代PIC系列单片机,引起了业界的广泛关注,特别它的产品只有33条精简指令集吸引了不少用户,使人们从INTEL的111条复杂指令集中走出来。PIC单片机获得了快速的发展,在业界中占有一席之地。

随后的事情,熟悉单片机的人士都比较清楚了,更多的单片机种蜂拥而至,MOTOROLA公司相继发布了MC68HC系列单片机,日本的几个著名公司都研制出了性能更强的产品,但日本的单片机一般均用于专用系统控制,而不象INTEL等公司投放到市场形成通用单片机。例如NEC公司生产的uCOM87系列单片机,其代表作uPC7811是一种性能相当优异的单片机。MOTOROLA公司的MC68HC05系列其高速低价等特点赢得了不少用户。

1990年美国INTEL公司推出了80960超级32位单片机引起了计算机界的轰动,产品相继投放市场,成为单片机发展史上又一个重要的里程碑。

我国开始使用单片机是在1982年,短短五年时间里发展极为迅速。1986年在上海召开了全国首届单片机开发与应用交流会,有的地区还成立了单片微型计算机应用协会,那是全国形成的第一次高潮。截止今日,单片机应用技术飞速发展,我们上因特网输入一个“单片机”的搜 索,将会看到上万个介绍单片机的网站,这还不包括国外的。随着微电子技术的高速发展,单片机在国民经济的各个领域得到了广泛的应用。首先,单片机技术不断进步,出现了许多新的技术和新的产品。本文以Intel MCS-51系列单片机为模型,阐述单片机的一般原理、应用以及单片机的影响,较为详细地介绍当前主要单片机厂家的产品系列及发展动向。主要内容包括:单片机的基本原理、硬件结构、发展趋势以及具体的应用介绍。本文主要目的是想让大家对单片机有一个更为深入的了解。

科技的进步需要技术不断的提升。试想,曾经一块大而复杂的模拟电路花费了您巨大的精力,繁多的元器件增加了您的成本。而现在,只需要一块几厘米见方的单片机,写入简单的程序,就可以使您以前的电路简单很多。相信您在使用并掌握了单片机技术后,不管在您今后开发或是工作上,一定会带来意想不到的惊喜。

数字钟的发展:1350年6月6日,意大利人乔万尼·德·党笛制造了世界上第一台结构简单的机械打点多功能数字钟,由于数字钟报价便宜,功能齐全,因此很快受到众多用户的喜爱。1657年,荷兰人惠更斯率先把重力摆引入机械钟,进而才创立了摆钟。

到了20世纪以后,随着电子工业的快速发展,电池驱动钟、交流电钟、电机械表、指针式石英电子钟表以及数字显示式石英钟表相继问世,数字钟报价非常合理,再加上产品的不断改良,多功能数字钟的日差已经小于秒,因此受到广大用户的青睐。尤其是原子钟的出现,它是使用原子的振动来控制计时的,是目前世界上最精准的时钟,即使经过将近100万年,其偏差也不可能超过1秒钟。

多功能数字钟最早是在欧洲中世纪的教堂,属于完全机械式结构,动力使用重锤,打点钟声完全使用人工进行撞击铸钟,所以当时一个多功能数字钟工程在建筑与机械结构方面是非常复杂的,进而影响了数字钟报价。进入电子时代以后,电子多功能数字钟也相继问世。我国电子多功能数字钟行业从80年代开始渐渐成长壮大,目前不仅数字钟报价合理,在技术和应用水平上也已经达到世界同类水平。

4. 国内外现状和发展趋势:

纵观单片机的发展过程,可以预示单片机的发展趋势,大致有:

1.低功耗CMOS化

MCS-51系列的8031推出时的功耗达630mW,而现在的单片机普遍都在100mW左右,随着对单片机功耗要求越来越低,现在的各个单片机制造商基本都采用了CMOS(互补金属氧化物半导体工艺)。象80C51就采用了HMOS(即高密度金属氧化物半导体工艺)和CHMOS(互补高密度金属氧化物半导体工艺)。CMOS虽然功耗较低,但由于其物理特征决定其工作速度不够高,而CHMOS则具备了高速和低功耗的特点,这些特征,更适合于在要求低功耗象电池供电的应用场合。所以这种工艺将是今后一段时期单片机发展的主要途径。

2.微型单片化

现在常规的单片机普遍都是将中央处理器(CPU)、随机存取数据存储(RAM)、只读程序存储器(ROM)、并行和串行通信接口,中断系统、定时电路、时钟电路集成在一块单一的芯片上,增强型的单片机集成了如A/D转换器、PMW(脉宽调制电路)、WDT(看门狗)、有些单片机将LCD(液晶)驱动电路都集成在单一的芯片上,这样单片机包含的单元电路就更多,功能就越强大。甚至单片机厂商还可以根据用户的要求量身定做,制造出具有自己特色的单片机芯片。

此外,现在的产品普遍要求体积小、重量轻,这就要求单片机除了功能强和功耗低外,还要求其体积要小。现在的许多单片机都具有多种封装形式,其中SMD(表面封装)越来越受欢迎,使得由单片机构成的系统正朝微型化方向发展。

3.主流与多品种共存

现在虽然单片机的品种繁多,各具特色,但仍以80C51为核心的单片机占主流。所以C8051为核心的单片机占据了半壁江山。而Microchip公司的PIC精简指令集(RISC)也有着强劲的发展势头,中国台湾的HOLTEK公司近年的单片机产量与日俱增,与其低价质优的优势,占据一定的市场分额。此外还有MOTOROLA公司的产品,日本几大公司的专用单片机。在一定的时期内,这种情形将得以延续,将不存在某个单片机一统天下的垄断局面,走的是依存互补,相辅相成、共同发展的道路。

问:毕业设计做单片机应该怎么做?答:在心中建立一个基本模型,知道应该需要些什么知识,而自己又掌握了多少,并根据一定的灵感开始搜索资料,上面的资料基本上能满足初学者的需求了。选择完成单片机论文后,基于这个方向进行相关资料查找,一般来写作是有自己的基本方法的。先写序论序列部分的话,主要是阐述一下,你的单片机领域之前人干了什么情况,然后存在什么缺点。基于这些缺点你要做什么改进,然后把你目前这个行业内要改进的东西进行写一下,分别通过下述4个章节进行阐述,一般来说主要是把你的硬件选型和为什么这么选型的部分给讲清楚。第3章就是基本的硬件设计这块的话需要画电路图。问:单片机毕业设计那个方向比较好过?答:单片机好过,在实际中应用很广泛问:写有关单片机的毕业论文 可以写控制什么答:单片机的毕业论我理解,但是你没有具体题目功能我怎么半你发哪里问:单片机毕业论文有哪些题目可以参考?答:单片机控制自动恒温箱的设计(电路图+原理图+程序)双坐标步进电机控制系统的设计(论文) 原材料仓物位智能检测系统的设计 单片机多用宽频转速计的设计智能家居安防红外报警器设计(附protel文件)基于单片机的多功能信号发生器设计(新品)数字示波器的设计(AVR单片机)(新品)基于单片机的中文输入系统设计(程序+电路原理图+PCB图)农业暖棚(温室)温湿度控制系统的设计基于单片机喷泉控制系统的设计参考地址:问:跪求单片机相关毕业论文答:单片机类毕业设计·基于单片机的变频恒压供水控制系统的设计·基于单片机的恒压供水系统的设计·基于AT89S51单片机的数字温度计设计·基于单片机的温室大棚测控系统研究·基于单片机的温度测量系统设计·基于单片机温湿度控制系统·基于单片机的自动化点焊控制系统·红外声控报警系统的设计·红外防盗报警器的设计·基于AT89S51单片机的出租车计价器·煤气报警器的设计

图像压缩算法研究论文

数字图像压缩技术的研究及进展摘要:数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法:JPEG、JPEG2000、分形图像压缩和小波变换图像压缩,总结了它们的优缺点及发展前景。然后简介了任意形状可视对象编码算法的研究现状,并指出此算法是一种产生高压缩比的图像压缩算法。关键词:JPEG;JPEG2000;分形图像压缩;小波变换;任意形状可视对象编码一 引 言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。二 JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。1.JPEG压缩原理及特点 JPEG算法中首先对图像进行分块处理,一般分成互不重叠的 大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的。2. JPEG压缩的研究状况及其前景 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:(1)DCT零树编码 DCT零树编码把 DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比 EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。(2)层式DCT零树编码 此算法对图像作 的DCT变换,将低频 块集中起来,做 反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。三 JEPG2000压缩 JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示。编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作。2.JPEG2000压缩的前景 JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。四 小波变换图像压缩1.小波变换图像压缩原理小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的JPEG2000标准 。2.小波变换图像压缩的发展现状及前景 目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。(1)EZW编码器 1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。(2)SPIHT编码器 由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。(3)EBCOT编码器优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。五 分形图像压缩 1988年,Barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的学生提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。1. 分形图像压缩的原理 分形压缩主要利用自相似的特点,通过迭代函数系统(Iterated Function System, IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。 分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像。2.几种主要分形图像编码技术 随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。(1)尺码编码方法 尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度 随着图像各个组成部分复杂性的不同而改变。(2)迭代函数系统方法 迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。(3)A-E-Jacquin的分形方案 A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。3.分形图像压缩的前景 虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。六 其它压缩算法 除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~ [13]。(1)形状自适应DCT(SA-DCT)算法 SA-DCT把一个任意形状可视对象分成 的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应Gilge DCT[10][11]变换的有效变换,但它比Gilge DCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。(2)Egger方法 Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。(3)形状自适应离散小波变换(SA-DWT) Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。 在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。七 总结 图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。参考文献:[1] 田青. 图像压缩技术[J]. 警察技术, 2002, (1):30-31.[2] 张海燕, 王东木等. 图像压缩技术[J]. 系统仿真学报, 2002, 14(7):831-835.[3] 张宗平, 刘贵忠. 基于小波的视频图像压缩研究进展[J]. 电子学报, 2002, 30(6):883-889.[4] 周宁, 汤晓军, 徐维朴. JPEG2000图像压缩标准及其关键算法[J]. 现代电子技术, 2002, (12):1-5.[5] 吴永辉, 俞建新. JPEG2000图像压缩算法概述及网络应用前景[J]. 计算机工程, 2003, 29(3):7-10.[6] J M Shaprio. Embedded image coding using zerotree of wavelet coefficients[J]. IEEE Trans. on Signal Processing, 1993, 41(12): 3445-3462.[7] A Said, W A Pearlman. A new fast and efficient image codec based on set partitioning in hierarchical trees[J]. IEEE Trans. on Circuits and Systems for Video Tech. 1996, 6(3): 243-250.[8] D Taubman. High performance scalable image compression with EBCOT[J]. IEEE Transactions on Image Processing, 2000, 9(7): 1158–1170.[9] 徐林静, 孟利民, 朱建军. 小波与分行在图像压缩中的比较及应用. 中国有线电视, 2003, 03/04:26-29.[10] M Gilge, T Engelhardt, R Mehlan. Coding of arbitrarily shaped image segments based on a generalized orthogonal transform[J]. Signal Processing: Image Commun., 1989, 1(10): 153–180.[11] T Sikora, B Makai. Shape-adaptive DCT for generic coding of video[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(1): 59–62.[12] T Sikora, S Bauer, B Makai. Efficiency of shape-adaptive 2-D transforms for coding of arbitrarily shaped image segments[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(3): 254–258.[13]邓家先 康耀红 编著 《信息论与编码》

huffman算法是基于词频统计的,所以适用于有大量重复单词的情况,也就是文本这种对于图片来说,每个像素的颜色都不一样,整个图片上完全相同的像素点很少,不适合统计用所以像图形图像这种一般来说不适合用词频统计的方式压缩

下面是我从网上搜索到的资料,希望对你有帮助。1.哈夫曼图像压缩算法引言随着网络与多媒体技术的兴起,人们需要存储和传输的数据越来越多,数据量越来越大,以前带宽有限的传输网络和容量有限的存储介质难以满足用户的需求。特别是声音、图像和视频等媒体在人们的日常生活和工作中的地位日益突出,这个问题越发显得严重和迫切。如今,数据压缩技术早已是多媒体领域中的关键技术之一。Huffman(哈夫曼)算法在上世纪五十年代初提出来了,它是一种无损压缩方法,在压缩过程中不会丢失信息熵,而且可以证明Huffman算法在无损压缩算法中是最优的。Huffman原理简单,实现起来也不困难,在现在的主流压缩软件得到了广泛的应用。对应用程序、重要资料等绝对不允许信息丢失的压缩场合,Huffman算法是非常好的选择。2.哈夫曼图像压缩算法原理Huffman编码是1952年由Huffman提出的对统计独立信源能达到最小平均码长的编码方法。这一年,他发表了著名论文“A Method for the Construction of Minimum Redundancy Codes”,即最短冗余码的构造方法.之后,Huffman编码及其一些改进方法一直是数据压缩领域的研究热点之一。Huffman码是一种变长码,其基本思想是:先统计图像(已经数字化)中各灰度出现的概率,出现概率较大的赋以较短的码字,而出现概率较小的则赋以较长的码字。我们可以用下面的框图来表示Huffman编码的过程:在整个编码过程中,统计图像各灰度级出现的概率和编码这两步都很简单,关键的是Huffman树的构造。不但编码的时候需要用到这颗树,解码的时候也必须有这颗树才能完成解码工作,因此,Huffman树还得完整的传输到解码端。Huffman树的构造可以按照下面图2的流程图来完成。首先对统计出来的概率从小到大进行排序,然后将最小的两个概率相加;到这儿的时候,先把已经加过的两个概率作为树的两个节点,并把他们从概率队列中删除;然后把相加所得的新概率加入到队列中,对这个新队列进行排序。如此反复,直到最后两个概率相加为1的时候停止。这样,Huffman树就建立起来了。3. 哈夫曼图像压缩算法软件实现这儿,我们以Turbo C为例来说明软件实现Huffman图像压缩算法的一些关键技术。为了叙述方便,我们不妨假设处理的图像的灰度级变化范围从0到255,即具有256个灰度级。我们先来统计输入图像的概率,实际上是要统计各个灰度级在整幅图像中出现的次数。为此,我们先定义一个具有256个元素的数组。然后对输入图像信号进行扫描,每出现一个灰度,就把它存入实现定义好的一个数组中的相应元素中(让这个元素的值自增1)。最后,通过读取数组中各元素的值就可以求出各个灰度出现的频数。接下来就该构造Huffman树了。为了构造Huffman树,我们要用到C语言中链表的概念。我们必须用一个结构体来表示Huffman树的节点。对于每个节点而言我们需要这样几个信息:本节点的权重(就是灰度的频数)、指向父节点的指针和分别指向左右子叶节点的指针。于是,我们可以定义这样一个结构体:Struct Node{Floatweight;Node * father;Node * left;Node * right;}Huffman_Node我们需要先确定权最低的两个自由结点,这将是最初的left和right节点。然后建立这两个结点的父结点,并让它的权等于这两个结点的权之和。接着将这个父结点增加到自由结点的序列中,而两个子结点则从序列中去掉。重复前面的步骤直到只剩下一个自由结点,这个自由结点就是Huffman树的根。Huffman编码树作为一个二叉树从叶结点逐步向上建立。Huffman树建立好以后,为了把权、概率等数值转化码字,我们还得对整个Huffman树进行扫描。请注意,在建立Huffman树的时候,我们是从树叶开始的,而在对Huffman树分配码字的时候却刚好相反,是从树根开始,沿着各个树枝的走向“顺藤摸瓜”似的对各个系数进行编码。对于一个节点的两个子节点(left和right),其中一个节点对应的位为0,而另一个结点则人为地设置成为l。解码的时候也是完全相同的一颗Huffman树完成的。下面的循环是实现压缩的关键语句之一[ 1 ]。for (i = length-1; i >= 0; ――i) {if ((current_code >> i) & 1)thebyte |= (char) (1 << curbit);if (--curbit < 0) {putc (thebyte, ofile);thebyte = 0;curbyte++;curbit = 7;}}注意:这几行代码执行了数据压缩的功能,但是还没有生成编码和解码所需要的代码表。4.哈夫曼图像压缩算法性能评价我们主要从三方面[ 2 ]来评价Huffman的性能:(1)压缩比的大小;(2)恢复效果的好坏,也就是能否尽可能的恢复原始数据;(3)算法的简单易用性以及编、解码的速度。首先分析一下对压缩比的影响因素(不同的著作中对压缩比的定义不尽相同,这儿我们采用如下定义:压缩比等于压缩之前的以比特计算的数据量比上压缩之后的数据量)。对于Huffman编码来说,我们因为要用额外的位保存和传输Huffman树而“浪费”掉一些存储位,也就是说,为了编、解码的方便,我们把本已减少的数据量又增加了一些。如果文件比较大的话,这一点多余的数据根本算不了什么,所占比例很小。但是,如果压缩的文件本来就很小的话,那么这笔数据就很可观了。一般来说,经典的Huffman算法的压缩比不是很高,这是无损压缩的“通病”。第二点就不用说了,由于它是无损压缩,能够完全恢复压缩之前图像的本来面貌。最后,让我们来分析一下Huffman压缩方法的速度问题。大家在第三节中已经看到了,在压缩的过程中,我们进行了两次扫描,第一次是为了统计各个灰度出现的频数而扫描整幅图像,第二次则是为了分配码字而扫描整个Huffman树。这样一来,对较大的文件进行编码时,频繁的磁盘读写访问必然会降低数据编码的速度,如果用于网络的话,还会因此带来一些延时,不利于实时压缩和传输。另外,Huffman算法的编码和解码的速度是不对称的,解码快于编码,因为解码不需要生成Huffman树的环节。5.图像压缩算法结束语Huffman算法目前已经得到了广泛的应用,软件和硬件都已经实现。基于Huffman经典算法的缺陷,不少人提出了一些自适应算法。前面的算法中,Huffman树是整个图像全部输入扫描完成后构造出来的,而自适应算法(或称动态算法)则不必等到全部图像输入完成才开始树的构造,并且可以根据后面输入的数据动态的对Huffman树进行调整。实际上,实用的Huffman树都是经过某种优化后的动态算法。网络资源

图像分割算法研究论文

图像处理的很多任务都离不开图像分割。因为图像分割在cv中实在太重要(有用)了,就先把图像分割的常用算法做个总结。         接触机器学习和深度学习时间已经不短了。期间看过各种相关知识但从未总结过。本文过后我会尽可能详细的从工程角度来总结,从传统机器学习算法,传统计算机视觉库算法到深度学习目前常用算法和论文,以及模型在各平台的转化,量化,服务化部署等相关知识总结。         图像分割常用算法大致分为下面几类。由于图像的能量范函,边缘追踪等方法的效果往往只能解决特定问题,效果并不理想,这里不再阐述。当然二值化本身也可以分割一些简单图像的。但是二值化算法较多,我会专门做一个文章来总结。这里不再赘述。         1.基于边缘的图像分割算法:             有利用图像梯度的传统算法算子的sobel,roberts,prewitt,拉普拉斯以及canny等。             这些算法的基本思想都是采用合适的卷积算子,对图像做卷积。从而求出图像对应的梯度图像。(至于为什么通过如图1这样的算子卷积,即可得到图像的梯度图像,请读者复习下卷积和倒数的概念自行推导)由于图像的边缘处往往是图像像素差异较大,梯度较大地方。因此我们通过合适的卷积核得到图像的梯度图像,即得到了图像的边缘图像。至于二阶算子的推导,与一阶类似。优点:传统算子梯度检测,只需要用合适的卷积核做卷积,即可快速得出对应的边缘图像。缺点:图像边缘不一定准确,复杂图像的梯度不仅仅出现在图像边缘,可以能出现在图像内部的色彩和纹理上。              也有基于深度学习方法hed,rcf等。由于这类网络都有同一个比较严重的缺陷,这里只举例hed网络。hed是基于FCN和VGG改进,同时引出6个loss进行优化训练,通过多个层输出不同scale的粒度的边缘,然后通过一个训练权重融合各个层的边缘结果。hed网络结构如下: 可以得到一个比较完整的梯度图像,可参考github的hed实现。优点:图像的梯度细节和边缘完整性,相比传统的边缘算子要好很多。但是hed对于边缘的图像内部的边缘并不能很好的区分。当然我们可以自行更改loss来尝试只拟合外部的图像边缘。但最致命的问题在于,基于vgg的hed的网络表达能力有限,对于图像和背景接近,或者图像和背景部分相融的图片,hed似乎就有点无能为力了。         2.基于区域分割的算法:             区域分割比较常用的如传统的算法结合遗传算法,区域生长算法,区域分裂合并,分水岭算法等。这里传统算法的思路是比较简单易懂的,如果有无法理解的地方,欢迎大家一起讨论学习。这里不再做过多的分析。             基于区域和语意的深度学习分割算法,是目前图像分割成果较多和研究的主要方向。例如FCN系列的全卷积网络,以及经典的医学图像分割常用的unet系列,以及rcnn系列发展下的maskrcnn,以及18年底的PAnet。基于语意的图像分割技术,无疑会成为图像分割技术的主流。             其中,基于深度学习语意的其他相关算法也可以间接或直接的应用到图像分割。如经典的图像matting问题。18年又出现了许多非常优秀的算法和论文。如Deep-Image-Matting,以及效果非常优秀的MIT的 semantic soft segmentation(sss).             基于语意的图像分割效果明显要好于其他的传统算法。我在解决图像分割的问题时,首先尝试用了hed网络。最后的效果并不理想。虽然也参考github,做了hed的一些fine-tune,但是还是上面提到的原因,在我多次尝试后,最终放弃。转而适用FCN系列的网络。但是fcn也无法解决图像和背景相融的问题。图片相融的分割,感觉即需要大的感受野,又需要未相融部分原图像细节,所以单原FCN的网络,很难做出准确的分割。中间还测试过很多其他相关的网络,但都效果不佳。考虑到感受野和原图像细节,尝试了resnet和densenet作为图像特征提取的底层。最终我测试了unet系列的网络:                 unet的原始模型如图所示。在自己拍照爬虫等手段采集了将近1000张图片。去掉了图片质量太差的,图片内容太过类似的。爬虫最终收集160多张,自己拍照收集200张图片后,又用ps手动p了边缘图像,采用图像增强变换,大约有300*24张图片。原生unet网络的表现比较一般。在将unet普通的卷积层改为resnet后,网络的表达能力明显提升。在将resnet改为resnet101,此时,即使对于部分相融的图像,也能较好的分割了。但是unet的模型体积已经不能接受。                 在最后阶段,看到maskrcnn的实例分割。maskrcnn一路由rcnn,fasterrcnn发展过来。于是用maskrcnn来加入自己的训练数据和label图像进行训练。maskrcnn的结果表现并不令人满意,对于边缘的定位,相比于其他算法,略显粗糙。在产品应用中,明显还不合适。                         3.基于图的分割算法             基于深度学习的deepgrab,效果表现并不是十分理想。deepgrab的git作者backbone采用了deeplabv2的网络结构。并没有完全安装原论文来做。 论文原地址参考: 整体结构类似于encode和decoder。并没有太仔细的研究,因为基于resent101的结构,在模型体积,速度以及deeplab的分割精度上,都不能满足当前的需求。之前大致总结过计算机视觉的相关知识点,既然目前在讨论移动端模型,那后面就分模块总结下移动端模型的应用落地吧。 由于时间实在有限。这里并没有针对每个算法进行详细的讲解。后续我会从基础的机器学习算法开始总结。

图像分割是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。我整理了图像分割技术论文,欢迎阅读!

图像分割技术研究

摘要:图像分割是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。本文介绍了基于阈值的分割方法和图像分割的图像分割性能的评价、应用现状;最后总结出图像分割的发展趋势。

关键词:图像分割、阈值、边缘检测、区域分割

中图分类号: 文献标识码: A

1引言

随着图像分割技术研究的深入,其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题,是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的,有很大的针对性和局限性,到目前为止还不存在一个通用的方法,也不存在一个判断分割是否成功的客观标准。因此,对图像分割的研究目前还缺乏一个统一的理论体系,使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation),简单地说就是将一幅数字图像分割成不同的区域,在同一区域内具有在一定的准则下可认为是相同的性质,如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一,它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种:

(1)单阈值法,用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时,选择两峰之间的谷底作为阈值。

(2)双阈值法,用两个阈值区分背景和目标。通过设置两个阈值,以防单阈值设置阈值过高或过低,把目标像素误归为背景像素,或把背景像素误归为目标像素。

(3)多阈值法,当存在照明不均,突发噪声等因素或背景灰度变化较大时,整幅图像不存在合适的单一阈值,单一阈值不能兼顾图像不同区域的具体情况,这时可将图像分块处理,对每一块设一个阈值。

边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有:差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况,其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割,效果较好。

区域生长方法是把一幅图像分成许多小区域开始的,这些初始的小区域可能是小的邻域甚至是单个像素,在每个区域中,通过计算能反映一个物体内像素一致性的特征,作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数,即特征。接下来对相邻区域的所有边界进行考查,如果给定边界两侧的特征值差异明显,那么这个边界很强,反之则弱。强边界允许继续存在,而弱边界被消除,相邻区域被合并。没有可以消除的弱边界时,区域合并过程结束,图像分割也就完成。

结合特定工具的图像分割技术

20世纪80年代末以来,随着一些特殊理论的出现及其成熟,如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等,大量学者致力于将新的概念、新的方法用于图像分割,有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中,将一幅图像比为一个具有不同高度值的地形,高灰度值处被认为是山脊,底灰度值处被认为是山谷,将一滴水从任一点流下,它会朝地势底的地方流动,最终聚于某一局部最底点,最后所有的水滴会分聚在不同的吸引盆地,由此,相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良,能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息,对噪声较敏感。

基于模糊数学的分割算法

目前,模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合,形成一系列的集成模糊分割技术,例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理,使真正的边缘处于较低灰度级,但还有一些不是边缘的像素点的灰度也在较低灰度级中,虽然算法的计算简明,且边缘细腻,但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述,通过计算图像的模糊熵来选取图像的分割阈值,后用阈值法处理图像得到边界。

基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法,它使用参数编码集而不是参数本身,通过模拟进化,以适者生存的策略搜索函数的解空间,它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作,它唯一需要的信息是适应值,通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索,且可以降低搜索空间维数,降低算法对模板初始位置的敏感,计算时间也大为减少。其缺点是容易收敛于局部最优。

基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力,适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题,因而也适合解决比较复杂的图像分割问题。原则上讲,大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚,只有多层前馈NN,多层误差反传(BP)NN,自组织NN,Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割,输入层神经元的数目取决于输入特征数,而输出层神经元的数目等同于分类的数目。

图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法,有关图像分割方法和文献很多,新方法不断产生,这些方法有的只对特定的情形有效,有的综合了几种方法,放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法,这种方法将图像欲分割成的几个区域各以一个不同的标号来表示,用一定的方式对图像中的每一个像素赋以标号,标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法,基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割,由于新的数学工具的引入,纹理分割技术取得了一些进展,张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法,直接建立在先验知识的基础上,使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容:一是研究各分割算法在不同情况下的表现,掌握如何选择和控制其参数设置,以适应不同需要。二是分析多个分割算法在分割同一图像时的性能,比较优劣,以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能,而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣,由于缺乏可靠理论依据,并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的,不同的评价方法只能反映分割算法性能的某一性能。另一方面,每一种分割算法的性能是由多种因素决定的,因此,有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用,图像分割技术呈现出以下的发展趋势:(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦,等译.北京:电子工业出版社,2003

[2] 章毓晋.图像分割[M].北京:科学出版社,2001.

[3] 李弼程,彭天强,彭波等.智能图像处理技术[M].北京:电子工业出版社,2004.

[4] 杨晖,曲秀杰.图像分割方法综述[J].电脑开发与应用。2005,18(3):21-23.

点击下页还有更多>>>图像分割技术论文

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

图像复原研究论文

张玉君

(地质矿产部航空物探遥感中心研究所北京)

摘要:本文介绍一种独特的航放数据图像复原方法。该方法的主要技术关键是:提出航放数据图像复原原理和理论基础;建立航放数据图像复原处理流程;制定重建数据网格文件的途径;进行航放数据图像复原效果及误差评价。

关键词:航放数据,大气本底,图像处理,图像复原技术。

一、引言

自20世纪70年代初期方柱形NaI晶体进入机载综合航空站以来,航放测量的灵敏度和有效性显著提高,地质及地球物理勘探界对于航空放射性测量的需求产生了根本变化。

在近20年的应用实际中,大气氡本底(简称大气本底)的改正很难准确,它始终是困扰该方法应用效果的主要难点;其后果是在图面上造成条带现象,从而严重地影响着图件的可用性及方法的效果。其原因[1]可概括为:空中所测放射性不仅仅来源于地下,而且受飞机硬件环境、宇宙射线、大气中氡及其子体的影响。后者称之为大气本底干扰,它又受气候、风力、风向、温度、季节及一天中何时测量等因素的影响。大气本底干扰的主要表现形式是架次与架次间本底水平不同。受干扰最大的是铀道,钾道次之,钍道和总道虽较小,但也不可忽视,(见彩版附图7中的图3、图4)。由于这种噪声的存在,来源于地质体的信息常常淹没于噪声之中。图3a(彩版附图7)为哈密土墩测区K(红)、Th(绿)、U(蓝)三元素复原图像,图3b为该测区航放原始数据合成图像,图4a(彩版附图7)表示各架次早、晚校准读数,图4b为总道原始数据图像。条带噪声的存在,可以形象地比喻为挂在有用信息图像前面的彩条窗帘,条带的严重性使得该工区原始航放数据无法绘制等值线图。

航放图面条带问题是一个“世界性”的问题[2]。解决得较好的是加拿大,靠星罗棋布的湖泊河流等水域上空测量结果改正本底,取得较好的效果,而且不使用向上探头[1]。美国Geometrics公司及其他航空物探公司则是靠向上探头测量,作为本底改正的依据[3]。1986年Grasty[4]提出当测区内没有湖泊时,可用测线上无异常区的平均值代替本底。

本文介绍的方法与国际上已采用的各种方法全然不同,该方法在数字图像处理学中可称之为航放图像复原技术。图像复原技术的主要目的,是要改善给定的图像。复原是一个过程,它试图利用蜕化现象的某种先验知识,把已经蜕化了的图像加以重建或恢复。因此,复原技术是把蜕化模型化,并运用相反的过程在某种程度上恢复原来的图像。

Cannon博士[5]研究了一种图像复原技术或称图案去除技术,它适用于:从规则图案(如纺织品)上提取指纹图形,改善散焦图像,消除卫片图像探测器与探测器间的噪声,使在曝光过程中相机或物体平移造成模糊的图像清晰化等。Srinivasan也报道了这类研究[6]。张玉君等研究了深海锰结核照片光照不均匀等蜕化现象的图像复原问题[7]。航放数据图像复原处理是数字图像复原技术在地学界成功应用的又一实例,但航放数据图像所存在的蜕化问题与上述各例均不相同。该方法研究成功后,曾在6个测区得到验证。

二、航放数据图像复原技术原理和理论基础

航放所测到的是一幅蜕化了的图像G(x,y)它可视为由真实图像F(x,y)与干扰图像η(x,y)叠加而成,简化了的蜕化过程,见图1。航放图像蜕化现象的先验知识来自对航放测量过程及原始图像的分析。在测量过程中,来自地质体的有用信息是不随时间为转移的。而干扰在本质上是随时间变化的,但在图像上干扰已变为(x,y)的函数,因为:

张玉君地质勘查新方法研究论文集

图1航放数据图像蜕化示意图

η的变化可分为架次之间的跳变及架次之内的渐变,见图4(彩版附图7),在每一测线上此干扰大致为一个常数,如果将x(即图像上的列)表示垂直测线的方向,则η(x,y)简化为η(x),则有

张玉君地质勘查新方法研究论文集

航放图像复原的目的,就在于设法近似地求出η(x),从而近似地得到F(x,y)。为此,沿测线方向对原始图像进行多次单列

多行窄长窗口褶积:

张玉君地质勘查新方法研究论文集

式中W为褶积模板,是由加权因子组成的矩阵。褶积过程是一种线性运算,其算子H不随空间变化。因为算子为线性的,则两个输入之和的响应等于两个响应之和。

张玉君地质勘查新方法研究论文集

由于假定了η仅与x有关,又由于褶积窗口为单列,则有:

张玉君地质勘查新方法研究论文集

现在分析HF(x,y)的性质,由于沿y方向的多次滑动平均,局部异常“淹没”于近区域特征之中,这种近区域特征表现为沿测线方向的低缓变化;如果用f(x,y)表示局部异常,用L(x,y)表示近区域场,于是:

张玉君地质勘查新方法研究论文集

再经如下处理

张玉君地质勘查新方法研究论文集

由(9)式可见,从原始图像中减去噪声图像后,所得复原图像f(x,y),它从局部异常角度是接近真实图像的,误差取决于所减去的“近区域背景值”在测线方向起伏变化的幅度。

三、航放数据图像复原处理过程

航放数据图像复原技术的研究是以多元统计为理论基础,以图像处理为工具来完成的,并体现了图像处理快速直观的特点,其流程如图2所示。

图2航放数据图像复原处理流程

此方法假定航放噪声本底沿测线方向不变或呈线性变化。通过沿测线方向的多次滑动平均,使局部异常逐渐淹没在噪声本底之中,得出一幅与噪声本底线性相关的噪声图像。噪声图像尚需进行边缘影响补偿;对去除噪声后的图像,经中值滤波和空间变量反差增强,达到最终复原的效果。这一复原过程集中表示于图2的左半部。

图2的右半部为数据网格文件的重建过程,它是实际应用所必不可少的。经过分类分区,求得各类别在复原前后的均值向量,经最小二乘拟合求出复原图像的元素含量或计数率值,重新建立为在主计算机上绘制等值线图用的网格文件。

本研究曾试验通过沿测线方向取平均值做为噪声水平,结果不及上述方法理想。

四、效果及误差评价

1.航放数据图像复原的效果

(1)图面直观效果的改善。

可以形象地说,航放图像复原好比揭去一层条带窗帘,使原来透过此窗帘隐约可见的图像显示出了真面目,见图3a(彩版附图7)。图面直观效果的改善还表现在由于定位问题所引起的岩体边界上的锯齿状噪声得以消除,见图5(彩版附图7)。图5为总道对比图像,5a为原始数据,5b表示噪声图像,5c为去噪声后的图像,5d为复原图像。

(2)用复原数据所做等值线图真实可信。

以哈密土墩测区为例,原始资料由于条带干扰,在主计算机上,钾、钍、铀道都无法绘等值线图,仅提供了平剖图;只有总道提供了等值线图,但仍可看到条带的影响。

经图像复原、重建网格文件,反馈回主计算机后绘制了TC、K、Th和U等值线图,现以K道经复原后数据等值线图为例示于图6(彩版附图7),与地质图对比,表明异常和地质体对应良好,各类岩性的放射性趋势也都吻合,证实这些等值线图的可靠性。利用复原图像所做分类图也证实了这一点,见图7(彩版附图7),图7中数字分别为:①超基性岩;②基性岩;③花岗岩;④闪长岩;⑤变质岩;⑥混合岩;⑦第四纪沉积;⑧第三、四纪沉积;⑨第三纪沉积。

(3)有用信息增加。

本研究利用多元统计的方法,对航放图像复原的效果给出定量评价。可用一幅图像有用信息构成的变异值的大小来对它做定量评价。为此应计算全图面总变异对于一个象素的平均值,即平均变异值。用C、C´和C"分别表示原始图像中有用信息平均变异值、原始图像中干扰信息平均变异值和最终复原图像有用信息平均变异值。统计时以G´(x,y)近似代表η(x);以[G(x,y)-G´(x,y)]近似代表F(x,y);以P(x,y)表示最终复原图像,并假定它已无干扰存在。

张玉君地质勘查新方法研究论文集

式中,字母上加“—”表示平均值;M、N为图像的行、列数。

表1为哈密土墩测区航放数据图像按上述各式所做定量评价的统计结果。

表1

从表1可见,K、Th、U、TC经图像复原后,有用信息都有十分显著的增长;就此工区而论,TC和K原始图像相对质量较好,Th和U较差。

2.复原图像的准确度及误差评价

复原图像的主要误差来源是“近区域背景值”L(x,y),它是在多次滑动平均时形成的。通过对干扰图像剖面数据的统计,得到以下准确度评价:

K±(绝对含量);Th+ pp m;

U± ppm;TC±计数。

五、结论

(1)本文介绍的方法是在国内外首次提出的方法独特的航放数据图像的复原技术,并在多个工区验证了其可靠性和实用性。

(2)本技术可以基本上消除由于大气本底及阈值变动所造成的图面条带现象,基本复原航放图像的真面目,为进一步图像处理(诸如:求导、增强、分类、逻辑运算等)做了准备,因此本技术也是一种快速预处理方法。

(3)本方法改善了由于飞行往返定位位移所引起的某些地质体边缘呈锯齿状的图像噪声问题。

(4)本研究建立了“有用信息平均变异值”做为定量评价航放数据图像复原效果的尺度。还讨论了图像复原做为一种预处理过程,对于元素含量值可能导入的绝对误差或称为方法的准确度。

参考文献

[1]Grasty, ., Gamma ray spectrometric methods in uranium exploration—Thcory and operational procedures, Geophysics and Geochemistry in the Search for Metallic Ores,GSC,Ottawa,147-162,1977.

[2]Creen, airborne gamma-radiation data using between-channel correlation information,Geophysics,52,1557-1562,1987.

[3]Foote, ., Improvement in airborne gamma-radiation data analysis by removal of environmental and pedologic radiation changes, in the Use of Nuclear Techniques in Prospecting and Developmcnt of Mineral Resources: Energy Agency Mtg.,Buenos Aires,187-196,1968.

[4]Grasty, system for computing on-line atmospheric backgrounds,GSC paper,1-52,1987.

[5]Cannon,M.,Lehar, Preston,F.,Background pattern removal by power spectral filtering,Applied Optics,22,777-779,1983.

[6]Srinivasan,R.,Software image restoration techniques,Digital Design, 16,4,27-34, 1986.

[7]张玉君,史鉴文.深海多金属结核照片的图像复原和图像处理技术研究.物探与化探,1989,(13):435~441.

致谢林振民同志对本文提出了宝贵的意见,史鉴文同志参加了重复工区试验,张志民和谢欣同志分别编制了网格文件转换和最小二乘拟合程序,杨星虹同志拍摄了屏幕图片,水恩海同志搜集了试验工区校准资料,在此一并致谢。

A STUDY ON IMAGE RESTORATION TECHNIQUES FOR AERORADIOMETRIC DATA

Zhang Yu jun

(Research Institute, Center of Aero-Gcophysics and Remote Sensing,Ministry of Geology and Mineral Resources, Beijing)

Abstract

This paper represents a specific methodfor restoration of images of airborne radiometric main technical keys involved in this study are;the advancementof the principles and theory;the establishment of the flow-diagram for processing;the formulation of the means for reestablishment of the gridded data file;the evaluation of the restoration results and the errors, involved by the restoration processing.

Key words Aeroradiometric data, Atmospheric background, Image processing, Image restoration techniques.

原载《地球物理学报》,1990,。

张玉君史鉴文

(地矿部航空物探总队研究所)

摘要 本文报导了关于深海洋底多金属结核照片的图像复原和图像处理方法技术研究结果。海底照片存在的主要问题是:光照分布不均匀、有时聚焦欠佳、常有铁丝影像、有时有泥浆局部干扰等。本文剖析了光照分布的数学模型,推导了倾斜相机系统和水平相机系统条件下的光照分布及感光光强分布公式。本工作利用图像处理系统研究成功了一套适用于海底照片的图像复原和图像处理技术,给出了详细流程图。做为实例本文附有六幅图片,说明所研究的方法在去除光照不均匀、铁丝干扰、提高反差、增强分辨率、自动分类、科学统计覆盖率等的显著效果,以及通过局部放大研究结核的结构和形态方面的可能性。本文所报导的方法是改善和研究珍贵海底照片的重要工具。

一、前言

地球各大洋海底广泛赋存有锰结核、铁锰结核、多金属结核等丰富宝藏;为了探明其分布和储量,各国在公海正在开展着深海多金属结核的勘探工作,这是一项具有深远意义的造福后代的工作。这种勘探工作所用手段之一是海底照相,根据海底相片估算多金属结核的覆盖率和储量,并对结核的形态进行研究。

深海多金属结核照相由于拍摄环境及装置存在着一系列问题,因此提出图像复原和处理的要求。

在深海洋底照相需要外加光源,数千米深的海水将阳光几乎全部吸收掉了,外加光源与相机的位置相对固定,他们之间的距离大约为20~30cm。相机系统由缆绳绞车控制下降至海洋底,根据重锤触底信号再将相机升起一个高度(~3m),即拍照;这一距离根据海况变化一次下水调整一次。海况是指:海风、洋流、底质等情况。由于洋流的存在,相机系统可能倾斜,拍摄高度随之也有所变化。所获海底多金属结核照片存在一系列影响分辨和研究的问题,主要有:

(1)光照分布不均匀,其中心与照片中心偏离,甚至由于相机倾斜,造成光照分布失去对称规律;

(2)有时聚焦欠佳;

(3)常常出现有铁丝干扰影像;

(4)有时有因重锤搅混海底沉积物而局部模糊。

利用数字图像技术处理深海多金属结核照片的目的在于:

(1)通过图像处理改善照片的质量,主要是图像复原;

(2)通过分类技术分辨裸露核、浅埋及深埋核,并对各类面积进行精确计算,从而得到覆盖率的科学数据;

(3)结核形态研究。

为了达到以上目的首先要对海底照片进行数字化,形成图像数据文件,即可利用数字图像处理系统进行处理。

数字图像处理技术随着计算机技术、遥感科学的发展而在近20年得到极为迅速的发展、成熟与应用。正如图像增强一样,图像复原技术的主要目的,在某种意义上说,是要改善给定的图像。复原是一个过程,这一过程试图利用退化现象的某种先验知识,把已经退化了的图像加以重建或恢复。因此,复原技术是把退化模型化,并运用相反的过程以便恢复原来的图像。

Cannon博士(1983,“Applied Optics”)研究了一种图像复原技术,或称图案去除技术,适用于:规则图形(如纺织品)上手纹处理、散焦图像改善、卫片上探测器与探测间噪声消除、曝光过程中的平移模糊的清晰化等。Srinivasan(1986,“Digital Design”)也阐述了此方法。此技术可分解为明确的三个步骤:

(1)对图像中的“模糊”或“图案”问题进行估计,即分析退化问题的实质;

(2)生成一个近似模型或频率域滤波器,以便准备进行复原或图案去除;

(3)利用威纳(Wiener)滤波器或富里叶(Fouriel)滤波器对图像进行改善。

海底结核图像所存在的具体退化问题有自己的独特性,但Cannon所提出的方法原则仍有重要参考价值。

二、深海多金属结核图像退化问题的剖析

1.光照计算

前言所述噪声中,影响最大的是光照不均匀问题,现将此问题进行数学分析。

已知:光源可认为是点光源;海底假定为一平面,所拍照片对应于abcd四边形;相机底片中心f与光源中心f´之间距离为l,由于相机与光源为硬固定,因此光源永远位于底片平面长对称轴的延长线上;底片中心与abcd四边形的对角线交点o的距离为h;相机倾斜角为α;光源源强为Q,见图1。

求解:写出abcd四边形中任意一点的光照强度函数F=f(Q,h,a,l,x,у)。

解:通过o点作x、y座标轴,任意点g,其座标为x,y,与光源间距离为R。如写出R公式,即求出F方程的表达式。

做h´∥于h,由g点向h´做垂线gK。

张玉君地质勘查新方法研究论文集

光照强度表达示为:当底片平面平行于海底平面时,图1简化为图2,式(4)简化为(5)式。

张玉君地质勘查新方法研究论文集

从图2可见:

图1相机系统倾斜条件下的光照强度计算示意图

图2相机系统水平条件下的光照强度计算示意图

张玉君地质勘查新方法研究论文集

若(5)式中y=0,

则:

张玉君地质勘查新方法研究论文集

(6)式为x轴上各点的光照强度,显然这是一个以о´点为中心的对称曲线,示意于图3。

图3沿x轴光照强度分布曲线

而在abcd平面上光照分布则为一个曲面,它由上图中之曲线,以mo ′为轴旋转而成。

对于式(4),即对于相机系统发生倾斜时,此曲线及曲面显然将变得复杂化,并将失去轴对称性。

2.感光光强计算

在拍照时还要考虑到底片各点感光光强同样与距离有关。

令L为感光光强函数,用与前述类似方法可求出对应于倾斜和水平两种状态L的表达式。

对于倾斜相机系统:

张玉君地质勘查新方法研究论文集

对于水平相机系统,显然公式可较简单:

张玉君地质勘查新方法研究论文集

图像复原的实质是试图用理论的或试验的方法建立起深海结核图像的感光光强分布本底图像,从原图中扣除,便可去除光照不均匀所造成的失真,达到图面基本改善。

从(8)式可知,实际上α角是最大的难点。试图利用底片或照片本身,逆演求解α角也将是十分困难的。故本研究用试验方法建立光强分布本底图像,较好地实现了复原。

三、深海多金属结核图像复原和处理方法流程

经研究,建立了图4所示之方法流程:

图4深海多金属结核图像复原和处理方法流程

流程图由20个步骤组成,其2—8属图像复原,9—20属图像处理,1为准备工作。

数字化使用I2S公司所产C4500扫描仪,将135底片上的短边方向扫成512行,长边方向对中舍去两边。若扫描所获图像不足512行,则进行适当拼接,这是为了减少快速富氏变换时的边界效应。

挖补是为了解决铁丝干扰,否则不仅图面不完整,而且在频率域处理时,干扰范围还会扩大。

在频率域适当选取低通滤波参数,用指数滤波可以获得近似的光强本底分布图像,并适当选取比例因子从原图中扣除,即可得到基础图像。

利用基础图像通过聚类分析,并提取其中对应于裸露核,浅埋核及深埋核三个类别。叠加后,进行邻域滤波,去除零星干扰,便可进行分类统计了。

对于泥浆搅动干扰区,必要时可在统计前挖去,减少这种干扰所带来的误差。

四、图像复原和处理效果

为了开展此项研究,由广州海洋地质调查局提供了三张海底照相底片,其质量分别属于优、中、差三级。通过实验,均获得了成功的结果。现以中等一级的图像复原和处理结果为例,展示方法的效果。

图片1为原始图像,它的主要问题是:反差小,光强不均匀,存在铁丝干扰,行数不足512。

图片2为经过拼接,挖补和增强的图像,图中反差有所改善,消除了铁丝干扰,补足了行数,但光强不均匀问题仍然存在。

图片3为复原后的图像,成功地克服了光强不均匀问题,为计算机自动分类提供了前提。

图片4为分类处理后所提取裸露核(深灰),浅埋核(白色)和深埋核(浅灰)的合成图像。

图片5为对比图像。左上角为三类核的合成图像,右上角为裸露核图像,左下角为浅埋核图像,右下角为深埋核图像。

通过统计和计算,得到各类结核的象元数、全图总象元素及各类结核的覆盖率。见下表:

张玉君地质勘查新方法研究论文集

此外对优质底片,经过上述处理后,还做了局部放大,经四倍放大后的图像(图片6)对于结核形态研究很有用,从图片6可以清晰地看到环形,盘形、菜花形多金属结核的形态和结构。

图片1

图片2

图片3

图片4

图片5

图片6

五、几点结论

本工作所研究的深海多金属结构图像复原方法可以成功地去除光强不均匀造成的干扰,并可消除铁丝影像干扰,增强清晰度,提高反差,效果显著。

经复原后的图像,具备了计算机自动分类处理的条件,经聚类分析成功地提取了裸露核、浅埋核和深埋核信息,并精确地统计了各自的象元数,求出了各类核的覆盖率。

通过局部放大,有可能进一步研究多金属结核的结构以及形态。

本文所研究成功的方法,无疑对于探明数千米以下深海海底蕴藏的丰富矿产资源有着重要意义,希望能投入半生产性批量处理应用。这种方法当然也可以用于其他方面。

本工作得到广州海洋地质调查局王光宇同志、陈邦彦同志、张国祯同志的支持,本所朱月娥同志多次一起商讨,杨星虹同志拍摄了图片,一并向他们致谢。

参考文献

[1]Cannon M.,Lehar A., Preston F.: Background pattern removal by power spectral filtering, Applied Optics, .

[2]SrinivasanR.:Software image restoration techinques,Digital Design,.

A STUDY OF IMAGE RECONSTRUCTION AND IMAGE PROCESSING TECHNIQUES FOR PHOTOS OF DEEP-SEA POLYMETALLIC NODULES

Zhang Yu jun,Shi Jian wen

(Institute of Aerogeophysical Survsy,Ministry of Geologyand Mineral Resources)

AbstractThis paper reports the results of research on image reconstruction and image processing techniques for photos of polymetallic nodules from the bottom of deep major troubles with submarine photos include uneven distribution of illuminance, unsatisfactory focusing,frequent existence of iron wire image, local mud interference present paper analyses the mathematic model for distribution of illuminance and derives, the formulae for illuminance distribution and light sensitivity distribution under the conditions of inclining camera system and horizontal camera image processing system,we have successfully developed a suite of image reconstruction and image processing techniques suitable for submarine photos and drawn a datailed flow examples,four pictures are attached to this paper, which illustrate the obvious effects of our method in such aspects as eliminating uneven illuminance and iron wire interference,raising contrast and resolution power, automatic classification and scientific statistical analysis of coverage, and indicate the possibility of examining textures and shapes of the nodules by means of partial method described in this paper serves as an important tool for improving and studying precious submarine photos.

原载《物探与化探》,1989,。

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

  • 索引序列
  • 图像盲恢复的算法研究论文
  • 单片机图像恢复毕业论文
  • 图像压缩算法研究论文
  • 图像分割算法研究论文
  • 图像复原研究论文
  • 返回顶部