基于图像识别的运动目标检测论文

发布时间：2023-12-11 17:15:16

基于图像识别的运动目标检测论文

数字图像处理方面了解的了。

图像处理是利用计算机对图像信息进行加工以满足人的视觉心理或者应用需求的行为，应用广泛，多用于测绘学、大气科学、天文学、美图、使图像提高辨识等。学术堂在这里为大家整理了一些图像处理本科毕业论文题目，希望对你有用。1、基于模糊分析的图像处理方法及其在无损检测中的应用研究2、数字图像处理与识别系统的开发3、关于数字图像处理在运动目标检测和医学检验中若干应用的研究4、基于ARM和DSP的嵌入式实时图像处理系统设计与研究5、基于图像处理技术的齿轮参数测量研究6、图像处理技术在玻璃缺陷检测中的应用研究7、图像处理技术在机械零件检测系统中的应用8、基于MATLAB的X光图像处理方法9、基于图像处理技术的自动报靶系统研究10、多小波变换及其在数字图像处理中的应用11、基于图像处理的检测系统的研究与设计12、基于DSP的图像处理系统的设计13、医学超声图像处理研究14、基于DSP的视频图像处理系统设计15、基于FPGA的图像处理算法的研究与硬件设计

运动目标检测与跟踪算法研究视觉是人类感知自身周围复杂环境最直接有效的手段之一，而在现实生活中大量有意义的视觉信息都包含在运动中，人眼对运动的物体和目标也更敏感，能够快速的发现运动目标，并对目标的运动轨迹进行预测和描绘。随着计算机技术、通信技术、图像处理技术的不断发展，计算机视觉己成为目前的热点研究问题之一。而运动目标检测与跟踪是计算机视觉研究的核心课题之一，融合了图像处理、模式识别、人工智能、自动控制、计算机等众多领域的先进技术，在军事制导、视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实用价值和广阔的发展前景。 1、国内外研究现状 1.1 运动目标检测运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。根据运动目标与摄像机之间的关系，运动目标检测分为静态背景下的运动目标检测和动态背景下的运动目标检测。静态背景下的运动目标检测是指摄像机在整个监视过程中不发生移动；动态背景下的运动目标检测是指摄像机在监视过程中发生了移动，如平动、旋转或多自由度运动等。静态背景静态背景下的运动目标检测方法主要有以下几种：（1）背景差分法背景差分法是目前最常用的一种目标检测方法，其基本思想就是首先获得一个背景模型，然后将当前帧与背景模型相减，如果像素差值大于某一阈值，则判断此像素属于运动目标，否则属于背景图像。利用当前图像与背景图像的差分来检测运动区域，一般能够提供比较完整的特征数据，但对于动态场景的变化，如光照和外来无关事件的干扰等特别敏感。很多研究人员目前都致力于开发不同的背景模型，以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、阴影的去除等对跟踪结果的好坏至关重要。背景差分法的实现简单，在固定背景下能够完整地精确、快速地分割出运动对象。不足之处是易受环境光线变化的影响，需要加入背景图像更新机制，且只对背景已知的运动对象检测比较有效，不适用于摄像头运动或者背景灰度变化很大的情况。（2）帧间差分法帧间差分法是在连续的图像序列中两个或三个相邻帧间，采用基于像素的时间差分并阈值化来提取图像中的运动区域。帧间差分法对动态环境具有较强的自适应性，但一般不能完全提取出所有相关的特征像素点，在运动实体内部容易产生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法，它是对图像序列中每连续三帧图像进行对称差分，检测出目标的运动范围，同时利用上一帧分割出来的模板对检测出来的目标运动范围进行修正，从而能较好地检测出中间帧运动目标的形状轮廓。帧间差分法非常适合于动态变化的环境，因为它只对运动物体敏感。实际上它只检测相对运动的物体，而且因两幅图像的时间间隔较短，差分图像受光线变化影响小，检测有效而稳定。该算法简单、速度快，已得到广泛应用。虽然该方法不能够完整地分割运动对象，只能检测出物体运动变化的区域，但所检测出的物体运动信息仍可用于进一步的目标分割。（3）光流法光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流是指空间中物体被观测面上的像素点运动产生的瞬时速度场，包含了物体表面结构和动态行为等重要信息。基于光流法的运动目标检测采用了运动目标随时间变化的光流特性，由于光流不仅包含了被观测物体的运动信息，还携带了物体运动和景物三位结构的丰富信息。在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可用于动态场景的情况。但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明性及噪声等原因，使得光流场基本方程——灰度守恒的假设条件无法满足，不能正确求出光流场，计算方也相当复杂，计算量巨大，不能满足实时的要求。动态背景动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动，检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、光流法以及全局运动估计法等。 2、运动目标跟踪运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。近年来出现了大批运动目标跟踪方法，许多文献对这些方法进行了分类介绍，可将目标跟踪方法分为四类：基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、基于模型的跟踪，这种分类方法概括了目前大多数跟踪方法，下面用这种分类方法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪基于区域的跟踪方法基本思想是：首先通过图像分割或预先人为确定提取包含目标区域的模板，并设定一个相似性度量，然后在序列图像中搜索目标，把度量取极值时对应的区域作为对应帧中的目标区域。由于提取的目标模板包含了较完整的目标信息，该方法在目标未被遮挡时，跟踪精度非常高，跟踪非常稳定，但通常比较耗时，特别是当目标区域较大时，因此一般应用于跟踪较小的目标或对比度较差的目标。该方法还可以和多种预测算法结合使用，如卡尔曼预测、粒子预测等，以估计每帧图像中目标的位置。近年来，对基于区域的跟踪方法关注较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重遮挡时的情况。 (2)基于特征的跟踪基于特征的跟踪方法基本思想是：首先提取目标的某个或某些局部特征，然后利用某种匹配算法在图像序列中进行特征匹配，从而实现对目标的跟踪。该方法的优点是即使目标部分被遮挡，只要还有一部分特征可以被看到，就可以完成跟踪任务，另外，该方法还可与卡尔曼滤波器结合使用，实时性较好，因此常用于复杂场景下对运动目标的实时、鲁棒跟踪。用于跟踪的特征很多，如角点边缘、形状、纹理、颜色等，如何从众多的特征中选取最具区分性、最稳定的特征是基于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪基于活动轮廓的跟踪方法基本思想是：利用封闭的曲线轮廓表达运动目标，结合图像特征、曲线轮廓构造能量函数，通过求解极小化能量实现曲线轮廓的自动连续更新，从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来，基于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方法，轮廓表达有减少复杂度的优点，而且在目标被部分遮挡的情况下也能连续的进行跟踪，但是该方法的跟踪结果受初始化影响较大，对噪声也较为敏感。 (4)基于模型的跟踪基于模型的跟踪方法基本思想是：首先通过一定的先验知识对所跟踪目标建立模型，然后通过匹配跟踪目标，并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型，即线图模型、二维轮廓模型和三维立体模型口61，应用较多的是运动目标的三维立体模型，尤其是对刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹，即使在目标姿态变化和部分遮挡的情况下也能够可靠的跟踪，但跟踪精度取决于模型的精度，而在现实生活中要获得所有运动目标的精确模型是非常困难的。目标检测算法，至今已提出了数千种各种类型的算法，而且每年都有上百篇相关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研究，现己提出的分割算法大都是针对具体问题的，并没有一种适合于所有情况的通用算法。目前，比较经典的运动目标检测算法有：双帧差分法、三帧差分法(对称差分法)、背景差法、光流法等方法，这些方法之间并不是完全独立，而是可以相互交融的。目标跟踪的主要目的就是要建立目标运动的时域模型，其算法的优劣直接影响着运动目标跟踪的稳定性和精确度，虽然对运动目标跟踪理论的研究已经进行了很多年，但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑战。基于此目的，系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂环境中运动目标快速、稳定的跟踪，人们提出了众多算法，但先前的许多算法都是针对刚体目标，或是将形变较小的非刚体近似为刚体目标进行跟踪，因而这些算法难以实现对形状变化较大的非刚体目标的正确跟踪。根据跟踪算法所用的预测技术来划分，目前主要的跟踪算法有：基于均值漂移的方法、基于遗传算法的方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方法等。运动检测与目标跟踪算法模块运动检测与目标跟踪算法模块与目标跟踪一、运动检测算法 1.算法效果算法效果总体来说，对比度高的视频检测效果要优于对比度低的视频。算法可以比较好地去除目标周围的浅影子，浅影的去除率在 80%以上。去影后目标的完整性可以得到较好的保持，在 80%以上。在对比度比较高的环境中可以准确地识别较大的滞留物或盗移物。从对目标的检测率上来说，对小目标较难进行检测。一般目标小于 40 个像素就会被漏掉。对于对比度不高的目标会检测不完整。总体上来说，算法在对比度较高的环境中漏检率都较低，在 0.1%以下，在对比度不高或有小目标的场景下漏检率在 6%以下。精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域，以供高层进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。反映算法优缺点的详细效果如下所示：去影子和完整性效果好公司内视频左边的为去影前，右边的为去影后的结果，可以看出在完整性和去影率上都有所突出。这两个视频的共周特点城市交通是，影子都是浅影子，视频噪声不太明显。目标与背景的对比度比较高。效果差这两个视频的特点是影子都是深影子。虽然影子没有去掉，但是物体的完整性是比较高的。主要原因就是场景的对路口，上午十点比度比较高。滞留物检测和稳定性效果好会议室盗移效果好的原因，一是盗移或滞留目标与背景对比度较大，二是目标本身尺寸较大。另外盗移物或滞留物在保持各自的状态期间不能受到光照变化或其它明显运动目标的干扰，要不然有可能会造成判断的不稳定。效果差会议室遗留物大部分时间内，滞留的判断都是较稳定的，但是在后期出现了不稳定。主要原因是目标太小的原故。因此在进行滞留物判断时，大目标，对比度较高的环境有利于判断的稳定性和准确性。漏检率效果好城市交通在对比度高的环境下，目标相对都较大的情况下（大于 40 个像素）可以很，稳定的检测出目标。在这种条件下的漏检率通常都是非常低的，在 0.1%以下。效果差行人－傍晚和“行人”目录下的其它昏暗条件下的视频在对比度较低的情况下，会造成检测结果不稳定。漏检率较高。主要原因是由于去影子造成的。这种对比度下的漏检率一般在 6%以下。除了对比度低是造成漏检的原因外，过小的目标也会造成漏检，一般是 40 个像素以下的目标都会被忽略掉。 1.2 算法效率内存消耗（单位：b） .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率一帧耗时 Max:57% Min:2.8% Avg:37.5% Max:23 Min:1.14 Avg:15 运动区域占 1/3 左右时 Max:45% Min:2.8% Avg:20% Max:18 Min:1.14 Avg:8 1.3 检测参数说明检测参数说明检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧，可以通过参数来自行调整。目前目标与背景的差异是根据局部光照强度所决定的，范围在 4 个像素值以上。目前参数设置要求目标大小要在 20 个像素以上才能被检测到，可以通过参数来自行调整。目标阴影的去除能力是可以调整的，目前的参数设置可以去除大部分的浅影子和较小的光照变化。 1.4 适用环境推荐光照条件较好（具有一定的对比度）的室内环境或室外环境。不易用它去检测过小的目标，比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标，可以为后面高层应用提供良好的信息。二、目标跟踪 2.1 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合，对相机的架设和视频的背景环境和运动目标数量运动方式有一定要求：背景要求：由于运动跟踪是基于运动检测的结果进行的，所以对背景的要求和运动检测一样，背景要求：运动目标相对于背景要有一定反差。运动目标：由于运动检测中，对较小的目标可能过滤掉。所以运动目标的大小要符合运动检运动目标：测的要求。运动目标的速度不能太大，要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改，过小，可能把碎片当成原目标分裂出来的小目标，过大，可能失去跟踪。当然可试着调节以适应不同场景)。该算法对由于运动检测在地面上产生的碎片抗干扰性比较差，运动目标和碎片相遇时，容易发生融合又分离的现象，造成轨迹混乱。消失目标和新生目标很容易当成同一目标处理，所以可能出现一个新目标继承新生目标的轨迹。运动方式：运动目标的最大数量由外部设定。但运动跟踪对运动目标比较稀疏的场景效果比运动方式：较好。算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。算法没对物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。拍摄角度：拍摄角度：拍摄视野比较大，且最好是俯视拍摄。

数字图像处理是利用计算机对图像信息进行加工以满足人的视觉心理或者应用需求的行为，应用广泛，多用于测绘学、大气科学、天文学、美图、使图像提高辨识等。这里学术堂为大家整理了一些数字图像处理毕业论文题目，希望对你有用。1、基于模糊分析的图像处理方法及其在无损检测中的应用研究2、数字图像处理与识别系统的开发3、关于数字图像处理在运动目标检测和医学检验中若干应用的研究4、基于ARM和DSP的嵌入式实时图像处理系统设计与研究5、基于图像处理技术的齿轮参数测量研究6、图像处理技术在玻璃缺陷检测中的应用研究7、图像处理技术在机械零件检测系统中的应用8、基于MATLAB的X光图像处理方法9、基于图像处理技术的自动报靶系统研究10、多小波变换及其在数字图像处理中的应用11、基于图像处理的检测系统的研究与设计12、基于DSP的图像处理系统的设计13、医学超声图像处理研究14、基于DSP的视频图像处理系统设计15、基于FPGA的图像处理算法的研究与硬件设计

图像检测识别方法研究论文

摘要针对基于PC实现的图像边缘检测普遍存在的执行速度慢、不能满足实时应用需求等缺点，本文借助于TI公司的TMS320DM642图像处理芯片作为数字图像处理硬件平台，DSP/BIOS为实时操作系统，利用CCS开发环境来构建应用程序；并通过摄像头提取视频序列，实现对边缘检测Sobel算子改进[1]。关键词 DM642；Sobel算子；程序优化；图像边缘检测 1 引言边缘是图像中重要的特征之一，是计算机视觉、模式识别等研究领域的重要基础。图像的大部分主要信息都存在于图像的边缘中，主要表现为图像局部特征的不连续性，是图像中灰度变化比较强烈的地方，也即通常所说的信号发生奇异变化的地方。经典的边缘检测算法是利用边缘处的一阶导数取极值、二阶导数在阶梯状边缘处呈零交叉或在屋顶状边缘处取极值的微分算法。图像边缘检测一直是图像处理中的热点和难点。近年来，随着数学和人工智能技术的发展，各种类型的边缘检测算法不断涌现，如神经网络、遗传算法、数学形态学等理论运用到图像的边缘检测中。但由于边缘检测存在着检测精度、边缘定位精度和抗噪声等方面的矛盾及对于不同的算法边缘检测结果的精度却没有统一的衡量标准，所以至今都还不能取得令人满意的效果。另外随着网络和多媒体技术的发展，图像库逐渐变得非常庞大；而又由于实时图像的目标和背景间的变化都不尽相同，如何实现实时图像边缘的精确定位和提取成为人们必须面对的问题。随着DSP芯片处理技术的发展，尤其是在图像处理方面的提高如TMS320C6000系列，为实现高效的、实时的边缘检测提供了可能性[5]。在经典的边缘检测算法中，Sobel边缘检测算法因其计算量小、实现简单、处理速度快，并且所得的边缘光滑、连续等优点而得到广泛的应用。本文针对Sobel算法的性能，并借助于TMS320DM642处理芯片[3]，对该边缘检测算法进行了改进和对程序的优化，满足实时性需求。2 Sobel边缘检测算法的改进经典的Sobel图像边缘检测算法，是在图像空间利用两个方向模板与图像进行邻域卷积来完成的，这两个方向模板一个是检测垂直边缘，一个是检测水平边缘。算法的基本原理：由于图像边缘附近的亮度变化较大，所以可以把那些在邻域内，灰度变化超过某个适当阈值TH的像素点当作边缘点。Sobel算法的优点是计算简单，速度快。但由于只采用了两个方向模板，只能检测水平方向和垂直方向的边缘，因此，这种算法对于纹理较复杂的图像，其边缘检测效果欠佳；同时，经典Sobel算法认为，凡灰度新值大于或等于阈值的像素点都是边缘点。这种判定依据是欠合理的，会造成边缘点的误判，因为多噪声点的灰度新值也很大。2.1 图像加权中值滤波由于图像中的边缘和噪声在频域中均表现为高频成分，所以在边缘检测之前有必要先对图像进行一次滤波处理，减少噪声对边缘检测的影响。中值滤波是一种非线性信号的处理方法[2]，在图像处理中，常用来保护边缘信息；保证滤波的效果。加权中值滤波，首先对每个窗口进行排序，取适当的比例，进行曲线拟合，拟合后的曲线斜率表征了此窗口的图像特征，再根据图像各部分特性适当的选择权重进行加权。2.2 增加方向模板除了水平和垂直两方向外，图像的边缘还有其它的方向，如135o和45o等，为了增加算子在某一像素点检测边缘的精度，可将方向模板由2个增加为8个即再在经典的方向模板的基础上增加6个方向模板，如图1所示。2.3 边缘的定位及噪声的去除通常物体的边缘是连续而光滑的，且边缘具有方向和幅度两个特征，而噪声是随机的。沿任一边缘点走向总能找到另一个边缘点，且这两个边缘点之间的灰度差和方向差相近。而噪声却不同，在一般情况下，沿任一噪声点很难找到与其灰度值和方差相似的噪声点[4]。基于这一思想，可以将噪声点和边缘点区分开来。对于一幅数字图像f(x，y)，利用上述的8个方向模板Sobel算子对图像中的每个像素计算，取得其中的最大值作为该点的新值，而该最大值对应的模板所表示的方向为该像素点的方向。若｜f(x，y)－f(x+i，y+j)｜＞TH2，对于任意i=0，1，-1；j=0，1，-1均成立，则可判断点(x，y)为噪声点。图2给出了图像边缘检测系统改进算法的软件流程图。图1 边缘检测8个方向模板图2 系统结构图3 基于TMS320DM642的图像处理的设计及算法优化3.1 TMS320DM642功能模块及图像处理系统的硬件结构 DSP以高速数字信号处理为目标进行芯片设计，采用改进的哈佛结构(程序总线和数据总线分开)、内部具有硬件乘法器、应用流水线技术、具有良好的并行性和专门用于数字信号处理的指令及超长指令字结构(VLIW)等特点；能完成运算量大的实时数字图像处理工作。 TMS320DM642是TI公式最近推出的功能比较强大的TMS320C6x系列之一，是目前定点DSP领域里性能较高的一款[6]。其主频是600MHz，8个并行运算单元、专用硬件逻辑、片内存储器和片内外设电路等硬件，处理能力可达4800MIPS。DM642基于C64x内核，并在其基础上增加了很多外围设备和接口，因而在实际工程中的应用更为广泛和简便。本系统使用50 MHz晶体震荡器作为DSP的外部时钟输入，经过内部锁相环12倍频后产生600 MHz的工作频率。DM642采用了2级缓存结构(L1和L2)，大幅度提高了程序的运行性能。片内64位的EMIF(External Memory Interface)接口可以与SDRAM、Flash等存储器件无缝连接，极大地方便了大量数据的搬移。更重要的是，作为一款专用视频处理芯片，DM642包括了3个专用的视频端口(VP0～VP2)，用于接收和处理视频，提高了整个系统的性能。此外，DM642自带的EMAC口以及从EMIF 口扩展出来的ATA口，还为处理完成后产生的海量数据提供了存储通道。本系统是采用瑞泰公司开发的基于TI TMS320DM642 DSP芯片的评估开发板——ICETEK DM642 PCI。在ICETEK DM642 PCI评估板中将硬件平台分为五个部分，分别是视频采集、数据存储、图像处理、结果显示和电源管理。视频采集部分采用模拟PAL制摄像头，配合高精度视频A/D转换器得到数字图像。基于DSP的视频采集要求对视频信号具备采集，实时显示、对图像的处理和分析能力。视频A/D采样电路—SAA7115与视频端口0或1相连，实现视频的实时采集功能。视频D/A电路—SAA7105与视频口2相连，视频输出信号支持RGB、HD合成视频、PAL/NTSC复合视频和S端子视频信号。通过I2C总线对SAA7105的内部寄存器编程实现不同输出。整个系统过程由三个部分组成：图像采集—边缘处理—输出显示，如图2所示。摄像头采集的视频信号经视频编码器SAA7115数字化，DM642通过I2C总线对SAA7115进行参数配置。在SAA7115内部进行一系列的处理和变换后形成的数字视频数据流，输入到核心处理单元DM642。经过DSP处理后的数字视频再经过SAA7105视频编码器进行D/A转换后在显示器上显示最终处理结果。3.2 图像处理的软件设计和算法优化的实现由于在改进Sobel边缘检测算子性能的同时，也相对增加了计算量，尤其是方向模板的增加，每个像素点均由原来的2次卷积运算增加为8次卷积运算，其实时性大大减弱。为了改进上述的不足，在深入研究处理系统和算法后，针对TMS320DM642的硬件结构特点，研究适合在TMS320DM642中高效运行的Sobel改进算法，满足实时处理的要求。整个程序的编写和调试按照C6000软件开发流程进行，流程分为：产生C代码、优化C代码和编写线性汇编程序3个阶段。使用的工具是TI的集成开发环境CCS。在CCS下，可对软件进行编辑、编译、调试、代码性能测试等工作。在使用C6000编译器开发和优化C代码时[7-8]，对C代码中低效率和需要反复调用的函数需用线性汇编重新编写，再用汇编优化器优化。整个系统的控制以及数字图像处理是用C程序实现，大部分软件设计采用C程序实现，这无疑提高了程序的可读性和可移植性，而汇编程序主要是实现DM642的各部分初始化。其边缘检测优化算法在DM642中的实现步骤具体如下： S1：根据DM642的硬件结构要求和控制寄存器设置，初始化系统并编写实现边缘检测算法的C程序。 S2：借助CCS开发环境的优化工具如Profiler等产生.OUT文件。 S3：根据产生的附件文件如.MAP文件，分析优化结果及源程序结构，进一步改进源程序和优化方法。 S4：使用CCS中调试、链接、运行等工具，再生成.OUT可执行文件。 S5：运行程序，如果满足要求则停止；否则重复步骤S2～S4直至满足使用要求。4 实验结果本文以Lena图像为例根据上述的硬件环境和算法实现的原理和方法，图4～图6分别给出了在该系统下采集的视频Lena图像及使用边缘检测算子和改进后处理的结果。由实验结果可以看出，在该系统下能实时完成视频图像的处理，并且给出的边缘检测算子能较好的消除噪声的影响，边缘轮廓清晰。该算法不仅能抑制图像中大部分噪声和虚假边缘，还保证了较高的边缘点位精度。图4 Lena原始图像图5 传统Sobel算子图6 改进Sobel算子5 总结本文实现了在TMS320DM642评估板上用改进的Sobel算子对实时图像进行边缘检测，无延迟地得到边缘图像。边缘检测效果较好，既提高了图像检测的精度又满足了实时性的要求。从检测结果看，利用该改进后的算子在边缘精确定位、边缘提取都达到了很好的效果，且抗噪声能力强，并为目标跟踪、无接触式检测、自动驾驶、视频监控等领域的应用提供了坚实的基础。参考文献[1] 王磊等. 基于Sobel理论的边缘提取改善方法[J]．中国图像图形学报，2005.10[2] 陈宏席. 基于保持平滑滤波的Sobel算子边缘检测.兰州交通大学学报，2006，25(1)：86—90[3] 熊伟. 基于TMS320DM642的多路视频采集处理板卡硬件设计与实现[ M]. 国外电子元器件，2006[4] 朱立.一种具有抗噪声干扰的图像边缘提取算法的研究[J]．电子技术应用.2004，25(1)[5] 刘松涛，周晓东.基于TMS320C6201的实时图像处理系统[J].计算机工程，2005(7)：17—23[6] TI TMS320DM642 video/imaging fixed-point digital signal processor data manual，2003[7] TMS320C6x Optimizing C Compiler User’s Guide’ TEXAS INSTRUMENTS”，2002[8] TMS320C32x Optimizing C/C++ Compiler User's Guide，Texas Instruments Incorporated，2001

随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文，欢迎阅读!

图像识别技术研究综述

摘要：随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解，由于图像在成像时受到外部环境的影响，使得图像具有特殊性，复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词：图像处理;图像识别;成像

中图分类号：TP391 文献标识码：A 文章编号：1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像，是人类最重要的信息源，它是通过各种观测系统从客观世界中获得，具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展，图像处理技术的应用也越来越广泛，并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段，比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等，在这些应用中，都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理，着重强调图像与图像之间进行的交换，主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性，使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析，以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理，而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声，将原始图像编程适于计算机进行特征提取的形式，主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集，图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像，也包括一些动态图像，并可以将其转为数字图像，和文字、图形、声音一起存储在计算机内，显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强，图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化，数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分，使图像的主体结构更加明确，必须对图像进行改善，即图像增强。通过图像增强，以减少图像中的图像的噪声，改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量，使图像中的物体的轮廓更加清晰，细节更加明显。图像增强不考虑图像降质的原因，增强后的图像更加赏欣悦目，为后期的图像分析和图像理解奠定基础。

3)图像复原，图像复原也称图像恢复，由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊，为了提取比较清晰的图像需要对图像进行恢复，图像恢复主要采用滤波方法，从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建，该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩，数字图像的显著特点是数据量庞大，需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频，那么必须对图像进行编码和压缩。目前，图像压缩编码已形成国际标准，如比较著名的静态图像压缩标准JPEG，该标准主要针对图像的分辨率、彩色图像和灰度图像，适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列，因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术，图像分割是把图像分成一些互不重叠而又具有各自特征的子区域，每一区域是像素的一个连续集，这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位，然后把目标从背景中分离出来。目前，图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰，使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述，描述是用数字或者符号表示图像或景物中各个目标的相关特征，甚至目标之间的关系，最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时，可以采用模板匹配模型。在某些具体的应用中，图像识别除了要给出被识别对象是什么物体外，还需要给出物体所处的位置和姿态以引导计算初工作。目前，图像识别技术已广泛应用于多个领域，如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有：

2.1 指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段，主要应用于身份验证。指纹识别是生物特征的一个部分，它具有不变性：一个人的指纹是终身不变的;唯一性：几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前，指纹识别技术与我们的现实生活紧密相关，如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

2.2 人脸识别目前大多数人脸识别系统使用可见光或红外图像进行人脸识别，可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下，其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响，但由于红外线不能穿透玻璃，如果待识别的对象戴有眼镜，那么在图像识别时，眼部信息全部丢失，将严重影响人脸识别的性能[4]。

2.3 文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术，可以自动地把文字和其他信息分离出来，通过智能识别后输入计算机，用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档，如银行票据、文稿、各类公式和符号等自动录入，可以提供文字的处理效率，有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样，使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事，但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下，图像识别技术取得了一定的成功，但在复杂的环境下，仍面临着许多问题：如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准，以及算法本身存在一定的局限性，这使得图像识别的最终结果不十分精确等。

参考文献：

[1] 胡爱明，周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用，2003，39(7)：90—91.

[2] 胡学龙.数字图像处理[M].北京：电子工业出版社，2011.

[3] 范立南，韩晓微，张广渊.图像处理与模式识别[M].北京：科学出版社，2007.

[4] 晓慧，刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用，2009，1(29)：8.

[5] 陈良育，曾振柄，张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用，2005，25(7)：1629-1631.

[6] Sanderson C，Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33，Martigny，Swizerland，2002.

点击下页还有更多>>>图像识别技术论文

这两天在公司做PM实习，主要是自学一些CV的知识，以了解产品在解决一些在图像识别、图像搜索方面的问题，学习的主要方式是在知网检索了6.7篇国内近3年计算机视觉和物体识别的硕博士论文。由于时间关系，后面还会继续更新图片相似度计算（以图搜图）等方面的学习成果将这两天的学习成果在这里总结一下。你将会看到计算机视觉在解决特定物体识别问题（主要是卷积神经网络CNNs）的基础过程和原理，但这里不会深入到技术的实现层面。

计算机视觉（Computer vision）是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图像处理，用计算机处理成为更适合人眼观察或传送给仪器检测的图像。 ————维基百科通常而言，计算机视觉的研究包括三个层次：（1）底层特征的研究：这一层次的研究主要聚焦如何高效提取出图像对象具有判别性能的特征，具体的研究内容通常包括：物体识别、字符识别等（2）中层语义特征的研究：该层次的研究在于在识别出对象的基础上，对其位置、边缘等信息能够准确区分。现在比较热门的：图像分割；语义分割；场景标注等，都属于该领域的范畴（3）高层语义理解：这一层次建立在前两层的基础上，其核心在于“理解”一词。目标在于对复杂图像中的各个对象完成语义级别的理解。这一层次的研究常常应用于：场景识别、图像摘要生成及图像语义回答等。而我研究的问题主要隶属于底层特征和中层语义特征研究中的物体识别和场景标注问题。

人类的视觉工作模式是这样的：首先，我们大脑中的神经元接收到大量的信息微粒，但我们的大脑还并不能处理它们。于是接着神经元与神经元之间交互将大量的微粒信息整合成一条又一条的线。接着，无数条线又整合成一个个轮廓。最后多个轮廓累加终于聚合我们现在眼前看到的样子。计算机科学受到神经科学的启发，也采用了类似的工作方式。具体而言，图像识别问题一般都遵循下面几个流程

（1）获取底层信息。获取充分且清洁的高质量数据往往是图像识别工作能否成功的关键所在（2）数据预处理工作，在图像识别领域主要包括四个方面的技术：去噪处理（提升信噪比）、图像增强和图像修复（主要针对不够清晰或有破损缺失的图像）；归一化处理（一方面是为了减少开销、提高算法的性能，另一方面则是为了能成功使用深度学习等算法，这类算法必须使用归一化数据）。（3）特征提取，这一点是该领域的核心，也是本文的核心。图像识别的基础是能够提取出足够高质量，能体现图像独特性和区分度的特征。过去在10年代之前我们主要还是更多的使用传统的人工特征提取方法，如PCA\LCA等来提取一些人工设计的特征，主要的方法有（HOG、LBP以及十分著名的SIFT算法）。但是这些方法普遍存在（a）一般基于图像的一些提层特征信息（如色彩、纹理等）难以表达复杂的图像高层语义，故泛化能力普遍比较弱。（b）这些方法一般都针对特定领域的特定应用设计，泛化能力和迁移的能力大多比较弱。另外一种思路是使用BP方法，但是毕竟BP方法是一个全连接的神经网络。这以为这我们非常容易发生过拟合问题（每个元素都要负责底层的所有参数），另外也不能根据样本对训练过程进行优化，实在是费时又费力。因此，一些研究者开始尝试把诸如神经网络、深度学习等方法运用到特征提取的过程中，以十几年前深度学习方法在业界最重要的比赛ImageNet中第一次战胜了SIFT算法为分界线，由于其使用权重共享和特征降采样，充分利用了数据的特征。几乎每次比赛的冠军和主流都被深度学习算法及其各自改进型所占领。其中，目前使用较多又最为主流的是CNN算法，在第四部分主要也研究CNN方法的机理。

上图是一个简易的神经网络，只有一层隐含层，而且是全连接的（如图，上一层的每个节点都要对下一层的每个节点负责。）具体神经元与神经元的作用过程可见下图。

在诸多传统的神经网络中，BP算法可能是性能最好、应用最广泛的算法之一了。其核心思想是：导入训练样本、计算期望值和实际值之间的差值，不断地调整权重，使得误差减少的规定值的范围内。其具体过程如下图：

一般来说，机器学习又分成浅层学习和深度学习。传统的机器学习算法，如SVM、贝叶斯、神经网络等都属于浅层模型，其特点是只有一个隐含层。逻辑简单易懂、但是其存在理论上缺乏深度、训练时间较长、参数很大程度上依赖经验和运气等问题。如果是有多个隐含层的多层神经网络（一般定义为大于5层），那么我们将把这个模型称为深度学习，其往往也和分层训练配套使用。这也是目前AI最火的领域之一了。如果是浅层模型的问题在于对一个复杂函数的表示能力不够，特别是在复杂问题分类情况上容易出现分类不足的弊端，深度网络的优势则在于其多层的架构可以分层表示逻辑，这样就可以用简单的方法表示出复杂的问题，一个简单的例子是：如果我们想计算sin(cos(log(exp(x))))，那么深度学习则可分层表示为exp(x)—>log(x)—>cos(x)—>sin(x)

图像识别问题是物体识别的一个子问题，其鲁棒性往往是解决该类问题一个非常重要的指标，该指标是指分类结果对于传入数据中的一些转化和扭曲具有保持不变的特性。这些转化和扭曲具体主要包括了：（1）噪音（2）尺度变化（3）旋转（4）光线变化（5）位移

该部分具体的内容，想要快速理解原理的话推荐看[知乎相关文章] ( )，特别是其中有些高赞回答中都有很多动图和动画，非常有助于理解。但核心而言，CNN的核心优势在于共享权重以及感受野，减少了网络的参数，实现了更快的训练速度和同样预测结果下更少的训练样本，而且相对于人工方法，一般使用深度学习实现的CNN算法使用无监督学习，其也不需要手工提取特征。

CNN算法的过程给我的感觉，个人很像一个“擦玻璃”的过程。其技术主要包括了三个特性：局部感知、权重共享和池化。

CNN中的神经元主要分成了两种：（a）用于特征提取的S元，它们一起组成了卷积层，用于对于图片中的每一个特征首先局部感知。其又包含很关键的阈值参数（控制输出对输入的反映敏感度）和感受野参数（决定了从输入层中提取多大的空间进行输入，可以简单理解为擦玻璃的抹布有多大）（b）抗形变的C元，它们一起组成了池化层，也被称为欠采样或下采样。主要用于特征降维，压缩数据和参数的数量，减小过拟合，同时提高模型的容错性。（c*）激活函数，及卷积层输出的结果要经过一次激励函数才会映射到池化层中，主要的激活函数有Sigmoid函数、Tanh函数、ReLU、Leaky ReLU、ELU、Maxout等。

也许你会抱有疑问，CNN算法和传统的BP算法等究竟有什么区别呢。这就会引出区域感受野的概念。在前面我们提到，一个全连接中，较高一层的每个神经元要对低层的每一个神经元负责，从而导致了过拟合和维度灾难的问题。但是有了区域感受野和，每个神经元只需要记录一个小区域，而高层会把这些信息综合起来，从而解决了全连接的问题。

了解区域感受野后，你也许会想，区域感受野的底层神经元具体是怎么聚合信息映射到上一层的神经元呢，这就要提到重要的卷积核的概念。这个过程非常像上面曾提到的“神经元与神经元的联系”一图，下面给大家一个很直观的理解。

上面的这个过程就被称为一个卷积核。在实际应用中，单特征不足以被系统学习分类，因此我们往往会使用多个滤波器，每个滤波器对应1个卷积核，也对应了一个不同的特征。比如：我们现在有一个人脸识别应用，我们使用一个卷积核提取出眼睛的特征，然后使用另一个卷积核提取出鼻子的特征，再用一个卷积核提取出嘴巴的特征，最后高层把这些信息聚合起来，就形成了分辨一个人与另一个人不同的判断特征。

现在我们已经有了区域感受野，也已经了解了卷积核的概念。但你会发现在实际应用中还是有问题：给一个100 100的参数空间，假设我们的感受野大小是10 10，那么一共有squar（1000-10+1）个，即10的六次方个感受野。每个感受野中就有100个参数特征，及时每个感受野只对应一个卷积核，那么空间内也会有10的八次方个次数，，更何况我们常常使用很多个卷积核。巨大的参数要求我们还需要进一步减少权重参数，这就引出了权重共享的概念。用一句话概括就是，对同一个特征图，每个感受野的卷积核是一样的，如这样操作后上例只需要100个参数。

池化是CNN技术的最后一个特性，其基本思想是：一块区域有用的图像特征，在另一块相似的区域中很可能仍然有用。即我们通过卷积得到了大量的边缘EDGE数据，但往往相邻的边缘具有相似的特性，就好像我们已经得到了一个强边缘，再拥有大量相似的次边缘特征其实是没有太大增量价值的，因为这样会使得系统里充斥大量冗余信息消耗计算资源。具体而言，池化层把语义上相似的特征合并起来，通过池化操作减少卷积层输出的特征向量，减少了参数，缓解了过拟合问题。常见的池化操作主要包括3种：分别是最大值池化（保留了图像的纹理特征）、均值池化（保留了图像的整体特征）和随机值池化。该技术的弊端是容易过快减小数据尺寸，目前趋势是用其他方法代替池化的作用,比如胶囊网络推荐采用动态路由来代替传统池化方法，原因是池化会带来一定程度上表征的位移不变性，传统观点认为这是一个优势，但是胶囊网络的作者Hinton et al.认为图像中位置信息是应该保留的有价值信息，利用特别的聚类评分算法和动态路由的方式可以学习到更高级且灵活的表征，有望冲破目前卷积网络构架的瓶颈。

CNN总体来说是一种结构，其包含了多种网络模型结构，数目繁多的的网络模型结构决定了数据拟合能力和泛化能力的差异。其中的复杂性对用户的技术能力有较高的要求。此外，CNN仍然没有很好的解决过拟合问题和计算速度较慢的问题。

该部分的核心参考文献：《深度学习在图像识别中的应用研究综述》郑远攀,李广阳,李晔.[J].计算机工程与应用,2019,55(12):20-36. 深度学习技术在计算机图像识别方面的领域应用研究是目前以及可预见的未来的主流趋势，在这里首先对深度学习的基本概念作一简介，其次对深度学习常用的结构模型进行概述说明，主要简述了深度信念网络（DBN）、卷积神经网络（CNN）、循环神经网络（RNN）、生成式对抗网络（GAN）、胶囊网络（CapsNet）以及对各个深度模型的改进模型做一对比分析。

深度学习按照学习架构可分为生成架构、判别架构及混合架构。其生成架构模型主要包括：受限波尔兹曼机、自编码器、深层信念网络等。判别架构模型主要包括：深层前馈网络、卷积神经网络等。混合架构模型则是这两种架构的集合。深度学习按数据是否具有标签可分为非监督学习与监督学习。非监督学习方法主要包括：受限玻尔兹曼机、自动编码器、深层信念网络、深层玻尔兹曼机等。监督学习方法主要包括：深层感知器、深层前馈网络、卷积神经网络、深层堆叠网络、循环神经网络等。大量实验研究表明，监督学习与非监督学习之间无明确的界限，如：深度信念网络在训练过程中既用到监督学习方法又涉及非监督学习方法。

[1]周彬. 多视图视觉检测关键技术及其应用研究[D].浙江大学,2019. [2]郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36. [3]逄淑超. 深度学习在计算机视觉领域的若干关键技术研究[D].吉林大学,2017. [4]段萌. 基于卷积神经网络的图像识别方法研究[D].郑州大学,2017. [5]李彦冬. 基于卷积神经网络的计算机视觉关键技术研究[D].电子科技大学,2017. [6]李卫. 深度学习在图像识别中的研究及应用[D].武汉理工大学,2014. [7]许可. 卷积神经网络在图像识别上的应用的研究[D].浙江大学,2012. [8]CSDN、知乎、机器之心、维基百科

图像中的目标检测论文

有一个月没更博客了，捂脸 o(￣=￣)d

端午回家休息了几天，6月要加油~

回到正文，HOG是很经典的一种图像特征提取方法，尤其是在行人识别领域被应用的很多。虽然文章是2005年发表在CVPR上的，但近十年来还没有被淹没的文章真的是很值得阅读的研究成果了。

key idea：局部物体的形状和外观可以通过局部梯度或者边缘的密度分布所表示。

主要步骤：

上图为论文中提供的图，个人觉得我在参考资料中列出的那篇博客中给出的图可能更好理解一些。

具体细节：关于每一个过程的详细解释还是在这篇博客中已经写得很清楚了，这里就不再搬运了。

文章中数据集的图像大小均为：64*128, block大小为16x16， block stride为8x8，cell size为8x8，bins=9（直方图等级数）；

获取到每张图的特征维度后，再用线性SVM训练分类器即可。

下图为作者而给出的示例图：

这两篇博客写的都很好，推荐阅读一波。

能不能给我发一份呢？

图像目标检测综述论文

论文名称：Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间：2014年论文地址：针对问题：从Alexnet提出后，作者等人思考如何利用卷积网络来完成检测任务，即输入一张图，实现图上目标的定位（目标在哪）和分类（目标是什么）两个目标，并最终完成了RCNN网络模型。创新点： RCNN提出时，检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢，作者采用的是Selective Search候选区域提取算法，来获得当前输入图上可能包含目标的不同图像块，再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。参考博客：。论文题目：OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间：2014年论文地址：针对问题：该论文讨论了，CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后，在网络后端组织两组卷积或全连接层，一组用于实现定位，输出当前图像上目标的最小外接矩形框坐标，一组用于分类，输出当前图像上目标的类别信息。也是以此为起点，检测网络出现基础主干网络(backbone)+分类头或回归头（定位头）的网络设计模式雏形。创新点：在这篇论文中还有两个比较有意思的点，一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的，而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制，那用1x1卷积来替换FC层，是否可行呢？作者在测试时通过将全连接层替换为1x1卷积核证明是可行的；二是提出了offset max-pooling，也就是对池化层输入特征不能整除的情况，通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练，然后切换分类头为回归头，再训练回归头的参数，最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。参考博客：论文题目：Scalable Object Detection using Deep Neural Networks 提出时间：2014年论文地址：针对问题：既然CNN网络提取的特征可以直接用于检测任务（定位+分类），作者就尝试将目标框（可能包含目标的最小外包矩形框）提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。创新点：本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心，（800个anchor box）然后学习预测不考虑目标类别的二分类网络，背景or前景。用到了多尺度下的检测。参考博客：论文题目：DeepBox: Learning Objectness with Convolutional Networks 提出时间：2015年ICCV 论文地址：主要针对的问题：本文完成的工作与第三篇类似，都是对目标框提取算法的优化方案，区别是本文首先采用自底而上的方案来提取图像上的疑似目标框，然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序；而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点：本文作者想通过CNN学习输入图像的特征，从而实现对输入网络目标框是否为真实目标的情况进行计算，量化每个输入框的包含目标的可能性值。参考博客：论文题目：AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间：2015年ICCV 论文地址：主要针对的问题：对检测网络的实现方案进行思考，之前的执行策略是，先确定输入图像中可能包含目标位置的矩形框，再对每个矩形框进行分类和回归从而确定目标的准确位置，参考RCNN。那么能否直接利用回归的思路从图像的四个角点，逐渐得到目标的最小外接矩形框和类别呢？创新点：通过从图像的四个角点，逐步迭代的方式，每次计算一个缩小的方向，并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。参考博客：论文题目：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间：2014年论文地址：针对问题：如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络，在处理过程中就造成了图像块信息的损失。在实际的场景中，输入网络的目标尺寸很难统一，而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点：作者提出的SPPnet中，通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸，在训练的时候，池化的操作还是通过滑动窗口完成的，池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。参考博客：论文题目：Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间：2015年论文地址：针对问题：既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位，本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点：作者通过对输入网络的region进行一定的处理（通过数据增强，使得网络利用目标周围的上下文信息得到更精准的目标框）来增加网络对目标回归框的精度。具体的处理方式包括：扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置，使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性，从而提高了回归框的精度。参考博客：论文题目：Fast-RCNN 提出时间：2015年论文地址：针对问题： RCNN中的CNN每输入一个图像块就要执行一次前向计算，这显然是非常耗时的，那么如何优化这部分呢？创新点：作者参考了SPPNet（第六篇论文），在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸，从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图，再将原图上用Selective Search算法得到的目标框映射到特征图上，避免了特征的重复提取。参考博客：论文题目：DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间：2015年论文地址：主要针对的问题：本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文，作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。创新点：作者在不同的激活层上以滑动窗口的方式生成了假设，并表明最终的卷积层可以以较高的查全率找到感兴趣的对象，但是由于特征图的粗糙性，定位性很差。相反，网络的第一层可以更好地定位感兴趣的对象，但召回率降低。论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间：2015年NIPS 论文地址：主要针对的问题：由multibox（第三篇）和DeepBox（第四篇）等论文，我们知道，用CNN可以生成目标待检测框，并判定当前框为目标的概率，那能否将该模型整合到目标检测的模型中，从而实现真正输入端为图像，输出为最终检测结果的，全部依赖CNN完成的检测系统呢？创新点：将当前输入图目标框提取整合到了检测网络中，依赖一个小的目标框提取网络RPN来替代Selective Search算法，从而实现真正的端到端检测算法。参考博客：

随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文，欢迎阅读!

图像识别技术研究综述

关键词：图像处理;图像识别;成像

中图分类号：TP391 文献标识码：A 文章编号：1009-3044(2013)10-2446-02

1 图像处理技术

2 图像识别技术

2.1 指纹识别

2.3 文字识别

3 结束语

参考文献：

[1] 胡爱明，周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用，2003，39(7)：90—91.

[2] 胡学龙.数字图像处理[M].北京：电子工业出版社，2011.

[3] 范立南，韩晓微，张广渊.图像处理与模式识别[M].北京：科学出版社，2007.

[4] 晓慧，刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用，2009，1(29)：8.

[5] 陈良育，曾振柄，张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用，2005，25(7)：1629-1631.

[6] Sanderson C，Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33，Martigny，Swizerland，2002.

点击下页还有更多>>>图像识别技术论文

遥感图像目标检测论文

森林资源调查中SPOT5遥感图像处理方法探讨王照利、黄生、张敏中、马胜利（国家林业局西北林业规划设计院，遥感计算中心，西安710048）本文发表于＜陕西林业科技＞2005 No.1 P.27-29,55摘要：目前，多光谱、高空间分辨率的SPOT5卫星遥感数据被广泛应用到森林资源调查中。本文结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的处理和信息提取。探讨性地提出了适应于森林资源调查的SPOT5遥感数据处理方法。关键词：SPOT5 遥感数据，森林资源调查、数据处理DISCUSSION ON SPOT5 IMAGE DATA PROCESSING FOR FOREST INVENTORYWang Zhaoli, Huangsheng,Zhangminzhong,Ma Shengli(Northwest Institute for Forest Inventory, Planning &Design, Xi’an China 710048)Abstract: Now days, high spatial resolution and multispectral SPOT5 image data are widely applied in forest inventory in China. Based on the characteristics of SPOT5 image and requirements of forest inventory, this paper discusses the processing procedures of ordering image data, ortho-rectification, image bands composition and image data fusion. The complete steps of image processing for forest inventory are given.Key words: SPOT5 image data，forest inventory, data processing前言卫星遥感影像具有空间宏观性、视角广、多分辨率（光谱和空间）、多时相、周期性、信息量丰富等特点，所以卫星遥感影像既可以提供森林资源的宏观空间分布信息又能提供局部的详细信息以及随时间、空间变化的信息等[1]。目前在林业领域卫星遥感数据被广泛的应用于不同尺度层次的森林资源调查、资源监测、病虫害、火灾监测等方面。2002年5月法国SPOT地球观测卫星系列之5号卫星（即SPOT5星）发射。SPOT5遥感数据的多光谱波段空间分辨率为10米（短波红外空间分辨率为20米），但全色波段空间分辨率达到2.5米。SPOT5遥感数据的高空间分辨率和多光谱分辨率为森林资源调查提供了丰富的、可靠的、高精度的基础数据源。从性价比分析，在其他高分辨率遥感数据目前比较昂贵的状况下，SPOT5遥感数据比较适宜应用于大面积的森林资源调查，可大幅度的森林调查的减少外业工作量、提高工作效率。在我国SPOT5卫星数据已被大量地应用于森林资源调查工作中，尤其，是在森林资源“二类”调查中被作基本的森林资源信息源提取各类信息。针对于将多光谱分辨率和高空间分辨率的SPOT5遥感数据应用于森林资源调查的数据处理技术和方法鲜有报道。本文总结工作实践，结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的订购、正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的基本处理方法。1．SPOT5卫星遥感数据特点SPOT卫星系统采用线性阵列传感器和推扫式扫描技术，具有旋转式平面镜可以进行倾斜观察获得倾斜图像和立体像对。采用与太阳同步的近极地的椭圆形轨道，轨道高度约832Km，轨道倾角98.7o ，每天绕地球14圈多，重复覆盖周期26天[2]。由于有倾斜观测功能，使重复覆盖周期减少到2-3天。SPOT5卫星载有2台高分辨率几何成像仪（HRG）、1台高分辨率立体成像装置（HRS）和1台宽视域植被探测仪（VGT）。高分辨率几何成像仪的波段选择是总结了多年的研究成果，认为HRG的波段设置（见表1）足以取得辨别作物和植被类型的最佳效果。本文主要探讨HRG高空间分辨率数据的处理。2．SPOT5数据的处理方法和过程SPOT5数据处理工作流程：2.1 遥感数据的订购订购数据时，用户需向数据代理商提供购买区域的四个角的大地坐标或者数据的景号（PATH/ROW）。特别应该注意数据订购时间和用户拿到数据之间有时间差，间隔时间长短因用户的要求、天气、卫星重复覆盖周期而异。相对于其他卫星数据，比较有利的一面是SPOT5卫星装置有旋转式平面镜可以进行倾斜观察，用户可向代理商申请红色编程提前得到调查区域的遥感数据，但要支付编程费。对于遥感数据的时相、云量、入射角、阴影量、是否购买高空间分辨率的全色波段等用户根据自己具体的工作需要向代理商提出限制要求。根据我们对SPOT5遥感数据的使用，对于森林资源调查，北方9，10月份和11月初的遥感影像比较适宜。代理商向用户提供经过处理的不同级别的影像产品，在森林资源调查中建议购买SPOT1A级产品，用户可根据自己的工作需要进行处理，同时也可减少费用。2.2 基础数据准备大比例尺地形图和高精度DEM是进行SPOT5遥感数据高精度正射校正必需的基础地理数据。建议购买1：10000地形图和1：25000数字高程模型（DEM）。将1：1万地形图扫描，扫描分辨率设置为300DPI。将扫描好的地形图进行几何精纠正，纠正精度控制在0.3毫米内。从测绘部门购买的1：1万地形图为北京54坐标系3度分带高斯克吕格投影，而1：2.5万DEM为北京54坐标系6度分带投影。在数据准备时，将校正好的1：1万地形图通过换带转换转成和DEM一致的6度分带投影。对于没有1：1万地形图的地区，建议使用差分GPS接收机采集地面控制点。2.3几何正射校正正射校正过程应用了法国SPOT公司发行的GEOIMAGE软件。GEOIMAGE软件有针对SPOT5卫星数据开发的SPOT5物理模型。模型模块自动读取DEM信息。SPOT 物理模型可读取卫星在获取遥感数据的瞬间状态参数，这些参数存贮在数据的头文件中[3]。卫星状态参数包括：卫星成像瞬间的经纬度、高度、倾角等。卫星状态参数能够帮助提高几何校正的精度。以校正好的1：1万地形图为基准，在影像图上找出和地形图上地物相匹配的明显地物作为地面控制点。在进行正射校正时，应先进行全色波段数据校正，然后以校正好的全色波段数据为基准进行多光谱数据校正。以全色波段数据为基准校正多光谱波段就比较容易校正，且能提高两者的匹配精度。地面控制点应分布均匀，影像的边缘部分布要有控制点分布，同时在不同的高程范围最好都有控制点。地面控制点的数量因地形地貌的复杂程度而定，根据我们的经验，一景60KmX60Km的SPOT5数据，一般地势平缓的地区20个左右控制点即可达到满意的结果，在高山区25个左右控制点就可使正射校正精度满足要求。重采样方法采用双线性内插法。2.4 辐射校正用户购买的SPOT5的各级数据，数据提供商已经根据卫星的记录参数对遥感数据做了辐射校正，即消除了传感器自身引起的、大气辐射引起的辐射噪声。若果影像存在薄雾或地形高差较大引起的辐射误差情况，用户应进一步进行辐射校正处理。薄雾的简单消除原理是基于近红外波段不受大气辐射影响，清澈的水体或死阴影区的数值应为零。从各波段数据中减去近红外波段的水体或阴影的不为零值。地形起伏引起的辐射误差校正公式: f (x,y)=g(x,y)/cosa，g(x,y)为坡度为a的倾斜面上的地物影像；f (x,y)为校正后的影像。由于坡度因子参与校正所以需要DEM支持。2.5 波段组合根据SPOT5数据波谱特征（表1），各波段分别记录反映了植被的不同特征方面：B4（SWIR）短波红外反映植物和土壤的含水量，利于植被水分状况和长势分析；B3（NIR）近红外波段对植被类别、密度、生长力、病虫害等的变化敏感；B2（RED）红光波段对植被的覆盖度、植被的生长状况敏感；B1（VIS）可见光波段对植物的叶绿素和叶绿素浓度敏感。经过比较分析和实际应用发现SPOT5的B3、B4、B2波段组合对植被类型的识别要优于B3、B2和B1的组合。但由于B4波段的空间分辨率为20米，使B342组合对植被空间几何细节表达没有B321组合清晰，例如林缘界线信息表达方面B321要优于B342。2.6 影像数据融合对于购买有高空间分辨率全色波段数据的用户，进行数据融合是必不可少的。影像数据融合能够综合不同波段、不同空间分辨率数据（层）的特征，融合后的数据具有更丰富、更可靠的信息[4]。根据影像数据融合的水平阶段，影像融合分为：像元级、特征级和决策级三个层次。为了最大限度的从SPOT5遥感数据中提取森林植被信息，应进行像元级的数据融合，将2.5米的全色波段和10米多光谱数据进行融合。融合得到的新数据既具有全色波段数据的高空间分辨率特征又具有多光谱特征。像元级数据融合的方法多种多样，根据数据融合的目的，即最大限度的突显森林植被信息，应选取B4、B3、B2和PAN波段，根据我们的试验Brovey 融合算法方法比较理想：2.7遥感影像地图将融合好的数据按Rfused、Gfused、Bfused组合，叠加上行政界线、公里格网、坐标、比例尺等辅助信息，按1：1万地形图分幅生成1：1万纸质图作为外业手图。3. 结果和讨论3.1 几何精度利用SPOT5物理模型，采用1：1万地形图和2.5万DEM ，经过正射校正处理，可使影像的几何精度控制在2个像元内（<10米）,达到1：1万制图标准要求。为以遥感影像为基础信息源提取林分调查因子、区划林班界线生成大比例尺的林相图、森林分布图提供了几何精度保障。3.2 波段选择对于没有全色波段的情况，SPOT5数据的B342组合有利于森林植被类型的识别。在应用遥感技术进行森林资源调查区划中，林分类型信息提取是最为重要的环节，所以B342波段组合是小班区划和外业手图的最佳组合。3.3 融合效果融合数据技术使SPOT5遥感影像既具有全色波段的高空间分辨率又拥有多光谱数据的光谱分辨率，丰富了遥感影像的信息量。采用Brovey算法使SPOT5遥感影像从色彩、纹理等方面增强了影像的可判读性，提高了小班因子正判率和林分小班的区划精度。参考文献1．周成虎，杨晓梅，骆剑承等.《遥感影像地学理解与分析》，科学出版社，北京，2001，3-4.2．赵英时.《遥感应用分析原理与方法》，科学出版社，北京，2001.88-903．北京视宝卫星图像有限公司.《专业制图工作室GEOIMAGE用户指南》，2004，68-70.4．Christine Pohl. Geometric Aspects of Multisensor Image Fusion for Topographic Map Updating in The Humid Tropics, ITC Publication, 1996,51-52.21世纪遥感与GIS的发展来源：李德仁时间： 2005-08-11-23:09 浏览次数: 7921世纪遥感与GIS的发展李德仁（武汉大学测绘遥感信息工程国家重点实验室，武汉市珞瑜路129号，430079）摘要：在20世纪，人类的一大进步是实现了太空对地观测，即可以从空中和太空对人类赖以生存的地球通过非接触传感器的遥感进行观测，并将所得到的数据和信息存储在计算机网络上，为人类社会的可持续发展服务。在短短的30年中，遥感和GIS作为一个边缘交叉学科已发展成为一门科学、技术和经济实体。本文深入地论述了21世纪中遥感的6大发展趋势和GIS的5个发展特征。关键词：发展趋势；航空航天遥感；地理信息系统；对地观测中图法分类号：P208；P237.9随着计算机技术、空间技术和信息技术的发展，人类实现了从空中和太空来观测和感知人类赖以生存的地球的理想，并能将所感知到的结果通过计算机网络在全球流通，为人类的生存、繁荣和可持续发展服务。在20世纪后半叶，遥感和地理信息系统作为一门新兴的科学和技术，迅速地成长起来。1 遥感技术的主要发展趋势1.1 航空航天遥感传感器数据获取技术趋向三多（多平台、多传感器、多角度）和三高（高空间分辨率、高光谱分辨率和高时相分辨率）从空中和太空观测地球获取影像是20世纪的重大成果之一，短短几十年，遥感数据获取手段迅猛发展。遥感平台有地球同步轨道卫星（35000km）、太阳同步卫星（600—1000km）、太空飞船（200—300km）、航天飞机（240—350km）、探空火箭（200—1000km），并且还有高、中、低空飞机、升空气球、无人飞机等；传感器有框幅式光学相机、缝隙、全景相机、光机扫描仪、光电扫描仪、CCD线阵、面阵扫描仪、微波散射计雷达测高仪、激光扫描仪和合成孔径雷达等，它们几乎覆盖了可透过大气窗口的所有电磁波段。三行CCD阵列可以同时得到3个角度的扫描成像，EOS Terra卫星上的MISR可同时从9个角度对地成像。卫星遥感的空间分辨率从Ikonos Ⅱ的1m，进一步提高到Quckbird（快鸟）的0.62m，高光谱分辨率已达到5—6nm，500—600个波段。在轨的美国EO-1高光谱遥感卫星，具有220个波段，EOS AM-1（Terra）和EOS PM-1（Aqua）卫星上的MODIS具有36个波段的中等分辨率成像光谱仪。时间分辨率的提高主要依赖于小卫星技术的发展，通过发射地球同步轨道卫星和合理分布的小卫星星座，以及传感器的大角度倾斜，可以以1—3d的周期获得感兴趣地区的遥感影像。由于具有全天候、全天时的特点，以及用INSAR和D-INSAR，特别是双天线INSAR进行高精度三位地形及其变化测定的可能性，SAR雷达卫星为全世界各国所普遍关注。例如，美国宇航局的长远计划是要发射一系列太阳同步和地球同步的长波SAR,美国国防部则要发射一系列短波SAR，实现干涉重访问间隔为8d、3d和1d，空间分辨率分别为20m、5m和2m。我国在机载和星载SAR传感器及其应用研究方面正在形成体系。“十五”期间，我国将全方位地推进遥感数据获取的手段，形成自主的高分辨率资源卫星、雷达卫星、测图卫星和对环境与灾害进行实时监测的小卫星群。1.2 航空航天遥感对地定位趋向于不依赖地面控制确定影像目标的实地位置（三维坐标），解决影像目标在哪儿（Where）是摄影测量与遥感的主要任务之一。在已成功用于生产的全自动化GPS空中三角测量的基础上，利用DGPS和INS惯性导航系统的组合，可形成航空/航天影像传感器的位置与姿态的自动测量和稳定装置（POS），从而可实现定点摄影成像和无地面控制的高精度对地直接定位。在航空摄影条件下的精度可达到dm级，在卫星遥感的条件下，其精度可达到m级。该技术的推广应用，将改变目前摄影测量和遥感的作业流程，从而实现实时测图和实时数据库更新。若与高精度激光扫描仪集成，可实现实时三维测量（LIDAR），自动生成数字表面模型（DSM），并可推算出数字高程模型（DEM）。美国NASA在1994年和1997年两次将航天激光测高仪（SLA）安装在航天飞机上，企图建立基于SLA的全球控制点数据库，激光点大小为100m，间隔为750m，每秒10个脉冲；随后又提出了地学激光测高系统（GLAS）计划，已于2002年12月19日将该卫星IICESat（cloud and land elevation satellite）发射上天。该卫星装有激光测距系统、GPS接收机和恒星跟踪姿态测定系统。GLAS发射近红外光（1064nm）和可见绿光（532nm）的短脉冲（4ns）。激光脉冲频率为40次/s，激光点大小实地为70m，间隔为170m，其高程精度要明显高于SRTM，可望达到m级。他们的下一步计划是要在2015年之前使星载LIDAR的激光测高精度达到dm和cm级。法国利用设在全球的54个站点向卫星发射信号，通过测定多普勒频移，以精确解求卫星的空间坐标，具有极高的精度。测定距地球1300km的Topex/Poseidon卫星的高度，精度达到±3cm。用来测定SPOT 4卫星的轨道，3个坐标方向达到±5cm精度，对于SPOT 5和Envisat，可望达到±1m精度。若忽略SPOT 5传感器的角元素，直接进行无地面控制的正射像片制作，精度可达到±15m，完全可以满足国家安全和西部开发的需求。1.3 摄影测量与遥感数据的计算机处理更趋向自动化和智能化从影像数据中自动提取地物目标，解决它的属性和语义（What）是摄影测量与遥感的另一大任务。在已取得影像匹配成果的基础上，影像目标的自动识别技术主要集中在影像融合技术，基于统计和基于结构的目标识别与分类，处理的对象既包括高分辨率影像，也更加注重高光谱影像。随着遥感数据量的增大，数据融合和信息融合技术逐渐成熟。压缩倍率高、速度快的影像数据压缩方法也已商业化。我国学者在这些方面取得了不少可喜的成果。1.4 利用多时像影像数据自动发现地表覆盖的变化趋向实时化利用遥感影像自动进行变化监测（What change）关系到我国的经济建设和国防建设。过去人工方法投入大，周期长。随着各类空间数据库的建立和大量新的影像数据源的出现，实时自动化监测已成为研究的一个热点。自动变化监测研究包括利用新旧影像（DOM）的对比、新影像与旧数字地图（DLS）的对比来自动发现变化和更新数据库。目前的变化监测是先将新影像与旧影像（或数字地图）进行配准，然后再提取变化目标，这在精度、速度与自动化处理方面都有不足之处。笔者提出了把配准与变化监测同步的整体处理[1]。最理想的方法是将影像目标三维重建与变化监测一起进行，实现三维变化监测和自动更新。进一步的发展则是利用智能传感器，将数据处理在轨完成，发送回来的直接为信息，而不一定为影像数据。1.5 摄影测量与遥感在构建“数字地球”、“数字中国”、“数字省市”和“数字文化遗产”中正在发挥愈来愈大的作用“数字地球”概念是在全球信息化浪潮推进下形成的。1999年12月在北京成功地召开了第一届国际“数字地球”大会后，我国正积极推进“数字中国”和“数字省市”的建设，2001年国家测绘局完成了构建“数字中国”地理空间基础框架的总体战略研究。在已完成1∶100万和1∶25万全国空间数据库的基础上，2001年全国各省市测绘局开始1∶5万空间数据库的建库工作。在这个数据量达11TB的巨型数据库中，摄影测量与遥感将用来建设DOM（数字正射影像）、DEM（数字高程模型）、DLG（数字线划图）和CP（控制点数据库）。如果要建立全国1m分辨率影像数据库，其数据量将达到60TB。如果整个“数字地球”均达到1m分辨率，其数据量之大可想而知。本世纪内可望建成这一分辨率的数字地球。“数字文化遗产”是目前联合国和许多国家关心的一个问题，涉及到近景成像、计算机视觉和虚拟现实技术。在近景成像和近景三位量测方面，有室内各种三维激光扫描与成像仪器，还可以直接由视频摄像机的系列图像获取目标场三维重建信息。它们所获取的数据经过计算机自动处理后，可以在虚拟现实技术支持下形成文化遗迹的三维仿真，而且可以按照时间序列，将历史文化在时间隧道中再现，对文化遗产保护、复原与研究具有重要意义。1.6 全定量化遥感方法将走向实用从遥感科学的本质讲，通过对地球表层（包括岩石圈、水圈、大气圈和生物圈4大圈层）的遥感，其目的是为了获得有关地物目标的几何与物理特性，所以需要通过全定量化遥感方法进行反演。几何方程式是有显式表示的数学方程，而物理方程一直是隐式。目前的遥感解译与目标识别并没有通过物理方程反演，而是采用了基于灰度或加上一定知识的统计、结构和纹理的影像分析方法。但随着对成像机理、地物波谱反射特征、大气模型、气溶胶的研究深入和数据积累，多角度、多传感器、高光谱及雷达卫星遥感技术的成熟，相信在21世纪，估计几何与物理方程式的全定量化遥感方法将逐步由理论研究走向实用化，遥感基础理论研究将迈上新的台阶。只有实现了遥感定量化，才可能真正实现自动化和实时化。2 GIS技术的主要发展趋势2.1 空间数据库趋向图形、影像和DEM三库一体化和面向对象[2]GIS发展曾经历过栅格、矢量两个不同数据结构发展阶段，目前随着高分辨率卫星遥感数据的飞快增长和数字地球、数码城市的需求，形成了面向对象的数据模型和三库（图形矢量库、影像栅格库和DEM格网库）一体化的数据结构。这样的数据库结构使GIS的发展更加趋向自然化、逼真化，更加贴近用户。以面向应用的GIS软件为前台，以大型关系数据库（Oracle 8i,9i等)为后台数据库管理，成为当前GIS技术的主流趋势。2.2 空间数据表达趋向多比例尺、多尺度、动态多位和实时三维可视化在传统的GIS中，空间数据是以二维形式存储并挂接相应的属性数据。目前，空间数据表达的趋势是基于金字塔和LOD（level of detail）技术的多比例尺空间数据库，在不同尺度表示时可自动显示出相应比例尺或相应分辨率的数据，多比例尺数据集的跨度要比传统地图的比例尺大，在显示不同比例尺数据时，可采用LOD或地图综合技术。真三维GIS的空间数据要存储三维坐标。动态GIS在土地变更调查、土地覆盖变化监测中已有较好的应用，真四维的时空GIS将有望从理论研究转入实用阶段。基于三库一体化的时空3D可视化技术发展势头迅猛，已能再PC机上实现GIS环境下的三维建筑物室外室内漫游、信息查询、空间分析、剖面分析和阴影分析等，基于虚拟现实技术的真三维GIS将使人们在现实空间外，可以同时拥有一个Cyber空间。2.3 空间分析和辅助决策智能化需要利用数据挖掘方法从空间数据库和属性数据库中发现更多的有用知识GIS是以应用导向的空间信息技术，空间分析与辅助决策支持是GIS的高水平应用，它需要基于知识的智能系统。知识的获取是专家系统中最困难的任务。随着各种类型数据库的建立，从数据库中挖掘知识成为当今计算机界一个非常引人注目的课题。从GIS空间数据库中发现的知识可以有效的支持遥感图像解译，以解决“同物异谱”和“同谱异物”的问题。反过来，从属性数据库中挖掘的知识又具有优化资源配置等一些列空间分析的功能[3]。尽管数据挖掘和知识发现这一命题仍处于理论研究阶段，但随着数据库的快速增大和对数据挖掘工具的深入研究，其应用前景是不可估量的。2.4 通过Web服务器和WAP服务器的互联网和移动GIS将推进联邦数据库和互操作的研究及地学信息服务事业随着计算机通讯网络（包括有线和无线网）的大容量和高速化，GIS已成为在网络上的分布式异构系统。许多不同单位、不同组织维护管理的既独立又互联互用的联邦数据库，将可提供全社会各行各业的应用需要。因此，联邦数据库和互操作（federal databases & interoperability）问题成为当前国际GIS联合研究的一个热点。互操作意味着数据库中数据的直接共享，GIS规律功能模块的互操作与共享，以及多点之间的相同工作，这方面的研究已显示出明显的成效。未来的GIS用户将可能在网络上缴纳为其需要所选用数据和软件功能模块的使用费，而不必购买这个数据库和整套的GIS软硬件，这些成果产生的直接效果是GIS应用将走向地学信息服务。目前已兴起的LBS和MLS，即基于位置的服务和移动定位服务，突出地反映了这种变化趋势。它引起的革命性变化使GIS将走出研究院所和政府机关，成为全社会人人具备的信息服务工具。我国目前已有2亿个手机用户，若每人每月为MLS支付10元费用，全国一年的产值将达到240亿。可以预测在不久的将来，地学信息将能随时随地为任何人和任何事情进行4A服务（geo-in-formation for anyone and anything at anywhere and anytime）。2.5 地理信息科学的研究有望在本世纪形成较完整的理论框架体系笔者曾扼要地叙述了地球空间信息科学的7大理论问题[4]：（1）地球空间信息的基准，包括几何基准、物理基准和时间基准；（2）地球空间信息标准，包括空间数据采集、存储与交换标准、空间数据精度与质量标准、空间信息的分类与代码标准、空间信息的安全

自己进百度去查啊!!!!~~~~~~

森林资源调查中SPOT5遥感图像处理方法探讨王照利、黄生、张敏中、马胜利（国家林业局西北林业规划设计院，遥感计算中心，西安710048）本文发表于＜陕西林业科技＞2005 No.1 P.27-29,55 摘要：目前，多光谱、高空间分辨率的SPOT5卫星遥感数据被广泛应用到森林资源调查中。本文结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的处理和信息提取。探讨性地提出了适应于森林资源调查的SPOT5遥感数据处理方法。关键词：SPOT5 遥感数据，森林资源调查、数据处理DISCUSSION ON SPOT5 IMAGE DATA PROCESSING FOR FOREST INVENTORYWang Zhaoli, Huangsheng,Zhangminzhong,Ma Shengli(Northwest Institute for Forest Inventory, Planning &Design, Xi’an China 710048) Abstract: Now days, high spatial resolution and multispectral SPOT5 image data are widely applied in forest inventory in China. Based on the characteristics of SPOT5 image and requirements of forest inventory, this paper discusses the processing procedures of ordering image data, ortho-rectification, image bands composition and image data fusion. The complete steps of image processing for forest inventory are given.Key words: SPOT5 image data，forest inventory, data processing 前言卫星遥感影像具有空间宏观性、视角广、多分辨率（光谱和空间）、多时相、周期性、信息量丰富等特点，所以卫星遥感影像既可以提供森林资源的宏观空间分布信息又能提供局部的详细信息以及随时间、空间变化的信息等[1]。目前在林业领域卫星遥感数据被广泛的应用于不同尺度层次的森林资源调查、资源监测、病虫害、火灾监测等方面。2002年5月法国SPOT地球观测卫星系列之5号卫星（即SPOT5星）发射。SPOT5遥感数据的多光谱波段空间分辨率为10米（短波红外空间分辨率为20米），但全色波段空间分辨率达到2.5米。SPOT5遥感数据的高空间分辨率和多光谱分辨率为森林资源调查提供了丰富的、可靠的、高精度的基础数据源。从性价比分析，在其他高分辨率遥感数据目前比较昂贵的状况下，SPOT5遥感数据比较适宜应用于大面积的森林资源调查，可大幅度的森林调查的减少外业工作量、提高工作效率。在我国SPOT5卫星数据已被大量地应用于森林资源调查工作中，尤其，是在森林资源“二类”调查中被作基本的森林资源信息源提取各类信息。针对于将多光谱分辨率和高空间分辨率的SPOT5遥感数据应用于森林资源调查的数据处理技术和方法鲜有报道。本文总结工作实践，结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的订购、正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的基本处理方法。 1．SPOT5卫星遥感数据特点 SPOT卫星系统采用线性阵列传感器和推扫式扫描技术，具有旋转式平面镜可以进行倾斜观察获得倾斜图像和立体像对。采用与太阳同步的近极地的椭圆形轨道，轨道高度约832Km，轨道倾角98.7o ，每天绕地球14圈多，重复覆盖周期26天[2]。由于有倾斜观测功能，使重复覆盖周期减少到2-3天。SPOT5卫星载有2台高分辨率几何成像仪（HRG）、1台高分辨率立体成像装置（HRS）和1台宽视域植被探测仪（VGT）。高分辨率几何成像仪的波段选择是总结了多年的研究成果，认为HRG的波段设置（见表1）足以取得辨别作物和植被类型的最佳效果。本文主要探讨HRG高空间分辨率数据的处理。 2．SPOT5数据的处理方法和过程 SPOT5数据处理工作流程： 2.1 遥感数据的订购订购数据时，用户需向数据代理商提供购买区域的四个角的大地坐标或者数据的景号（PATH/ROW）。特别应该注意数据订购时间和用户拿到数据之间有时间差，间隔时间长短因用户的要求、天气、卫星重复覆盖周期而异。相对于其他卫星数据，比较有利的一面是SPOT5卫星装置有旋转式平面镜可以进行倾斜观察，用户可向代理商申请红色编程提前得到调查区域的遥感数据，但要支付编程费。对于遥感数据的时相、云量、入射角、阴影量、是否购买高空间分辨率的全色波段等用户根据自己具体的工作需要向代理商提出限制要求。根据我们对SPOT5遥感数据的使用，对于森林资源调查，北方9，10月份和11月初的遥感影像比较适宜。代理商向用户提供经过处理的不同级别的影像产品，在森林资源调查中建议购买SPOT1A级产品，用户可根据自己的工作需要进行处理，同时也可减少费用。 2.2 基础数据准备大比例尺地形图和高精度DEM是进行SPOT5遥感数据高精度正射校正必需的基础地理数据。建议购买1：10000地形图和1：25000数字高程模型（DEM）。将1：1万地形图扫描，扫描分辨率设置为300DPI。将扫描好的地形图进行几何精纠正，纠正精度控制在0.3毫米内。从测绘部门购买的1：1万地形图为北京54坐标系3度分带高斯克吕格投影，而1：2.5万DEM为北京54坐标系6度分带投影。在数据准备时，将校正好的1：1万地形图通过换带转换转成和DEM一致的6度分带投影。对于没有1：1万地形图的地区，建议使用差分GPS接收机采集地面控制点。 2.3几何正射校正正射校正过程应用了法国SPOT公司发行的GEOIMAGE软件。GEOIMAGE软件有针对SPOT5卫星数据开发的SPOT5物理模型。模型模块自动读取DEM信息。SPOT 物理模型可读取卫星在获取遥感数据的瞬间状态参数，这些参数存贮在数据的头文件中[3]。卫星状态参数包括：卫星成像瞬间的经纬度、高度、倾角等。卫星状态参数能够帮助提高几何校正的精度。以校正好的1：1万地形图为基准，在影像图上找出和地形图上地物相匹配的明显地物作为地面控制点。在进行正射校正时，应先进行全色波段数据校正，然后以校正好的全色波段数据为基准进行多光谱数据校正。以全色波段数据为基准校正多光谱波段就比较容易校正，且能提高两者的匹配精度。地面控制点应分布均匀，影像的边缘部分布要有控制点分布，同时在不同的高程范围最好都有控制点。地面控制点的数量因地形地貌的复杂程度而定，根据我们的经验，一景60KmX60Km的SPOT5数据，一般地势平缓的地区20个左右控制点即可达到满意的结果，在高山区25个左右控制点就可使正射校正精度满足要求。重采样方法采用双线性内插法。 2.4 辐射校正用户购买的SPOT5的各级数据，数据提供商已经根据卫星的记录参数对遥感数据做了辐射校正，即消除了传感器自身引起的、大气辐射引起的辐射噪声。若果影像存在薄雾或地形高差较大引起的辐射误差情况，用户应进一步进行辐射校正处理。薄雾的简单消除原理是基于近红外波段不受大气辐射影响，清澈的水体或死阴影区的数值应为零。从各波段数据中减去近红外波段的水体或阴影的不为零值。地形起伏引起的辐射误差校正公式: f (x,y)=g(x,y)/cosa，g(x,y)为坡度为a的倾斜面上的地物影像；f (x,y)为校正后的影像。由于坡度因子参与校正所以需要DEM支持。 2.5 波段组合根据SPOT5数据波谱特征（表1），各波段分别记录反映了植被的不同特征方面：B4（SWIR）短波红外反映植物和土壤的含水量，利于植被水分状况和长势分析；B3（NIR）近红外波段对植被类别、密度、生长力、病虫害等的变化敏感；B2（RED）红光波段对植被的覆盖度、植被的生长状况敏感；B1（VIS）可见光波段对植物的叶绿素和叶绿素浓度敏感。经过比较分析和实际应用发现SPOT5的B3、B4、B2波段组合对植被类型的识别要优于B3、B2和B1的组合。但由于B4波段的空间分辨率为20米，使B342组合对植被空间几何细节表达没有B321组合清晰，例如林缘界线信息表达方面B321要优于B342。 2.6 影像数据融合对于购买有高空间分辨率全色波段数据的用户，进行数据融合是必不可少的。影像数据融合能够综合不同波段、不同空间分辨率数据（层）的特征，融合后的数据具有更丰富、更可靠的信息[4]。根据影像数据融合的水平阶段，影像融合分为：像元级、特征级和决策级三个层次。为了最大限度的从SPOT5遥感数据中提取森林植被信息，应进行像元级的数据融合，将2.5米的全色波段和10米多光谱数据进行融合。融合得到的新数据既具有全色波段数据的高空间分辨率特征又具有多光谱特征。像元级数据融合的方法多种多样，根据数据融合的目的，即最大限度的突显森林植被信息，应选取B4、B3、B2和PAN波段，根据我们的试验Brovey 融合算法方法比较理想： 2.7遥感影像地图将融合好的数据按Rfused、Gfused、Bfused组合，叠加上行政界线、公里格网、坐标、比例尺等辅助信息，按1：1万地形图分幅生成1：1万纸质图作为外业手图。 3. 结果和讨论 3.1 几何精度利用SPOT5物理模型，采用1：1万地形图和2.5万DEM ，经过正射校正处理，可使影像的几何精度控制在2个像元内（<10米）,达到1：1万制图标准要求。为以遥感影像为基础信息源提取林分调查因子、区划林班界线生成大比例尺的林相图、森林分布图提供了几何精度保障。 3.2 波段选择对于没有全色波段的情况，SPOT5数据的B342组合有利于森林植被类型的识别。在应用遥感技术进行森林资源调查区划中，林分类型信息提取是最为重要的环节，所以B342波段组合是小班区划和外业手图的最佳组合。 3.3 融合效果融合数据技术使SPOT5遥感影像既具有全色波段的高空间分辨率又拥有多光谱数据的光谱分辨率，丰富了遥感影像的信息量。采用Brovey算法使SPOT5遥感影像从色彩、纹理等方面增强了影像的可判读性，提高了小班因子正判率和林分小班的区划精度。参考文献 1．周成虎，杨晓梅，骆剑承等.《遥感影像地学理解与分析》，科学出版社，北京，2001，3-4. 2．赵英时.《遥感应用分析原理与方法》，科学出版社，北京，2001.88-90 3．北京视宝卫星图像有限公司.《专业制图工作室GEOIMAGE用户指南》，2004，68-70. 4．Christine Pohl. Geometric Aspects of Multisensor Image Fusion for Topographic Map Updating in The Humid Tropics, ITC Publication, 1996,51-52.21世纪遥感与GIS的发展来源：李德仁时间： 2005-08-11-23:09 浏览次数: 79 21世纪遥感与GIS的发展李德仁（武汉大学测绘遥感信息工程国家重点实验室，武汉市珞瑜路129号，430079）摘要：在20世纪，人类的一大进步是实现了太空对地观测，即可以从空中和太空对人类赖以生存的地球通过非接触传感器的遥感进行观测，并将所得到的数据和信息存储在计算机网络上，为人类社会的可持续发展服务。在短短的30年中，遥感和GIS作为一个边缘交叉学科已发展成为一门科学、技术和经济实体。本文深入地论述了21世纪中遥感的6大发展趋势和GIS的5个发展特征。关键词：发展趋势；航空航天遥感；地理信息系统；对地观测中图法分类号：P208；P237.9 随着计算机技术、空间技术和信息技术的发展，人类实现了从空中和太空来观测和感知人类赖以生存的地球的理想，并能将所感知到的结果通过计算机网络在全球流通，为人类的生存、繁荣和可持续发展服务。在20世纪后半叶，遥感和地理信息系统作为一门新兴的科学和技术，迅速地成长起来。 1 遥感技术的主要发展趋势 1.1 航空航天遥感传感器数据获取技术趋向三多（多平台、多传感器、多角度）和三高（高空间分辨率、高光谱分辨率和高时相分辨率）从空中和太空观测地球获取影像是20世纪的重大成果之一，短短几十年，遥感数据获取手段迅猛发展。遥感平台有地球同步轨道卫星（35000km）、太阳同步卫星（600—1000km）、太空飞船（200—300km）、航天飞机（240—350km）、探空火箭（200—1000km），并且还有高、中、低空飞机、升空气球、无人飞机等；传感器有框幅式光学相机、缝隙、全景相机、光机扫描仪、光电扫描仪、CCD线阵、面阵扫描仪、微波散射计雷达测高仪、激光扫描仪和合成孔径雷达等，它们几乎覆盖了可透过大气窗口的所有电磁波段。三行CCD阵列可以同时得到3个角度的扫描成像，EOS Terra卫星上的MISR可同时从9个角度对地成像。卫星遥感的空间分辨率从Ikonos Ⅱ的1m，进一步提高到Quckbird（快鸟）的0.62m，高光谱分辨率已达到5—6nm，500—600个波段。在轨的美国EO-1高光谱遥感卫星，具有220个波段，EOS AM-1（Terra）和EOS PM-1（Aqua）卫星上的MODIS具有36个波段的中等分辨率成像光谱仪。时间分辨率的提高主要依赖于小卫星技术的发展，通过发射地球同步轨道卫星和合理分布的小卫星星座，以及传感器的大角度倾斜，可以以1—3d的周期获得感兴趣地区的遥感影像。由于具有全天候、全天时的特点，以及用INSAR和D-INSAR，特别是双天线INSAR进行高精度三位地形及其变化测定的可能性，SAR雷达卫星为全世界各国所普遍关注。例如，美国宇航局的长远计划是要发射一系列太阳同步和地球同步的长波SAR,美国国防部则要发射一系列短波SAR，实现干涉重访问间隔为8d、3d和1d，空间分辨率分别为20m、5m和2m。我国在机载和星载SAR传感器及其应用研究方面正在形成体系。“十五”期间，我国将全方位地推进遥感数据获取的手段，形成自主的高分辨率资源卫星、雷达卫星、测图卫星和对环境与灾害进行实时监测的小卫星群。 1.2 航空航天遥感对地定位趋向于不依赖地面控制确定影像目标的实地位置（三维坐标），解决影像目标在哪儿（Where）是摄影测量与遥感的主要任务之一。在已成功用于生产的全自动化GPS空中三角测量的基础上，利用DGPS和INS惯性导航系统的组合，可形成航空/航天影像传感器的位置与姿态的自动测量和稳定装置（POS），从而可实现定点摄影成像和无地面控制的高精度对地直接定位。在航空摄影条件下的精度可达到dm级，在卫星遥感的条件下，其精度可达到m级。该技术的推广应用，将改变目前摄影测量和遥感的作业流程，从而实现实时测图和实时数据库更新。若与高精度激光扫描仪集成，可实现实时三维测量（LIDAR），自动生成数字表面模型（DSM），并可推算出数字高程模型（DEM）。美国NASA在1994年和1997年两次将航天激光测高仪（SLA）安装在航天飞机上，企图建立基于SLA的全球控制点数据库，激光点大小为100m，间隔为750m，每秒10个脉冲；随后又提出了地学激光测高系统（GLAS）计划，已于2002年12月19日将该卫星IICESat（cloud and land elevation satellite）发射上天。该卫星装有激光测距系统、GPS接收机和恒星跟踪姿态测定系统。GLAS发射近红外光（1064nm）和可见绿光（532nm）的短脉冲（4ns）。激光脉冲频率为40次/s，激光点大小实地为70m，间隔为170m，其高程精度要明显高于SRTM，可望达到m级。他们的下一步计划是要在2015年之前使星载LIDAR的激光测高精度达到dm和cm级。法国利用设在全球的54个站点向卫星发射信号，通过测定多普勒频移，以精确解求卫星的空间坐标，具有极高的精度。测定距地球1300km的Topex/Poseidon卫星的高度，精度达到±3cm。用来测定SPOT 4卫星的轨道，3个坐标方向达到±5cm精度，对于SPOT 5和Envisat，可望达到±1m精度。若忽略SPOT 5传感器的角元素，直接进行无地面控制的正射像片制作，精度可达到±15m，完全可以满足国家安全和西部开发的需求。 1.3 摄影测量与遥感数据的计算机处理更趋向自动化和智能化从影像数据中自动提取地物目标，解决它的属性和语义（What）是摄影测量与遥感的另一大任务。在已取得影像匹配成果的基础上，影像目标的自动识别技术主要集中在影像融合技术，基于统计和基于结构的目标识别与分类，处理的对象既包括高分辨率影像，也更加注重高光谱影像。随着遥感数据量的增大，数据融合和信息融合技术逐渐成熟。压缩倍率高、速度快的影像数据压缩方法也已商业化。我国学者在这些方面取得了不少可喜的成果。 1.4 利用多时像影像数据自动发现地表覆盖的变化趋向实时化利用遥感影像自动进行变化监测（What change）关系到我国的经济建设和国防建设。过去人工方法投入大，周期长。随着各类空间数据库的建立和大量新的影像数据源的出现，实时自动化监测已成为研究的一个热点。自动变化监测研究包括利用新旧影像（DOM）的对比、新影像与旧数字地图（DLS）的对比来自动发现变化和更新数据库。目前的变化监测是先将新影像与旧影像（或数字地图）进行配准，然后再提取变化目标，这在精度、速度与自动化处理方面都有不足之处。笔者提出了把配准与变化监测同步的整体处理[1]。最理想的方法是将影像目标三维重建与变化监测一起进行，实现三维变化监测和自动更新。进一步的发展则是利用智能传感器，将数据处理在轨完成，发送回来的直接为信息，而不一定为影像数据。 1.5 摄影测量与遥感在构建“数字地球”、“数字中国”、“数字省市”和“数字文化遗产”中正在发挥愈来愈大的作用 “数字地球”概念是在全球信息化浪潮推进下形成的。1999年12月在北京成功地召开了第一届国际“数字地球”大会后，我国正积极推进“数字中国”和“数字省市”的建设，2001年国家测绘局完成了构建“数字中国”地理空间基础框架的总体战略研究。在已完成1∶100万和1∶25万全国空间数据库的基础上，2001年全国各省市测绘局开始1∶5万空间数据库的建库工作。在这个数据量达11TB的巨型数据库中，摄影测量与遥感将用来建设DOM（数字正射影像）、DEM（数字高程模型）、DLG（数字线划图）和CP（控制点数据库）。如果要建立全国1m分辨率影像数据库，其数据量将达到60TB。如果整个“数字地球”均达到1m分辨率，其数据量之大可想而知。本世纪内可望建成这一分辨率的数字地球。 “数字文化遗产”是目前联合国和许多国家关心的一个问题，涉及到近景成像、计算机视觉和虚拟现实技术。在近景成像和近景三位量测方面，有室内各种三维激光扫描与成像仪器，还可以直接由视频摄像机的系列图像获取目标场三维重建信息。它们所获取的数据经过计算机自动处理后，可以在虚拟现实技术支持下形成文化遗迹的三维仿真，而且可以按照时间序列，将历史文化在时间隧道中再现，对文化遗产保护、复原与研究具有重要意义。 1.6 全定量化遥感方法将走向实用从遥感科学的本质讲，通过对地球表层（包括岩石圈、水圈、大气圈和生物圈4大圈层）的遥感，其目的是为了获得有关地物目标的几何与物理特性，所以需要通过全定量化遥感方法进行反演。几何方程式是有显式表示的数学方程，而物理方程一直是隐式。目前的遥感解译与目标识别并没有通过物理方程反演，而是采用了基于灰度或加上一定知识的统计、结构和纹理的影像分析方法。但随着对成像机理、地物波谱反射特征、大气模型、气溶胶的研究深入和数据积累，多角度、多传感器、高光谱及雷达卫星遥感技术的成熟，相信在21世纪，估计几何与物理方程式的全定量化遥感方法将逐步由理论研究走向实用化，遥感基础理论研究将迈上新的台阶。只有实现了遥感定量化，才可能真正实现自动化和实时化。 2 GIS技术的主要发展趋势 2.1 空间数据库趋向图形、影像和DEM三库一体化和面向对象[2] GIS发展曾经历过栅格、矢量两个不同数据结构发展阶段，目前随着高分辨率卫星遥感数据的飞快增长和数字地球、数码城市的需求，形成了面向对象的数据模型和三库（图形矢量库、影像栅格库和DEM格网库）一体化的数据结构。这样的数据库结构使GIS的发展更加趋向自然化、逼真化，更加贴近用户。以面向应用的GIS软件为前台，以大型关系数据库（Oracle 8i,9i等)为后台数据库管理，成为当前GIS技术的主流趋势。 2.2 空间数据表达趋向多比例尺、多尺度、动态多位和实时三维可视化在传统的GIS中，空间数据是以二维形式存储并挂接相应的属性数据。目前，空间数据表达的趋势是基于金字塔和LOD（level of detail）技术的多比例尺空间数据库，在不同尺度表示时可自动显示出相应比例尺或相应分辨率的数据，多比例尺数据集的跨度要比传统地图的比例尺大，在显示不同比例尺数据时，可采用LOD或地图综合技术。真三维GIS的空间数据要存储三维坐标。动态GIS在土地变更调查、土地覆盖变化监测中已有较好的应用，真四维的时空GIS将有望从理论研究转入实用阶段。基于三库一体化的时空3D可视化技术发展势头迅猛，已能再PC机上实现GIS环境下的三维建筑物室外室内漫游、信息查询、空间分析、剖面分析和阴影分析等，基于虚拟现实技术的真三维GIS将使人们在现实空间外，可以同时拥有一个Cyber空间。 2.3 空间分析和辅助决策智能化需要利用数据挖掘方法从空间数据库和属性数据库中发现更多的有用知识 GIS是以应用导向的空间信息技术，空间分析与辅助决策支持是GIS的高水平应用，它需要基于知识的智能系统。知识的获取是专家系统中最困难的任务。随着各种类型数据库的建立，从数据库中挖掘知识成为当今计算机界一个非常引人注目的课题。从GIS空间数据库中发现的知识可以有效的支持遥感图像解译，以解决“同物异谱”和“同谱异物”的问题。反过来，从属性数据库中挖掘的知识又具有优化资源配置等一些列空间分析的功能[3]。尽管数据挖掘和知识发现这一命题仍处于理论研究阶段，但随着数据库的快速增大和对数据挖掘工具的深入研究，其应用前景是不可估量的。 2.4 通过Web服务器和WAP服务器的互联网和移动GIS将推进联邦数据库和互操作的研究及地学信息服务事业随着计算机通讯网络（包括有线和无线网）的大容量和高速化，GIS已成为在网络上的分布式异构系统。许多不同单位、不同组织维护管理的既独立又互联互用的联邦数据库，将可提供全社会各行各业的应用需要。因此，联邦数据库和互操作（federal databases & interoperability）问题成为当前国际GIS联合研究的一个热点。互操作意味着数据库中数据的直接共享，GIS规律功能模块的互操作与共享，以及多点之间的相同工作，这方面的研究已显示出明显的成效。未来的GIS用户将可能在网络上缴纳为其需要所选用数据和软件功能模块的使用费，而不必购买这个数据库和整套的GIS软硬件，这些成果产生的直接效果是GIS应用将走向地学信息服务。目前已兴起的LBS和MLS，即基于位置的服务和移动定位服务，突出地反映了这种变化趋势。它引起的革命性变化使GIS将走出研究院所和政府机关，成为全社会人人具备的信息服务工具。我国目前已有2亿个手机用户，若每人每月为MLS支付10元费用，全国一年的产值将达到240亿。可以预测在不久的将来，地学信息将能随时随地为任何人和任何事情进行4A服务（geo-in-formation for anyone and anything at anywhere and anytime）。 2.5 地理信息科学的研究有望在本世纪形成较完整的理论框架体系笔者曾扼要地叙述了地球空间信息科学的7大理论问题[4]：（1）地球空间信息的基准，包括几何基准、物理基准和时间基准；（2）地球空间信息标准，包括空间数据采集、存储与交换标准、空间数据精度与质量标准、空间信息的分类与代码标准、空间信息的安全

随心所欲的写咯

索引序列
基于图像识别的运动目标检测论文
图像检测识别方法研究论文
图像中的目标检测论文
图像目标检测综述论文
遥感图像目标检测论文
返回顶部

基于图像识别的运动目标检测论文