• 回答数

    3

  • 浏览数

    117

Mr.白马王爷
首页 > 期刊论文 > ros论文检测

3个回答 默认排序
  • 默认排序
  • 按时间排序

草泥马叔叔

已采纳

论文: Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

目标检测网络大多依靠 区域生成 (region proposal)算法来假设目标的位置。 R-CNN 是采用 Selective Search 算法来提取(propose)可能的 RoIs(regions of interest) 区域,然后对每个提取区域采用标准 CNN 进行分类。选择性搜索(Selective Search )方法就是在目标对象周围设定2000个形状大小位置不一的候选区域,目标物体在候选区域的可能性还是比较大的。然后对这些区域卷积,找到目标物体,虽然大多数区域都是无用的。与寻找几乎个区域比起来,这种方法要高效的多。

Fast R-CNN ,不在原始图像生成备选区域,而是先整张图片通过卷积网络得到特征图,然后在特征图上使用备选区域算法得到感兴趣的区域在特征图的映射,之后使用 Rol Pool将所有区域变成同样尺寸,大大减少了这些目标检测网络的运行时间,但是区域生成的计算成为整个检测网络的瓶颈。

Faster R-CNN 引入了一个 区域生成网络(Region Proposal Network,RPN) ,该网络与检测网络共享输入图像的卷积特征,从而使接近零时间成本的区域生成成为可能。 RPN是一个全卷积网络,可以同时在每个位置预测目标边界和目标分数。RPN经过端到端的训练,可以生成高质量的区域候选框,然后提供给Fast R-CNN用于检测。

Faster R-CNN 由两个模块组成:第一个模块是区域生成的深度全卷积网络,第二个模块是使用备选区域的Fast R-CNN检测器。整个系统是一个单个的,统一的目标检测网络。使用最近流行的“注意力”机制的神经网络术语,RPN模块告诉Fast R-CNN模块在哪里寻找目标。

针对一张图片,需要获得的输出有:

Faster R-CNN 第一步是采用基于分类任务(如ImageNet)的 CNN 模型作为特征提取器。输入图片表示为 H × W × D 的形式,经过预训练 CNN 模型的处理,得到卷积特征图(conv feature map)。

Faster R-CNN 最早是采用在 ImageNet 训练的 ZF 和 VGG ,其后出现了很多其它权重不同的网络.。如 MobileNet 是一种小型效率高的网络结构,仅有 参数;而ResNet-152 的参数量达到了 60M;新网络结构,如 DenseNet 在提高了结果的同时,降低了参数数量。

以 VGG16 为例:

VGG16 图片分类时,输入为 224×224×3 的张量(即,一张 224×224 像素的 RGB 图片)。网络结构最后采用 FC 层(而不是 Conv 层)得到固定长度的向量,以进行图片分类.。对最后一个卷积层的输出拉伸为1维的向量,然后送入 FC 层。官方实现中是采用的卷积层 conv5/conv5_1 的输出。

在深度上,卷积特征图对图片的所有信息进行了编码,同时保持相对于原始图片所编码 “things” 的位置。例如,如果在图片的左上角存在一个红色正方形,而且卷积层有激活响应,那么该红色正方形的信息被卷积层编码后,仍在卷积特征图的左上角。因此利用特征图检测目标所在的位置是可行的。

ResNet 结构逐渐取代 VGG 作为基础网络,用于提取特征。ResNet 相对于 VGG 的明显优势是,网络更大,因此具有更强的学习能力.。这对于分类任务是重要的,在目标检测中也应该如此。另外,ResNet 采用残差连接(residual connection) 和 BN (batch normalization) 使得深度模型的训练比较容易。

然后,RPN(Region Propose Network) 对提取的卷积特征图进行处理,寻找可能包含 目标的 预定义数量的区域(regions,边界框) 。为了生成候选区域,在最后的共享卷积层输出的卷积特征图上做 3x3 卷积,卷积核共有512个(VGG),后面是ReLU,这样每个 3x3 区域会得到一个512维的特征向量。然后这个特征向量被输入到两个全连接层——一个边界框回归层(reg)和一个边界框分类层(cls)。

下面解释 k, 2k, 4k 的含义。

基于深度学习的目标检测中,可能最难的问题就是生成长度不定(variable-length)的边界框列表(bounding-boxes),边界框是具有不同尺寸(sizes)和长宽比(aspect ratios )的矩形。在构建深度神经网络时,最后的网络输出一般是固定尺寸的张量输出(采用RNN的除外)。例如,在图片分类中,网络输出是 (C, ) 的张量,C是类别标签数,张量的每个位置的标量值表示图片是类别的概率值。

在 RPN 中,通过采用 anchors(锚) 来解决边界框列表长度不定的问题,即在原始图像中统一放置固定大小的参考边界框。上面说到RPN对特征图做3x3的卷积,假设每一次卷积需要预测 k 个候选区域,因此,reg层具有 4k 个输出,编码 k 个边界框的坐标,cls层输出 2k 个分数,估计每个区域是目标或是背景的概率。这 k 个区域就是 被 k 个参考边界框初始化, k 个参考框就是 k 个锚点,作为第一次预测目标位置的参考 boxes。锚点的中心位于卷积核滑动窗口的中心。默认情况下每个滑动位置使用3个不同尺度(128 2 , 256 2 , 512 2 )3个不同长宽比(1:2, 1:1, 2:1)的锚点,k=9。对于大小为W×H(通常约为2400)的卷积特征图,总共有 W×H×k 个锚点。对于RPN的最后两个全连接层,参数的个数为 512×(4+2)×k.

不同于直接检测目标的位置,这里将问题转化为两部分。对每一个 anchor 而言:

有一种简单的方法来预测目标的边界框,即学习相对于参考边界框的偏移量。假设参考 box:( ),待预测量:( ),一般都是很小的值,以调整参考 box 更好的拟合所需要的。

虽然 anchors 是基于卷积特征图定义的,但最终的 anchos 是相对于原始图片的.

由于只有卷积层和 pooling 层,特征图的维度是与原始图片的尺寸成比例关系的. 即,数学地表述,如果图片尺寸 w×h,特征图的尺寸则是w/r×h/r. 其中,r 是下采样率(subsampling ratio). 如果在卷积特征图空间位置定义 anchor,则最终的图片会是由 r 像素划分的 anchors 集。在 VGG 中, r=16。

RPN 利用所有的参考边界框(anchors),输出一系列目标的良好的 proposals。针对每个 anchor,都有两个不同的输出:

RPN是全卷积网络。

对于分类层,每个 anchor 输出两个预测值:anchor 是背景(background,非object)的 score 和 anchor 是前景(foreground,object) 的 score.

对于回归层,也可以叫边界框调整层,每个 anchor 输出 4 个预测值: (Δxcenter,Δycenter,Δwidth,Δheight),用于 anchors 来得到最终的 proposals。根据最终的 proposal 坐标和其对应的 objectness score,即可得到良好的 objects proposals.

RPN 有两种类型的预测值输出:二值分类和边界框回归调整。

为了训练RPN,我们为每个锚点分配一个二值类别标签(是目标或不是目标)。我们给两种锚点分配一个正标签:(i)具有与实际边界框的重叠最高交并比(IoU)的锚点,或者(ii)具有与实际边界框的重叠超过 IoU的锚点。注意,单个真实边界框可以为多个锚点分配正标签。通常第二个条件足以确定正样本;但我们仍然采用第一个条件,因为在一些极少数情况下,第二个条件可能找不到正样本。对于所有的真实边界框,如果一个锚点的IoU比率低于,我们给非正面的锚点分配一个负标签。既不正面也不负面的锚点不会有助于训练目标函数。

然后,随机采样 anchors 来生成batchsize=256 的 mini-batch,尽可能的保持 foreground 和 background anchors 的比例平衡。

RPN 对 mini-batch 内的所有 anchors 采用二分类交叉熵来计算分类 loss。然后,只对 mini-batch 内标记为 foreground 的 anchros 计算回归 loss。为了计算回归的目标targets,根据 foreground anchor 和其最接近的 groundtruth object,计算将 anchor 变换到 object groundtruth 的偏移值 Δ。

Faster R-CNN没有采用简单的 L1 或 L2 loss 用于回归误差,而是采用 Smooth L1 loss. Smooth L1 和 L1 基本相同,但是,当 L1 误差值非常小时,表示为一个确定值即认为是接近正确的,loss 就会以更快的速度消失.

由于 Anchors 一般是有重叠,因此,相同目标的候选区域也存在重叠。

为了解决重叠 proposals 问题,采用 NMS 算法处理,丢弃与一个 score 更高的 proposal 间 IoU 大于预设阈值的 proposals.

虽然 NMS 看起来比较简单,但 IoU 阈值的预设需要谨慎处理. 如果 IoU 值太小,可能丢失 objetcs 的一些 proposals;如果 IoU 值过大,可能会导致 objects 出现很多 proposals。IoU 典型值为 。

NMS 处理后,根据 sore 对topN 个 proposals 排序. 在 Faster R-CNN 论文中 N=2000,其值也可以小一点,如 50,仍然能的高好的结果.

当获得了可能的相关目标和其在原始图像中的对应位置之后,问题就更加直接了,采用 CNN 提取的特征和包含相关目标的边界框,采用 RoI Pooling 处理,并提取相关目标的特征,得到一个新的向量。

RPN 处理后,可以得到一堆没有分类得分的目标 proposals。待处理问题为,如何利用这些边界框并分类。

一种最简单的方法是,对每个 porposal,裁剪,并送入pre-trained base 网络,提取特征;然后,将提取特征来训练分类器. 但这就需要对所有的 2000 个 proposals 进行计算,效率低,速度慢。Faster R-CNN通过重用卷积特征图来加快计算效率,即采用 RoI(region of interest) Pooling 对每个 proposal 提取固定尺寸的特征图。然后 R-CNN 对固定尺寸的特征图分类。

目标检测中,包括 Faster R-CNN,常用一种更简单的方法,即:采用每个 proposal 来对卷积特征图裁剪crop,然后利用插值算法(一般为双线性插值 bilinear)将每个 crop resize 到固定尺寸14×14×ConvDepth. 裁剪后,利用 2×2 kernel 的 Max Pooling 得到每个 proposal 的最终7×7×ConvDepth 特征图.

之所以选择该精确形状,与其在下面的模块(R-CNN)中的应用有关。

R-CNN利用RoI Pooling提取的特征进行分类,采用全连接层来输出每个可能的 目标类别的分类得分,是Faster R-CNN框架中的最后一个步骤。

R-CNN 有两个不同的输出:

R-CNN 对每个 proposal 的特征图,拉平后采用 ReLU 和两个大小为 4096 维的全连接层进行处理。然后,对每个不同目标采用两个不同的全连接层处理:一个全连接层有 N+1 个神经单元,其中 N 是类别 class 的总数,包括 background class;一个全连接层有 4N 个神经单元,是回归预测输出,得到 N 个可能的类别分别预测 Δcenterx,Δcentery,Δwidth,Δheight。

R-CNN 的目标基本上是与 RPN 目标的计算是一致的,但需要考虑不同的可能的 object 类别 classes.

根据 proposals 和 ground-truth boxes,计算其 IoU。与任何一个 ground-truth box 的 IoU 大于 的 proposals 被设为正确的 boxes。IoU 在 到 之间时设为 background。这里忽略没有任何交叉的 proposals。这是因为,在此阶段,假设已经获得良好的 proposals。当然,所有的这些超参数都是可以用于调整以更好的拟合 objects。

边界框回归的目标计算的是 proposal 与其对应的 ground-truth间的偏移量,只对基于 IoU 阈值设定类别后的 proposals 进行计算。随机采用一个平衡化的 mini-batch=64,其中,25% 的 foreground proposals(具有类别class) 和 75% 的background proposals.

类似于 RPNs 的 losses,对于选定的 proposals,分类 loss 采用 multiclass entropy loss;对于 25% 的 foreground proposals 采用 SmoothL1 loss 计算其与 groundtruth box 的匹配。

由于 R-CNN全连接网络对每个类别仅输出一个预测值,当计算边框回归loss 时需谨慎,只需考虑正确的类别。

类似于 RPN,R-CNN 最终输出一堆带有类别分类的objects,在返回结果前,再进一步进行处理。

为了调整边界框,需要考虑概率最大的类别的 proposals. 忽略概率最大值为 background class 的proposals.

当得到最终的 objects 时,并忽略被预测为 background 的结果,采用 class-based NMS. 主要是通过对 objects 根据类别class 分组,然后根据概率排序,并对每个独立的分组采用 NMS 处理,最后再放在一起.

最终得到的 objects 列表,仍可继续通过设定概率阈值的方式,来限制每个类的 objects 数量.

Faster R-CNN在论文中是采用分步方法,对每个模块分别训练再合并训练的权重. 自此,End-to-end 的联合训练被发现能够得到更好的结果.

当将完整的模型合并后,得到 4 个不同的 losses,2 个用于 RPN,2 个用于 R-CNN。4 种不同的 losses 以加权和的形式组织. 可以根据需要对分类 loss 和回归 loss 设置权重,或者对 R-CNN 和 RPNs 设置不同权重.

采用 SGD 训练,momentum=. 学习率初始值为 ,50K 次迭代后衰减为 . 这是一组常用参数设置。

257 评论

慧慧在济南

是因为格式不对 不要用word格式 转换成txt格式就好了

298 评论

d1329256550

“不管你测或不测,微塑料颗粒一直就在那里,只增不减。”似乎无计可施。而且在人体内低剂量的微塑料仍然在安全范围内,因此脱离剂量无法谈毒性,微塑料对人类的健康影响仍在研究中,很多体外实验已经证明微塑料对细胞的损伤。2004年,《科学》杂志上发表关于海洋塑料碎片论文,提出了“微塑料”的概念。2017年,在伯利兹海岸附近的特内菲环礁,四分之三的水下海草上附着着微塑料纤维、碎片和珠子。首次在水生维管束植物上发现微塑料,是世界上第二次在海洋植物上发现微塑料。2018年在人类粪便中发现了塑料颗粒,每10g粪便中含有约20颗微塑料颗粒。2019年,欧洲首次在两栖动物欧洲蝾螈(Triturus carnifex)的胃内容物中发现微塑料。证明高海拔环境中出现塑料问题。2020年,亚利桑那州立大学研究了来自人体肺、肝、肾等器官的47个人体组织样本,在所有47个相关组织样本中发现了微塑料。2021年在人类胎盘中发现了微塑料颗粒,同年发现摄入微塑料颗粒的怀孕老鼠胎儿的肝、肺、心脏、肾中检测出微塑料颗粒。2022年在人类血液中检测到微塑料颗粒,这意味着微塑料可以随着血液进入人体循环。那么微塑料很有可能通过血脑屏障进入大脑,造成脑损伤。微塑料的来源微塑料是指直径μm–5 mm直径的塑料颗粒(MP),纳米塑料是指直径<μm的塑料颗粒(NP)。微塑料/纳米塑料的来源分为两种;一种是人类产生的塑料垃圾(每年约有800万吨塑料垃圾进入海洋,万吨塑料漂浮在海洋表面)通过微生物降解、长时间的紫外线照射或物理磨损,塑料会碎裂成微塑料或纳米塑料。另一种是MP/NP是空气喷射技术、清洁剂、化妆品、药物输送配方、涂料和牙膏的生产原料。塑料微珠在个人护理及化妆品产品中常常作为填充剂、成膜剂、增稠剂及悬浮剂等应用于磨砂膏、洁面乳、沐浴露、牙膏、防晒霜、眼影、腮红、粉底液等产品中,添加量约为1%-90%。生产材料包括粒聚氯乙烯、聚苯乙烯、聚丙烯、聚酰胺、聚氯乙烯等。2021年9月1日,针对日化用品中塑料微粒检测的国家标准GB/T 40146-2021《化妆品中塑料微珠的测定》正式实施,《化妆品中塑料微珠的测定》采用傅里叶变换红外光谱法对产品中的塑料为主进行定性检测。塑料微珠检测标准的实施为实现2022年底禁止销售含塑料微珠的日化产品的目标提供了有力保障。人类摄入微塑料的来源人类摄入微塑料的来源主要是通过食物、水、空气以及医疗系统。微塑料已经在地球的各个地方都有发现,包括喜马拉雅山以及马里亚纳海沟都发现了微塑料。微塑料进入生态循环后,已经与陆地和水生生物群相互作用,并通过食物链中的营养转移传递给各级生物和人类。比如海鲜、海盐、蜂蜜等;所有的海鲜中,贻贝、牡蛎以及扇贝受微塑料污染程度最高。有研究表明,每一克软体动物含有个微塑料微粒,每一克甲壳类动物含有个微塑料微粒,每一克鱼类则含有个微塑料微粒。此外,瓶装水、自来水、被塑料粉尘污染的空气也是人类摄入微塑料;最后医疗设备(比如塑料盐水袋)的使用以及口服药物或塑料注射器的使用都会使人体直接摄入微型塑料。人体接触微塑料的途径人类接触MP/NP的途径主要有口服、吸入、皮肤或其他途径。口服:经口摄入后,微塑料颗粒首先接触肠道粘膜,然后是上皮细胞,大部分的颗粒会被肠粘膜屏障阻止吸收,然而少量,微/纳米颗粒可以穿过肠道屏障,到达体循环;吸入:空气中的MP/NP会直接接触呼吸道,包括粘液层、纤毛周层、纤毛细胞、非纤毛分泌细胞和基底细胞。塑料颗粒可穿透肺组织,在慢性吸入时引起肺部炎症和继发性遗传毒性;纺织工人的肺部发现含有异物(假定为聚酯、尼龙和/或丙烯酸粉尘)的肉芽肿性病变(Pimentel等人,1975年)。皮肤:皮肤的角质层可以阻止小于1纳米的分子透过皮肤,但MP/NP可以通过塑料静脉导管、注射器和其他药物输送系统进入体循环。之所以使用微塑料颗粒用于医药是因为它们被认为是“惰性和生物相容性的”。微塑料产生毒性的可能原因大小和剂量。较小的颗粒可以通过内吞或被动吸收过程吸收,但较大的颗粒通常需要特殊细胞的吞噬作用。通常,颗粒大小和毒性之间存在反比关系。人们认为<10 nm的颗粒可以作为气体材料,很容易进入组织,造成广泛损伤。尺寸减小可促进通过肠道或肺部对微塑料颗粒的吸收,影响细胞。其次,微塑料如果不能顺利代谢掉或排除,在体内积累的量达到一定程度会产生细胞毒性。电荷。微塑料颗粒表面所带的电荷会影响颗粒的吸收和体内转运已经毒性。带阳离子的塑料颗粒比带阴离子的对吞噬细胞表现为更大的毒性。塑料添加剂。塑料添加剂/沥滤液平均占微塑料含量的4%,包括稳定剂、增塑剂、润滑剂、染料和阻燃剂,可能存在毒性问题。比如塑料添加剂种的双酚A、邻苯二甲酸盐和溴化阻燃剂,它们会扰乱内分泌功能。商用PET水瓶在60°C以上的温度下将Sb滤入水中;如果在夏季将瓶子放在汽车和车库内,可以达到的以上温度。颗粒制备过程中使用的表面活性剂可以分解细胞膜或调节细胞表面受体、糖蛋白、蛋白聚糖、信号部分、细胞外基质成分和脂筏的结构和功能。(当然不谈剂量谈毒性就是耍流氓)吸附的污染物。微塑料可以会吸附有机物、重金属或病原体,比如塑料可以是持久性有机污染物(多氯联苯、多环芳烃、滴滴涕)的载体,重金属(Cd、Cr、Cu、Zn、Sb、Al、Br、Hg、As、Sn、Ti、Co、Ba、Mn)或微生物,如致病性弧菌。微塑料的毒性机制在近10年对微塑料的研究中,微塑料对肠道细胞、肺细胞、免疫细胞都有毒性。MP/NP的毒性被认为是由i)膜损伤、ii)氧化应激、iii)免疫反应和iv)遗传毒性引起的。其中,MP/NP的细胞毒性主要归因于膜损伤和氧化应激。微塑料颗粒会破坏质膜。2020年发现聚乙烯纳米颗粒渗透到质膜双层的疏水环境中,并引起结构变化。被内吞的颗粒可以渗透内体溶酶体膜,并与细胞内的细胞器相互作用。在塑料聚合和颗粒加工过程中,以及与生物环境相互作用时,会产生ROS,从而导致细胞应激。参考文献:综述:Banerjee, Amrita; Shelver, Weilin L. (2020).Micro- and Nanoplastic induced cellular toxicity in mammals: A Review. Science of The Total Environment, (), 142518–

306 评论

相关问答

  • 免费论文检测查重检测

    可以免费论文查重的系统,下面给你分享一些:1,蝌蚪论文查重(免费)专业版每天免费查重一次,非常适合初稿检测,不花钱。3,论文狗(免费)专业版每天免费查重一次,适

    Melinda麒儿 7人参与回答 2023-12-05
  • 用论文检测软件检测

    1、paperfree免费查重。千字1.5元,通过活动领取免费查重字数。优点:通过海量数据库对提交论文进行对比分析,准确地查到论文中的潜在抄袭和不当引用,拥有实

    cll19880211 6人参与回答 2023-12-10
  • 土壤检测检测论文

    浅谈垃圾填埋场的土地整理和利用论文 1某地垃圾填埋场现状 该垃圾填埋场地处沿海某地城郊,原为荒滩林地,现因当地经济快速发展,已经开发成工业开发区,填埋场距离市区

    我爱娟子 3人参与回答 2023-12-09
  • ros论文范文

    网址: ROS (机器人操作系统,Robot Operating System),是专为机器人软件开发所设计出来的一套电脑[操作系统]架构。它是一个开源的元级

    五爷威武 3人参与回答 2023-12-07
  • ros论文查重

    网址: ROS (机器人操作系统,Robot Operating System),是专为机器人软件开发所设计出来的一套电脑[操作系统]架构。它是一个开源的元级

    颂美装饰 2人参与回答 2023-12-07