img

官方微信

遥感技术与应用, 2019, 34(4): 727-735 doi: 10.11873/j.issn.1004-0323.2019.4.0727

CNN 专栏

基于深度卷积神经网络的油罐目标检测研究

王颖洁,, 张荞,, 张艳梅, 蒙印, 郭文

国家测绘地理信息局第三航测遥感院,四川 成都 610100

Oil Tank Detection from Remote Sensing Images based on Deep Convolutional Neural Network

Wang Yingjie,, Zhang Qiao,, Zhang Yanmei, Meng Yin, Guo Wen

The Third Remote Sensing Geomatics Institute of National Administration of Surveying, Mapping and Geoinformation, Chengdu 610100, China

通讯作者: 张荞(1985-),男,四川平昌人,博士,高级工程师,主要从事遥感大数据应用研究。E⁃mail: scrs_qiaozh@163.com

收稿日期: 2018-08-03   修回日期: 2019-06-02   网络出版日期: 2019-09-19

基金资助: 四川省遥感大数据应用工程技术研究中心开放基金课题.  2018KFJJ01
自然资源部基础测绘科技项目.  2018KJ0304
成都市科技项目.  2015-CX00-00011-ZF

Received: 2018-08-03   Revised: 2019-06-02   Online: 2019-09-19

作者简介 About authors

王颖洁(1990-),女,重庆人,硕士,助理工程师,主要从事遥感数据处理应用研究E⁃mail:641055472@qq.com , E-mail:641055472@qq.com

摘要

油罐是用于储存油品的工业设施,常用在炼油厂等工业园中,通过卫星或航空遥感图像实现油罐目标的快速检测,可以实现对侵占生态保护红线的疑似工业园区的快速查找,为自然资源监管和生态环境保护提供科学技术支持。探讨了基于深度卷积神经网络在高分辨率遥感影像目标检测中的有效性,基于深度学习目标检测算法中具有代表性的Faster R-CNN(Convolutional Neural Network)和R-FCN(Region-based Fully Convolutional Network)框架,通过对ZF、VGG16、ResNet-50 3种网络模型进行训练和测试,实现了遥感影像上油罐目标的快速检测;通过修改锚点尺度和数量,丰富了候选框类型和数量,提升了油罐的目标检测精度,最优召回率接近80%。研究表明:深度卷积神经网络能够实现对高分辨率遥感影像中油罐目标的快速检测,为深度学习技术在遥感小目标的快速检测提供了实例和新的思路。

关键词: 深度学习 ; 卷积神经网络 ; 遥感目标检测 ; 油罐

Abstract

Oil tanks are industrial facilities for storing oil products, which are commonly used in industrial parks such as oil refineries. The rapid detection of oil tank target through satellite or aerial remote sensing images can quickly find suspected industrial parks, providing scientific and technical support for natural resource regulation and ecological environment protection. This paper discussed the possibility of object detection with high-resolution remote sensing images based on deep convolutional neural network. The state-of-the-art algorithms of Faster R-CNN (Convolutional Neural Network) and R-FCN (Region-based Fully Convolutional Network) and three network models were applied for oil tank detection from high-resolution remote sensing images. To promote the detection accuracy and execution efficiency for the oil tank target, an improved approach by increasing the scales of the anchor was proposed. The optimum recall reached about 80%. The results confirm that deep learning network approach can rapid detect oil tank from high-resolution remote sensing image. This provide an example and new idea for rapid detection small target from remote sensing image by deep learning technology.

Keywords: Deep learning ; Convolutional neural network(CNN) ; Remote sensing object detection ; Oil tank

PDF (16251KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王颖洁, 张荞, 张艳梅, 蒙印, 郭文. 基于深度卷积神经网络的油罐目标检测研究. 遥感技术与应用[J], 2019, 34(4): 727-735 doi:10.11873/j.issn.1004-0323.2019.4.0727

Wang Yingjie, Zhang Qiao, Zhang Yanmei, Meng Yin, Guo Wen. Oil Tank Detection from Remote Sensing Images based on Deep Convolutional Neural Network. Remote Sensing Technology and Application[J], 2019, 34(4): 727-735 doi:10.11873/j.issn.1004-0323.2019.4.0727

1 引 言

油罐是用于储存油品且具有较规则形体的大型容器,常用在炼油厂等工业园区中。针对生态保护红线的监测,通过卫星或航空遥感图像实现油罐目标的快速检测,可以进一步实现侵占生态保护红线的疑似工业园区的快速查找,进而有的放矢地排查这些工业园区是否对重点生态功能区造成影响,为自然资源监管和生态环境保护提供科学技术支持。在油罐目标的遥感监测中,由于光照、传感器成像质量及油罐材料、结构、位置等因素的影响,部分油罐目标特征不明显,采用手工设计特征的方法提取油罐目标[1,2,3],往往存在适用范围有限、泛化能力较弱的问题。

近10年,随着机器视觉领域的快速发展,涌现出大量基于机器视觉的目标自动检测算法,已在自然图像领域取得较好的应用效果,其中由Felzenszwalb提出的DPM(Defomable Parts Model)算法,连续获得VOC(Visual Object Class)大赛2007~2009年度的检测冠军。随着卷积神经网络被成功应用到场景目标分类,深度学习技术在目标检测方面也取得了不错的效果,与传统依赖先验知识的特征提取算法不同,基于深度学习的目标检测对几何变换、形变、光照具有一定程度的不变性,并且可在训练数据驱动下自适应地构建特征描述,具有更高的灵敏性和泛化能力[4]。“深度学习”概念于2006年由加拿大的Hinton教授提出[5],2012年,Hinton教授和他的学生Alex等[6]将深度卷积神经网络应用于在ImageNet挑战赛上,Top-5错误率比上一年的冠军下降了10个百分点,而且远远超过当年的第二名,引起了学术界和工业界的广泛关注。目前深度学习在机器视觉领域应用越来越广泛,网络层数呈现越来越多的趋势。微软亚洲研究院团队提出的深达152层的深度残差网络ResNet[7]在ILSVRC2015 (ImageNet Large scale Visual Recognition Competition 2015)年的计算机视觉挑战赛中获得图像检测、图像分类和图像定位3个项目的冠军,图像分类的错误率为3.57%,甚至超过了人类的识别精度。相对于传统的目标检测算法,基于深度学习的目标检测算法流程更精简、精度更高。常见的基于深度学习目标检测算法包括两类,一类是基于候选区域(Region Proposal)的深度学习目标检测算法,如R-CNN[8]、Fast R-CNN、Faster R-CNN[9]等,另一类是基于回归方法的深度学习目标检测算法,如YOLO[10]、SSD[11]

在遥感图像的目标检测方面,由于遥感图像不同于相机拍摄的自然图像,遥感图像易受噪声、拍摄角度、时间和气候等诸多因素的影响,并且目标尺寸较小。目前,基于候选区域的深度学习目标检测算法在遥感领域应用较广泛,戴陈卡等[12]基于Faster R-CNN以及多部件结合对机场场面静态飞机进行目标检测,对不同姿态、不同场景下的飞机目标检测准确率达到90%以上。王万国等[13]基于候选区域的深度学习目标检测算法结合无人机巡检图像对电力小部件进行识别,达到每张近80 ms的识别速度和92.7%的准确率。胡炎等[14]基于深度卷积神经网络结合SAR影像对海上舰船目标进行检测,并对4种不同海洋杂波环境的宽幅SAR图像进行测试,均得到了较好的检测结果。

基于候选区域的深度学习目标检测算法是目前较为主流的目标检测算法,因此本文采用基于候选区域的深度学习目标检测方法,综合对比了Faster R-CNN和R-FCN两种效果较好的算法,对遥感影像上的油罐目标进行了检测,并提出了通过增加锚点尺度的方法来提高油罐检测精度,以便为深度学习技术在工业区监测及自然资源监管等方面提供了技术参考。

2 基于候选区域的深度学习目标检测算法

基于深度学习的目标检测方法,是在深度卷积神经网络的基础上,增加目标位置判断的网络,在输出目标类别的同时,输出目标空间位置和尺寸,由于油罐目标在遥感影像中的尺寸较小,本文采用基于候选区域的深度学习目标检测算法来对油罐目标进行检测,其中Faster R-CNN和R-FCN是检测效果较好的两种模型。

2.1 Faster R-CNN目标检测原理

2014年由微软研究院的Ross B Girshick提出,采用基于建议区域(Region Proposal RP)和卷积神经网络(CNN)代替传统的滑动窗口和手工设计特征,形成了R-CNN框架,经过几年的发展建立的Faster R-CNN[9],在速度和精度方面又有了一定提升。

Faster R-CNN网络结构包含3部分:特征提取网络、区域候选网络和分类回归网络,前两部分都是卷积神经网络,而且在训练和测试的过程中都有卷积共享,从而提高了效率。

在具体实现中,Faster R-CNN首先利用特征提取网络对待检测图像进行特征提取,生成特征图,接着利用区域建议网络(RPN)对特征图进行处理并输出多种尺度和宽高比的目标候选区域,最后将特征提取网络输出的特征图和区域候选网络生成的候选区域作为输入,利用分类回归网络输出各候选区域的置信度和修正参数[15]。Faster R-CNN的网络结构如图1所示。

图1

图1   Faster R-CNN算法网络结构

Fig.1   The network structure of the Faster R-CNN framework


2.1.1 特征提取网络

在Faster R-CNN算法网络中,训练样本的数量是影响网络性能的决定因素,充分训练一般要求上百万数量级的图片。因此在深度学习中,研究人员通过迁移学习的方法来提高网络性能,即把在海量数据中训练好的网络应用到自己的数据中,然后微调该网络以达到快速收敛的目标。Jason等[16]通过实验对比得出结论:微调一个预训练好的卷积神经网络,比从头开始训练网络具有更好的分类精度和更快的收敛速度。底层网络学习到的图像特征具有很好的泛化能力,对于不同的数据集都有很好的表示。

实验中,实际能获取到的油罐目标的遥感图像很难达到上百万数量级的要求,因此本研究考虑采用上述迁移学习的思路来解决训练样本不足的问题。ImageNet分类数据集[17],大约包含1 000多类样本,训练图像120万张,正是在Image⁃Net数据集的支撑下,卷积神经网络才在短短几年内快速发展,利用该数据集训练出来的模型具有优秀的特征提取能力[18]。实验中将制作的油罐目标训练样本直接输入到在ImageNet上预训练好的深度卷积神经网络中进行特征提取,再利用提取到的特征训练分类回归网络。

2.1.2 候选区域生成网络(RPN)

在Faster R-CNN网络中,候选区域网络是一个卷积神经网络,该网络以特征提取网络输出的特征图作为输入,输出多种尺度和宽高比的矩形候选区域。候选区域网络首先利用一个卷积核在特征图上进行卷积操作生成特征向量,然后将每个特征向量输入到两个全连接层中,然后输出候选区域的分数和修正参数,每个滑动窗口位置定义了9个候选区域,每个候选区域对应4个修正参数、2个分数,分别代表该候选区域内包含和不包含待测目标的可能性。网络结构如图2所示。

图2

图2   候选区域生成网络(RPN)

Fig.2   Region Proposal Network


2.1.3 分类回归网络

获得候选区域之后,就要对候选区域进行分类回归操作,在Faster R-CNN网络中,将特征提取网络输出的特征图和候选区域网络生成的候选区域输入分类回归网络之中,输出候选区域对应各类别的置信度和修正参数[15]。网络结构如图3所示。

图3

图3   分类回归网络结构

Fig.3   The structure of the classification network


因为候选区域网络输出的候选区域形状、大小各异,所以不同候选区域所包含的特征向量维度也各不相同。而全连接层对输入特征向量维度有固定限制,所有输入特征向量维度必须相同,因此分类回归网络首先使用一个ROIpooling层将候选区域所包含的特征池化成大小、形状相同的特征图,然后用两个全连接层对特征图进行特征映射,然后使用全连接层cls_score、bbox_pred输出各个类别的分数和修正参数,并使用Softmax层将分数归一化,得到候选区域各个类别的置信度。

2.2 R-FCN原理

由于Faster R-CNN在卷积层之后连接的是感兴趣区域池化层,网络结构的平移不变性被削弱,因此Dai等[19]在Faster R-CNN的基础上提出了R-FCN模型,采用专门的卷积层构建位置敏感分数图代替Faster R-CNN的感兴趣区域池化层,使网络具备更好的平移不变性,该方法已经在ImageNet挑战赛和COCO目标检测任务中取得较好的效果。

在具体实现中,首先输入一张图片,经过一个参数共享的全卷积神经网络,得到特征映射图,然后将特征映射图输出给区域建议网络(RPN)对全图的前后景目标进行搜索和筛选,以确定候选框。得到一系列的候选窗口后,特征图经过一个专门的卷积层,在整幅图像上为每类生成k2个位置敏感分数图,用于描述对应位置的空间网格;每个位置敏感图有C+1个通道输出(C类待检测目标和1个背景)[20],R-FCN最后用位置敏感的ROI池化层来管理这些得分图的信息,并且这一层是没有任何权重的。如果一个大小为w×h的候选框将被划分为k×k个子区域,每个子区域大小为w×h/k2,因此对于任意一个子区域bin(i,j),0≤i,j≤k-1,位置敏感的池化操作如公式(1)所示:

rCi,j|θ=x,ybini,j1nZi,j,Cx+x0,y+y0|θ

其中:rCi,j是第C类子区域bini,j的池化响应,Zi,j,C是子区域bini,j所对应的位置敏感分数图,(x0,y0代表目标候选框左上角的坐标,n是子区域bini,j中的像素数,θ代表网络中的参数。计算出k×k个子区域的池化响应输出rCi,j|θ的均值,最后利用回归分类获得其属于每个类别的概率[21]。R-FCN目标检测框流程如图4所示。

图4

图4   R-FCN结构图

Fig.4   The structure of R-FCN


3 油罐目标检测试验与分析

3.1 训练样本集制作

常规的目标检测数据集有很多,但基于常规数据集训练出来的网络在遥感影像上效果并不好,主要是因为遥感影像存在尺度多样、视角特殊、小目标问题等特殊性。因此对于遥感影像的目标检测工作,常规的数据集往往难以训练出理想的目标检测器,需要专门的遥感影像样本集来训练网络。目前常用的遥感影像数据集有:DOTA、NWPU VHR-10、UC_Merced等,在本文实验中,主要用到UC_Merced、RSOD、AID、NWPU-RESISC45共4种遥感数据集,还辅助使用了部分高分二号(GF2)获取的遥感数据。本文实验中制作了1 300张油罐样本图片,总共包含约2.5万个不同尺寸的油罐目标,使用其中60%的图片作为训练和验证,其余40%作为测试。训练样本样例如图5所示,采用LabelImg标注工具人工标注其中的油罐样本外边框和类别。

图5

图5   标注的油罐样本

Fig.5   The sample of the oil tank


3.2 卷积网络特征

深度卷积网络学习到的特征具有辨别性,背景部位的激活度很少,通过可视化过程结果,可以看出提取到的特征忽略了背景,提取到了目标中的关键信息。图6显示的是ZF模型各个卷积层学习到的特征,为了显示清晰,将灰度特征图用彩色来显示,从图6可以看出,随着卷积网络层的加深,提取到的特征越来越丰富,conv1、conv2学习到一些基本的特征比如颜色、边缘等底层特征;conv3学习到一些纹理特征;conv4、conv5则是学习到一些具有关键辨别性的特征。上述各卷积层提取的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的,这就是深度卷积神经网络的关键优势即不需要手工设计特征提取器,通过通用学习过程而得到良好的特征;深度卷积神经神经网络把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达,通过足够多的转换的组合,非常复杂的函数也可以被学习,因此能够发现大数据中的复杂结构,具有更高的灵敏性和泛化能力[22]。在油罐目标的遥感监测中,由于光照、传感器成像质量及油罐材料、结构、位置等因素的影响,部分油罐目标特征不明显,采用传统的手工设计特征的方法提取油罐目标,往往存在适用范围有限、泛化能力较弱的问题,基于深度卷积神经网络对油罐目标进行目标检测,能根据不同来源的训练数据集自适应的构建特征描述,进而有效地提取油罐的目标特征,同时削弱不相关因素,具有更高的泛化能力和更高的效率。

图6

图6   ZF模型各个卷积层提取到的特征

Fig.6   The extracted features of convolution layer from ZF model


3.3 实验结果及分析

在本文实验中,Faster R-CNN算法利用典型的ZF[23]和VGG16[24]网络,训练和微调网络的各项参数,R-FCN算法则利用深度残差网络ResNet-50[7]来训练网络。ZF模型网络包括5个卷积层和3个全连接层,该网络是ILSVRC2013(ImageNet Large scale Visual Recognition Competition 2013)冠军。VGG16是由牛津视觉几何组开发的卷积神经网络,并赢得了ILSVRC2014的冠军,该网络有13个卷积层,3个全连接层。ResNet-50[7]在2015年横空出世,并获得当年ILSVRC2015冠军,该网络利用残差学习单元减少了参数量,解决了在训练很深网络时会遇到的梯度消失和梯度爆炸的问题,使得模型深度得以进一步加深(49个卷积层和1个全连接层),同时错误率也大大降低。在本文实验中,待检测目标只有一个类别即油罐,所以需要根据待检测目标类别数修改上述模型中的参数。本文使用Caffe框架实现卷积神经网络模型,所有试验均基于同一台GPU服务器(显卡:NVIDIA GTX1080TI)进行测试。

3.3.1 目标检测结果

分别对3种模型进行训练测试,每种模型分别采用交替优化和端到端两种训练方式进行训练,交替优化方式即训练两个网络,一个是RPN,一个是Fast R-CNN,一共有两个阶段,每个阶段各训练一次RPN和Fast R-CNN;端到端训练采用一次性训练的方式完成模型权重的更新。为了比较各种模型和训练方式的效率和精度,采用准确率(mAP)和召回率(recall)来评价目标检测的精度,其中,召回率=正确识别油罐的数量/测试图像中油罐的总数量,准确率=正确识别油罐的数量/模型识别出的所有油罐数量,结果如表1所示。

表1   两种训练方式油罐检测结果

Table 1  The oil tank detection result of the two training mode

网络准确率召回率时间/h
端到端

交替

优化

端到端

交替

优化

端到端交替优化
ZF0.6190.6100.6220.61835
VGG160.6180.6120.6640.6697.514
ResNet-500.6260.6000.6950.693413

新窗口打开| 下载CSV


从表中结果可看出,对于Faster R-CNN而言,VGG16的精度比ZF略高,同时由于VGG16网络更深,训练时间更长;R-FCN的ResNet-50的检测精度略高于ZF和VGG16,但是由于残差网络特殊的网络结构,训练时间比VGG16短。

3种网络通过交替优化训练和端到端训练两种方式得到的结果精度相差不大,但是交替优化训练花费的训练时间明显增多,这是因为:在交替训练中,RPN训练结束后,会有一个RPN生成的过程,这时会生成所有训练图片的候选区域框,耗费大量的时间;而使用端到端训练方式,一次训练一张图片,RPN阶段产生一张图片的候选区域框,然后送入Fast R-CNN训练,因此端到端的训练方式更省时省内存。

3.3.2 改进锚点参数的效果

Faster R-CNN和R-FCN网络中,原始的数据集是VOC数据集,图片大小集中在500×375左右,每张图片约2~5个目标,而本文待检测目标是遥感图像中的油罐,且样本图片大小在300×300左右,每张样本图片中平均约20个油罐目标,因此考虑对用于检测目标的候选框尺度进行调整。

2.1.3小节提到区域建议网络(RPN),RPN以特征提取网络输出的特征图作为输入,输出一批矩形区域候选框,每个区域对应一个目标存在的概率分数和位置信息。在最后一个卷积层的特征图上每个像素点称为锚点(anchor),每个锚点都是以滑动窗口的中心为中心,大小是由尺度和长宽比两个元素构成。在自然图像的目标检测中,Faster R-CNN和R-FCN网络中,锚点的默认设置是采用了1282、2562、51223种面积尺度,以及1∶1、1∶2、 2∶1等3种长宽比例,每个锚点可以对应原始图像上的九个候选框。针对油罐这种小目标的检测,可以通过修改锚点的对应的面积大小和长宽比例,来调整目标检测候选框的尺度,提高对油罐目标的检测精度。本文对锚点的面积尺度和长宽比例均进行了修改,长宽比例增加为1∶4、1∶2、3∶4、1∶1、2∶1等5种,面积尺度增加为22、42、62、82、102、122、142、162、322、642、1282、2562、5122共13种,修改后每个锚点可以产生65个候选框。实验结果如表2所示。

表2   不同模型修改锚点大小对油罐检测的影响

Table 2  The influence of different anchor scales

网络准确率(mAp)召回率(recall)时间/h
修改前修改后修改前修改后修改前修改后
ZF0.6190.7120.6220.72833
VGG160.6180.7140.6640.7647.27.5
ResNet-500.6260.7160.6950.79544

新窗口打开| 下载CSV


表2可以看出,对锚点对应的面积尺度和长宽比例进行调整后,上述3个模型识别油罐的准确率和召回率均有明显的提升,且增加锚点的数量,训练耗费的时间增加的并不明显。实验证明,针对不同的数据集,不同大小的待检测目标,通过修改锚点大小和数量,即丰富了候选框类型和数量,进而对提升模型识别精度有较好的效果,特别是遥感影像中的小目标识别,修改锚点的大小和数量是很有必要的。

为直观展示三种模型的检测效果,随机选取部分检测效果图,如图7所示。从图中可看出,3个模型对油罐的识别效果总体来说相差不大,ZF模型有将非油罐区域误识别为油罐的情况,ResNet-50模型精度虽然比其他两种模型高,但是对图像边缘上的目标检测效果不如ZF和VGG16。综合3种模型的检测效果可以看出,基于深度学习的高分辨率遥感影像上油罐目标检测取得了较好的效果,能够通过查找油罐目标,找到工业园区疑似区域,分析该工业园区对生态环境的影响。

图7

图7   不同模型油罐识别效果比较


4 结 语

本文探讨了基于深度卷积神经网络的在高分辨率遥感影像目标检测中的有效性,采用Faster R-CNN和R-FCN算法对遥感图像油罐进行检测,并提出针对遥感图像小目标的检测,通过增加锚点的方法,提升检测精度,实现了对遥感影像上油罐目标的检测,召回率可接近80%,为深度学习在特定目标检测的应用提供了实例和新的思路。

目前,基于深度学习的目标检测算法还处于初步阶段,虽然在深度学习推动下,目标检测的准确率已经取得了跨越式的提高,但是基于深度学习的目标检测还有很大的提高空间,特别是应用于遥感图像目标检测领域。基于深度学习的目标检测在不断进步和发展,本文只是进行了初步的研究,还有很多问题有待深入研究:

(1)由于本文样本数据是人工标注,难免会有一些主观因素的影响,在实验中,一些面积很小的疑似目标很难被识别出来,这个问题将在后续研究中进一步探索。

(2)不同网络层次能提取不同层次的特征,不同层次的特征对实验结果的贡献程度不同[25]。后续研究中应该进一步理解网络参数的设置和网络结构的设计,针对待检测目标,保留贡献程度较大的网络层参与模型训练过程,改进优化模型,去除冗余信息,提高算法效率。

(3)针对生态红线保护特别是长江经济上游生态环境保护面临的问题和自然资源调查监测的相关要求,在后续的研究中将探索基于深度学习的其他感兴趣目标的识别检测问题,如生态保护区的违规厂房建筑、采矿点等目标的快速检测。

参考文献

Zhang Weisheng , Wang Chao , Zhang Hong , et al .

An Automatic Oil Tank Detection Algorithm based on Remote Sensing Image

[J]. Journal of Astronautics, 2006, 27(6): 1298-1301.

[本文引用: 1]

张维胜,王超,张红, .

基于遥感影像的油罐自动检测算法

[J].宇航学报, 2006, 27(6): 1298-1301.

[本文引用: 1]

Yin Liang , Gao Kun , Bai Tingzhu .

Research on Oilcan Segmentation in Remote Sensing Image based on Improved Otsu Algorithm

[J]. Optical Technique, 2012, 38(2): 197-201.

[本文引用: 1]

殷亮,高昆,白廷柱 .

基于改进Otsu法的遥感图像油罐目标分割研究

[J].光学技术, 2012, 38 (2): 197-201.

[本文引用: 1]

Wu Xiaodong , Feng Wufa , Feng Qianqian , et al .

Oil Tank Extraction from Remote Sensing Images based on Visual Attention Mechanism and Hough Transform

[J]. Journal of Information Engineering University, 2015, 16(4): 503-506.

[本文引用: 1]

吴晓东,冯伍法,冯倩倩, .

基于视觉注意机制和Hough变换融合的遥感影像油罐提取

[J].信息工程大学学报, 2015, 16 (4): 503-506.

[本文引用: 1]

Song Huansheng , Zhang Xiangqing , Zheng Baofeng , et al .

Vehicle Detection based on Deep Learning in Complex scene

[J]. Application Research Computers, 2018, 35 (4): 1270-1273.

[本文引用: 1]

宋焕生,张向清,郑宝峰, .

基于深度学习方法的复杂场景下车辆目标检测

[J]. 计算机应用研究, 2018, 35 (4): 1270-1273.

[本文引用: 1]

Hinton G E , Osindero S , Teh Y W .

A Fast Learning Algorithm for Deep Belief Nets

[J]. Neural Computation, 2006, 18: 1527-1554.

[本文引用: 1]

Krizhevsky A , Sutskever I , Hinton G E .

ImageNet Classification with Deep Convolutional Neural Networks

[C]∥International Conference on Neural Information Processing Systems, 2012, 25(2): 1097-1105.

[本文引用: 1]

He K M , Zhang X Y , Ren S Q , et al .

Deep Residual Learning for Image Recognition

[C]∥IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2006: 770-778.

[本文引用: 3]

Girshick R , Donahue J , Darrell T , et al .

Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation

[C]∥Computer Vision and Pattern Recognition, 2014: 580-587.

[本文引用: 1]

Ren Shaoqing , He Kaiming , Girshick R , et al .

Faster R-CNN: Towards Real-time Object Detection with Region Proposal Networks

[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6): 1137-1149.

[本文引用: 2]

Redmon J , Divvala S , Girshick R , et al .

You only Look Once: Unified, Real-time Object Detection

[C]∥IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2016: 779-788.

[本文引用: 1]

Liu Wei , Anguelov D , Erhan D , et al .

SSD: Single Shot MultiBox Detector

[M]. Computer Vision-ECCV 2016. Springer International Publishing, 2016: 21-37.

[本文引用: 1]

Dai Chenka , Li Yi .

Aeroplane Detection in Static Aerodrome based on Faster RCNN and Multi-part Model

[J]. Journal of Computer Applications, 2017, 37(Sup.2: 85-88.

[本文引用: 1]

戴陈卡, 李毅 .

基于Faster RCNN以及多部件结合的机场场面静态飞机检测

[J]. 计算机应用, 2017, 37(增刊2): 85-88.

[本文引用: 1]

Wang Wanguo , Tian Bing , Liu Yue , et al .

Study on the Electrical Devices Detection in UAV Images based on Region Based Convolutional Neural Networks

[J]. Journal of Geo-information Science, 2017, 19(2): 256-263.

[本文引用: 1]

王万国,田兵,刘越, .

基于RCNN的无人机巡检图像电力小部件识别研究

[J]. 地球信息科学学报, 2017, 19(2): 256-263.

[本文引用: 1]

Hu Yan , Shan Zili , Gao Feng , et al .

Ship Detection based on Faster-RCNN and Multiresolution SAR

[J]. Radio Engineering, 2018, 48(2): 96-100.

[本文引用: 1]

胡炎,单子力,高峰 .

基于Faster-RCNN和多分辨率SAR的海上舰船目标检测

[J]. 无线电工程, 2018, 48(2): 96-100.

[本文引用: 1]

Wu Weiming .

Research on Object Detection Algorithm Based on Faster R-CNN

[D]. Guangzhou: South China University of Technology, 2017.

[本文引用: 2]

伍伟明 .

基于Faster R-CNN的目标检测算法的研究

[D]. 广州华南理工大学2017.

[本文引用: 2]

Yosinski J , Clune J , Bengio Y , et al .

How Transferable are Features in Deep Neural Networks

[C]∥International Conference on Neural Information Processing Systems. MIT Press, 2014: 3320-3328.

[本文引用: 1]

Russakovsky O , Deng Jia , Su Hao , et al .

ImageNet Large Scale Visual Recognition Challenge

[J]. International Journal of Computer Vision, 2015, 115(3): 211-252.

[本文引用: 1]

Zhang Wei .

Land Cover Classification with Extracted Deep Features of Deep Convolutional Neural Network

[D]. Beijing: Institute of Remote Sensing and Digital Earth Chinese Academy of Sciences, 2017.

[本文引用: 1]

张伟 .

基于深度卷积神经网络自学习特征的地表覆盖分类研究

[D]. 北京中国科学院大学2017.

[本文引用: 1]

Dai J F , Li Y , He K M , et al .

R-FCN: Object Detection Via Region-based Fully Convolutional Networks

[M]. Advances in Neural Information Processing Systems, 2016: 379-387.

[本文引用: 1]

Jiang Sheng , Huang Min , Zhu Qibing , et al .

Pedestrain Detection Method based on R-FCN

[J]. Computer Engineering and Application, 2018(1):180-183,262.

[本文引用: 1]

蒋胜,黄敏,朱启兵, .

基于R-FCN的行人检测方法研究

[J]. 计算机工程与应用, 2018(1):180-183,262.

[本文引用: 1]

Xu Yizhi , Yao Xiaojing , Li Xiang , et al .

Object Detection in High Resolution Remote Sensing Images based on Fully Convolution Networks

2018(1):77-82.

[本文引用: 1]

徐逸之,姚晓婧,李祥, .

基于全卷积网络的高分辨遥感影像目标检测

[J]. 测绘通报, 2018(1):77-82.

[本文引用: 1]

Lecun Y , Bengio Y , Hinton G .

Deep Learning

[J]. Nature, 2015, 521(7553): 436-444.

[本文引用: 1]

Zeiler M D , Fergus R .

Visualizing and Understanding Convolutional Networks

[M]. Computer Vision-ECCV 2014. Springer International Publishing, 2014: 818-833.

[本文引用: 1]

Simonyan K , Zisserman A .

Very Deep Convolutional NetWorks for Large-scale Image Recognition

[J]. Computer Science, 2014: abs/1409.1556.

[本文引用: 1]

Dong Yunya , Zhang Qian .

A Survey of Depth Semantic Feature Extraction of High-resolution Remote Sensing Images based on CNN

[J]. Remote Sensing Technology and Application, 2019, 34(1): 1-11.

[本文引用: 1]

董蕴雅, 张倩 .

基于CNN的高分遥感影像语义特征提取研究综述

[J]. 遥感技术与应用, 2019, 34(1): 1-11.

[本文引用: 1]

/