张瑞琰 姜秀杰 安军社 崔天舒

张瑞琰, 姜秀杰, 安军社, 崔天舒. 面向光学遥感目标的全局上下文检测模型设计[J]. 188bet网站真的吗 , 2020, 13(6): 1302-1313. doi: 10.37188/CO.2020-0057
ZHANG Rui-yan, JIANG Xiu-jie, AN Jun-she, CUI Tian-shu. Design of global-contextual detection model for optical remote sensing targets[J]. Chinese Optics, 2020, 13(6): 1302-1313. doi: 10.37188/CO.2020-0057
基金项目: 中国科学院复杂航天系统电子信息技术重点实验室自主部署基金(No. Y42613A32S)



  • 中图分类号: TP391.4

Design of global-contextual detection model for optical remote sensing targets

Funds: Supported by Laboratory Fund of Key Laboratory of Electronics and Information Technology for Space Systems, CAS (No. Y42613A32S)
  • 摘要: 在复杂背景下的光学遥感图像目标检测中,为了提高检测精度,同时降低检测网络复杂度,提出了面向光学遥感目标的全局上下文检测模型。首先,采用结构简单的特征编码-特征解码网络进行特征提取。其次,为提高对多尺度目标的定位能力,采取全局上下文特征与目标中心点局部特征相结合的方式生成高分辨率热点图,并利用全局特征实现目标的预分类。最后,提出不同尺度的定位损失函数,用于增强模型的回归能力。实验结果表明: 当使用主干网络Root-ResNet18时,本文模型在公开遥感数据集NWPU VHR-10上的检测精度可达97.6%AP50和83.4%AP75,检测速度达16 PFS,基本满足设计需求,实现了网络速度和精度的有效平衡,便于后续算法在移动设备端的移植和应用。


  • 图 1  特征编码-特征解码网络架构

    Figure 1.  Framework of the feature encoder-feature decoder network

    图 2  全局上下文检测模型总体架构

    Figure 2.  Overall framework of the global-contextual detection model

    图 3  普通卷积采样和变形卷积采样示意图

    Figure 3.  Sampling diagrams in standard convolution and deformation convolution

    图 4  全局上下文特征提取流程

    Figure 4.  Flow chart of global-contextual feature extraction

    图 5  (a)添加目标框的原图及(b)高斯椭圆掩模示意图

    Figure 5.  (a) Original image with a target box and (b) schematic diagram of gaussian elliptical mask

    图 6  不同γ值对结果的影响

    Figure 6.  Effects of different γ values on results

    图 7  不同ν值对结果的影响

    Figure 7.  Effects of different ν values on results

    图 8  GCDN的可视化检测效果图

    Figure 8.  Visual detection results of the GCDN

    表  1  ResNet18与Root-ResNet18结构

    Table  1.   Structures of ResNet18 and Root-ResNet18

    C1128×1287×7, 643×3, 64
    3×3, 64
    3×3, 64
    3×3, MaxPool
    $\left[ {\begin{array}{*{20}{c}} {3 \times 3,64} \\ {3 \times 3,64} \end{array}} \right]\times 2$
    C264×643×3, MaxPool$\left[ {\begin{array}{*{20}{c}} {3 \times 3,128} \\ {3 \times 3,128} \end{array}} \right]\times 2$
    $\left[ {\begin{array}{*{20}{c}} {3 \times 3,64} \\ {3 \times 3,64} \end{array}} \right]\times 2$
    C332×32$\left[ {\begin{array}{*{20}{c}} {3 \times 3,128} \\ {3 \times 3,128} \end{array}} \right]\times 2$$\left[ {\begin{array}{*{20}{c}} {3 \times 3,256} \\ {3 \times 3,256} \end{array}} \right]\times 2$
    C416×16$\left[ {\begin{array}{*{20}{c}} {3 \times 3,256} \\ {3 \times 3,256} \end{array}} \right]\times 2$$\left[ {\begin{array}{*{20}{c}} {3 \times 3,512} \\ {3 \times 3,512} \end{array}} \right]\times 2$
    C58×8$\left[ {\begin{array}{*{20}{c}} {3 \times 3,512} \\ {3 \times 3,512} \end{array}} \right]\times 2$
    表  2  数据集NWPU VHR-10目标尺寸统计表

    Table  2.   Statistics of target sizes in the NWPU VHR-10 dataset

    表  3  不同模型在数据集NWPU VHR-10上的平均精确度对比

    Table  3.   Comparison of mean average precisions of different models in the NWPU VHR-10 dataset

    表  4  检测阈值0.75下的不同模型平均精确度对比

    Table  4.   Comparison of mean-average precision of different models under the 0.75 detection threshold

    模型平均准确率 (AP)平均准确率(AP)($I_{ {\rm{{ou} } } }$=0.50:0.95)平均召回率(AR)($I_{ {\rm{{ou} } } }$=0.50:0.95)
    $I_{ {\rm{{ou} } } }$=0.50:0.95$I_{ {\rm{{ou} } } }$=0.50$I_{ {\rm{{ou} } } }$=0.75小目标中目标大目标小目标中目标大目标
    表  5  不同模型的平均检测时间对比

    Table  5.   Comparison of the average detection times with different models

    表  6  不同模型在数据集DOTA上的平均精确度对比

    Table  6.   Comparison of the mean-average precisions with different models in the DOTA dataset

