遥感图像军用飞机目标识别是对遥感图像中的军用飞机进行定位和细粒度分类,其在侦察预警、情报分析等领域起着至关重要的作用。
但是,由于数据集匮乏,遥感图像军用飞机目标识别发展相对缓慢。为推动该领域的研究进展,本文构建了公开的遥感图像军用飞机目标识别数据集MAR20(Military Aircraft Recognition)。
通过Google Earth在全球60个军用机场收集了3842张高分辨率遥感图像数据,建立了大规模公开的遥感图像军用飞机目标识别数据集MAR20,包含了20种飞机型号和22341个目标实例。
在数据标注方面,MAR20提供了水平边界框和有向边界框两种标注方式,分别对应于水平框与有向框目标识别任务,方便研究人员根据任务需求灵活使用。
MAR20数据集具有以下3个特点:
(1)大规模:MAR20是目前公开的规模最大的遥感图像军用飞机目标识别数据集,包含3842张图像、20种军用飞机型号以及22341个实例。此外,该数据集提供了水平边界框和有向边界框两种标注方式,分别对应水平框目标识别任务与有向框目标识别任务,方便研究人员进行不同算法的性能。
(2)不同型号目标类间差异小:由于这20个细粒度类别均隶属于同一个飞机大类,因此不同型号的飞机往往具有相似的特征,这导致细粒度类别之间具有较高的相似性。不同飞机型号的区别主要体现在局部部件的不同,例如,SU-35和SU-34飞机型号的差别是头部的前鸭翼。
(3)相同型号目标类内差异大:由于遥感图像采集过程中受到气候、季节、光照、遮挡、乃至大气散射等因素的影响,相同型号的目标往往视觉差异大,存在较高的类内差异性。
尽管使用Google Earth获得了不同气候、不同季节和不同光照的遥感影像,但是同一机场同一型号的军用飞机仍然存在相似的空间信息和背景信息。
若同一机场的飞机被分配到训练集和测试集中,将会严重影响目标识别算法的泛化性能评估。所以在划分数据集时,本文首先随机筛选机场,再将图像数据分配到训练集和测试集中。
另外值得说明的是,受功能用途、造价等因素的影响,个别型号飞机的生产和保有数量较少,再加上一些典型目标自身的敏感性,导致获取到的目标样本数据存在一定程度的样本不平衡问题,如A6、A11、A12、A15、A18型号的飞机实例数较其他型号较少。
来源:遥感学报
评论