论文部分内容阅读
无人机以其灵活高效、低成本等优点,在军事上和民用上有非常多的应用,如地面目标打击、交通监控和搜索救援等,这些应用得以实现的基础就是目标定位与跟踪技术。本文利用机载成像系统传送的图像视频流,研究针对地面静态标志物和车辆、行人等运动目标的自动检测算法,构建实时、高精度的无人机地面目标定位与跟踪系统。论文的主要内容与研究成果总结如下:(1)基于改进的RefineDet单阶段检测框架实现航拍视频中的车辆检测,采用感受野模块改进RefineDet框架,该模块通过模拟人类视觉皮层实现提取更有效的图像特征,可改善模型的检测性能。在UAV车辆数据集上的测试结果表明,在满足实时性的同时,本文模型的mAP(mean Average Precision)相比于Yolov3和RefineDet,分别高5.8%、1.9%。(2)通过SiamRPN跟踪框架构建了应用于无人机场景的静态目标跟踪模型。针对SiamRPN模型的性能容易受相似干扰目标所影响的问题,本文在SiamRPN框架中加入了干扰目标感知模块,并采用注意力机制改进模型的损失函数。利用UAV123数据集中包含静态目标的视频序列评估模型,实验结果表明本文模型的OS(Overlap Score)、AUC(Area Under Curve)指标与SiamRPN模型相比增长了19.29、6.94。(3)设计了由离线训练的候选目标回归网络和在线更新的验证网络构成的运动目标跟踪模型。候选目标回归网络以SiamRPN框架为基础并结合CIR(Cropping-inside Residual)模块进行改进,在提取丰富图像特征的同时保留了更多的定位信息。基于MDNet框架构建验证网络,用于判断SiamRPN网络生成的候选目标是否为跟踪目标,考虑到MDNet的实时性较差,加入了PSRoIAlign池化操作和膨胀卷积进行优化。利用UAV123数据集中包含运动目标的视频序列评估模型,实验结果表明本文的运动目标跟踪模型达到了实时性要求,并且该模型的Precision、OS、AUC值分别比SiamCIR-LT模型提升了17.52、15.24和9.68。(4)使用大疆Phantom 3无人机采集了包含建筑物(静态目标)和行人(运动目标)的航拍视频以测试跟踪模型的实际应用性能,实验结果表明,本文提出的跟踪模型对地面目标的跟踪具有较好的准确性和鲁棒性。