基于CNN的Pan-Tilt-Zoom(PTZ)摄像机实时无人机检测和跟踪

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wxjct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商用无人机,尤其是在民用领域,由于其应用广泛,在过去的二十年里得到了显著的发展。由于价格低廉,技术发展迅速,这些无人机设备在公共市场上的可用性很高。但是这种情况引发了公众和政府对安全的担忧,因为不论有意或无意,这些微小的装置都可能会造成严重的威胁。近年来,学术界和业界一直在提出一些检测无人机的方法以保护本国的一些重要地理位置。目前,使用雷达、声学、激光雷达、射频(RF)信号分析以及计算机视觉的算法都被广泛使用。从人们最关注的的算法来看,近年来,基于计算机视觉的算法因其鲁棒性和有效性而广泛应用于无人机的识别和跟踪。然而,由于计算时间长、光照变化、阴影推断、物体小、背景推断、尺度变化、遮挡、面内、面外旋转、摄像机运动等挑战,这种算法很难有效地识别、检测和跟踪无人机。本文系统呈现了一个以安装在旋转台上的红外线摄影机为硬件的无人机侦测与追踪系统。为了实现基于卷积神经网络(CNN)的无人机实时检测与跟踪,本文采用了两种并行的算法,这两种并行的算法使系统具有灵活性和独立性。本文的并行算法分为检测算法和跟踪算法两部分。在检测算法中,本文采用深度学习技术对无人机进行检测、识别和定位。目前,深度学习方法克服了雷达、声学、激光雷达、射频等传统方法的不足,是计算机视觉领域一种有效、鲁棒的方法。该检测算法中采用的深度学习方法,利用了红外摄像机的输入图像来寻找场景中的无人机。本文利用CNN结合传统图像处理技术,以序列的方式设计了深度学习算法。该算法中使用的CNN在检测无人机时,在计算时间、性能和精度方面是有效和鲁棒的。在这项工作中,深度学习算法使用了两种不同的输入尺寸。第一个深度学习模块使用完整的帧大小输入CenterHedNet。一旦检测到无人机,则使用从上一帧获得的感兴趣区域作为下一帧的缩放和裁剪边界的区域,而在下一帧中,CenterHedNet步骤会被跳过,并且以上一帧的所获得的感兴趣区域为指导,缩放并裁剪该帧。裁剪后的帧进一步以一个固定比例调整大小并输入第二个深度学习模块CropNet。本文还使用另一种深度学习方法从图像感兴趣区域的序列中定位无人机,而无需使用CenterHedNet。值得一提的是,CenterHedNet和CropNet都使用了关键点检测的方法来检测和识别无人机,但是正如前文所述,它们各自的输入尺寸是不同的,这样做可以使我们只关注目标区域。在跟踪算法中,本文采用了卡尔曼滤波器对无人机状态进行粗略预测,并通过旋转电机让红外摄像头旋转两圈来跟踪无人机。无人机控制器朝向中心(TC)算法用于确保无人机中心始终位于相机图像平面的中心。系统中使用的红外摄像头用作反馈传感器,以将旋转的转塔定期引导至无人机的方向,达到跟踪的目的。总体而言,由于人类的关注点往往只集中在他们视线范围内的移动物体上,所以从某种程度来说,该系统模仿了人类眼球追踪目标的方式。通过作者对系统的精心设计,本文所使用的方法可以实时工作并能在很远的距离检测出小的目标。为了提高计算效率并使其实时工作,该方法采用了免锚框的检测算法,这有效地提高了检测的处理速度,使得系统平均速度提高至66FPS。此外,为了检测小目标,本文还使用了一种基于感兴趣区域的方法,这使得系统可以最小识别4 x 4像素大小的无人机。
其他文献
柔性可穿戴电子因其轻薄便携、集成度高等特点而受到人们的喜爱。为了模拟人类触觉,研究人员将触觉传感器与柔性可穿戴电子集成,提出一种“贴在”皮肤上的可穿戴式触觉传感器。在设计可穿戴式触觉传感系统时,为了让柔性触觉传感器与外围电路高度集成,不仅要实现器件柔性化,还要实现外围电路柔性化,除此之外,还应考虑可穿戴系统的佩戴舒适性问题。本文主要对触觉传感及其可穿戴集成技术进行研究。主要研究内容包括:(1)对具
随着互联网的发展,大众接触信息的方式已经从文字演变成图片。每天都有数以亿计的图片被使用,图片版权问题随之而来。论文从现有数字资产登记系统出发,对数字资产登记进行了详细的研究,总结出目前数字产权登记系统中存在的缺陷:第一数字产权登记系统在登记图片版权时仅登记所有人信息,并没有对图片的特征进行登记,也没有对比已登记的图片版权,无法保证原创者的权益;第二受限于区块链的性质,现有的数字资产登记系统,处理速
随着计算机视觉的不断发展,快速、准确地获取待测目标三维点云的需求日益增加。双目立体视觉作为三维重建的一个重要实现途径,它除了能够类人的处理目标,还具有低成本、高效率、强灵活性等特点,故其广泛应用于商务、教育、文化等领域。相较于传统的定焦相机,变焦相机具有灵活度高、控制性强等优点。它可以根据场景的变化而改变焦距,从而获取更精确和完整的三维点云。因此,基于变焦双目立体视觉的三维重建系统具有极为重要的研
农业作为我国的第一产业,是一切生产的首要条件。农业土地资源是农业生产的最基本生产要素,是指在农业生产中,为农作物生长发育提供场所和主要营养来源的地面表层。提高农业土地资源的利用效率,不但能促进实现农业现代化,同时可进一步提高农业生产经济效率。一直以来,我国农业土地资源在数量上表现为总量大人均少,在空间上表现为分布不均的特点。近年来,黑龙江省海伦市作为我国典型的农业生产区,农业土地资源未得到合理利用
随着叉车需求量不断增加,客户的需求呈现个性化和多样化的特点,传统的卖方市场转向买方市场。在这样的生产背景下,叉车制造企业为了提高市场竞争力,开始向多品种小批量的生产模式转变,引进了面向多品种小批量生产的混流装配线,但是由于企业缺乏精益生产思想的指导,使混流装配线不能完全发挥其高效生产的优点。因此如何利用企业的生产资源,充分发挥混流装配系统高效生产的优点对企业具有重要的指导意义。针对企业销售预测结果
硫酸钡作为一种重要的化工原料,被应用于众多行业,随着硫酸钡应用研究的不断深入,对硫酸钡品质提出了新的要求,尤其是纯度和形貌可控的超微硫酸钡新品种的研究,受到广泛关注。目前国内硫酸钡的制备方式多采用的是直接沉淀法,因其反应速率较快,无法控制晶体的生长速度,难以控制硫酸钡晶体的形貌。离子交换法作为一种新颖的合成方式,其原理是利用反应物与生成物之间溶度积的差异,在固-液体系中实现离子交换、沉淀转化,其本
遥感卫星地面系统是地球观测卫星数据接收,预处理和系统集成的重要系统。遥感卫星地面系统由遥感卫星地面系统数据接收系统和遥感卫星地面系统数据处理系统组成,主要任务是接
在声音嘈杂的环境中,和语音相比使用手势进行交流会更加方便有效。因此在这一环境中通过手势进行人机交互就成为了人们的迫切需要。同时随着Wi-Fi无线通信技术的发展,无线网络的布置难度越来越小、成本越来越低,覆盖范围也逐渐增大,数据传输速率也逐步提升。因此使用Wi-Fi信号进行手势识别成为近年来的研究热点之一。复杂的电磁环境干扰在对Wi-Fi信号通信干扰的同时,也会对基于Wi-Fi信号的手势识别产生影响
工业漆是应用于工业生产设备、集装箱、船舶、桥梁、储气罐、化工设备、铁路油轮、港口机械、管道、钢结构和混凝土等的防护与装饰漆。传统工业漆主要以有机溶剂为分散介质,
近年来,就实践中绝大多数的恐怖活动犯罪而言,资助等帮助恐怖活动的行为对恐怖活动的实施起到了至关重要的作用,对公民人身和财产安全,社会公共安全,国家安全,乃至整个人类社会都产生了巨大危害。为应对恐怖主义新形势,《刑法修正案(三)》新增120条之一资助恐怖活动罪,《刑法修正案(九)》将资助恐怖活动罪变更罪名为帮助恐怖活动罪,对资助恐怖活动罪的构成要件进行修改。刑法分则中所处罚的行为通常是实行行为,但是