论文部分内容阅读
随着物联网技术的不断发展,人类社会进入万物互联的智能信息化时代,智能机器人、智能门禁以及智能家电等智能设备极大的方便了人们的生活,改变了人们的日常生活方式。其中,图像处理需求是智能设备的主要需求之一,图像处理应用于目标检测、图像分割、医学成像分析等各类领域。图像处理通常需要进行复杂的运算,将人工智能技术应用于图像处理有较好的效果,可以减少运算量,提高图像处理的性能。在云计算模型中,物联网的本地终端设备将采集到的数据经网络传送至云服务器,由云服务器完成数据运算。云计算模型可以很好解决物联网设备性能差的问题,但随着物联网终端设备的不断增加,巨量设备接入网络,云计算模型受网络带宽和性能瓶颈的制约,带来延迟高、实时性差和安全性低等一系列问题。将采集到的数据信息在本地完成运算处理,仅将运算结果传回云服务端的边缘计算模型可以有效解决上述问题。边缘计算模型的实现难点在于边缘设备硬件资源有限以及性能较低,本文针对这一问题进行了研究,研究主要包括以下内容。本文设计了边缘计算系统,研究了人工智能图像处理算法,完成了一个用于人群信息检测的边缘计算系统实例的搭建。本文设计了由树莓派开发板和ARC开发板以及云服务器组成的边缘计算系统,并对卷积神经网络进行了剪枝、参数量化等优化,使其减少计算量与硬件需求、适配边缘计算模型,完成了卷积神经网络的边缘端部署。本文研究了RISC-V架构与RI5CY处理器,设计了用于指令拓展的协处理接口。RISC-V是一套新兴的开源精简指令集架构,RI5CY是基于RISC-V架构的一款低功耗开源处理器,本文基于RI5CY设计了自定义指令来加速卷积神经网络的卷积运算。为了简化后续开发流程、增加协处理器加速模块的可移植性,设计了一套用于指令拓展的协处理器接口。本文基于Winograd算法设计了协处理器加速模块,减少内存访问,加速卷积神经网络的卷积运算过程。本文设计了协处理器加速模块,并对模块进行了测试验证,结果表明,在实现4×4特征图与3×3卷积核的卷积运算中,减少了约77.8%的内存访问次数,实现了性能5倍以上提升,经过内存优化后加速性能提升到了11.7倍,并在特定运算下有更大的性能提升。在更大尺寸的特征图中,协处理器加速模块可以将基于Winograd算法的4×4特征图与3×3卷积核的卷积运算作为一个Winograd加速算子,利用Winograd加速算子对特征图分块进行卷积运算,同样能够获得较大的性能提升。本文通过对基于卷积神经网络算法的图像处理边缘计算进行了加速优化,能够显著提高边缘设备进行图像处理的能力,针对边缘计算模型中边缘端性能不足的问题提出了解决方案,对物联网和边缘计算的发展有一定的推动作用。