基于异构平台的视频图像识别算法研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:weidaxia888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度神经网络的学术研究取得了喜人的突破,而如何在实际应用中发挥人工智能的潜力仍然是一项艰巨的挑战。以计算机视觉为例,深度卷积神经网络的图像识别准确率虽然在Image Net数据集上表现卓越,但这些成果距实际的商用还有很大的距离。一方面由于图像识别算法的复杂性,另一方面则由于图像处理和计算带来的算法复杂度对计算设备的性能的超高要求。后者催生了高性能计算在异构平台上的广泛应用,如使用GPU加速使深度神经网络的图像训练时间控制在可接受的范围之内。与此同时,视频网站在版权、网络带宽、服务器等资源上的高昂成本需要新的广告推荐模式平衡用户体验和商业收入。基于以上立题背景,本文对已有的视频图像识别算法与技术进行研究分析,提出了一套用于解决垂直内容类的视频图像中的目标物品的定位和识别任务的基于异构平台的可行性方案。该方案的设计与实现包括主要三大部分的工作内容:(1)视频图像分割:对视频源进行预处理并获取帧图像,使用基于图表示的像素合并算法获取被分割区域后采取选择搜索策略获得可能存在目标对象的矩形框位置;(2)改进深度学习框架Caffe的跨平台性:使用异构编程语言Open CL实现原生的基于CUDA的GPU加速功能,从而克服已有的Caffe只能在NVIDIA平台上进行运算加速的局限性;(3)训练卷积神经网络执行图像识别:使用Image Net数据集对该模型进行训练得到能够识别目标对象的神经网络结构,将图像的识别结果与矩形框位置进行回溯映射定位视频中的目标物体位置。论文的实验部分对提出的方案的可行性和有效性进行了验证。为了实现识别的有效性实验的可视化,对图像分割结果包含区域矩形框和对应坐标位置通过图形编程对比神经网络的图像识别效果。实验还通过分析卷积神经网络不同神经层的输出结果理解卷积神经网络内部对图像特征的学习机制,印证了本文提出的解决方案的可行性。在总结与展望部分提出视频图像识别的研究方向与基于视频内容的广告推荐优化建议。
其他文献
计算机图像处理与识别是一门跨学科的前沿高科技技术,目前广泛地应用于遥感、工业检测、机器人视觉、生物医学、公安等诸多领域,特别是21世纪信息时代的到来,使其成为了认识世界
党的十九大是一次具有里程碑意义的大会。习近平总书记所作的报告,把坚持党的领导、加强党的建设贯穿全篇,彰显了我们党勇于自我革命的鲜明品格和坚如磐石的决心毅力。党章修
小月(化名)是一个19岁的女孩,正值花季,但她却没有花季女孩的朝气、天真和浪漫,在她的脸上写满了超越年龄的沧桑,在她的内心笼罩着一片挥之不去的乌云。因为19年了,她一直是个"
<正>大家都知道在互联网下,以及购物中心很大的企业运作后,中小百货店到底怎么走会被忽略掉,很少讨论甚至找不到办法。我相信有很大的主题可以外包,可以让互联网的企业参与进
在对单光子探测过程中后脉冲现象进行理论分析的基础上,通过实验对后脉冲概率进行了统计测量,这种方法与其它方法的不同之处在于不需要更多的实验仪器,而测量得到的实验结果与其