【摘 要】
:
在新零售背景下,无人货架上商品种类繁多、背景复杂且易受光照等外界因素干扰,顾客手持商品时手部或身体也会对商品关键信息形成遮挡,使得自然场景中仅采用图像识别算法在精度和速度上不能满足无人货架应用需求。针对无人货架实际应用场景的特性,本文在深度学习及卷积神经网络框架下,基于人体关节点定位算法与图像分类算法对该场景下的手持商品进行识别。其中人体关节点定位算法能准确定位持有商品手部的相关关节点,而图像分类
【基金项目】
:
河北省自然科学基金(F2019202364);
论文部分内容阅读
在新零售背景下,无人货架上商品种类繁多、背景复杂且易受光照等外界因素干扰,顾客手持商品时手部或身体也会对商品关键信息形成遮挡,使得自然场景中仅采用图像识别算法在精度和速度上不能满足无人货架应用需求。针对无人货架实际应用场景的特性,本文在深度学习及卷积神经网络框架下,基于人体关节点定位算法与图像分类算法对该场景下的手持商品进行识别。其中人体关节点定位算法能准确定位持有商品手部的相关关节点,而图像分类算法主要识别以关节点为中心截取的包含商品主要特征的图像。为了提升算法的实用性,本文主要从识别速度与精度两个方面入手研究。具体研究内容如下:(1)轻量级人体关节点定位算法研究无人货架场景下对顾客手持的商品进行识别,首先需要准确定位顾客手臂关节点。本文提出一种轻量级卷积姿态机(L-CPM)算法进行关节点定位,主要通过引入轻量级卷积结构以及降低特征图分辨率两个方面,来提升人体关节点定位速度。为降低算法计算量,一方面用轻量级卷积结构代替人体关节点定位算法中的标准卷积结构,另一方面在保留图像主要特征的前提下,通过下采样尽可能减小算法部分卷积结构输出的特征图分辨率,以减少冗余信息。采用公开数据集与真实场景数据集分别对算法进行测试,从计算量(FLOPs)、视觉效果、精度(PCKh)等评价指标验证算法的有效性。结果表明本文L-CPM算法在保证识别精度的情况下能有效降低算法的复杂度。(2)基于超分辨率重建的人体关节点定位算法研究轻量级卷积姿态机(L-CPM)在降低计算量的同时,不可避免产生卷积输出特征丢失,降低了人体关节点定位精度。因此本文提出一种基于超分辨率重建的人体关节点定位算法(EP-L-CPM),通过在L-CPM中引入超分辨重建(ESPCN)来恢复丢失的特征信息。ESPCN主要作用在网络的最后一个卷积层,其通过核心操作亚像素卷积对输出的低分辨率特征图的像素重新进行排列,以重建得到高分辨率特征图。采用公开数据集与真实场景数据集分别对算法进行测试,从视觉效果、精度(PCKh)、计算量(FLOPs)等评价指标验证算法的有效性。结果表明本文EP-L-CPM算法在不增加计算量的情况下能有效提高关节点定位精度。(3)基于注意力机制的无人货架商品图像分类算法研究无人货架上商品的识别效果主要取决于训练数据的有效性以及分类算法的性能。在训练数据方面,以EP-L-CPM能精确定位持有商品手部的有效关节点为基础,利用被定位到的手肘、手腕、手指部位等关节点确定出有效关节点位置,并以该有效关节点为中心截取包含商品主要信息的图像构建背景纯净、少冗余的训练数据集;同时为了增加算法鲁棒性、减少光照等外界因素的影响,进一步对训练数据集进行数据增强。在算法性能改进方面,本文提出一种基于注意力机制的图像分类算法ATN-Mobile Net,主要是在Mobile Net V2的网络后端引入注意力模型,来实现对注意力区域特征的增强。为验证所提出算法的有效性,在所构建的数据集上进行多组对比实验,结果表明本文算法能有效提升商品识别精度。
其他文献
混凝土3D打印(3D Concrete Printing,3DCP)作为一种无模、快速、灵活的先进建造技术在土木建筑领域已获得成功应用。然而,逐层堆叠的固有成型工艺使3D打印混凝土结构存在有规律的层间弱面,造成了材料的细观非均质性,削弱了结构的力学承载性能和耐久性能,制约了该技术的发展和应用。研究3D打印混凝土结构层间弱面的形成机制,细观探究层间粘结机理,研发界面增强材料,提高3D打印混凝土的连续
快速路作为许多大型或者特大型城市道路网的重要组成部分,具有速度快且通行能力大的优势。但是与日俱增的交通压力使得一些城市的快速路拥堵愈加严重,尤其是在通勤等交通需求较高的时段。多匝道协调控制是抑制快速路拥堵的有效手段,这是因为快速路匝道间距短,主线速度限制和单匝道流量调节对于快速路拥堵的控制效果有限。但是现有的多匝道协调控制方法较少涉及控制信号施加范围优化及确定问题,较少考虑“匝道上不设信号灯,流量
铸铁是一种重要的工程材料。铸铁的结晶过程比较复杂,人们仍未完全掌握其凝固过程,实际生产中经常因工艺设置不当导致铸件中出现冶金缺陷。为了控制铸件的组织和性能,减少废品,需要对铸铁的结晶过程进行更深一步的研究。在实际情况下,铸铁在非平衡条件下凝固,其中共晶结晶是铸铁凝固中最重要的阶段,但生产过程中工艺条件的变化会造成铸铁共晶点的移动,直接影响铸铁的组织。本课题基于热分析技术,找到了一种确定非平衡凝固条
现如今全球水资源匮乏,水资源的处理再利用显得尤为重要,工业领域和生活中均会产生含油废水,含油废水处理问题亟待解决。近年来,用于处理含油废水的超亲水-水下超疏油多孔膜受到广大学者的青睐。聚乙烯-乙烯醇共聚物(EVAL)良好的亲水性和稳定的性质使其成为膜材料的选择之一,普兰尼克(Pluronic)F127亲水性添加剂因其良好的亲水性和致孔剂作用引起广泛关注。基于此,本文旨在通过浸没凝胶法制备超亲水-水
随着我国交通运输体系的迅猛发展,道路养护和修善的问题日益受到关注。阳离子沥青乳液凭借其施工温度低、低VOC、成本低廉和优异的粘结性等优点被广泛应用于道路施工过程中,而决定沥青乳液品质的关键因素是乳化剂。因此,设计、合成新型阳离子沥青乳化剂一直是高性能沥青乳液的研究热点。本文首先合成了一种含有环氧官能团的季铵盐中间体,然后使用该中间体对两种天然生物大分子进行接枝改性,成功制备了两种改性大分子阳离子沥
膜蒸馏(Membrane Distillation,MD)是一种将传统蒸馏方法与膜分离技术相结合的分离技术,在海水淡化、盐溶液浓缩结晶、纯水制备等工艺中具有较大的应用前景。但是潜在的膜污染问题会降低膜蒸馏的通量及效率,其中有机污染物对膜的污染是阻碍膜蒸馏技术在实际生产中应用的重要因素之一。金属有机框架(Metal Organic Frameworks,MOFs)是由无机金属中心与桥联的有机配体通过
有机磷农药作为复杂污染物的代表,在环境中广泛分布且对环境和人类健康危害严重。传统降解方式对反应条件要求苛刻,且单一方式难以彻底降解。作为绿色可持续催化的典型代表,酶催化和光催化在近年来得到了越来越多的关注。但生物酶和普通光催化剂难以回收、成本高昂、对复杂污染物降解效果较差等缺点限制了其广泛应用。本课题通过设计具有光催化能力、性质稳定、生物相容性好的载体,用于有机磷水解酶(OPH)的成功固定化,成功
合成芳胺类化合物主要通过偶联反应进行C-N键的建立,其中Buchwald-Hartwig交叉偶联反应是构建C-N键的重要方法。但是这类偶联反应大部分存在许多缺点,如催化剂用量大、配体结构复杂且较难合成等。虽然已经有许多催化效率高且选择性好的催化体系,但一些催化体系对水和空气等比较敏感因而不利于反应进行。因此制备选择性高、毒性低、能循环使用的催化体系,是C-N偶联反应的发展趋势。本文依Bippy P
从煤焦油中分离的混合二甲酚实用价值有限,通过催化加氢脱烷基方法将其转化为苯酚和甲酚等用途更为广泛的化工产品,是实现二甲酚综合利用的有效方法。微孔沸石具有能发生脱烷基反应的强酸位点,但狭小的孔道限制了反应物与产物的有效扩散,造成二次裂解,使得产物选择性降低。Al-MCM-41分子筛具有较大孔径结构有利于反应物的扩散,提高产物选择性,但其酸性较弱导致催化脱甲基反应活性较低。复合分子筛由两种或多种分子筛