基于动态拓扑图的人体骨架动作识别算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:redfox1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的人体骨架动作识别算法采用手动构建拓扑图的方式来建模包含在多个视频帧中的动作序列,并针对性地学习每个视频帧以反映数据变化,这容易造成计算代价大、网络泛化性低和灾难性遗忘等问题.针对上述问题,提出了基于动态拓扑图的人体骨架动作识别算法,使用持续学习思想动态构建人体骨架拓扑图.将具有多关系特性的人体骨架序列数据重新编码为关系三元组,并基于长短期记忆网络,通过解耦合的方式学习特征嵌入.当处理新骨架关系三元组时,使用部分更新机制动态构建人体骨架拓扑图,并采用基于时空图卷积网络的骨架动作识别算法来实现动作识别.实验结果表明,所提方法在Ki netics-Skeleton,NTU-RGB+ D(X-Sub)和NTU-RGB+ D(X-View)基准数据集上分别取得了40%,85%和90%的识别准确率,提高了人体骨架动作识别的准确率.
其他文献
上市公司年报中的描述性文本信息是上市公司信息披露的重要组成部分,通过对上市公司信息披露文本的挖掘与分析可以提高对其财务风险的预测能力.基于BERT(bidirectional encoder representations from transformer)模型与自编码器(autoencoder,AE),提出了BERT-AE融合文本特征提取模型,提取A股市场531家上市公司年报中“经营情况讨论与分析”和“审计报告”的文本特征,构建能够反映财务困境公司与正常公司的文本特征指标,随后将文本特征指标与财务指标数
在人到货订单拣选系统中,客户下达订单后将由拣货员穿梭仓库进行拣选.在仓库的拣选设备容量和拣货人员数量有限制的条件下,研究在线订单分批优化问题,预防订单过早或延迟服务,以最短的时间完成拣货任务.构建考虑最小拣货路径的在线订单分批规划模型,以最小化平均有效订单服务时间.提出一种基于规则的启发式算法来求解模型,其中包含k-means聚类算法和遗传算法,分别处理订单的分批和拣选路径的规划.最后利用具体算例进行模拟计算,实验结果表明,与传统固定时间窗启发式算法相比,提出的基于规则的启发式算法能够显著提高拣货效率.
为解决复杂融合空域内的无人机(unmanned aerial vehicle,UAV)冲突解脱过程中消耗大的问题,提出基于速度障碍法的合作型无人机的最优防相撞策略.首先根据有限时间的速度障碍法进行冲突探测,并推导出解脱条件下冲突双方航向改变量与速度大小改变量满足的关系,再将合作博弈概念用在冲突解脱过程中,利用最优化理论,将联盟福利最优解作为博弈双方最优解脱策略.该冲突解脱算法基于无人机冲突双方最小机动与满足自身性能约束的原则,实现支付代价最小前提下的实时冲突解脱.仿真结果表明该算法在不同冲突场景下具有可行
微表情指当人们试图隐藏或抑制自己的真实情感时,脸上出现的一种无法控制的肌肉运动.此类情绪面部表情由于具有持续时间短、动作幅度小、难以掩饰和抑制的特点,因此其识别精度受到了制约.为了应对这些挑战,文中提出一种结合特征融合和注意力机制的微表情识别方法,同时考虑了光流特征和人脸特征,通过进一步加入注意力机制来提升识别性能.该网络由3个部分组成:1)提取每个微表情片段中Onset到Apex的光流与光学应变,将垂直光流、水平光流、光学应变输入到一个浅层3DCNN中,以提取光流特征;2)以深度卷积神经网络ResNet
为简化嵌入式开发人员更新RISC-V处理器固件的操作流程,提出了一种易操作、高效且稳定的固件更新系统设计方法,包括BootROM引导流程设计和在应用中编程(in-application programming,IAP)设计.在BootROM引导流程设计中,通过启动参数再配置的方法,可使此引导流程兼容多种启动模式,如SRAM启动、主内存启动.在IAP设计中,处理器先通过通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接收从上位机发送过来的
真实的数据是支撑智慧水务系统正确决策的前提条件.针对联盟链、公有链吞吐量低的问题与智慧水务中数据量大的特点,以某智慧水务框架下的海绵城市运行监管平台为例,设计并实现一种基于私有链的数据监管方法.该方法以传感器实时数据构建哈希树,将哈希树根交给时间戳服务器签名;时间戳签名、时间戳、哈希树根等存储在私有链区块头中,其余哈希树非根顶点存储至区块体中.以此私有链作为运行监管平台时间序列数据的证明文件,具有签名很难伪造和证明文件伪造成本高的特点,可达到证明文件难以被篡改,且可高效检测出被篡改数据的目的.实验结果表明
计算机视觉技术是人工智能技术的重要组成部分,也是计算机科学与信号处理研究的前沿领域.计算机视觉经过近年来的不断发展,在交通、医学、工业等多个领域得到了广泛应用.我国计算机视觉领域的研究者众多,研究成果在国际上具有很大的影响力,及时、集中、全面地报道计算机视觉相关理论、应用实践的最新成果与进展,以便研究人员快速、系统地了解新技术的发展动态和脉络,是策划本次专题的初衷.
期刊
深度学习技术的快速发展为深度伪造的研究提供了强有力的工具,人眼越来越难区分伪造视频图像的真假.伪造的视频图像会对社会生活造成巨大的负面影响,如:金融欺诈、假新闻传播、人身欺凌等.目前,基于深度学习的假脸检测技术在多个基准数据库(如FaceForensics++)上已经达到了较高的准确率,但在跨数据库上的检测精度远低于源数据库内的检测精度,即许多检测方法难以推广到不同的或未知的伪造类型上.专注于基于深度学习的人脸伪造检测方法泛化性研究,首先对伪造检测常用的数据库进行简单介绍和比较;其次从数据、特征和学习策略
深度伪造可以将人的声音、面部及身体动作拼接,从而合成虚假内容,用于转换性别、改变年龄等.基于生成对抗式图像翻译网络的人脸性别伪造图像存在容易改变无关图像域、人脸细节不够丰富等问题.针对这些问题,文中提出基于改进Cy-cleGAN的人脸性别伪造图像生成模型.首先,优化生成器结构,利用注意力机制与自适应残差块提取更丰富的人脸特征;然后,借鉴相对损失的思想对损失函数进行改进,提高判别器的判别能力.最后,提出基于年龄约束的模型训练策略,减小了年龄变化对生成图像的影响.在CelebA和IMDB-WIKI数据集上进行
在计算机视觉领域中,三维人脸重建是一个具有研究价值的方向,高质量地重建出三维人脸在人脸识别、防伪、游戏娱乐、影视动画和美容医疗等领域具有重要的意义.近二十年来,虽然基于单幅图像的三维人脸重建领域已经取得很大的进展,但使用传统算法进行重建的结果仍会受到人脸表情、遮挡、环境光的影响,并且会出现重建效果精度不佳和鲁棒性不足等问题.随着深度学习进入三维人脸重建领域,各种优于传统重建算法的方法相继出现.文中首先重点介绍了基于深度学习的单幅图像三维人脸重建算法,将算法按不同的网络架构分为4类,并对各类最具有代表性的方