智能虚拟人生成引擎设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:kkufo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪,随着智能手机、GPU硬件的更新迭代,计算机图形学已广泛地运用在生活和工程中,手机游戏凭借渲染算法获得良好的视觉效果,高级渲染效果甚至可以很好的模拟真人的外观。“智能虚拟人”是三维渲染与人工智能结合的产物,表现结合智能算法,拥有一定自主学习能力于可交互性的虚拟角色,虚拟人的研究可以为探究人类自身的智能提供了参考,同时虚拟人具有一定应用值,可用于智能服务,虚拟主播等。随着三维相关的人工智能技术的发展,一些神经网络可以从视频中快速估计人物姿态,为智能角色的互动性,自主学习动作资源提供了可能。进行三维角色的智能开发,可以选择大型三维引擎,如虚幻引擎,但存在一定局限性:功能冗余、占用空间大、源码抽象、架构复杂等。自制引擎具有较小的体积,灵活的可定制性,比较利于算法研究。本论文以结合深度学习、识别算法对虚拟角色进行控制与展示为核心,设计并实现了一个轻量级的智能角色开发引擎,该引擎结合了Qt和Imgui两种界面库,通过Direct X12进行延迟渲染管线搭建,能够快速地定制渲染功能。引擎通过ECS组件系统来进行组件开发,以满足不同控制系统的伸缩性,可扩展性。本文设计了一套智能控制框架,通过对外界输入的识别,将识别数据在驱动层转化为驱动数据,最后将驱动数据广播到各个控制组件,实现智能角色控制,最后,针对姿态模拟和语音控制两种方式,在该引擎中实现了可交互性的虚拟角色,该角色可以通过外界视频输入学习动作,并通过语音输入进行动作调用。本文首先引出一些交互性智能技术以及三维引擎的研究、应用背景,对国内外的研究现状进行阐述,给出各个章节的内容概要;然后对该引擎进行了需求分析和总体设计,介绍控制框架的设计与实现;接下来对三维角色的动画渲染相关技术进行介绍,并对各个模块,包括:组件模块、渲染模块、动画模块、场景管理模块、资源管理模块的相关技术进行介绍和实现;最后对引擎各模块进行了功能测试,并对本文的工作进行了总结,并对后续的发展进行了展望。
其他文献
近年来,深度神经网络模型已经能在各种分类任务中达到很高的准确率,然而最近的研究表明,深度神经网络容易受到对抗样本的攻击,攻击者只需在干净样本中添加一些人眼无法识别的微小扰动,就可以生成对抗样本,从而轻易地使深度神经网络模型对其产生错误分类,随着深度神经网络广泛应用于各个领域,对抗样本使这些深度神经网络系统面临巨大的安全威胁。因此,为了减少对抗样本对神经网络的影响,提高神经网络的鲁棒性,对深度神经网
随着智能交通系统的不断发展,我国的交通管理也在不断进步,现已有很多城市普及安装了一体化自动识别车牌系统。车牌识别是智能交通重要的一环,往往起决定性作用。车牌识别应用现状主要在固定的条件下进行,如对小区门口进出车辆的车牌识别。随着适用场景范围的扩大,车牌识别技术面临着更多的问题。目前,摄像头拍摄的图像采集技术已经相当成熟了,但当应用场景的需求扩大后,车牌定位和识别技术仍然需要进一步发展。随着人工智能
命名实体识别和关系抽取是自然语言处理领域中两项主要的信息抽取任务,旨在从无结构文本中抽取实体和关系,由它们共同组成的关系三元组可以直接应用于知识图谱的构建,同时也在信息检索、问答系统等上层应用中起着至关重要的作用。通过对现有算法的设计思路和建模机制进行深入分析后,发现这些方法存在以下几个不足之处:第一,传统研究方法将命名实体识别和关系抽取以管道的方式分两步处理,采用两套不同的模型结构及参数,割裂了
语音识别系统已经成为了人们工作、学习和生活中行之有效的工具。智能手机微信的语音输入辅助、智能家居的声控电视、声控的行车导航系统和自动会议语音转录系统等都是它可以被应用的场景。但语音识别系统仍有不少瑕疵,这使它不能很好的落地和应用到需要的场景中去。变化的噪声类型、低信噪比和说话人种类等声学条件极大地影响了语音识别系统的性能。因此,一个好的语音增强模块可以成为语音识别系统重要的前端。但是,基于映射的语
卷积神经网络近几十年有了很大的进展,性能越来越强劲,应用场景越来越多。但是与此同时,卷积神经网络的结构也变得越来越宽,越来越深,参数量越来越大,这对运行该卷积神经网络的设备的算力和内存资源也提出了要求。这种情况很大程度上阻碍了其实际应用。因此,对神经网络模型进行压缩,使得性能优异的神经网络模型也能在资源有限的条件下使用,这对于深度学习算法的应用意义重大。在本文中,我们提出了两个对卷积神经网络的结构
近年来,伴随着生成对抗网络的进一步发展,我们日常生活中的越来越多现象都可以结合生成对抗网络来进行“智能创造”,比如图像领域中的从语义生成图片、图片风格化、图片特征编辑等创新型工作。本文则是对图片特征编辑这个领域中的人脸老化/年轻化预测的工作进行系统性的探究。在调研了国内外近年来的相关研究课题后我们发现,当前的人脸老化/年轻化预测算法还存在着生成图片清晰度不够、个人身份特征在转换过程中损失较严重、年
Spiking神经网络(SNN)模仿了大脑中神经元通过自适应的突触连接发射脉冲进行信息转换的机制,被誉为第三代神经网络。相比依赖高耗能图形卡进行训练的传统神经网络,由于脉冲(spike)在时间和空间上是稀疏的,Spiking神经网络可以通过低功耗的专用硬件进行实现。Spiking神经网络已被用于图像识别,目标检测和语音识别等领域。如何让Spiking神经网络达到媲美传统神经网络的表现是目前研究的热
随着科技的快速发展,现代技术的不断更新交替,出现了越来越多复杂智能电子设备。但在长期使用智能电子设备的过程中往往伴随着出现一定程度的损耗和故障,所以对电子设备进行故障预测成为了工业运用领域关注的重点和难点,在学术界也对其出现的难题进行了大量的研究。在现阶段中,对于处理时间序列,许多方法都是利用点过程或者传统的时间序列处理方法进行时间预测。这往往需要高质量的数据和提前设定好参数化的模型并设定一定范围
强化学习是机器学习领域的一个重要分支,它通过模拟生命体大脑的学习思维模式来学习行动策略。与传统的学习方法不同,强化学习中的智能体在学习时不被直接告知需要采取哪些行动,而是得到这些行动带来的即时奖励学习一个策略最大化这些奖励。通过“试错”和“延迟奖励”这两种方式,强化学习能够处理很多传统机器学习很难处理的高交互性,决策性问题。深度强化学习在强化学习的基础上,把深度神经网络运用到其中。这可以解决传统强
群体智能灵感来源于生物群体的智能行为,蚁群优化算法和遗传算法是两种典型的群体智能算法。受益于其分布式求解方式,群体智能可由忆阻网络等硬件电路实现并行。忆阻器是一种非易失、可编程的新型电路器件,在物理上具有诸多优良特性。相较于传统存储计算异地的计算模型,忆阻器可实现内存计算模型(存储和计算同地完成),消除内存与计算单元间的传输代价。因此,忆阻网络被应用于深度神经网络和群体智能等算法的并行计算与记忆计