基于稀疏贪婪搜索的人脸画像合成

来源 :西安电子科技大学 | 被引量 : 6次 | 上传用户:telecom_god0221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸画像合成是通过机器学习对照片和画像之间的复杂映射关系建模进而利用该模型从照片合成画像的过程。画像合成对刑侦破案和数字娱乐具有重要的应用价值。例如,当案件发生后,由于环境或硬件条件的制约,警方无法获取犯罪嫌疑人的影像资料。此时,画家根据受害者或者目击证人的描述绘制的素描画像就成为犯罪嫌疑人照片的最优替代。将警方数据库中的身份证照片转换成对应的素描画像,再利用犯罪嫌疑人的素描画进行检索,从而缩小或锁定犯罪嫌疑人的身份。另外,随着社交媒体的发展,很多年轻人都希望自己的用户头像富有个性,因此各种风格的素描画便成为他们热衷的选择之一。此外,人脸画像合成还可作为其他计算机视觉任务的重要组成部分,比如人脸画像老化等。现有基于机器学习的人脸画像合成方法可分成两大类:模型驱动和数据驱动的方法。本论文致力于研究数据驱动的方法,针对现有数据驱动方法存在的一些不足,如对测试照片要求严格、需要依赖大量的训练样本等,进行方法的创新。本文的主要创新点可以概括为:1. 提出一种基于多照片-画像对的人脸画像合成方法。现有的数据驱动方法只考虑局部搜索策略,导致无法顺利合成测试照片独有的非人脸因素。此外,局部搜索要求测试照片和训练集中的图像对齐,限制了测试照片的要求。针对上述问题,提出一种基于多照片-画像对的人脸画像合成方法:第一步利用稀疏编码算法将图像块像素特征变成稀疏表示特征,提高算法对干扰的鲁棒性;第二步利用稀疏表示中每个稀疏系数的值以及稀疏系数编码的次序这两个信息对训练图像块建立搜索树,提高算法的搜索精度和速度;第三步利用测试照片的先验信息,结合图模型,通过贝叶斯推断进行人脸画像的合成。第一步和第二步简称稀疏贪婪搜索算法。实验表明所提方法相较于已有的数据驱动方法能更好更快的合成非人脸因素,而且对于任意的测试照片都适用。2. 提出一种基于单照片-画像对的人脸画像合成方法。现有数据驱动方法需要依赖大量的照片-画像对作为训练集。然而获取大量照片-画像对的代价很大,限制了已有方法的实际应用。此外,在某些极端情况下只有一个照片-画像对可用。针对上述问题,提出一种基于单照片-画像对的人脸画像合成方法:第一步对训练集中的单照片-画像对建立高斯金字塔,不仅增加了训练样本而且考虑了人脸结构的尺度信息;第二步利用稀疏贪婪搜索算法得到测试照片的初始画像,充分保持了基于多照片-画像对的人脸画像合成方法的优点;第三步利用由测试照片和初始画像以及已有的单照片-画像对所构成的新训练集,通过结合级联回归策略和图模型进行最终的人脸画像合成。实验表明所提方法能取得与最新数据驱动方法可比拟的结果,而且同样能合成非人脸因素且不限制测试照片的要求。3. 提出一种基于单目标画像的人脸画像合成方法。现有数据驱动方法需要依赖照片-画像对,不管是大量还是一对,都限制了合成任意风格画像的能力。针对上述问题,提出一种基于单目标画像的人脸画像合成方法。第一步利用稀疏贪婪搜索算法合成测试照片的初始画像;第二步利用多尺度特征寻找候选画像块;第三步利用基于多特征的最优化模型精选候选画像块;第四步利用级联回归策略对初始画像进行质量提升。实验表明所提方法能取得与最新数据驱动方法可比拟的结果。而且在以实验所列的风格目标画像作为训练集的情况下,所提方法对于任意给定的测试照片都能合成质量良好的对应风格画像,这使算法更加有利于数字娱乐。4. 提出一种基于统一框架的人脸画像合成方法。现有数据驱动方法在候选图像块搜索时只利用了局部搜索策略而上述所提方法则只利用了全局搜索策略。此外,已有方法在最终画像合成时大多利用了多个候选块的线性组合,导致合成结果有些平滑。而已有的高频重建策略都是模型驱动的方法,缺失画像风格信息。针对上述问题,提出一种基于统一框架的人脸画像合成方法:第一步将训练集划分为初始训练集和高频训练集;第二步给定测试照片利用局部搜索策略和全局搜索策略在初始训练集中进行候选图像块的搜索,充分利用局部位置信息和人脸全局相似性的信息,然后利用图模型进行人脸初始画像合成;第三步对给定的测试照片利用与初始画像合成相同的策略进行人脸高频画像的合成。将初始画像和高频画像相加得到最终的人脸画像。实验表明所提算法能同时合成非人脸部件和人脸部件,并且高频细节更加丰富。综上,本文本着训练样本从多到少、研究思路从偏到全的方式,提出以稀疏贪婪搜索作为基础的四种人脸画像合成方法,用于提升人脸画像合成的实用性。理论分析和实验结果表明了所提出方法相对于已有方法的优越性。
其他文献
本文从美学原理中的审美价值类型进行阐述,叙述了美学作为价值类型带给人们的心灵满足。其中悲剧美学作为审美价值类型的重要分支,反向触动人们的感官,并具有讽刺意味。通过
中职学校教育的基本目标就是以就业为导向来培养学生的综合素质。21世纪的社会人才济济,要想让中职生在以后的就业中占据优势,首先以就业为导向来培养他们的口语交际能力,掌
随着全球化市场竞争的日益激烈,制造企业愈加重视创新以及促使创新实现的知识。计算机辅助工艺创新(Computer-Aided Process Innovation,CAPI)能激发工艺人员的创新思维、辅
由于近年来公路工程施工力求速度不求质量的现象越来越严重,致使有的工程出现了各种各样的弊病,这种弊病严重影响了公路工程的质量。如何避免这种问题的出现,就成为了施工中首要
在互联网普及的背景下,选择上海微课信息科技有限公司,分析其客户导向,从收入来源、运营成本两个个角度,探讨在线教育相对于传统线下教育的区别,从而了解目前在线教育内容服
在鲁北大地上,有一座历史古城阳信。阳信的县名源于汉代名将韩信屯兵于笃马河之阳,是一个军事重镇。它同时也是山东乃至全国古旧和古典家具集散地,鲁北地区民家财富殷实,为子
期刊
随机支持模型试图以假设支持为随机变量的方式描述主观概率的校准。采用随机配对的60个中国城市户籍人口的比较任务验证了该模型对初中、高中和大学生的适用性。研究还表明青
象似性的发展由来已久,最先由符号学发展而来,随后渐渐地在认知语言学界发展起来。关于象似性的研究国内外主要集中在理论层面,象似性的实践分析也主要集中在现代诗歌。然而
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
图像信息是人类认识世界的重要信息来源,然而由于在图像成像条件和图像传输过程中存在各种不利因素致使图像质量下降,从而影响图像的使用及其后续处理.如何从退化图像复原出