大容量实时人脸检索系统及其任务调度算法的研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:suyihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展与智能电子产品的普及,可利用的数据量显著增长,使得大数据处理技术应运而生并快速发展。目前大数据处理的方式分为两大类,一类是流式的实时处理,另一类是批量式的离线处理。基于图像的人脸识别是大数据处理的一种典型应用,并且关于高识别准确度算法的研究已经成系统发展,但是大容量人脸图像数据下的实时人脸识别及检索技术却刚起步,亟待研究和解决。论文针对一个特定的大容量人脸图像实时识别及检索的需求,研究其大数据实时处理所面对的技术难点,设计并实现了一个自主、可控、高效、并发的系统平台,为大数据实时处理类工作提供了应用实例,具备参考价值。论文主要完成工作:1)测试分析大容量实时人脸检索系统的运行工作量、数据存储量及检索实时性方面的需求,确定分布式处理方案,分析测试并最终选择大数据流式实时处理平台Storm。2)设计分布式行键动态存储方案。分析单台年千万级别人脸抓拍图像数据与单表千万级别非结构化人物信息数据的特点,为提升检索效率、保证完整性,对大容量数据分布式存储框架进行比对分析,并基于HBase设计了针对性的分布式行键动态存储方案。3)设计了专业及平台松耦合的计算接口。为了把大数据专业计算及人脸识别算法更灵活地嵌入分布式平台,设计了专业及平台松耦合的计算接口,定义了JNI接口规范,并设计实现分布式并发动态调度机制,达到专业、动态、可替换的目的。4)设计并实现了一个大容量实时人脸检索系统。把人脸识别算法嵌入分布式平台,设计实现了人脸抓拍、照片抓取、人脸检测、特征提取、人脸检索的完整流程功能。系统在单进程5万张照片数据量下进行了加速比测试,最大加速比可达21.05。系统在50万张照片实际数据量下试运行,测得人脸检索平均耗时1.77秒,验证了系统的可行性与实时性。
其他文献
本论文主要对无线通信系统中的无源关键技术进行研究。提出了通过优化算法确定滤波器阶数及传输零点位置的方法,同时研究与设计了双模及多模带通滤波器,带有滤波特性的威尔金
目的探讨碱性成纤维细胞生长因子(b FGF)-壳聚糖载体诱导神经干细胞高比例向神经元分化的潜在机制。方法纯化后神经干细胞分别与单纯壳聚糖、可溶性b FGF和b FGF-壳聚糖载体共
目的探讨无创正压通气治疗重度急性左心衰合并II型呼吸衰竭的效果。方法 2011年1月-2014年1月,该院80例重度急性左心衰合并II型呼吸衰竭患者,根据随机数字法,将其分为对照组(
近10多年来,“失范行为”这一概念由大众媒体广泛传播。因此,“失范行为社会学”这门新兴的分支学科也开始受到人们的关注。一、失范行为社会学的形成作为社会学的一门应用
近年来,矿山地质灾害不断发生,给国家、矿山企业及广大人民群众造成了重大的经济损失和不良的社会影响,严重制约国民经济和社会的可持续发展。矿山地质灾害是地质灾害的一个
会议
在烽火连绵的山东抗日战场上,有这样一对夫妇,他们勤勤恳恳地工作,带领山东抗日根据地的军民同仇敌忾、共赴国难;他们志同道合地生活在一起,成为后人歌颂的革命爱情榜样;他们
结合Midas/GTS有限元分析软件,以某大型水电站围堰工程为例,通过计算分析得出了深厚覆盖层地基高土石围堰在完建期和蓄水期两种工况下的应力变形特性。结果表明:在两种工况下
[目的]了解红花超临界CO2萃取物的化学成分并检测其抑菌活性。[方法]采用气相色谱-质谱联用(GC-MS)技术对超临界CO2提取的红花成分进行分析,并采用滤纸片法检测萃取物对6种常见
民初南北政府对峙时期,国民外交运动持续高涨。南方国民政府所辖范围内的国民外交运动不仅规模大,而且其取得的外交成果也比较显著,这与南方政府的有力领导、与民众及时沟通,