论文部分内容阅读
随着信息社会的不断发展,军人接触互联网的机会已大大增加,军人在网络上的活动日益频繁。部分现役和退伍军人喜欢在一些网络论坛和社交网站(如QQ,人人网等)中上传自己的军装照片,这为军队的保密工作和形象维护带来了新的挑战。为此,我军出台了一系列规定规范军人在互联网上的行为。为了加强对军人网络违规行为的检测,本文围绕网络空间中的军装图片识别问题进行研究并提出一种基于多特征融合的军装图片识别方法,通过对军装图片的识别可以有效检测军人上网行为。该方法首先提取人体图像上部区域的颜色、纹理和局部特征,然后利用多核学习方法对多特征进行融合并分类。本文主要工作如下:(1)提出了基于稀疏SIFT和稠密SIFT描述子的混合SIFT-BOW特征表达方式。将一幅图像中的局部显著区域作为前景区域用稀疏SIFT描述,其余区域作为背景区域用稠密SIFT描述。在生成BOW特征时将稀疏SIFT作为主描述子,将稠密SIFT作为辅助描述子进行加权融合得到混合SIFT-BOW特征。混合SIFT-BOW特征表达方法结合了稀疏SIFT描述局部显著区域的优点和稠密SIFT描述平滑一致区域的优点,能够更准确地表达军装图像局部特征。(2)提出了一种改进的BOW模型ESWM-BOW来提取军装图片的局部区域特征,该模型基于一种新的视觉单词加权方法——熵空间加权图ESWM(EntropySpatial Weight Map)。空间加权图SWM根据视觉单词在图像中不同局部区域出现的频率计算而得。由于每个视觉单词在不同图片类中出现的概率可能不同,根据信息理论可以用熵来描述视觉单词的这种分类信息。因而在计算视觉单词权重分布时除了考虑该视觉单词在局部区域出现的概率大小外,再融入视觉单词在该区域的分类信息,得到熵空间加权图ESWM,ESWM可以进一步提升视觉单词的区分能力。(3)利用多核学习方法对多特征进行融合,提升军装图片分类器性能。首先为每种特征选择最适合的核函数,然后通过多核学习优化各核函数权重。与单一核函数的支持向量机相比,基于多核学习的支持向量机能够获得更好的分类性能。本文利用MATLAB对军装图片识别方法进行模拟,实验结果表明该方法能对常服军装图片进行有效识别,对光照变化、部分遮挡和身体姿态变化具有较强的鲁棒性,平均识别率达92.8%。