K-Means聚类算法的优化及在图片去重中的应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cxycsnf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云存储服务高速发展及普及,多媒体数据如图片、视频等越来越成记录和分享信息的主要方式。与传统文字记录相比,图片等多媒体数据存储所占用存储空间要大得许多。因此在应对图片等多媒体数据时,如何有效的对图片去重,减少存储图片的容量也是一种新的挑战。研究观察发现在主流的社交网站(如facebook、qq、百度云)中,相似性图片在总图片数量集中占据很大比例。相似性图片其定义为经过图片的常见变换,例如图片的连拍、水印、裁剪、缩放等操作得到的一系列图片。针对这一发现,设计出一种图片去重系统。图片去重系统可以分为两部分。第一部分,将图片集进行相似性聚类,对图片集进行基于内容的图片检索。在图片检索技术方面,先将图片进行预处理,提取图片局部特征值,对提取的所有特征值执行K-Means聚类算法,将最终的聚类中心作为BOW(Bag-of-Words)模型的视觉单词,用视觉单词对SIFT特征点集进行量化处理,从而达到一张图片只需要用一个特征向量表示。最后采用倒排索引方式,将相似性图片进行聚类。第二部分,由于已聚类好的相似性图片其相似度很高,采用视频流压缩算法对图片进行压缩,极大减少图片存储容量。K-Means聚类算法是图片相似性聚类过程中的关键技术,其执行速度与结果将直接影响相似性图片压缩效果。换句话说,K-Means聚类算法会是整个系统的一个性能瓶颈。当处理大数量特征点时,标准K-Means聚类算法中数据点n和中心点k值会变得相当大,从而使得K-Means聚类算法效率变得低下。设计实现一种K-Means聚类算法优化方案,使其能够在面对大数据量n和k值情况下,降低算法时间复杂度,提升K-Means算法执行效率,因而应用于图片去重系统中提升系统执行速度。最后根据实验测试结果显示,优化的K-Means算法在大数量级下有较好的性能提升。
其他文献
住户无酬服务主要是指居民(住户成员)为自身和家庭其他成员的最终消费而提供的没有货币报酬的服务,如房屋和家庭耐用品的清洁与保养、膳食的制作、儿童的照顾和教育、病人与
作为中国最大并且最具竞争力的保险公司之一,CPIC以其前瞻性的眼光,聘用世界知名的咨询顾问企业为CPIC制定未来3-5年内IT的策略与规划。作为未来CPIC技术基础类项目之一的终
<正>1电梯事故概述2016年7月某日上午8:40左右,某电梯公司接到电梯报修电话,称某小区2号楼东单元南侧电梯(以下简称事故电梯)发生故障,无法正常运行,于是该电梯公司派员工姜
移相器在相控阵雷达,现代移动通信,卫星导航系统之中都发挥着重要的作用。尽管其已经发展了几十年,但在带宽、体积和成本等方面仍然存在着各种不足。研究和设计新型且实用的
现代社会大型复杂建设工程越来越多,室内3D GIS应用需求旺盛,但海量室内3D数据的缺乏成为室内GIS应用瓶颈。建筑信息模型(Building Information Models,BIM)提供丰富的建筑空
自9·11事件发生以后,因恐怖袭击引起的航空器对地(水)面第三人的损害赔偿问题也成为国际民航组织关注的重要议题,国际民航组织积极推动了罗马公约(1952年《外国航空器对地(
<正>【教学内容】人教版四年级下册第五单元。【教学过程】一、课前谈话,引起兴趣同学们,"分类"在我们的生活中处处存在。今天老师给大家带来了几个分类的例子,我们一起去看
<正>下载地址:http://itunes.apple.com/cn/app/magicplan/id427424432?mt=8无论是新房装修还是旧房改造,对普通人来说都是一件麻烦的事情,往往把这些东西甩给装修公司来做,
追溯创客教育的源起,可见其既起于草根,但又内涵丰富,为基础教育带来了“创 新、实践、合作”的新气象.通过提出对创客教育的理解以及具体教学主张,追求一种融合、开放、均衡