【摘 要】
:
目的:著名建筑物如长城、天安门、凯旋门、埃菲尔铁塔等三维刚性物体,会在不同视点、光照、背景和部分遮挡情况下出现在各种图像和视频中。建筑物图像识别是利用已知集合
【机 构】
:
西安交通大学人工智能与机器人研究所,西安710049
论文部分内容阅读
目的:著名建筑物如长城、天安门、凯旋门、埃菲尔铁塔等三维刚性物体,会在不同视点、光照、背景和部分遮挡情况下出现在各种图像和视频中。建筑物图像识别是利用已知集合中的建筑物类别来标记任一幅图像中存在的建筑物。方法:本文从视觉词汇和视觉词典生成入手,以具有不变性的视觉特征如SIFT、PHOW作为视觉词汇的基础特征,利用K-Means对其进行聚类形成视觉词典。通过词袋模型统计每张图像词频,实现图像的特征表达。采用均值法、最近邻法和SVM支持向量机三种分类器分别实现建筑物图像分类识别算法。结果:本文建立了一个建筑物图像数据集XJTU-Building,它包含16个著名建筑物共1 755幅图像。在该数据集上,我们对所提出的算法进行了测试和性能比较,实验结果证明方法的有效性和可行性。结论:采用相同分类器时,采用PHOW特征的效果优于SIFT特征;在相同特征视觉词典条件下,SVM方法的效果明显优于KNN和均值法。
其他文献
溃坝问题由于其产生的巨大灾害而显得十分重要。溃坝水流模拟可以分为瞬间溃和逐渐溃。目前的水流模拟主要是研究瞬间溃。然而,作为应用最广泛同时也是溃决数量最多的坝型,土石
目的:三维模型重建习惯上是基于静态图像而不是视频,然而,重建视频中的三维模型可以有助于提高动作识别的精度。因此,本文提出了基于双反射镜视频的动作的形状恢复。方法:因为
随着坝工技术的发展,高坝建设进入快速发展阶段,水工隧洞的建设规模越来越大,同时也带来了一系列技术问题。导流洞在结构设计上通常需满足过流量大、内水压力水头高以及封堵期外
在目标精确定位的实际应用时,往往会由于倾斜拍摄物体而引入定位误差.本文针对这一问题开展研究,提出在世界坐标系下精确定位目标方法,即通过将图像坐标系中目标逆向投影到世
书法之美,呈现出线质之千姿百态、笔墨生发之玄妙,是方块汉字独有的艺术天地。在艺术的范畴中,古人作书,最讲究“势”的表现,作书得势,乃得生动。所谓灵动恣肆,似乎已给所书
纹理贴图作为一种有效的辅助造型工具在真实感建模、工业设计、娱乐、生物医学等领域应用广泛,一直是当前研究的热点。本文在研究纹理贴图过程中首先分析了基于离散指数
目的:基于图的半监督图像分类算法是半监督学习领域里的一个研究热点,然而较高的计算复杂度严重制约了其应用。当图像规模过大的时候,就必须要找到一种能够降低图规模的方法
蚯蚓纤溶酶(Earthworm Fibrinolytic Enzymes,简称EFE)是一组存在于蚯蚓体内的丝氨酸蛋白水解酶,具有纤维蛋白溶解活性或纤溶酶原激活活性,既能溶解陈旧血栓又能抑制新血栓形
随着我国筑坝技术的进一步提升,相关的研究也取得了国际领先成果。云南万家口子水电站碾压混凝土RCC拱坝为当前世界上第一高碾压混凝土拱坝,对其进行相关研究意义重大。
目的:数字半调的处理目标不仅要减少生成图像的瑕疵,使得黑白点的分布尽量均匀,还要求生成的图像具有一定的艺术效果,本文提出了一种基于六角形像素结构的Floyd-Steinberg算