论文部分内容阅读
随着人类社会生产力的不断发展,人类生活、生产及科研的活动越来越复杂。分类识别是人类生活、生产及科研中最基本最重要的活动之一。利用机器实现自动模式识别是人类生产力进一步发展的要求。随着计算机的出现,人工智能的兴起,自动模式识别迅速发展并成功地应用于工业、农业、国防、科研、医疗卫生、气象、天文等许多领域。这些成果很大程度上取决于不变量相关理论和方法的发展。模式识别的一个核心问题是如何构建恰当的不变量。恰当的不变量可在区别不同对象的同时辨识同一对象的不同形态或模式。然而目前模式识别领域的不变量相关研究仍面临着诸多挑战,比如如何更高效率地计算已有的不变量,如何设计复杂形变下的比如弹性形变或投影变换下的恰当的不变量以及如何组合不变量以更高效地进行模式识别等问题。本文首先回顾了模式识别领域的不变量研究历史和现状,在总结前人工作的基础上提出了一种新的不变量定义和求解方法,即隐性不变量定义和求解方法,为模式识别领域不变量的研究开拓了一个新的思路。同时,对上面提到的模式识别领域的不变量研究存在的若干挑战分别做出了相应的研究。本文的主要内容及贡献如下:本文提出了一种在大规模点集下求解模式识别领域的一个基本不变量——凸包的高效算法。在回顾总结当前凸包求解算法的原理的基础上,本文模拟人类视觉注意机理,设计了一种快速求解大规模点集的凸包的算法。算法的核心思想是快速排除模式初始凸包质心附近的大量冗余点。与当前几个最好的凸包算法的比较实验结果表明该算法在求解大规模点集的凸包时性能卓越。弹性形变或投影变换下的不变量设计是模式识别的一大难点。本文设计了一种基于点集拓扑结构的不变量。我们首先对点集进行环向的凸包分层分解,然后再依据凸包顶点分布对各凸包分层进行径向的分区,最后通过统计各分区内点的数量来求得不变量。当形变不破坏点集的拓扑结构时,该不变量均可保持不变。这些形变包括了投影变换和一定程度的弹性变换等。此外,该不变量还可抵抗一定程度的噪声。本文在对模式识别原理进行总结回顾的基础上,提出了一种新的不变量定义和求解方法。该方法的核心思想是通过设计基于形变的函数并解决该函数的最优化问题从而得到模式的归一化状态,即模式的隐性不变量。该方法的两个应用要素是设计一个定义在形变上的函数和求解该函数的最优化问题。本文给出了该方法在仿射变换下的一个应用框架算法,并成功地将该框架算法用于路牌的自动识别。如何将各种不变量进行优化组合,构建性能更好的模式分类器,也是不变量在模式识别中应用的一个重要命题。决策树算法是解决不变量的优化组合问题的有效工具。本文提出了一种新的决策树算法,逆向快速决策树算法,以提高决策树算法实时生成组合不变量用以标识并匹配模式的能力。该算法从目标函数出发,采用一种新的分类性能度量标准,该标准主要考虑不同属性对应的样本分布偏置的快慢。实验结果表明该算法生成规则的效率优于传统的ID3决策树算法。本文为模式识别领域的不变量相关理论和方法的研究开辟了新的思路,为自动模式识别的探索和应用提供了一些有意义的参考。