论文部分内容阅读
中医舌诊是望诊的重要组成部分,舌象的变化能较客观而真实地反映病情。然而,传统的舌诊方法受主观因素和环境变化的影响较大,为此,舌诊的客观化研究逐渐受到重视。
舌质、舌苔颜色分析是舌诊客观化的重要内容,至今基于模式识别的舌色、苔色自动分析取得了一定的进展。在众多分析方法中,有标记的舌象样本数量较少,SVM分类器成为一个较好的选择。由于舌象样本种类多,且有标记舌象样本须通过专家标定,获取代价高,样本数量较少;而无标记舌象样本容易获得,数量较大。因此舌象样本中存在大量的无关样本和无标记样本,这些样本隐含着一定的分类信息,而传统的SVM舌象分类器训练中未考虑加入这些样本。到目前为止,尚未见引入无关样本与无标记样本参与训练来提高舌象分类器性能的文献报道。因此,本论文针对该问题展开研究,期望进一步提高舌象分类器的性能。
本论文尝试将加入无关样本的Universum SVM、加入无标记样本的S3VM以及同时加入无关样本和无标记样本的3C-SVM三种不同的标准SVM扩展方法应用到舌象样本的分类中,取得了较好的效果。研究表明,并不是所有的无关样本都可提高分类器的性能,因此对无关样本选择进行了研究,实现了一种有效的IBU选择算法。由于无关样本和无标记样本一般包含着样本分布的先验知识,可提供更多的分类信息,从而获得了更好的识别结果。
分类器的模型参数对分类结果有直接影响。本论文针对引入无关样本与无标记样本的SVM中参数较多的特点,选择了粒子群算法对其进行优化选择。该方法概念简单、计算效率高且受问题维数变化的影响较小,其中粒子适应度函数的选择是其关键。考虑七遍交叉验证法的估计无偏性,本论文利用交叉验证误差作为评价粒子优劣的适应值。通过对参数优选前后测试样本识别正确率的比较,验证了该算法的有效性。
在上述研究的基础上,分析了加入无关样本与无标记样本的多类SVM在舌象分类中的可行性。本论文尝试实现了一种加入无关样本与无标记样本的OAA方法对舌色与苔色进行识别,取得了较好的效果。最后按照舌色苔色的描述规则,实现了对舌象特征的描述。理论分析与实验结果均表明了该算法在舌象样本分类中的有效性。