论文部分内容阅读
在机器学习中,按照降维方法中是否使用先验信息以及使用先验信息的比例可以将其分为:有监督学习、无监督学习和半监督学习。针对无监督学习的缺点(如对初值依赖性过强,需要预先输入参数,算法复杂程度高)给出了一种基于密度扩张的无监督学习算法,通过针对典型的Iris数据集和Fossil数据集的仿真结果可以清晰地看出,本文提出的算法平均聚类时间比较短,聚类精度有明显的提高。近些年来,随着数据的收集和存储技术高速发展,收集到大量的数据已变得越来越容易。大量的数据往往表现出很明显的非线性特性,为了很好地解决这一问题,人们提出了流形学习算法。流形学习算法只利用了数据及内部的几何结构,而没有考虑样本的类标记信息的作用,因此是一种无监督学习。有监督流形学习只利用了样本的类标记信息,而没有利用数据集的几何分布结构信息。然而在实际应用中,大量的有标记信息的获取是一件很难完成的工作,需要投入很大的人力和物力来完成对样本类别信息的标注工作。因此,半监督流形学习算法越来越多地得到了人们的关注。然而传统的半监督流形学习算法对类别信息要求比较高,因此,在实际应用中受到了一定的限制。针对这一问题,本文提出了一种基于边信息的局部线性嵌入算法。该算法只需知道部分样本之间的类别属性关系(正约束、负约束),而不需要知道样本的具体类别信息。这从很大程度上降低了样本类别信息获取的难度。通过在经典的人脸数据库上的仿真结果,可以看出该算法的有效性。为了验证该算法应用价值,将该算法应用于实际光通讯的绝对式光电编码器精码故障诊断中。采用小波变换提取监测信号的特征,以区分不同的故障类型,通过对编码器信号的预处理电路进行仿真获得训练的样本。经测试,上述方法可以准确地确定绝对式光电编码器的故障类型,并有较好的泛化能力,简化了光电编码器的地面调试工作,为译码电路参数调整和备份信号的启用提供依据,可提高其在空间应用上的可靠性。在对现有的流形学习算法研究分析的基础上,针对典型的流形学习算法搭建了一个仿真平台,通过该仿真平台可以很好地分析这些典型算法的性能,便于理解抽象的流形学习理论。