【摘 要】
:
在模式识别中多维数据分类是一个重要的研究课题。如今,分类算法存在一些问题:传统的分类算法需要大量计算的问题、分类识别的目标更加复杂的问题、分类结果的可解释性差、分
论文部分内容阅读
在模式识别中多维数据分类是一个重要的研究课题。如今,分类算法存在一些问题:传统的分类算法需要大量计算的问题、分类识别的目标更加复杂的问题、分类结果的可解释性差、分类过程的不可知性等问题。为了解决上述问题,本文研究了怎样以多元图图形特征基元表示和特征融合、特征提取技术为手段来降低分类算法的计算代价及实现分类结果可视化、分类过程可视化,并且提出了基于多元图图形特征基元表示的多维数据可视化分类的一般性方法。首先,在深入分析多维数据多元图表示原理的基础上,对多元图形特征进行了更加深入的挖掘。针对维数在3~15维之间(小高维数据)的数据,根据全息分类(不舍弃任何一个特征信息)的思想,提出了多元图表示和特征提取、变量融合相结合的多维数据可视化分类方法。此方法首先采用径向坐标图表示多维数据,不同类别的多维数据形成的多元图也各不相同,然后应用单原型图形分类器对径向坐标图形进行自动识别。最后进行实验,证明此方法的有效性。其次,针对维数在15~30维之间(中高维数据)的数据,为了实现多元图形的自动识别,需要研究多元图图形的描述方法和有利于机器判别的特征。为此,本文提出了一种特征提取、特征融合与多元图图形特征基元表示相结合的可视化分类方法。该方法先对数据进行特征提取,从而实现多维数据的降维,为了不损失数据信息,将其余的数据进行矢量模长融合,最后进行可视化表示,得到利于分类的标准模板,最后,在此基础上对于维数远大于30维(大高维数据)的数据,本文采用分层、递阶的方法将数据进行多元图表示,也可以将此方法推广到维数更多的数据分类情况。最后应用经典数据集进行实验证明此方法,实现了分类过程、分类结果可视化,并且取得较高的分类精度。
其他文献
将COREX工艺所产生的大量有价值煤气进行改质后,用于竖炉生产DRI/HBI是其尾气能量利用的重要方向之一,其好处在于改善COREX尾气COREX尾气能利用,开发气基竖炉还原工艺的新还
本文对心肌细胞内钙火花反常扩散的动力学模型进行了研究。文章建立了细胞内钙信号亚扩散的两种动力学模型,通过将数值模拟结果和实验结果对比,确定了与实验吻合的钙信号亚扩散
在人工髋关节置换中,置换重建的成功与否不仅取决于外科手术,更主要受假体设计的影响。假体的几何形状和材料性质决定着假体和股骨的应力状况。尤其是假体的几何形状设计,一直是
腹膜透析动力学用流体力学和传质力学的原理来解释和描述透析过程中物质跨腹膜转运的机理和过程。它是腹膜透析的基础,相关研究对腹膜透析的治疗有重要的指导作用。我们分析了
视觉信息的初级处理发生在视网膜,视网膜将外界视觉刺激的光信号转换为电信号,在神经节细胞上形成动作电位,经视神经进一步向中枢传递。研究神经节细胞的响应特性和编码方式
该课题确定了利用散体物料电特性与含水量的关系,研究以散料电特性为基础的测水理论,解决工、农业生产急需的测水问题.该课题重点对白支石、精矿粉、石灰石、煤粉、机烧灰、
现行稀土氟盐体系电解多采用REF-LiF或REF-LiF-BaF,因LiF易挥发且 价格昂贵而使电解质成本高.该文提出采用廉价的REF-NaF-LiF体系,通过对体系熔盐 性质和电极过程的研究,表明
梅山炼钢厂于1999年4月投产,具有两座150吨顶底复吹转炉和一台两机两流1350mm的板坯连铸机,其40吨中间包是国内大型中间包之一.为了了解和研究此类中间包的冶金特性以及技术
该文尝试用氨水、草酸、草酸铵作沉淀剂制备纳米氧化铈粉末,并利用XRD、TEM、BET进行表征.用成型结果表明,60Mpa为团聚体破碎的临界压力,为了获得高密度的素坯,需增加成型压
科技发展日新月异,教育教学已经进入现代化进程,多媒体技术普及到我们的日常教学中.在初中数学教学中应用多媒体技术辅助教学,能弥补传统教学手段的不足,为学生呈现生动、直