【摘 要】
:
高维数据降维是通过线性或非线性映射将数据从高维空间映射到低维空间,使得映射到低维空间的数据尽可能保持原有数据的内在几何结构和拓扑结构。数据降维可去掉冗余和不相关
论文部分内容阅读
高维数据降维是通过线性或非线性映射将数据从高维空间映射到低维空间,使得映射到低维空间的数据尽可能保持原有数据的内在几何结构和拓扑结构。数据降维可去掉冗余和不相关数据,减少数据量,它在分类、可视化等众多领域得到广泛的应用。本文在经典的线性判别分析方法基础上,将半监督类别信息融入到线性判别分析方法中,提出一种新的半监督线性降维方法,并将新提出的方法应用到不完全数据的降维问题中。本文主要研究工作如下:1.本文首先介绍了几种线性判别分析的改进算法,然后介绍了几种不完全数据的预测算法并对这几种算法的优缺点进行分析。2.现有正则化线性判别分析方法在构造正则项时只针对数据的局部几何结构,并没有考虑到数据类别信息,导致分类效果不好。针对以上问题,本文将数据的半监督类别信息引入到线性判别分析方法中,通过构造同类近邻图和异类近邻图,并最大化类间离散度和最小化类内离散度,提出了一种基于半监督类别信息的线性判别分析方法。该方法克服了正则化线性判别分析方法在构造正则项时没有考虑同类近邻点和异类近邻点几何结构的不足,具有很好的类别保持能力。3.在数据采集和获取过程中,由于受到环境因素和人为因素的影响,获取到的数据往往含有缺失值。不完全数据降维的常用方法要么忽略不完全数据,仅对完整数据进行降维,要么采用统计方法,先对不完全数据进行估计,然后再降维。本文利用新提出的基于半监督类别信息的线性判别分析方法,对不完全数据进行预测的同时实现高维数据的降维,这种兼顾了不完全数据预测和降维的方法,提高了不完全数据的分类精度。
其他文献
本研究以不育系黔糯1A、蓉18A和内香6A,与糯恢11、蜀恢527、黑919、红1130等8个恢复系,按3×8NCⅡ遗传设计方式配组成了24个杂交组合。在贵州省的贵阳、凤冈和黎平3个试验点对杂交组合的稻米品质和农艺性状的配合力效应进行了研究,其结果如下:1.通过对24个组合的食味研究发现,糯性组合的食味值较高,其中全糯组合的食味值最高;亲本之一具有糯性的组合食味值次之;亲本都不具有糯性的组合食味值
该翻译实践报告的原文本选自复旦大学社会科学基础部、思想政治教育专业的博士生夏兰的《民国时期现代大学制度演变研究》。首先,笔者在此翻译报告中对我国古代大学制度的改
目的:研究胃癌组织中E-cadherin、MMP-9、TIMP-1的表达与胃癌生物学行为的关系,以及三者在的相关性。材料与方法:应用免疫组织化学方法测定46例标本中E-cadherin、MMP-9及TIM
关注当地地形特征、与自然的互动和人的现场体验,西班牙RCR建筑师事务所的作品,展示了现代主义建筑在当代技术支撑下的旺盛生命力。本论文中,我采用了理论研究和案例分析相结
随着科技的发展和即时通讯软件的进步,信息化管理浪潮席卷而来,信息化成为企业发展的必然潮流。企业可以通过信息化建设、计算机和通讯软件的联合来搭建一个信息管理平台,这
目的:构建稳定过表达Notch1的胞内段(Notch1 intracellular domain,NICD)的牙周膜干细胞,探讨过表达NICD基因对人牙周膜干细胞(periodontal ligament stem cells,PDLSCs)增殖能力的影响。方法:复苏课题组前期冻存的人牙周膜干细胞,进行传代培养,35代用于实验。构建含NICD基因过表达的逆转录病毒颗粒,并将其转染至牙周膜干细胞,嘌
放射治疗的目的是在尽可能减少正常组织损伤的同时最大限度地杀死肿瘤细胞。治疗过程中病人摆位不当,使得病人治疗位置与放疗计划中的预定位置之间存在误差,导致正常组织受到
目的:本研究的目的是检测并探讨谷红注射液及其有效活性成分羟基红花黄色素A(HSYA)对过氧化氢(H_2O_2)及高氧化低密度脂蛋白(ox-LDL)诱导人冠状动脉内皮细胞(HCAEC)损伤的保护作用。方法:本研究通过用高ox-LDL诱导处理HCAEC来模拟动脉粥样硬化的过程。首先,用甲基四唑蓝(MTT)比色法检测了不同浓度的的谷红注射液、H_2O_2、ox-LDL、HSYA、高ox-LDL对HCAE
长余辉材料是一种重要的能量储存材料,因其具有特殊的发光和能量储存功能,在发光、显示、消防安全、交通运输、建筑装饰、工艺品和仪器仪表等很多领域具有重要应用。长余辉材
二氧化钛材料由于其优异的性质而被大量研究,成为当前比较成熟的光催化体系之一。但是Ti02禁带宽度较宽,只对紫外光响应,而这部分光占比不到太阳光的5%,对可见光利用率低,并