【摘 要】
:
随着互联网和大数据技术的发展,方方面面对数据的依赖越来越强,产生的数据规模越来越大,数据样本复杂度也越来越高。为了精准地预测数据,获取准确且有价值的信息,就需要选择合适的技术进行处理。本文借助极限学习机模型的优势,针对多标签分类中的数据标签和数据样本结构问题开展相关研究工作,主要工作包括:对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机的改进算法—样本
论文部分内容阅读
随着互联网和大数据技术的发展,方方面面对数据的依赖越来越强,产生的数据规模越来越大,数据样本复杂度也越来越高。为了精准地预测数据,获取准确且有价值的信息,就需要选择合适的技术进行处理。本文借助极限学习机模型的优势,针对多标签分类中的数据标签和数据样本结构问题开展相关研究工作,主要工作包括:对于多标签分类中存在非线性的数据样本和重复的样本数据问题,本文提出了一种基于在线顺序极限学习机的改进算法—样本线性化和数据预处理极限学习机。该算法对线性不可分的数据样本先利用核函数进行处理,使数据样本具有线性可分的特征。对于处理后的数据样本,利用在线顺序极限学习机在计算之前对分类数据进行预处理,即从训练和测试数据集中查找不一样的特征标签并保存类标签中。实验中新生成的标签组将不具有重复的特征标签,大大减少了训练的对比次数。实验表明,相比于其他没有样本线性化和数据预处理的极限学习机模型,计算的准确度得到的很大的提升,计算时间也有所降低。极限学习机来解决大型和复杂的多标签分类问题时,且易引起资源问题和不能够达到良好的泛化精度。因此本文中创新地引进了堆叠式极限学习机,专门用于解决大型和复杂的多标签分类问题。堆叠式极限学习机不仅仅学习速度更快、而且泛化能力更强。堆叠式极限学习机近似于将一个非常大的极限学习机,按照一定的规定和原则划分其为若干个非常小的并且串联的极限学习机。其在资源需求量很小并且网络规模比较固定的情况下,还能再高维的极限学习机空间中学习数据,很好的解决了当下样本数据处理中大型且复杂的数据问题。实验结果表明,堆叠式极限学习机相比于其他多标签分类模型,预测时间更短和准确率更高。
其他文献
随着基于导电复合材料的柔性触觉传感器不断发展,设计具有优良特性的柔性导电复合材料成为一个迫切的需求,具有高性能低成本等优势的碳纳米管填充导电复合材料因此受到广泛关注。碳纳米管填充导电复合材料的电学性能依赖于多项参数,在实验中难以精准高效控制。计算机建模与仿真技术能精确控制研究中各项参数变化,为研究材料特性提供低成本、高效的方法,被广泛应用于复合材料电学特性研究。本文采用计算机建模与仿真技术,基于碳
随着集成电路相关技术的快速发展,芯片功能越来越复杂,特征尺寸不断减小。在这样的前提下,对集成电路测试技术的要求也在不断提高。为了保证测试质量,测试成本不断提高,测试难度也随之增大。传统的测试方法无法应对一些新出现的问题。为了解决传统测试中的诸多不足,集成电路的适应性测试方法应运而生。适应性测试指的是根据芯片制造、测试数据和统计数据的分析来改变测试条件、测试流程或测试内容,以求降低测试成本或提高测试
水是人类生命之源,水文研究和水资源管理对人类至关重要。合理利用水资源有利于人类的生活生产,其中探测水体分布有助于人类监测生态环境,保护水资源。国内外学者广泛开展了水体探测方法的研究,但仍然存在诸多挑战。全球导航卫星系统反射信号遥感技术(Global Navigation Satellite System-Reflectometry,GNSS-R)是一种新型的遥感探测技术,具有低成本、全天候、高时空
随着科学技术的发展,电子设备的供电问题受到了越来越多的关注。传统的电池体积大、续航能力差,已经无法满足需求。因此,国内外学者将目光放到了身边环境中的可再生能源上。其中,压电能量收集技术由于能量密度高、易于实现和体积小等优点被而被广泛应用。为了提高压电能量收集的效率,国内外学者提出了同步开关技术。同步开关技术对同步控制信号的精度要求较高,如果信号延迟较大,会造成较大的能量损耗。已有的基于同步开关技术
EAST装置放电过程中,面向等离子体部件的状态对实现装置高功率、高参数、长脉冲稳态运行有着至关重要的影响。为了对放电过程中面向等离子体部件的状态进行实时监测,本文对EAST装置上使用的红外相机软件进行了二次开发,搭建了高速光纤网络来快速传输红外相机采集的数据。同时为了研究相应放电位型下偏滤器靶板的热负荷,基于红外相机测得的温度数据进行偏滤器靶板的三维热负荷程序开发,并进行了程序验证和初步的物理分析
基于计算机视觉的安全帽检测和身份识别一直是施工现场安全监控研究的重点。目前很多研究可以有效地识别没有佩戴安全帽的工人,但是对于工人的身份信息却很难确定。因此为了更有效的实施安全管理,本文提出了基于计算机视觉和深度学习的安全帽检测与身份识别的综合方法,对建筑工人进行安全帽检测的同时可以识别其身份。对于安全帽检测,本文采用基于YOLOV3的神经网络算法。数据集来源于公共数据集SHWD(Safety h
快速、准确的早期诊断对临床医学疾病的预防和治疗至关重要,以蛋白质、核酸、小分子等为代表的生物标志物作为药物研发靶点、疾病发病机理和预后的可衡量指标,已经被应用于早期疾病诊断和药物研发领域。CRISPR/Cas是细菌和古细菌中用于防御病毒感染的适应性免疫系统,其能够通过向导RNA(g RNA)引导Cas蛋白靶向特定的核酸序列。其中,Cas12a(Cpf1)是一种来自2类V-A型CRISPR/Cas系
声发射技术具有对损伤敏感、受几何构造影响小、探测距离远等优势,适用于土木工程结构的在线监测。利用声发射进行结构健康监测需要通过声发射信号的定量分析达到损伤识别、定位和评估的目的。声发射信号包含材料的动态微观损伤信息,不同损伤机理的信号通常具有不同的瞬时频率成分。本文针对声发射信号定量分析的需求,提出基于时频分析和深度学习的声发射信号分类方法。采用小波变换研究声发射信号的时频能量分布,然后建立卷积神
自2004年第一个基于核酸适配体的药物Macugen被成功运用于临床治疗后,核酸适配体药物便有了一定的发展。然而,目前用于临床治疗的适配体药物只有少数几种,而造成这种现象的原因之一是适配体的构象稳定性差。适配体折叠能量是评估适配体构象稳定性的重要参数,但是目前测量适配体折叠能量的方法有限且存在一定的误差。除上述基于适配体的药物发展所面临的问题之外,基于适配体的生物传感器同样面临着一定的困难。由于通
相控阵雷达、5G无线通信试验系统、宽带数字接收机和数字示波器的高速发展正在将系统带宽不断推高,显著增加了数据采集系统对高速、高精度ADC(Analog-to-Digital Converter)的需要。时间交织ADC(Time-Interleaved ADC,TIADC)技术是提高采样率的有效途径,但是这将不可避免地引入通道失配误差,主要包括失调失配、增益失配和采样时间失配,并严重降低了TIADC