基于池的无监督线性回归主动学习

来源 :自动化学报 | 被引量 : 0次 | 上传用户:ling401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多现实的机器学习应用场景中,获取大量未标注的数据是很容易的,但标注过程需要花费大量的时间和经济成本.因此,在这种情况下,需要选择一些最有价值的样本进行标注,从而只利用较少的标注数据就能训练出较好的机器学习模型.目前,主动学习(Active learning)已广泛应用于解决这种场景下的问题.但是,大多数现有的主动学习方法都是基于有监督场景:能够从少量带标签的样本中训练初始模型,基于模型查询新的样本,然后迭代更新模型.无监督情况下的主动学习却很少有人考虑,即在不知道任何标签信息的情况下最佳地选择要标注的初始训练样本.这种场景下,主动学习问题变得更加困难,因为无法利用任何标签信息.针对这一场景,本文研究了基于池的无监督线性回归问题,提出了一种新的主动学习方法,该方法同时考虑了信息性、代表性和多样性这三个标准.本文在3个不同的线性回归模型(岭回归、LASSO(Least absolute shrinkage and selection operator)和线性支持向量回归)和来自不同应用领域的12个数据集上进行了广泛的实验,验证了其有效性.
其他文献
使用可压缩的VOF空化两相流算法对倒角型阀座水压锥阀的空化射流进行了三维瞬态流场仿真.模拟结果揭示,空化结构首先在狭窄的倒角阀座流道内以附着空化的形式出现;在压差为4.4 MPa的工况条件下,空化分布集中在3个区域,阀座流道内及阀芯后沿的附着型空化,阀座流道至阀芯后沿的漩涡空化.射流势核在阀座流道入口及阀芯后沿均有分离流现象,从而诱发附着型空化;而大尺寸漩涡结构主要分布于射流势核的自由剪切层侧,漩涡空化亦相应地集中在自由剪切层侧,壁面侧偶发性形成薄层型漩涡空化.由于整体的空化行为涉及多个不同类型空化的耦合
P1+P4混合动力变速箱是在DCT360变速箱的基础上进行适应性的改进而设计出来的一款新能源变速箱,保留了原机械泵,增加了电子泵系统.电子泵在发动机不工作时,提供润滑冷却与换挡压力.介绍了对现有DCT360变速箱的改进、样机的设计和详细试验过程.通过模型仿真和大量的原有试验数据,验证了主油压在变化的情况下可以满足现有控制条件的换挡响应,最终确定能源系统和各相关附件系统,为后续系统功能和控制策略完善提供基础.
为简化离子型稀土矿提取稀土工艺,采用离子交换树脂富集矿山浸出母液技术制备高纯碳酸稀土用于有机溶料,系统考察了P507煤油萃取剂体系溶解碳酸镨钕过程中碳酸镨钕预处理方式、碳酸镨钕加入量、水相pH、杂质铝含量、反应时间和相比O/A等因素对萃取效果的影响.结果 表明,以湿碳酸镨钕为原料,其加入量控制为有机相负载稀土浓度0.16~0.18 mol/L,水相pH=2.0~3.0,相比O/A=1,反应时间12 min,碳酸镨钕中的铝含量小于2.5%,30℃条件下,碳酸镨钕溶解完全,分相效果好,有机相中稀土浓度达0.1
研究了一类严格反馈不确定非线性系统的模糊自适应实际固定时间量化反馈控制问题.基于李雅普诺夫有限时间稳定理论、自适应模糊控制理论及反演控制算法,提出了一种非线性系统模糊自适应实际固定时间量化反馈跟踪控制方案.所设计的控制方案能够保证闭环系统的输出跟踪误差在固定时间内收敛于原点的一个充分小邻域内,且闭环系统内所有信号均有界.最后,数值示例验证了设计方案的有效性.
水下机器人作为现代智能机器人的直接代表,长久以来扮演着海洋资源开发、环境监测及水下侦察的角色,广泛应用在水下极端复杂环境。随着研究的进行,愈发复杂、综合的任务要求使水下机器人朝着智能化、特殊化以及组网化发展。本课题“水下光通信机器人的路径规划与运动控制研究”属于“中央高校基本科研业务费”项目“可靠灵活机动的立体化海洋观测与光信息通信组网关键技术研究”(项目批准号:2019XD-A15)的一部分研究
生存分析旨在预测某个感兴趣事件发生前的延续等待时间,已广泛应用于临床治疗中患者的生存状态分析.然而,受限于研究代价高昂和环境因素的影响,现有的生存分析方法不可避免地面临着高维小样本挑战以及复杂环境所引起的噪声敏感等问题.为了克服上述缺陷,本文提出一类噪声容错弱监督直推式矩阵补全(Weakly supervised transductive matrix completion,WSTMC)生存分析方法.该方法首先将生存分析问题建模为多任务直推式矩阵补全模型,然后引入高斯混合分布拟合真实数据中的复杂噪声以减轻
近年来,太赫兹科学技术在无线通信、国防雷达、安检成像、生物医疗等领域受到日益广泛的关注,已经进入了飞速发展的阶段。超表面,作为具有高度设计灵活性的人工结构,能够与太赫兹波产生独特的电磁响应,对太赫兹科学技术的发展具有极大的推动作用。目前,太赫兹超表面吸收器、太赫兹超表面滤波器、以及太赫兹超表面调制器等各种太赫兹功能器件层出不穷,并且都展现了优越的性能。然而,在超表面太赫兹功能器件的研究中,存在着诸
近年来,信息化和网络化的迅猛发展加速了数据的增长,使其呈现爆炸态势。由于数据中蕴藏着巨大价值,社会各界对数据共享、信息公开和数据挖掘等的需求越来越迫切,而以这些为目的的数据发布过程往往伴随着隐私泄露。因此,如何有效地保护隐私并且尽可能减少对数据可用性的破坏是本文的研究重点。p-敏感性k-匿名模型及其现有扩展模型能有效防止链式和同质性攻击的发生,但同时抵抗偏斜性和敏感性攻击的能力不足,甚至面临语义相
新能源技术是化解能源危机、修复自然生态的重要途径,也是人类文明可持续发展、经济保持高质量增长的重要保障.新能源技术是一个综合性概念,整体上包括三大模块,一是清洁型、环境友好型、可再生型能源的开发技术,二是新能源材料与器件研发与应用技术,三是不同形式新能源“存储—转化”技术.其中,新能源材料与器件研发与应用技术是重中之重,我国已经将该技术上升至国家战略层面,一方面在高校相关专业(包括化学、材料、物理、电子工程等)开设新能源材料与器件课程,并于2011年正式启动了“新能源材料与器件专业” (本科层次),为培养
为了降低液压泵出口的压力脉动,设计了一种复合式广谱液压脉动衰减器.该衰减器由1个扩张室、2个容积室、2个限流管和8个质量室构成.通过对复合式广谱液压脉动衰减器的参数进行合理配置,可实现对多个频率段的脉动进行衰减.采用插入损失来评价复合式广谱液压脉动衰减器的衰减效果,利用MATLAB软件对其衰减效果进行仿真,并分析了脉动衰减器主要结构参数与衰减效果的关系.结果 显示,该液压脉动衰减器在20~1000 Hz的脉动频率范围内具有良好的衰减效果.复合式广谱液压脉动衰减器结构紧凑,衰减频率带变宽,衰减效果好,符合设