面向数据集覆盖问题的优化算法研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:ylwang8866
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据科学时代,基于某些数据集训练机器学习算法是常见的。通过调查或科学实验,可以前瞻性地收集到数据集。最近,已经认识到训练数据集只具有代表性是不够的,如果受训练的系统要很好地处理一些不太流行的类别,则必须包括来自这些类别的足够的例子,这便是数据集覆盖问题。本文在已有的处理数据集覆盖问题的方法的基础上,结合关联规则挖掘相关算法的思想,提出了获取MUP的优化算法,提高了获取MUP的运行效率;另外还提出了计算coverage算法面对数据稀疏问题以及位图过大、内存不足问题的解决思路,最后通过理论分析以及对实际数据集
其他文献
改性沥青SMA在当今高速公路上得到了广泛的应用,但是在具体的施工过程中仍存在一些问题需要注意。基于此,论文主要分析了SMA沥青路面的施工控制要点和方法。
厚朴是传统中药材,厚朴酚与和厚朴酚等提取物具有抗肿瘤、抗炎、抗菌,保护与调节神经、消化系统等功效,现已被广泛应用于临床。厚朴被广泛栽培于长江流域及以南地区,形成了“
稻盛和夫在短短两年时间,将曾濒临破产的日航的营业利润率从-17%提升到17%,日航成功复活,重新上市。日航的大成功使得阿米巴经营震惊世界,国内掀起了一场学习阿米巴的热潮。
目的初步探讨影响肝癌患者报告结局与生命质量的遗传因素。方法采用文献检索、生物信息查询、专家咨询、小组讨论等方法探索影响肝癌发生、发展、侵袭转移、预后、复发和遗传
近年来,随着女权主义思潮在文学领域的逐渐兴起,人们开始关注和研究男性作家创作作品中的男性话语权问题,这就相对弱化了作家在文本创作中文化和意识形成原因的探究。本文试