【摘 要】
:
随着数据存储技术的快速发展,越来越多的复杂对象被描述和存储。为了减少在数据挖掘中特征提取的时间开销,需要对特征提取方法进行加速。特征选择和特征抽取都可以从一定程度
论文部分内容阅读
随着数据存储技术的快速发展,越来越多的复杂对象被描述和存储。为了减少在数据挖掘中特征提取的时间开销,需要对特征提取方法进行加速。特征选择和特征抽取都可以从一定程度上降低特征提取开销,这些方法都是从降低特征维度的角度出发来提高特征提取效率。然而它们没有考虑到每个样本自身的性质对特征的影响。在本文的工作中,提出一种基于样本性质的特征抽取方法,该方法可以进一步的降低特征提取开销。此外,本文还会针对异纤检测问题提出了一个系统性、高效的特征抽取方案。本文主要有两个成果,如下:1.本文提出一种基于个体样本性质的特征抽取方法(DFE)。该方法可以根据样本自身的性质提取不同的特征序列,从而进一步降低特征提取开销;同时,给出实验来验证该方法的有效性;2.本文针对异纤检测问题提出了一个系统性的解决方案,该方案同时使用了高效的特征抽取和特性选择方法,并结合了DFE方法对特征进行选择。此外,为了取得良好的效果,本文中对分类器也进行了相应的改进。
其他文献
随着烟草物流信息化、智能化的不断发展,在烟叶仓储中心建立智能化车牌识别系统(License Plate Recognition System,LPRS)也成为烟草物流信息化的重大需求。现有车牌识别系统仅满
该文首先概述了成本核算的基本方法,然后针对半导体厂的实际核算管理要求提出了一种新的综合成本核算算法,它以分步核算为基础,同时根据引进流程定额兼顾了品种和批次,考虑了
随着摩尔定律的发展,处理器中核的数量也在不断增长,片上网络已经成为影响众核处理器性能的瓶颈。因此,如何设计一款高性能低功耗的片上网络一直受到学术界和工业界的广泛关注。
多核处理器的内存系统对于提高多核处理器性能与可扩展性有重要作用。随着集成电路芯片规模的增长和工艺的细化,内存系统面临着诸多因素如芯片可靠性以及功耗等方面限制的挑战
首先,该文从对网络QoS的定义开始,对QoS参数作了全面的论述.传统IP网络只提供一种QoS,就是"尽力而为"的数据服务.以往的应用在这个服务之上能够很好地工作也取得了巨大的成功
集群中的节点由于其硬件配置不同导致其性能不同,使得集群环境成为异构环境。然而,在以Hadoop为代表的MapReduce实现中并没有充分考虑到环境的异构性,致使节点的负载不能与其
随着互联网的普及与流行,以及“开放共享”观念的深入人心,越来越多的人愿意在互联网上分享他们的代码。目前,互联网上的开源代码量正以指数规模增长,如果这些代码能被很好地
论文围绕多跳无线网络以吞吐量最大化为目标的链路调度问题展开研究,重点解决单信道多跳无线网络和新型的多信道多跳认知无线电网络这两类不同网络类型下的链路调度问题。在传
网络的勃兴为维吾尔文的信息处理带来了新的挑战和新的希望。一方面维汉民族之间的交流日益频繁和深入,迫切需要机器翻译、跨语言信息检索、维汉双语新词辞典等工具的支持,而这