【摘 要】
:
时间序列数据在应用中无所不在,是一类非常特殊的高维数据,时序数据分类是时序数据分析中的最重要的任务。研究者对当前领域内的时序数据分类算法进行了全面客观的综合性实验,发现现有的时序数据分类算法中,存在两个比较明显的缺陷。其一是当前领域内的算法并没有关注算法对数据集的适应性,诚然没有算法能在所有数据集上跑出好结果,但是其应该给出其所适用的数据集的范围。其二是拥有最好分类性能的算法时间复杂度相当高,以至
论文部分内容阅读
时间序列数据在应用中无所不在,是一类非常特殊的高维数据,时序数据分类是时序数据分析中的最重要的任务。研究者对当前领域内的时序数据分类算法进行了全面客观的综合性实验,发现现有的时序数据分类算法中,存在两个比较明显的缺陷。其一是当前领域内的算法并没有关注算法对数据集的适应性,诚然没有算法能在所有数据集上跑出好结果,但是其应该给出其所适用的数据集的范围。其二是拥有最好分类性能的算法时间复杂度相当高,以至于难以投入实际应用。本文的工作内容旨在提出合适的算法改进上述两个当前领域内存在的缺陷。对于算法时间复杂度过高的问题,本文分析了作为领域内最佳算法之一的集成shapelet转换算法,从特征信息的选择,特征信息的评价,特征空间的构建以及特征空间中分类器的选择这四个方面进行优化,提出了基于等距短shapelet转换的时序数据二分类算法。对于该算法中的每一处创新和优化,我们都给出了相应的理论证明用以支撑之。而实验结果也显示我们的算法在保持最佳分类性能的同时,大幅降低了时间开销。对于算法对数据集的适应性问题,我们量化了数据集本身的一些和我们算法密切相关的特性,设计了适应性系数,通过数据集的适应性系数,我们可以有效判断给定数据集是否适合用我们的算法进行处理。相应的实验结果也证明了我们所设计的适应性系数的有效性。本文的主要贡献如下:·提出一个高效的新算法,在时序数据二分类问题上,能以极低的时间代价获得当前领域内己达到的最佳分类性能。·设计出了一个适应性系数,可以有效量化数据集的某种性质,并进一步可以借此判定给定数据集是否适合用我们提出的算法来处理。·对于一些时序数据分类算法中存在的普适性的优化策略,对其可行性给出了理论的证明。
其他文献
由于朝鲜半岛处在一个政治、军事、价值观等不同而复杂的政治板块之间,独特的地理位置和历史演变更增加了朝鲜半岛事态的动荡性、复杂性和敏感性。朝鲜半岛问题突出体现在朝
空芯金属包覆波导作为传感器的理论分析,该研究重点讨论空芯金属包覆波导的灵敏度和利用高灵敏度的光电子器件进行了一些新颖的结果。该研究通过分析空芯金属包覆波导的结构
农业产业化龙头企业是实现农业产业化经营,推进我国农业由传统农业向现代农业转变的重要力量。近年来,政府出台了一系列优惠政策支持农业产业化龙头企业的发展,取得了一定的
受成像设备等因素的影响,用户实际获取的图像的分辨率往往是受限的,从而导致图像的细节不够清晰。这不仅会影响用户的视觉体验,而且也会对相关的计算机视觉应用构成障碍。因
本文主要以《画布上的梦》作为分析对象,从四个部分对这部作品进行了分析和阐述,力求从多个侧面去展示这部作品的创作意图、拍摄过程以及最终笔者的收获和思考。蒙金霞是一名
镍基高温合金由于其优异的高温抗氧化性能,成为现代国防和工业生产中的重要材料,被广泛应用于航空航天、石油化工、电力、海水作业等领域。目前,大量实验研究显示在高温条件
针对加权质心算法无法改善所需锚节点比例较高的缺点,本文提出了一种将已定位节点升级为锚节点以及利用多跳距离外的锚节点进行定位的改进算法。为克服定位误差随着迭代次数
目的:调查云南省西双版纳傣族自治州傣族、哈尼族、拉祜族和当地汉族小学生斜视弱视的患病情况,分析其差异性和危险因素。方法:选取云南省西双版纳傣族自治州少数民族最集中
刀库及机械手自动换刀装置是龙门铣床的关键功能部件,为减少零件加工过程的非切削时间,提高生产效率,降低零部件的制造成本提供保障。刀库及机械手这一复杂系统能否确保换刀
炎热夏季.清爽可口的凉皮成了人们纳凉消暑的好餐饮。各地制作凉皮的原料不缺,成本不大,利润可观,制作也不复杂,适合个体小本经营。现介绍消费者欢迎的三种凉皮制作方法: