基于度量空间的通用分类算法框架研究

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:a287924625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  现有的大部分分类算法都是针对多维数据的,虽然存在一些方法可以用于不是用多维表示的数据类型,即非多维数据,但这些方法本身的弱点往往也都很明显。在大数据时代,复杂的数据类型越来越多,现有的可以处理非多维数据的分类方法的局限也逐渐成为瓶颈,而专用的非多维数据分类算法往往受限于其应用领域,如何能够把通用多维数据分类算法应用于大数据时代的复杂数据类型已经成为一个越发重要的问题。本文提出一个将传统的针对多维数据的分类算法广泛应用于多种非多维数据的算法框架:首先把非多维数据抽象到统一的度量空间;然后在支撑点空间模型的基础上通过支撑点选择把没有坐标的度量空间转化为有坐标的支撑点空间;最后将多维数据分类算法应用于支撑点空间以最终实现对非多维数据的分类。实验表明本文提出的分类算法框架可以有效地对非多维数据进行分类。总体上看,将本框架应用于多维数据可获得比直接对多维数据进行分类获得更优的准确率。
其他文献
本文针对某炼厂加氢裂化装置现有加热炉热效率不够高的问题,进行了热管技术在加氢裂化装置加热炉上的工业化应用的研究,通过在原有加热炉上增加热管空气预热器的措施,以提高
萘酰亚胺类化合物具有稳定性好、荧光强度高、易修饰等优点,不仅是一类优异的颜料和染料,而且被广泛应用于荧光探针、染料敏化太阳能电池、有机电致发光等有机光电功能材料领域
甲醇汽油是一种优越的汽车代用燃料,价格便宜,燃烧性能良好,同时减少发动机废气排放,对中国能源结构调整、缓解石油供需矛盾、减少大气污染等方面具有重要意义.该文研究了低
目的:胰岛细胞移植是治疗Ⅰ型糖尿病最有希望的方法,由于供体细胞不足和免疫排斥反应等问题,限制了胰岛细胞移植技术的应用。骨髓基质干细胞(BMSCs)具有获得容易,可体外复制和
  近年来,用户在社交媒体上越来越多地使用多媒体内容来分享经历和表达情绪,如新浪微博的一条微博常常包含文本和图像。相比于单独分析文本和图像的情感,融合文字和图像的多媒
会议
  本文考虑了微博中的多样性检索问题。我们第一次将多样性排序学习方法应用到微博多样性检索中,并针对微博的特点设计了一系列社交媒体特征。实验结果表明,多样性排序学习方
世界经济的高速发展,得益于石油、天然气、煤炭等化石能源的使用。然而,这一经济的资源载体将在21世纪上半叶迅速地接近枯竭。同时,化石能源的过度开采与使用所造成的环境污染和
  近几年,我国P2P网贷行业在高速发展的过程中出现了大量的失联跑路事件。本文基于P2P网贷及大数据相关概念深入剖析,创新性地将平台的风险预警同大数据技术相结合,最终通过海
  雾霾监测点作为雾霾大数据感知的源头,其自身的可靠性对大数据的可靠性至关重要。当感知源行为出现异常不可靠时,其所获得的数据本身就是不可靠的,更勿论进一步的处理和决策
会议
为了促进干旱区林果业的发展,创建水资源高效利用环保型生态林果业。本研究利用全生物降解膜套袋种植技术在吐鲁番市亚尔乡建立了生物降解膜杏树节水种植示范区。本试验对全