潜在属性空间树分类器

来源 :软件学报 | 被引量 : 0次 | 上传用户:loveqwg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种潜在属性空间树分类器(latent attribute space tree classifier,简称LAST)框架,通过将原属性空间变换到更容易分离数据或更符合决策树分类特点的潜在属性空间,突破传统决策树算法的决策面局限,改善树分类器的泛化性能.在LAST框架下,提出了两种奇异值分解斜决策树(SVD(singular value decomposition)oblique decision tree,简称SODT)算法,通过对全局或局部数据进行奇异值分解,构建正交的潜在属性空间,然后在潜在属性空间内构建传统的单变量决策树或树节点,从而间接获得原空间内近似最优的斜决策树.SODT算法既能够处理整体数据与局部数据分布相同或不同的数据集,又可以充分利用有标签和无标签数据的结构信息,分类结果不受样本随机重排的影响,而且时间复杂度还与单变量决策树算法相同.在复杂数据集上的实验结果表明,与传统的单变量决策树算法和其他斜决策树算法相比,SODT算法的分类准确率更高,构建的决策树大小更稳定,整体分类性能更鲁棒,决策树构建时间与C4.5算法相近,而远小于其他斜决策树算法. A latent attribute space tree classifier (LAST) framework is proposed, which breaks through the traditional decision tree algorithm by transforming the original attribute space into the potential attribute space that is easier to separate data or more suitable for the classification of decision tree In order to improve the generalization performance of tree classifiers, two kinds of SVD (singular value decomposition) oblique decision tree (SVDT) algorithms are proposed under the framework of LAST. By analyzing the global or local data The SVD algorithm can deal with the whole potential problem by constructing singular value decomposition and constructing the orthogonal potential attribute space, and constructing the traditional univariate decision tree or tree node in the potential attribute space to indirectly obtain the approximate optimal oblique decision tree in the original space Data and local data distribution of the same or different data sets, but also can take full advantage of tagged and unlabeled data structure information, the classification results are not affected by the sample random rearrangement, and the time complexity is also the same with the univariate decision tree algorithm. The experimental results on complex data sets show that compared with the traditional univariate decision tree algorithm and other oblique decision trees Compared to a higher classification accuracy SODT algorithm to construct a decision tree size is more stable, more robust performance of the overall classification, decision tree algorithm C4.5 time and build close, but far less than other oblique decision tree algorithm.
其他文献
在供应链需求持续推动RFID进入零售及仓储领域的同时,工业应用的数量也继续保持增长,反映了现有技术的多样性.为什么呢?主要有以下几个原因:无线射频识别(RFID)可以进行无线
“的”是现代汉语中频繁使用的助词之一,也是留学生学习的重难点之一。本文意在说明现代汉语状态助词“的2”的使用情况,并在此基础上探究其来源,全方位描写状态助词“的2”的整
现在各地各部门制定的制度并不少,但一执行起来,往往就走了样,其中原因之一便是制度在少数领导干部特别是“一把手”面前变得苍白无力,成为可有可无的摆设和形式。 Nowadays
TKScope是广州致远电子有限公司自2008年来陆续推出上市的高性能通用型综合仿真开发平台.自其上市以来,TKScope仿真器根据市场的需要,不断更新其支持内核类型和芯片型号,推出
摘 要: 玉米在世界范围内都得到了广泛种植,它作为一种十分普遍的作物,是较好的饲料。玉米的种植随着环境的不断变化,在不同时期会出现不同类型的问题。本文主要介绍在种植玉米的过程中,经常出现的一些具有代表性的问题,并且相应地给出切实可行的解决措施,为玉米的种植提供技术支持。  关键词: 玉米种植 存在问题 解决措施  玉米的种植有着悠久的历史,且在世界多个国家和地区得到种植,它的种植面积位于水稻和小麦
研究了超音速火焰喷涂制备的MoB-CoCr涂层在熔融锌液中的腐蚀情况,并分析锌液对MoB-CoCr涂层的腐蚀机理。结果表明,涂层中的缺陷孔隙成为裂纹源,而MoB-CoCr涂层的残余应力、
期刊
很多工业过程既包括连续也包括离散的元素,这样的过程经常被称作混合过程一在局部是连续流程,而在更高的层次上可以看作是以事件为基础也就是离散的.对这样的系统建模.也就需
变频器的问世和先进的电机控制方法让三相无刷电机(交流感应电机或永磁同步电机)曾经在调速应用领域取得巨大成功.十年来,电子元器件的大幅降价使得这些电机驱动器能够进入对
期刊