【摘 要】
:
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域研究工作带来了新挑战,而其中分类算法更是当前的研究热点. Domingos等人在VFDT中利用Hoef
【机 构】
:
国防科学技术大学计算机学院,长沙,410073
论文部分内容阅读
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域研究工作带来了新挑战,而其中分类算法更是当前的研究热点. Domingos等人在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题. Gama等人对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性,并在叶节点采用了贝叶斯分类算法使分类精度更高.基于VFDT和VFDTc,设计并实现了一种基于线索化二叉排序树的决策树分类新算法VFDTt,其主要贡献有如下3点:1)第1次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,VFDTt的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而VFDTt只需要更新相应的一个节点即可. 2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n). 3)相比VFDTc,VFDTt只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn)。
其他文献
运用块体集上限法详细分析了砂土中条形锚板的抗拔承载特性。首先分析了砂土中水平条形锚板的抗拔承载力,并与已有文献中的极限分析上限解、极限平衡解和模型试验结果等进行
我能参加这次陕西省各界慰问团赴福建前线去慰问我们最可爱的人,的确感到万分的荣幸。通过这次慰问活动,提高了我的认识水平,使我受到了一次极大的政治教育。在慰问活动的过
国际上已有比较成熟的基于原位孔压静力触探测试(CPTU)的土分类方法,这些方法多以美国统一土质分类标准(USCS)为依据,其土类与中国土的工程分类标准不对应。因此,建立基于CPT
地基沉降计算一直是岩土工程研究中的热点和难点问题,其困难在于室内试验与原位岩土参数差异较大,尤其是砂土地基和结构性强的硬黏土地基,基于室内试验参数的沉降计算与实际
采用离散元法(DEM)对胶结岩土材料本构模型中的破损规律进行验证。首先,根据胶结颗粒间胶结特性,建立适用于胶结颗粒的微观理论;其次,基于该微观理论,给出3种经典胶结岩土材
SincecitizensfromtencitiesoftheMainlandofChinaincludingGuangdong ,BeijingandShanghaiarepermittedtotravelinHongKongfreely ,moreandmoretravelersfromthese placesha
在石头凳、水泥板凳和水泥地面上,摆放着许多大大小小的树桩盆景,立、斜、卧、悬各式各样,有的英俊挺拔,有的阿娜多姿,有的卧盘健稳,有的悬走天边,奇巧古怪,令人日不暇接。
既有高层建筑地下增层开挖,不可避免地引起地基应力场改变,导致桩土接触面和桩端土层应力变化,从而降低原基础底板下桩基承载力。由于实际工程情况限制,增层开挖后桩基的承载
朴素贝叶斯算法的主要特征是分类速度快而分类精度较低,算法的目标是在传统贝叶斯文本分类算法的前提下达到令人满意的分类精度,并进一步提高分类速度.算法的技术手段包括在
健康永远排在美丽之前,没有一个方式可以让不健康的人拥有美丽的外表,但有了健康,却会让自己
Health is always ranked in the beauty before, there is no way for unhealt