【摘 要】
:
提出了一种基于最大频繁Induced子树的GML文档结构聚类新算法TBCClustering.通过挖掘GML文档集合中的最大频繁Induced子树构造特征空间,并对特征空间进行优化;采用CLOPE聚类
【机 构】
:
三江学院计算机基础部,南京师范大学数学与计算机科学学院
【基金项目】
:
国家自然科学基金(40771163)资助项目.
论文部分内容阅读
提出了一种基于最大频繁Induced子树的GML文档结构聚类新算法TBCClustering.通过挖掘GML文档集合中的最大频繁Induced子树构造特征空间,并对特征空间进行优化;采用CLOPE聚类算法聚类GML文档,可自动生成最小支持度与聚类簇的个数,无需用户设置;不仅减少了特征的维数,而且得到了较高的聚类精度.实验结果表明算法TBCClustering是有效的,且性能优于PBClustering算法.
其他文献
为解决卫星通信与地面无线通信两个产业链有机融合的难题,设计了一种卫星与无线融合系统的总体方案,实现了对系统中核心单元——多网融合网关的管理控制.管理软件的功能模块
传统的遗传算法求解VRP时,初始种群多半采取随机生成法形成染色体方案,以致于迭代开始就可能形成许多不可行的方案,要进行大量的计算后才能得到优化的方案,这在很大程度上降
当兵的时候他分到了甘肃。第一天去军营的时候,刚进连队一头大狼狗冲了出来,把所有人都吓了一跳,只有他把背包一放追了出去。
水是生物生存不可缺少的自然资源和环境资源,水资源状况直接影响着经济社会的持续发展.城市污水系统,不仅是城市基础设施的重要组成部分,而且作为城市水循环的重要环节,对城
用己二酸二酰肼(ADH)对透明质酸(HA)进行化学修饰,研究不同交联程度HA.ADH的理化性质.用溶剂挥发法制备出HA—ADH薄膜.经差示扫描量热仪DSC分析得知,交联后产物的微观结构发生了明显改
2011年8月4日凌晨3时38分,就在10分钟以前我再次从那一幕中惊醒,我还在喊着它的名字:“格里、格里、格里……”泪水再次忍不住地从我的眼角涌出,因为我清醒地意识到它牺牲已经两
目的分析子宫卵巢超声结合Z-score方法在女性性早熟中的诊断价值。方法选取2017年2月—2020年2月广东省东莞市第八人民医院(以下简称“我院”)收治的207例3~8岁女性性早熟患