利用粒计算的符号型数据分组算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:pankerong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘领域,基于符号型数据分组的数据预处理是一个极富挑战性的问题,它给人们提供了一种更加简化的数据表现形式。在已往的研究中,相关学者提出了许多解决方案,例如,运用粗糙集的方法来解决这一问题。文中提出了一种基于粒计算的符号型数据分组算法,主要分为粒度生成和粒度选择两个阶段。在粒度生成阶段,对于每一条属性,以对应属性值的聚类为叶子节点,自底向上以二进制树的形式构建粒层,形成属性树森林。在粒度选择阶段,以信息增益为基础,对每棵树进行全局考虑,选取最优的粒层,选层结果就是符号型数据的分组结果。实验结果表明,本
其他文献
文中研究了MapReduce框架下的云资源选择算法。该算法利用概率筛选的方法计算资源节点属于Skyline结果集的概率,并通过阈值过滤来降低MapReduce中的心跳频率,以达到优化网络
文章结合工程实例,就城镇易涝点整治工程排水系统存在问题及不利影响进行了阐述,从而针对易涝点整治工程规划设计原则及关键要点进行了分析,并提出了存在的问题及建议,以供水
网络功能虚拟化转变了网络架构和网络业务的部署。在网络功能虚拟化架构中,实现虚拟化深度包检测只需在传输路径上进行一次扫描,但高效部署深度包检测功能引擎成为难题。将深
针对软件中克隆代码的质量进行研究,评价软件当前所有版本中克隆代码的质量。在此基础上使用贝叶斯网络训练已有样本数据,得到克隆代码质量预测模型,其能预测软件未发布版本
主成分分析(Principal Component Analysis,PCA)是一种用线性变换选出少数重要变量(降维)的多元统计分析方法。虽然传统PCA被广泛应用于科学研究与工程领域中,但是其结果有时很难解
中国共产党自我革命精神的生成和演进自有其理论逻辑、历史逻辑和现实逻辑,考察中国共产党的指导理论、历史轨迹和现实指向,可以发现其自我革命精神生产的理论逻辑是唯物辩证
为明确日本及中国沿海部分鱼类的分类地位,测定了日本7目24科34属37种鱼类184条线粒体COI基因5′端652 bp序列,结合GenBank下载的日本和中国143条同源序列,共分析了7目24科35
采用架构分析与设计语言(AADL)建立嵌入式系统的半形式化模型,实现从AADL模型到静态故障树(Static Fault Tree,SFT)模型的转换,并根据故障树定量分析法对系统可靠性进行分析。首
水波优化(WaterWaveOptimization,WWO)算法是一种基于浅水波理论的新兴元启发式优化算法,通过模拟水波的传播、碎浪、折射操作在解空间中进行全局搜索。为提高算法的收敛速度和精
测试用例优先级排序作为一种高效实用的回归测试技术,通常以测试用例的覆盖度作为优先级排序的量化指标,忽略了测试用例的其他测试性能。针对该问题,提出一种基于DU链的测试