基于特征选择的数据流聚类

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:wanglei880917
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据流聚类时,冗余特征会影响数据的聚类质量,移除冗余特征以提高聚类质量就显得尤为重要。为解决此问题,提出一种基于特征选择的数据流聚类算法(DSCFC)。该算法应用了特征排序、特征等级评定、探测冗余不重要的特征、移除冗余特征算法等。实验结果表明,DSCFC算法能探测出数据流中隐舍的冗余特征并移除冗余特征,在对有冗余特征的数据流聚类时,比CluSteam算法更有效,聚类质量更好。
其他文献
<正> 目前学者们在替代动物的试验上又前进了一大步。他们采用一种新的诊断方法,即用来诊断不同寄生虫疾病的抗体(如阿米巴痢疾),不再是从兔血而是从卵黄中得到。过去,一直沿
<正> 港英政府工业署最近发表了在1984年进行第二次(第一次在1981年)香港工业引进外资情况调查的结果。考虑到,香港的一些经验可能对内地研究制订引进外资策略的工作提供借鉴
为了提高H.264/AVC中码率控制算法起始量化参数预测的准确性,提出了一种起始量化参数的预测算法。通过分析视频图像编码前的参数信息和I帧复杂度的特征量,提出了初始量化参数
医学基础课的作业有其特殊性,笔者以高职护理专业277名学生为对象,采用问卷和面谈等方式,着重调查分析学生对待医学基础课程作业的态度、评价等。指出高职护理专业学生医学基础
为解决协同过滤技术中存在的稀疏性、可扩展性问题,提出了一种基于自适应人工免疫网络的协同过滤算法。该算法将协同过滤推荐技术与自适应人工免疫网络相结合,利用人工免疫网络
为了增加检测器的覆盖率,提高算法性能,对V-detector检测器生成算法进行改进,提出了一种不限定检测器中心点位置的检测器生成算法。在检测器生成时,使大部分检测器中心点仍然在问题域内,覆盖问题域内的非我区域,少量检测器中心点位于问题域之外,覆盖问题域边缘。改进后的检测器生成算法中,检测器中心点分量服从正态分布,检测器覆盖问题域边缘的能力增强,检测器覆盖率更高。在基准数据集上的实验结果表明,改进后
Cu镀Au腔体是微波器件常用封装载体之一。在目前应用中,Cu镀Au腔体微波器件的气密性封装一直是工程化技术难题,大幅影响了微波器件的可靠性和使用寿命。对基于Cu镀Au腔体的微
目前实际应用的垃圾邮件过滤技术效果不太理想,尤其是对垃圾邮件的误判率和漏判率问题较为突出。其中,基于概率统计的简单贝叶斯分类算法相对而言效果较好。为提高垃圾邮件过
〔摘 要〕信息市场非价格竞争日益受到关注。论文围绕信息市场的非价格竞争的方法展开研究,着重介绍了信息市场的非价格竞争的内涵、重要意义、特点以及如何针对信息市场进行非价格竞争的多种策略。  〔关键词〕信息市场;价格竞争;非价格竞争;营销策略  〔中图分类号〕G202 〔文献标识码〕A 〔文章编号〕1008-0821(2009)09-0071-04    On The Non-price Compet