特征加权的结构α-熵模糊聚类算法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:cqufy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一种无监督机器学习方法,在模式识别、图像分割、市场研究、数据挖掘、计算机视觉等领域具有重要的应用,其中基于划分的聚类方法是人们研究的热点,例如,k-means聚类算法,模糊c均值算法等。对于这些传统的聚类算法,它们主要考虑了将数据集的所有属性特征视为同等重要,从而使得一些不重要的属性特征影响样本的聚类结果。为了提高聚类算法的性能,通过引入特征权值及其结构α-熵,研究了特征加权的结构α-熵的模糊聚类,具体研究内容如下:1.研究了基于特征加权的结构α-熵的模糊聚类。针对不同特征对聚类的不同作用,通过引入特征权值,并结合特征权值的结构α-熵,提出了特征加权的结构α-熵的模糊聚类模型;利用拉格朗日求解方法,导出了聚类算法的模糊隶属度、聚类中心与特征权值;在此基础上,利用迭代方法,提出了特征加权的结构α-熵的模糊聚类算法。2.研究了特征权值的求解方法。针对特征权值的求解方法,对特征加权的结构α-熵的模糊聚类使用了动态求解和静态求解两种方法,其中动态求解主要是在聚类过程中通过使用拉格朗日导出的特征权值公式进行迭代更新,而静态求解主要使用ReliefF算法求解特征权值并将其带入聚类算法中,该特征权值在聚类过程中保持不变。3.研究了特征权值与簇的关系。为了能够获得较好的聚类结构,在特征加权的结构α-熵的模糊聚类中,对特征权值与簇的关系进行了分析,即对不同簇的特征权值分配不一定相同以及每一簇的特征权值分配相同这两种情况进行推导,提出了考虑不同簇的特征权值分配不一定相同的情况能够获得较好的聚类结构。4.研究了放松隶属度约束对聚类算法的影响。当处理含有噪声的数据集聚类时,为了提高聚类的抗噪性能,通过对特征加权的结构α-熵的模糊聚类放松隶属度约束,并使用拉格朗日对其推导求解,提出了放松隶属度约束的特征加权的结构α-熵的模糊聚类算法。5.研究了基于特征加权的结构α-熵的核模糊聚类。为了解决较复杂结构的数据聚类,针对聚类中心的不同特性,将核方法引入到特征加权的结构α-熵的模糊聚类模型中,提出了两种不同类型的特征加权的结构α-熵的核模糊聚类模型;通过求解该模型,获得了聚类算法的模糊隶属度、聚类中心与特征权值,提出了特征加权的结构α-熵的核模糊聚类算法。6.实验研究了特征加权的结构α-熵的模糊聚类算法以及它的核模糊聚类算法。通过选取UCI标准数据集、人工生成数据集以及添加噪声的数据集,分别使用动态和静态两种求解特征权值的方法以及放松隶属度约束的方法,针对聚类正确率和Jaccard系数两种评价聚类指标,对提出的算法进行了实验研究,并与选择的FWFCM(Feature Weighting Fuzzy C-Means)、EWFCM(maximum-Entropy-regularized Weighted Fuzzy C-Means)算法进行了实验比较。
其他文献
1临床资料患者,男,65岁,2009年7月活动后突然出现胸骨后闷痛,持续约1h,诊为"急性心肌梗死"。2009-9-19出现全身无力、生活不能自理入院。既往无糖尿病及高脂血症病史、无烟酒嗜