【摘 要】
:
摘要:K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受“噪声”干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K
论文部分内容阅读
摘要:K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受“噪声”干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。
全文查看链接
当xij≠zaj时,δ(xij,zaj)=1;
全文查看链接
将传统算法运行10次,通过打乱数据集的各个数据位置,反复仿真得出以下聚类结果。
全文查看链接
其他文献
颜色是事物本质的属性,也是一种自然现象,通过语言被人类所认知、记录和表达。因为地域和文化的差异,不同民族,不同语言社团的成员对颜色有不同的认知。因为语言的演变,不同人群,不
“段位数词”指“十、百、千、万、亿、兆”等表示十进法单位的数词,但并非所有表示位置的数词都是段位数词,因为段位数词不仅是十进制计数法的产物,更是数的数学语义特征与数词
该文试图以中国诗学的境界理论为框架,以中国画论(偏重于山水画论)为背景,初步探讨中国山水诗论自南朝刘勰到近代王国维的一个动态流变历程,并对这一流程中的三种山水诗的美
摘要:针对传统人工势场模型在移动机器人路径规划中存在局部极值的问题,提出了一种改进方法。该方法首先将传统势场模型转换成解空间中寻优的问题,再加入罚因子建立罚函数数学模型。新的势场模型能够有效的使得机器人成功逃逸局部极值点。最后通过MATLAB进行仿真实验,仿真实验结果证明该方法的有效性。 关键词:移动机器人;人工势场;路径规划;罚函数;函数优化 中图分类号:TP242文献标识码:A文章编号:
语言是文化的载体和文化的写照,汉语和蒙语分属不同语系,记载和代表着不同的文化。但是,汉蒙谚语同其他各民族和世界各国谚语一样,都是人民群众的口头创作,都是一种普遍存在,也都有
讲话稿有广义和狭义之分。广义的讲话稿是人们在特定的场合发表讲话的文稿;狭义的讲话稿即一般所说的领导讲话稿,是各级领导在各种会议上发表带有宣传、指示、总结性质讲话的
理查德·罗蒂(RichardRorty,1931-2007)作为后哲学文化的开拓者和杰出的公共知识分子,在西方学界一直是一位影响巨大而又争议颇多的人物。无论作为生活中的人、作为传统哲学的
“有”字句是指一个句子中含有“有”字的句子。广义的“有”字句包括词语、成语、小句、分句、复句、句群和篇章中含“有”字的句子。狭义的“有”字句是指一个句子中含有“
青木正儿(Aoki Masaru,1887-1964)是日本中国学京都学派的第二代学人,其在戏曲、诗文、绘画、民俗等诸方面均取得了突出的成绩。本论文将以青木正儿的中国文艺理论研究为聚焦点