基于K均值和aiNet的两阶段文本聚类算法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:ychh1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服基于aiNet的文本聚类算法在处理高维数时性能下降的缺点,设计一种基于聚类中心的虚拟坐标映射机制的文本表示模型,实现文本向量模型的降维技术.在文本进行K均值聚类后,对文本向量进行降维,再将其作为aiNet文本聚类的输入.实验表明,通过两阶段的算法对文本进行聚类,有效提高了aiNet文本聚类质量.
其他文献
科技进步一方面是人类自身发展的产物,另一方面又对人的发展产生影响。科技进步对人的发展,既有积极的促进作用,又有消极的负面影响。要发挥科技进步对人类发展的促进作用,需
惩罚性赔偿是源自于英美法中的重要而特殊的一项制度。随着经济全球化化发展,不同法律文化国家之间的法律交往越来越密切,该制度也正逐步影响着大陆法系国家的法制发展。虽然
分析比较现有用于短时电能质量扰动检测的方法,研究用Wigner-Ville分布进行检测与抑制噪声的原理.仿真表明,采用Wigner-Ville分布算法进行电能质量扰动检测,具有良好的噪声鲁
犯罪未遂是各国刑法研究的重点问题,将我国犯罪未遂理论与大陆法系中意大利的犯罪未遂理论进行比较,明确两国刑法对此问题的认定,有利于完善丰富我国刑法犯罪未遂理论,正确界
本文围绕市场、产品、技术、管理及财务等影响风险投资的关键因素,结合高新技术项目产业化的过程,从风险方面构建了高新技术项目产业化过程中投资风险建立了层级评估指标体系
聚乳酸是一种可生物降解材料,文章采用直接缩聚法合成聚乳酸,并在此基础上,从分子量和降解介质两方面研究聚乳酸的降解机理.
本文简要阐述了高校文科高等数学课开设的现状及现阶段存在的问题,并从教学目标、教学原则、教学内容和考评等方面提出一些改革措施.
从聚合反应温度、丁油水值控制、聚合催化剂用量、胶液终止时间、原材料中炔烃浓度、聚合水值、膨胀干燥过程及制样方式几个方面对顺丁橡胶门尼升值的影响进行了分析研究,并
提出了一种利用FPGA发出的伪随机序列检测微弱光信号的方法。用伪随机序列调制LED或LD光源,注入测量光纤,输出光信号经过光电转换后与伪随机序列的调制信号做相关检测。由于伪随机序列具有与白噪声相近的相关特性,测量过程中的干扰、噪声对相关峰值影响很小。因此,可以检测到微弱的输出光信号,提高了测量精度。测量系统由LabVIEW虚拟仪器实现。
当今社会,是一个科技高度发展,生产突飞猛进的社会,是一个信息加竞争的时代。而中学物理教学中,也不可避免地要投入这场竞争中。它在最基本的层次上决定着一个国家公民的科学