TGFCM:基于模糊聚类的中文文本挖掘的新方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:ufo0101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种新的动态模糊聚类的方法,针对传统的模糊聚类需要预先确定聚类数的问题,提出采用动态自组织映射神经网络来确定聚类数,并通过文本向量空间模型和TF-IDF方法来确定文本的特征向量,再将动态自组织映射神经网络得到的聚类数,用模糊C均值算法(FCM)函数处理,得到聚类的结果。该算法同仅用动态自组织映射神经网络算法的运行结果相比,具有运行聚类结果精度高的优点,模糊聚类更适合处理语义的多样性和文本归属的模糊性,实验验证了算法的有效性。
其他文献
福田重工的崛起之路作为机械装备行业优秀的企业之一,福田重工几年来一步一个台阶,呈快速发展之势.他们生产的谷神收获机械自2000年至今连续5年销量创行业第一,市场份额持续
土地革命时期是国共合作破裂之后,中共尝试独立探索适合中国国情的革命道路的重要历史阶段。为寻求政权存在的合理性,利用报刊宣传塑造中共形象,建构革命话语权。在1927年至1937年间,中共创办多种党报,其中涉苏报道所占比重较大,并且在土地革命时期的不同历史阶段,涉苏宣传导向不断转变。其转变原因与中共时下政治诉求和革命需要相联系,通过对中共不同报刊中涉苏报道进行分析,凸显新闻宣传与政治诉求的互推互动,折
提出了一种基于遗传模拟退火算法的带宽、时延和时延抖动约束费用最小的组播路由选择方法,该方法针对遗传算法的局限性,采用基于备选路径集的整数队列编码机制,对适应度函数
依据教育部教职成[2009]2号(馓育部关于制定中等职业学校教学计划的原则意见》对中等职业教育培养人才类型的定位、国家职业资格标准以及饭店业发展趋势对服务与管理技能型人
创新精神和实践能力的培养是工科学生能力培养的重点,为了提高工科学生的工程实践能力和创新能力,特在《电机与电力拖动》课程教学中开展了研究性教学模式的探讨,并对此教学模式
本文对当前企业管理制度和企业法律顾问在企业中的作用进行了阐述,对企业在制度设立中普遍存在的问题做了分析。并从企业法律顾问制定制度设立办法、制度审核、起草制度以及建
目的:骨骼肌对糖尿病糖代谢起重要作用,本研究采用昆明种小鼠建立2型糖尿病动物模型,探讨适度游泳运动对2型糖尿病小鼠骨骼肌自噬和糖代谢的影响。方法:(1)2型糖尿病小鼠模型