主题聚类方法的探索与实践

来源 :全国第五次情报检索语言发展方向研讨会 | 被引量 : 0次 | 上传用户:haq1227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  传统信息组织方法存在很多困境、一般文本挖掘方法存在高维数据计算并缺乏主题控制问题,这使得传统信息组织方法与机器自动学习方法的融合尤为必要。信息组织方法中的主题法与数据挖掘中的聚类方法的结合,使得主题聚类方法应运而生。主题提取是一项基础性的信息提取工作,主题聚类则是以主题提取为前提的信息聚类过程。本文简要描述了主题聚类的研究意义、基本原理、方法与步骤,重点对主题聚类中的主题抽取、基于主题的文本聚类与聚类描述等关键问题进行了描述,介绍了主题聚类方法的相关实践。最后对今后的主题聚类研究和应用方向进行展望。
其他文献
氟离子透入法预防学龄前儿童龋齿的效果观察惠安县妇幼保健所苏春林我县学龄前儿童龋齿的发病率高达80%以上,为了降低儿童龋齿的发病率,我所从1991~1993年对县中心幼儿园277例儿童进行氟离子透
一起危险品仓库爆炸中受影响人群的健康监护情况分析深圳市劳动卫生监察所(田贝一路,518020)黄先青,彭崇信一、基本情况1993年8月5日,市某危险品仓库发生意外爆炸并引起大火,火灾延续数日,参与现
  目前大多数的文本分类都是针对单层分类,多层分类类目数量庞大、类目间区分度小,难度较大,尤其是基于《中图法》的多层自动分类研究较少,但却是图情部门实际工作需要的。本文
2004年11月25日是巴金101岁生日。在这属于巴金的日子里,似山似海的鲜花,一束束都在祝福:生日快乐。一个多世纪的漫长岁月里,这位老人历经风风雨雨,而今拥有一份难得的安宁。
养殖美国青蛙的中专农民 27岁的张少云小时候家里非常穷,两个弟弟因为营养不良而早早夭折,他是喝着碎米糊糊长大的。 1992年,张少云上了中专,鉴于他在中专学习期间的优秀表现
逆境是一笔财富,17岁的陈伟深深明白这句话的含义。尽管生活拮据,仅靠父亲打零工的收入和一些亲朋好友的资助,他始终保持着乐观向上的心态,学习努力,成绩优异,在2003年北大自
  主题词表的兼容转换与互操作一直是图书情报领域的重要研究课题,特别是基于概念梳理的跨领域主题词表集成,对语义网的构建以及信息组织与检索的智能化来说,是不可或缺的基础
  本文从知识服务的实际需求出发,提出通过语义自足性来处理知识抽取中的知识要素边界问题以及知识对象和知识要素约束问题。本文分析了语义自足性的特点,并根据以上特点提出
  本文从自动标引现状出发,通过大量实验数据统计,分析了词频分布规律,明确了词频分布规律对于关键词的选取没有太大作用,揭示了目前自动标引技术过渡依赖词频统计的误区。
  电子文件管理元数据元素语义的描述在概念上有三个层次即理解层次、语法层次和关系层次,本文分析了采用国际标准11179来定义电子文件管理元数据的概念体系,如采用XML来映射