短文本聚类簇描述及标签生成方法

来源 :信息系统协会中国分会第六届学术年会 | 被引量 : 0次 | 上传用户:haidiaiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从产生大量短文本的微博、微信、用户评论、交互式问答系统等社会化媒体出发,在分析短文本特点的基础上,对短文本聚类得到的类簇描述方法进行了研究.首先,基于网页排序的PageRank算法思想提出短文本重要性排序计算方法;其次,通过选取最具代表性的短文本完成对类簇的描述,满足了用户快速了解类簇内容的需求;再其次,在选取出的几个短文本中进行分词和词频统计,提出按语法规则合并高频词的类簇标签生成方法;最后,以某幼儿教育公司自动问答系统为例,对所提出的类簇标签生成方法进行了验证和分析.
其他文献
  在中国,养老产业作为一种新兴产业,在制度、经营、管理以及养老服务等方面都出现了问题,这些问题是由养老产业的哪些缺陷导致的?又该如何有效应对?本文采用多案例研究,选取了近
  本文以H省B市的疾控信息系统应用作为案例,探索了在中国的地方性疾控机构,信息系统业务价值的实现路径和机制。研究发现,在中国的地方性疾控机构,会面临许多与特定情境相关的
  随着互联网的发展,越来越多人通过互联网与医生进行互动,在线医疗社区在生活中扮演着越来越重要的角色。本文以好大夫在线作为研究对象,以信任理论为基础,研究了在线医疗社区
  异地养老是一种新兴的养老模式。因老年人的身体特征、心理特征、所处时代特征等与选择异地养老之后的环境改变、政策差异等相互作用,选择异地养老的老年人面临着一系列新
  互联网已成为人们了解和学习医疗保健知识的一个重要渠道,大量用户通过参与在线医疗社区来寻求和分享个人医疗保健和疾病治疗经验,同时在线医疗社区也为病人及其家属创造
会议
  现今,逆向物流逐渐成为人们关注的热点,构建和实施逆向物流信息系统已成为物流业发展的新领域。将信息技术应用在逆向物流中,可缓解逆向物流的分散性和复杂性,极大提高业务水
  通过反驳"IT生产率悖论"引出信息系统成功评价的必要性,然后首先明确了信息系统成功的定义,并且提出基于D&M模型的信息系统成功评价模型,分别从系统运行、系统应用和系统
  为方便用户阅读海量信息,不少网页采用了分页设计。随着网页交互设计技术的发展,除了传统的静态分页方式,近年来还出现了以"瀑布流"布局为代表的自动加载等新分页方式。本文
会议
  企业架构提供一个构建企业战略、业务和IT技术之间的集成视角,企业本体是将本体理论应用于企业管理领域,建立知识共享和不同系统互操作的通信基础。本文基于企业本体理论,提
  本文的研究目的在于发现在线商品评论的信息内容对于商品销售的影响模式。提出通过计算特定商品评论文本中关键词的词频和反文档频率,对商品评论文本展开关键词分析。基于