【摘 要】
:
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法.为验证该方法的有效性,以22 157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取
【机 构】
:
上海理工大学,管理学院,上海,20093
论文部分内容阅读
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法.为验证该方法的有效性,以22 157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语.实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果.
其他文献
机构知识库长期保存具有重要的意义,然而,在机构知识库的长期保存中,却面临着一系列的问题,如资源选择问题、法律问题、技术问题、信任问题、经费问题和责任体系问题等,本文
文章把“连锁经营”和“特许经营”合称为“连锁特许经营”,介绍了其概念和特点.在此基础上总结了连锁特许经营框架下的企业竞争情报特点,提出了连锁特许经营框架下的企业竞
本文主要阐述了分形理论在水文水资源环境中的应用,主要从水文现象中分形的特征、分形在水资源评价与分类中以及在预测方面等三个方面进行应用分析.然后对分形理论在应用中存
首先从理论上讨论期刊的h型指数、中心度、SJR和特征因子4种新型期刊引文评价方法各自的特性,再以统计学方法探析4种新方法的数值分布及结果差异。国外图书馆学情报学期刊的
本文以基于Web2.0环境构建的科技论文网络发表平台为研究对象,结合目前发展过程中遇到的学术质量不高的问题,运用质量管理中质量控制理论,对科技论文网络发表平台的质量控制主体
根据相关规则和研究内容确定元数据制定的流程,通过分析信息资源的特点,在DC和OAIS信息模型的基础上,对“指南针计划”专项信息资源核心元数据的元数据项、元数据内容结构、
本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略.实验结果表明:软件系
随着社会快速发展,国民素质的提高,教育培训市场需求越来越大,使培训机构的数量不断的增加,教育培训机构越来越多,教育培训机构的竞争日趋激烈。激烈的市场竞争使GG培训机构
乡间的黄昏,温馨静谧,略带一丝淡淡哀愁的气氛和情调。两个小伙伴被描绘的天真纯洁,可爱至极。人物刻画的精致细腻、完美无瑕。
Dusk in the countryside, warm and quiet,
法律框架网络语料库系统构建的目的是实现对法律语料的处理,从而为法律语言学及法律查询者提供强而有力的检索工具.本文提出了法律框架网络语料库系统的设计原则及语料选取原