【摘 要】
:
随着网络的普及以及WEB2.0的迅速发展,互联网已经成为世界上规模最大的公共数据源。与此同时电子商务的迅猛发展,给人们的生活带来了极大的便利。越来越多的人们开始选择网上
论文部分内容阅读
随着网络的普及以及WEB2.0的迅速发展,互联网已经成为世界上规模最大的公共数据源。与此同时电子商务的迅猛发展,给人们的生活带来了极大的便利。越来越多的人们开始选择网上购物。客户往往只能通过商品参考图,以及其他用户的评价,来综合衡量一件商品的好坏。因此,网络评论已经成为电子商务的一个十分重要的信誉评价方式。观点挖掘的任务是抽取评论中的观点和分析情感倾向性。用户发表的评论往往是针对一个主题的某个属性。对于一种商品,它的属性往往比较多,同时可以有不同的特征词进行描述。人们对于不同的属性使用的情感词也不尽相同。因此,本文从主题属性与特征词、情感词之间的关系入手,构建一个主题模型,并应用该模型进行基于属性特征的情感倾向性分析。结合当前的需求,本文对基于主题模型的情感搜索引擎进行了研究与实现。本文提出主题模型的概念以及主题模型的构建算法。首先,利用语言模式规则抽取出特征词,利用情感词典抽取情感词,然后根据特征情感词对进行特征情感词矩阵初始化,接着根据特征词相似度转换为属性情感词矩阵,最后构建主题模型。本文还提出一个基于主题模型的情感倾向性分析框架。首先,对评论集进行文档化处理,然后利用主题模型进行属性分类,最后利用情感词典进行情感倾向性计算。最后,本文设计与实现了一个基于主题模型的情感搜索引擎。实验表明,本文的算法能够有效的构建主题模型,同时本文的基于主题模型的情感倾向性框架分析具有良好的准确率、召回率和F值。最后,本文所实现的情感搜索引擎IMovie基本能够满足用户对于电影情感搜索的需求。
其他文献
随着数据库技术的广泛应用,企业信息系统产生了大量的数据,如何从这些海量数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。数据仓库与OLAP(联机分析
长时间运行的Web应用系统存在软件老化现象。软件老化会造成严重的经济损失、对系统可靠性影响大,如何解决Web应用系统软件老化问题已成为当前研究的热点。为了降低软件老化
近年来,随着智能接口和人机交互技术的迫切需求和快速发展,以人脸表情识别为主的情感计算成为新的研究热点。人脸表情识别能够增强人机交互的智能性和友好性,具有重要的科研
蚁群优化算法( ACO )内在的并行性、鲁棒性等良好特性使其成为解决复杂组合优化问题的一种非常有效的计算模型,但ACO亦存在初始求解速度慢、易出现早熟或停滞现象的缺陷,本文
如何快速地、准确地诊断癌症一直是困扰着医生的难题,很多肿瘤病例由于病变区域介于良性与恶性之间,一些欠缺经验的医生不能及时下诊断,使得病患耽误医治的最佳时机。癌症的发病
随着互联网用户和规模爆炸式增长,如何让用户更快捷的搜索到需要的信息成了学术界和搜索引擎公司共同关注的问题。搜索引擎上用户查询的形式是多种多样的,如何正确的分析查询
随着计算机和互联网的迅速普及,人类进入了信息时代,各种信息资源呈现出了爆炸式地增长。在大量的信息中帮助用户更加准确地找到他们想要的信息就成为了信息检索的重要任务。
目前,搜索引擎以及在线音乐网站主要采用文本关键词匹配的方式搜索相关的音乐,其中用作文本关键词的信息可以是音乐名称、演唱者、专辑名称或者歌词等。然而,这种以文本关键词为
车牌自动识别技术通过实时监控经过监控区域的车辆,对违章车辆进行自动抓拍和自动识别车牌号码,然后对违章车辆信息进行处理。它的出现大大缓解了交通事故的增加和警务人员的
分析震动数据从而识别震动目标类型和震动目标位置,在周界安全防护领域具有重要的研究意义。在了解国内外地面震动目标识别和定位技术的基础上,本文研究了基于时间序列相似搜