产品网络评论挖掘研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:jkhy66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅速发展,网络上涌现了许多购物网站和产品论坛,这些购物网站和产品论坛不只介绍商家的产品,还为消费者提供了发表评论的平台,消费者能及时的将对商品的评论反馈给商家以及那些潜在的消费者。越来越多的人在做出消费决策前喜欢先到互联网上参考用户和媒体对某产品的评论和报道信息。但是互联网上的信息数量巨大,全部阅读这些评论来帮助做出决策十分困难,所以急需一种有效的文本挖掘方法应用在观点评论上。   评论挖掘是文本挖掘的一个应用。文中简述了文本挖掘的概念和文本挖掘的技术方法,然后介绍了评论观点挖掘的处理方法以及涉及的技术,包括领域词的获取、词语相似度的计算、构建情感词典计算文本情感倾向、句法分析等技术。   本文通过简单候选领域词+扩展领域词过滤的方法得到最终的领域词。实验结果表明,使用本文中的两步走的方法确实能提高领域词获取的准确率。   本文还研究了利用《知网》计算词语相似度的计算方法。《知网》含有丰富的词汇语义知识和世界知识,内部结构复杂,是一部比较详尽的语义知识词典。在情感倾向识别试验中,达到了99%以上的准确率。   在本文第五章,构建了一部基本情感词典和一部领域情感词典。根据这些情感词典就可以计算文本的情感倾向度了。本文在计算文本情感倾向度时,还考虑了情感词的词性、否定词、程度副词、词语特征向量对情感词情感倾向度的影响,取得了较好的实验结果。   第六章中对指代消解、句法分析技术做了一些探讨,并利用句法分析树挖掘主题词与情感词的匹配关系。   基于上述方法,本文搭建了一个基于互联网的产品评论挖掘系统。该系统结果以直观的报表形式展现,用户可以从中得到一些非常有价值的信息。
其他文献
当前网络中存在着许多诸如网络扫描、拒绝服务攻击等以网络入侵或网络破坏为目的的网络异常行为,严重影响了网络的正常运行。虽然目前已经有了基于阀值过滤、特征匹配、统计
随着互联网和移动通信网的迅猛发展,下一代互联网协议和3G通信协议的产品层出不穷,而各种产品的开发离不开协议测试工具的检验。由欧洲电信标准协会ETSI(European Telecommun
随着Internet网络的普及,Linux操作系统正在各个方面得到广泛的应用。Linux操作系统在服务器、嵌入式等方面已经取得不俗的成绩,在桌面系统方面,也逐渐受到欢迎。于是,Linux
与Voronoi图不同,Power图有着精确限容的特性。在普通Power图上添加容量限制约束即得到容量限制Power图。现有生成容量限制Power图的算法时间复杂度高,速度较慢。本文提出了
因特网与音视频编解码技术的飞速发展使得更多的人可利用网络进行通信,这大大的刺激了网络语音(Voice over Internet Protocol)的发展。为了解决规模扩展及成本激增的问题,Pe
当今自动机理论及其相关的形式语言的理论得到了高度的发展,由其衍生出的知识也层出不穷。但经典自动机和语言理论也存在某方面的不足,特别是一些证明从数学的角度看仍不够完美
微粒群算法是基于群体智能理论的优化算法,通过群体中粒子间的合作与竞争产生的群体智能指导优化策略。微粒群算法与其它进化算法有许多共同之处,均使用“群体”概念,表示一
KVM(键盘、显示器和鼠标的缩写)系统的工作模型为客户/服务器模型。客户端通过RFB(远程帧缓冲)协议远程控制服务器。在KVM系统中,虚拟磁盘技术将客户端逻辑磁盘虚拟给服务器
图论是组合数学和离散数学最重要的分支之一,也是计算机科学、运筹学、系统科学的重要基础。图论的研究不仅具有重要的理论价值而且具有重要的应用背景,它已被广泛地用来解决信
随着计算机网络的空前发展,带宽已经成为制约其发展的一个瓶颈。而光纤由于其传输频带宽,通信容量大,损耗低,电磁干扰小,质量轻等优点,已经成为现在网络中最主要的一种传输介质。因