基于Web的汽车产品评论观点挖掘方法研究

来源 :山西大学 | 被引量 : 6次 | 上传用户:cdronglin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展和电子商务的不断普及,网上信息大量涌现,越来越多的网民希望互联网能够提供更多人性化的服务:商家希望能够及时了解用户对产品的意见或建议,以便改进产品的性能和售后服务;消费者则可以利用网上的评论来指导消费行为,政府部门也希望通过民众的舆情反应来调整一些决策等等。这些迫切的应用需求使得观点挖掘应势而生,并迅速成为信息处理领域的一个热点。本文重点研究基于web的汽车评论的观点挖掘问题。分别从词汇,句子,文本三个层面入手,开展倾向判别与评价对象抽取的研究,探索观点挖掘的新思路与新技术。主要内容如下:本文利用概率潜在语义分析给出了两种不同的词汇情感倾向判别方法:方法1,利用概率潜在语义分析得到每个目标词和基准词之间的相似度矩阵之后,再利用投票法来决定每个目标词的情感倾向;方法2,利用概率潜在语义分析对目标词进行语义聚类和扩展,自动找到每个目标词的同义词,然后采用基于同义词的词汇情感倾向判别方法对目标词的情感倾向进行判别。这两种方法均不受外部资源所限,能在一定程度上解决数据稀疏问题。针对产品评价对象的识别问题,本文首先抽取候选评价对象。通过综合使用词形模板和词性模板以及在对候选评价对象评分之前进行预处理,用以提高候选评价对象抽取的召回率和精确率;其次,从模板种子集和评价对象种子集出发,利用自举学习方法对评价对象进行了抽取,并进一步采用K均值聚类方法对其聚类,希望实现产品名称和产品属性同时自动抽取。综合利用本文的研究成果以及相关技术,研发一个基于Web的汽车产品评论观点挖掘系统。通过网络爬虫技术对后台知识库定时更新,分别从文本级、句子级以及搭配级三个不同的语言粒度对汽车产品进行全方位的观点挖掘,系统最终依据用户的选择,给出某汽车品牌的整体综合评价以及特性评价。
其他文献
连续工业的生产调度是较为复杂的问题,直接关系到企业的发展,影响到企业的生产成本和资源的合理利用,决定了生产过程是否能够顺利进行.该文主要研究了连续工业的生产调度技术
连续体手术机器人具有灵巧的操作能力和环境顺应性,能够使其到达人体内传统手术器械无法或难以到达的位置执行复杂的手术操作,在空间受限的腔内微创手术领域表现出巨大的优势。
随着计算机网络和数据通讯技术的发展,网络用户数量急剧增加,新业务不断出现,通信速率越来越高,应用的综合性越来越强,网络技术越来越复杂.在复杂的网络技术面前,如何有效地
三维超声成像由于能够让医生从多个角度认识造影部位的解剖结构,从而指导相关的手术治疗和定量测定.因此越来越多地受到医学界和工业界的重视.胎儿面部体显示是三维超声成像
该文针对油田综合自动化系统的实现开展了相关的研究.指出实现综合自动化的关键问题之一是如何将底层控制网络与上层信息网络有机结合.通过分析企业网内控制网与信息网之间传
近年来,GPS系统在军事上的应用越来越广泛,很多国家不但用其进行车船的导航,还用来进行武器系统的制导和通信的同步,因此,对GPS系统的干扰就变得越来越重要.而传统的干扰机存
本文先对现有的一些图像分割的基本方法作了简要概述,并对分割评价以及对图像分割评价标准的研究情况进行了简要的介绍.本文研究了基于直方图小波变换的图象分割方法,对图象
燃气锅炉是一种多变量系统,锅炉燃烧过程具有明显的非线性特性,被控量时变性大、影响因素多、内部关联强、外部扰动频繁,建立准确实用的数学模型比较困难。模糊控制器具有无需建
随着计算机与网络技术的发展,高性能集群服务器逐渐成为Web服务器的主要技术之一,而负载均衡是其中有待解决的关键问题.目前,负载均衡方法已由基于IP的负载均衡发展到基于内
该文阐述了镁合金冷室压铸机控制系统的设计与开发过程.镁合金冷室压铸机是目前被广泛使用的一种金属加工设备,主要用于生产汽车、航空设备、电子设备等产品的金属零部件.镁