互联网产品评论量化关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bambooasu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在互联网上出现了很多的电子商务网站,随之相关的在线用户评论也与日俱增。虽然这些大量的用户评论有助于潜在消费者做出正确的购买决策,但是如何对不同的厂家做全面和直观的比较仍然是一项具有挑战性的工作。为了实现这一目标,本文对互联网产品评论的量化关键技术进行了研究,具体的研究内容包括以下几个方面:首先,本文介绍了基于细颗粒度产品评论语料的标注工具的实现,以及目前进行的语料标注工作。本文中的标注虽然以手机产品为例,但语料标注系统具有良好的可移植性,可以扩展应用到其他的领域。其次,介绍了面向产品评论量化的特征词-情感块的抽取模块。为了提高情感挖掘的性能,本文设计了一些新的机制和方法来提高特征词-情感块的抽取精度,包括基于词性规则的算法、基于统计的算法和二者相结合的算法。实验证明,这些算法在大规模的语料库中能很好地提高抽取的结果。最后,介绍了融合本体知识的产品口碑量化及排序模块。领域本体的引入有效地解决了产品评论语句的稀缺、同一特征词的多重表达形式和不同层的特征词的量化比较问题。在该模块中,可以得到二维结构的口碑值信息,这不仅方便了消费者、供应商和生产商的查询,同时产品的趋向信息可以被挖掘和可视化。实验结果表明,该方法是有效可行的。
其他文献
学位
在和谐人机交互与人工智能领域,情感计算作为一个新的研究方向,日益受到关注。本文采用计算机视觉的方法,让家庭服务机器人通过对人脸表情的识别来认知人类情感,进而做出相应
动态联盟将成为新世纪企业超越传统竞争的新模式的观点,已被学术界和企业界广泛接受,然而,企业如何得到联盟信息,得知信息后如何进行联盟,谁来对联盟进行管理,保障企业的根本
随着汽车工业的迅速发展,汽车控制部件越来越多,控制系统越来越复杂,导致汽车控制软件的开发引入了很多问题,比如重复性开发,软件开发效率低,系统的移植性和扩展性问题。为了
远程实验室可以分为虚拟现实实验室和远程控制实验室。虚拟实验室是采用虚拟仿真技术实现的开放式实验系统,虚拟实验室由虚拟试验台、虚拟器材库和开放式实验管理系统组成,几
“质量即生命,责任重泰山”,工程质量一直都是工程建设过程中关注的焦点,而对工程项目建设过程的质量监督是保证工程质量的有效手段,传统的工程质量监督主要面向业务设计,面
随着无线传感器网络(Wireless Sensor Network,以下简称为WSN)的广泛应用,针对WSN的优化设计方法也得到了越来越多的关注。WSN由于其传感器节点自身能力以及无线传输方式的限
随着互联网上信息的爆炸式增长,通用的搜索引擎很难满足特定用户“专、精、深”的查询需求,在此情况下垂直搜索引擎应运而生。本文研究了垂直搜索引擎的几项主要技术:主题爬虫
随着人工智能和物联网的高速发展,动态目标的定位技术得到了广泛的关注。尽管卫星导航定位技术在户外非常成熟,但是由于建筑物的遮挡,在室内环境下其定位效果并不理想。基于WLAN
前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制。可变剪接的错误调节可以引起多种人类疾病。虽然对于可变剪接的调控机制已经进行了大量研究工作,但人