商品评论信息挖掘及其在推荐系统中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aaajansen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网及电子商务行业的发展促使了越来越多的消费者选择网上购物。为了提高网上购物的用户体验,购物网站纷纷采用评论与评分机制和推荐系统(Recommender Systems)来了解消费者的消费满意度与潜在的消费倾向。事实上,评分仅仅代表了用户对商品的总体印象而评论则包含了用户对商品具体特征的情感倾向。因此,商品评论信息具有更大的挖掘价值。一方面,消费者的购买意向和偏好受到多方面因素的影响,例如流行趋势、公共政策等等。消费者常常通过撰写评论来表达对某件商品的关注程度。因此对于一件商品来说,其收到的评论数量可以很好地作为其在消费者中流行程度的判别指标。对于互有竞争关系几件商品,可以通过它们所收到的评论数量来判断各自未来流行趋势。另一方面,如何正确合理地利用用户评论来了解消费者偏好倾向也是亟待解决的重要问题。传统的推荐系统往往只利用了评分信息来挖掘用户偏好,必须考虑如何将商品评论加入到推荐系统这一框架之中。针对以上问题,本文主要提出了如下解决方法:  (1)对用户评论的数量特征和分布特征进行了研究,并总结了评论文本包含的信息。  (2)针对互有竞争关系的商品,本文提出了一个预测用户短时关注量分布变化的框架。在该框架中,用户评论被作为用户关注程度的衡量指标,通过一系列用户评论特征,可以很好地预测出在未来的短时间来,处于竞争关系的几件商品谁会获得最多的用户关注量。通过此项研究方法,可以判断网上市场的流行趋势变化和用户的消费习惯走向。  (3)提出log-bilinear矩阵分解模型,该模型基于传统推荐系统和log-bilinear文本模型,同时挖掘评分信息和评论文本内容,提高了推荐结果准确度。该模型在多个亚马逊数据集的实验结果表明其相较于之前的推荐模型的有效性和高效性。
其他文献
机器人直线轨迹特性是工业机器人的一项重要指标,其中的轨迹重复性和稳定性综合反映了机器人的机电性能和控制运动轨迹能力,成为工业机器人最重要的一个出厂检测指标。但长期以
随着游戏领域的不断发展,游戏的种类和数量在不断地增长,相应的,游戏攻略数据也不断地增多。游戏攻略包含大量游戏升级信息,是玩家特别是新手玩家的主要查阅对象。目前,游戏攻略数
随着Internet技术的不断发展,越来越多的企业利用Internet技术组建企业信息网.基于Web的企业信息系统从根本上满足了企业对信息高质量的需求,提高了企业的经济效益,为管理者
电子政务是当前我国信息化工作的重点。电子政务的核心问题之一是实现政府各部门行政审批程序的电子化、网络化,即网上审批。网上审批将使提高政府办公效率、优化审批流程、精
随着技术的发展,无线传感网的应用越来越深入人们的生活,但无线传感网自身能量有限的缺陷很大程度上限制了其发展。如何有效地使用有限的节点能量,延长网络的生命周期成为了无线
随着通信技术、网络技术的不断发展,网络已经成为我们学习和生活中重要的基础设施.而校园网作为学校教育信息化建设的基础,在教学、科研、管理等方面发挥着越来越重要的作用.
主存数据库是数据库技术的一个分支,一般指将整个数据库存放于主存之中,通过简化操作、精简代码来缩短系统的响应时间,增加系统的吞吐量。它特别适用于一大类实时应用系统。传统
海量数据的存在以及从海量数据中提取决策信息的强烈需求,使得数据挖掘日益成为研究的热点.该文主要研究了数据挖掘的理论、相关技术以及数据挖掘技术在现实中的应用.论文以
设备管理位于网络管理中的最底层,属于网元层管理,对不同类型的网络设备开发专用的网管系统,可以突出设备的特性,同时更好地控制和管理网络设备,提高网络运行效率。本文旨在研究新
车牌识别系统是图像处理技术在智能交通系统中的具体应用.该论文主要围绕设计和实现一个实用的车牌识别系统,在涉及到的相关领域进行了展开之外,着重介绍了车牌识别系统中的