论文部分内容阅读
随着计算机技术的不断发展,每天都有海量的信息持续更新和增加,面对互联网上纷杂的数据,人们通常难以从其中找到自己真正需要的信息资源,推荐算法因此被提出。推荐算法能够根据用户以往的行为及评分预测出用户偏好,针对当前用户生成一个独一无二的推荐列表,主动引导用户对信息的发现。目前大部分的推荐算法利用的都是用户的显式反馈(比如评分),但这些显式反馈收集难度大且真实性无法保证。实际上,探究用户对物品的兴趣还可以依靠存在Web日志中的大量隐式反馈。就电商平台而言,用户从搜索到下单必然产生许多中间数据——点击、浏览、关注、收藏、加购等等,这些行为数据在未被用户察觉的情况下收集,能够真实可靠地反映用户兴趣,且这些行为数据能够实时更新,因此基于用户行为的推荐算法具有重要的研究价值。本文对推荐算法国内外发展现状、常用数据集以及测评指标进行了充分的调研,并分析了现有研究成果的不足,开展了如下工作:(1)要利用行为数据进行推荐,首先要建立起用户行为与用户兴趣间的联系,将用户行为量化表示,这需要对用户行为进行深入理解与分析,准确挖掘行为和兴趣间的隐含关系。一般的算法都是直接人为地给用户行为赋予分数,这种方法十分粗糙,可解释性差,造成行为模型不能够准确表示用户兴趣度。因此,本文提出了一种能准确衡量用户兴趣度的用户行为模型。该模型充分分析了行为产生的动机,利用主观G1法和客观熵值法两种方式给行为赋权,并结合时间因素对模型造成的影响,提高了模型的准确性,为如何利用行为数据提供了新的解决思路。实验结果表明,用户行为模型降低了人为赋权所导致的误差,提高了的推荐结果准确性。(2)基于用户行为的推荐算法受平台或数据集的限制一般都是离线定期更新,但在现实生活中用户兴趣每时每刻都在发生改变,因此体现着用户兴趣的行为模型也应该不断变化,这对算法的时间复杂度提出了更高的要求。内在兴趣的变化影响着外在行为的表达,因此系统收集到的反馈也在实时更新着,因此我们将利用这些源源不断的反馈修正模型,利用矩阵分解达到模型的动态更新,并在此基础上提出了一种基于用户行为反馈的推荐算法。实验结果表明,该算法能够有效提高模型的更新速度,也进一步提高了推荐结果的准确性。