个性化电影推荐算法综述

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:haojianhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据时代,各类影视资源纷纷涌现,“信息过载”问题在影视行业愈发凸显,有效的电影推荐算法是解决这个问题的关键。本文首先总结了电影推荐的主流推荐算法,主要有协同过滤、基于内容的推荐和混合推荐三类算法,然后比较分析了几种推荐算法的优缺点。最后,针对推荐算法的发展方向,又对基于上下文的推荐算法进行了简单的介绍。
  关键词:电影推荐;协同过滤;基于内容的推荐;混合推荐
  Abstract:In the era of big data, all kinds of film and television resources have emerged, and the problem of "information overload" has become increasingly prominent in the film and television industry. Effective film recommendation algorithm is the key to solve this problem. This paper first summarizes the mainstream recommendation algorithms of film recommendation, including collaborative filtering, content-based recommendation and hybrid recommendation, and then compares and analyzes the advantages and disadvantages of several recommendation algorithms. Finally, according to the development direction of recommendation algorithm, the context based recommendation algorithm is briefly introduced.
  Key words:Movie recommendation; collaborative filtering; content-based recommendation; hybrid recommendation
  1引言
  近年來,影视行业搭乘互联网的快车,发展迅速,数量和种类增长快速。面对令人眼花缭乱的海量影视资源,“电影过载”问题日益凸显,用户需要花费大量的时间寻找自己感兴趣的电影,并且用户对观影的要求也更加多样化。如何提升用户满意度,进而增加用户黏度是视频门户网站当前面临的巨大挑战。由此可见,提升个性化电影推荐算法性能的研究具有重要意义。
  2电影推荐算法研究
  推荐系统能在大数据时代有效的解决信息获取泛滥的问题。在日常生活中,辅助人们做出决策。传统推荐算法通常分为四类:协同过滤推荐、基于内容的推荐、基于人口统计学的推荐和混合推荐。
  2.1基于协同过滤的推荐算法
  协同过滤是推荐算法中的经典,也是当前应用最广泛的推荐算法,其思想可以概括为“物以类聚,人以群分”[1],是“集体智慧”的体现。例如,用户想要看电影,但没有明确观影对象时,通常会让兴趣类似的朋友推荐电影,这就体现了协同过滤的思想。协同过滤分支众多,通常来说可分为三类。
  (1)基于用户的协同过滤推荐算法
  此算法原理简单,就是从用户的角度出发,从大量用户中寻找与目标用户有相似兴趣的用户群进行推荐[2]。下面以基于用户的电影推荐为例,介绍一下推荐的流程。如图1,当对张三推荐时,张三和王五都看过电影《算死草》和《百变星君》,而张三和李四没有相同的观影记录,显然张三和王五的观影偏好更相似,故将王五观看过的电影《少林足球》推荐给张三。
  (2)基于物品的协同过滤推荐算法
  基于物品的协同过滤[3]从物品的角度出发,通过寻找与目标用户有关系的物品的相似物品进行推荐,一定程度上缓解了上述问题。如图2是一个基于物品推荐的简单例子。在这个例子中,用户喜欢《速度与激情8》和《敢死队》两部电影,然后推荐系统会分别找出与这两部电影最相似的三部电影,根据公式计算用户对每一部电影的感兴趣程度。例如,计算用户对《哥斯拉》的兴趣度。因为这部电影和《速度与激情8》以及《敢死队》的相似度分别为0.4和0.5.考虑到用户对《速度与激情8》的兴趣度是1.3,对《敢死队》的兴趣度是0.9,所以用户对《哥斯拉》的兴趣度为1.3*0.4 0.9*0.5=0.97。将用户对每一部电影的兴趣度计算出来,选择兴趣度最大的电影推荐给用户。
  2.2基于内容的推荐算法
  基于内容的推荐算法是最早被使用的推荐算法,是在信息检索和信息过滤的基础上发展而来,其原理就是根据用户有过消费行为物品的类别、标签、评论等相关信息找到与之相似的物品推荐给用户,原理简单,可解释性强[6]。因为基于内容的推荐算法只需根据物品特征计算相似度,且不需要其他用户信息,故不存在冷启动和新物品推荐问题。该算法主要用于文本领域。拿使用此算法的视频推荐系统为例,如图3所示,当给用户A推荐电影时,因为,用户A喜欢电影A,所以系统通过比较电影A、电影B和电影C的类型和主演,发现电影A和电影C都属于“喜剧”类型,且主演都有王宝强,故认为电影A与电影C更相似,所以将电影C推荐给用户A。
  2.3基于人口统计学的推荐算法
  此推荐算法简单、容易实现。简而言之,就是根据用户的基本信息进行推荐。通常,用户的基本信息包括年龄、职业、民族、性别和家庭地址等数据。根据用户的基本信息将用户划分成不同类别,同一类的用户相似,同属于多个类的用户相似度更高[8]。如图4是一个简单的基于人口统计学推荐系统原理图。在这个例子中,Lisa和Ketty年龄相仿、性别相同且都是学生,因此认为Lisa和Ketty的兴趣有高度的相似性,可以认为Ketty很可能喜欢Lisa喜欢的物品A,所以可以推荐给Ketty。通过这个例子可以看出,基于人口统计学的推荐算法仅需要用户的基本信息,所以可以应用到各种领域的推荐系统中。   2.4混合推荐算法
  推荐算法从出现到广泛应用历经十余年的实践,人们发现没有哪一种推荐算法可以适用任何场景,每种算法都它自身的局限性。所以推荐系统的实际应用中,很少使用单一某种推荐算法。并且随着商品数量和种类的增多,用户对个性化推荐的要求也更加多样化,推荐任务更加复杂,使用单一的推荐算法已经无法满足人们多样化的需求。为了解决单一算法的局限性,研究人员提出混合推荐模型[9],其基本思想就是融合各种推荐算法的优点,扬长避短,从而得到最优推荐,处理復杂推荐任务等问题。
  3各种推荐算法的优缺点和未来的发展
  3.1各种推荐算法的优缺点
  上文中提到的四种推荐算法的优缺点对比如表1所示:
  3.2发展方向
  在机器学习与人工智能迅速发展的今天,人们对电影推荐准确性的需求越来越高,一种基于上下文的推荐算法逐渐被专家们关注。从观影用户角度看,其观看电影的时间、地点以及观影时的心情状态等都属于上下文信息。专家学者深入挖掘 用户的上下文信息,并在提取用户偏好时融入上下文因素,得到基于用户个性化的上下文推荐算法,该算法进一步提高了推荐的准确性。文献[10]就是通过余弦相似度计算用户在时间维度上的当前和历史上下文之间的相似性,提出一种基于时间上下文的协同过滤推荐算法,从而预测用户在当前的可能偏好。
  4 结束语
  本文首先总结了电影推荐的主流推荐算法,比较分析了几种推荐算法的优缺点。然后,针对推荐算法的发展方向,又对基于上下文的推荐算法进行了简单的介绍,笔者将在后续的研究中进行深入探讨。
  参考文献:
  [1] 刘攀,陈敏刚.个性化推荐系统评估[J].南昌大学学报(理科版),2016,40(2):143-150.
  [2] 张小川,周泽红,向南,等.基于关联规则的协同过滤改进算法[J].重庆理工大学学报(自然科学),2019,33(3):161-168.
  [3] 梁天一,梁永全,樊健聪,等.基于用户兴趣模型的协同过滤推荐算法[J].计算机应用与软件,2014,31(11):260-263.
  [4] 王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):66-76.
  [5] 张驰,陈刚,王慧敏.基于混合推荐技术的推荐模型[J].计算机工程,2010,36(22):248-250,253.
  [6] 雷鸣,朱明.情感分析在电影推荐系统中的应用[J].计算机工程与应用,2016,52(10):59-63,107.
  [7] 孔欣欣,苏本昌,王宏志,等.基于标签权重评分的推荐模型及算法研究[J].计算机学报,2017,40(6):1440-1452.
  [8] 韩春阳.基于标签的个性化电影推荐算法研究与实现[D].北京:北京邮电大学,2017.
  [9] 孙光福,吴乐,刘淇,等.基于时序行为的协同过滤推荐算法[J].软件学报,2013,24(11):2721-2733.
  [10] 李涛,黎路,符丁.基于上下文信息的协同过滤推荐[J].电脑知识与技术,2015,11(27):174-175.
  【通联编辑:唐一东】
其他文献
摘要:该文针对当前高校班主任工作管理系统缺失,工作过程冗杂、低效的问题,基于微信云开发“severless”架构,使用WXML、WXSS和JavaScript语言,运用结构化生命周期法,设计了一款“方便、高效”的高校班主任日常工作管理系统。小程序具有考勤签到、请假管理、心理健康管理和预警提示等主要功能,将班主任最常用的功能结合在一起,精准定位和处理学生存在的问题。结合微信推送和微信内一键拨打电话功
摘要:在社会高速发展的今天,人们对网络的依赖性已经达到了前所未有的高度,互联网已经成为社会经济发展的保障,对各行各业都有着重要的影响,也是人们生活娱乐的重要媒介,但是随着互联网普及到社会的各个行业,计算机通信的安全问题也逐步进入到人们的视野当中,计算机通信网络安全涉及多个领域,对社会安全以及人身权益造成严重威胁,为了实现计算机通信网络安全运行,该对计算机网络通信安全进行简单阐述,对如今计算机网络通
任务、成就以及存档读档等模块,在游戏中总是不可缺少。对于游戏而言,这不仅仅是必要元素,同时也是游戏的加分项。该文通过以Unity3D为开发平台,以开发的《通通站》项目为实例,从程序开发者的视角阐述了在游戏的程序设计中对于任务、成就、存储系统的理解,使开发者在制作游戏系统时有明确的设计思路,研究也表明开发游戏时,提前思考游戏系统间联系对制作良好的系统是很重要的。
摘要:大数据时代背景下,计算机网络中的不确定因素进一步增多,这给计算机网络安全工作带来了一定的困难,需要对安全工作进一步研究。基于此,本文对此进行了探讨,通过分析当前计算机网络安全问题,提出了相应的安全技术和管理策略,以期为计算机网络安全方面提供解决对策。  关键词:大数据;计算机网络;网络安全;解决对策  Abstract: Under the background of the era of
摘要:高校基层党建工作需向信息化、数字化、智能化方向发展以适应新时代的要求。通过构建智慧党建平台,扩大组织覆盖面、规范党员活动,提高工作效能,提升党建工作的标准化、专业化水平。根据高校党建的党建宣传、在线教育、互动服务、党务管理、党员评价、决策分析六方面服务需求,提出平台的建设框架以及技术路线,并设计相关功能模块。平台对各项党建信息数据进行了整合分析,形成了数字化、智能化的党建工作运行全图。  关
摘要:為了增加跑步健身运动中计步数值的精确性以及跑步的趣味性,设计了基于红外光电传感器、OLED显示屏、MP3模块以及STM8L嵌入式微处理器的健身跑步计步器系统,并实现了硬件电路和软件程序的功能。该系统通过红外光电传感器的发射端通电连续发射红外光,接收端接收红外红外线并转换成电信号,由单片机采集电信号并计数,结果在显示屏上显示。此外,加入MP3模块实现播放音乐和语音提示功能,增加了系统的娱乐性质
基于微信公众号的智慧校园访客系统从物理架构、逻辑架构、功能模块三个角度进行分析研究,将微信公众号、智慧门禁系统、访客系统、短信平台有效结合在一起,实现跨平台无纸化办公。系统开发借助微信OpenID、H5、SQL数据库技术搭建B/S架构,达到访客线上提前申请,线下入校自主验证出行的目的,改善了传统的线下访客人工记录信息流程烦琐的现状,提高了访客出入校园的工作效率,值得广泛推广使用。
明确应用型人才培养的目标,分析找出高校传统教学模式存在的问题,该文以软件开发课程Web开发技术为例,对课程新教学模式进行研究和实践,提出了在课程中采用多种教学模式相结合的方式进行教学,建立团队合作教学,依托慕课平台,实现线上教学,线下以项目引导教学,鼓励学生个性化学习,校企合作,加强实践教学,采用基于过程的考核方式,通过新的教学模式,激发了学生的学习兴趣,提高了学生的实践能力。
摘要:现阶段计算机应用软件在开发环节,往往需要软件设计人员综合考虑,结合软件工程相关知识点,从而提升当前软件开发工作质量。该文主要介绍了当前常用的软件开发语言,并且对软件开发环节编程语言对于当前计算机应用的影响分析,详细提出了三点选择合适的编程语言方法,以供相关工作人员借鉴分析。  关键词:计算机软件;编程语言;开发平台;综合能力  中图分类号:TP311 文献标识码:A  文章编号:1009
摘要:生物多样性是群落生态学中的重要概念,α多样性指数普遍应用于生态学科学研究中。α多样性指数的计算与相关图像绘制,在数据处理与分析阶段是非常必要的。为获取α多样性指数相关数据信息,从规范的“物种-样地”二维矩阵初始数据格式出发,运用Python编程语言开发程序并通过测试,实现较高整合程度与较快计算速度,协助后续研究过程。  关键词:植物群落;α多样性;多样性指数;Python语言;程序设计  A