基于地理位置的个性化新闻推荐系统设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:bh2068285
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻作为人们获取信息的一种重要手段,在推荐系统领域是一个研究热点。一个好的新闻推荐系统会吸引大量的用户,并且不同用户在不同地点的阅读需求是不同的,将地理位置这一因素加入到推荐系统中,可以使新闻推荐系统更有价值。基于此,本文设计了一种基于地理位置的个性化新闻推荐系统,本文的主要工作如下:(1)本文基于Flink分布式流式计算引擎,结合地理位置上下文信息,设计并实现了基于地理位置的个性化新闻推荐系统。本系统具有Web服务功能、基于地理位置的个性化新闻推荐功能和数据处理和存储三个功能。数据处理和存储功能采用Redis、Elastic Search、HDFS等存储介质对推荐过程中产生的中间产物和结果进行存储;基于地理位置的个性化新闻推荐功能为用户提供相关新闻推荐服务、个性化推荐服务以及基于地理位置的热门推荐服务;Web服务为用户提供基本的注册登录功能,同时将新闻推荐结果列表渲染后进行展示,供用户阅览点击,满足用户的基本需求。系统中涉及到的分布式存储和分布式计算引擎,都具有很好地集群扩展能力,并且分布式集群都设置为主从模式,使系统具有良好的稳定性。(2)由于地理位置因素的引入,本系统主要解决了两个问题,分别为地理位置冷启动和基于地理位置的热门召回。地理位置冷启动借鉴协同过滤算法,若地理位置相似,则处于两个位置处的用户阅读偏好应当相似。对用户之前去过的地方进行聚类,得到每个聚类簇的标签列表,紧接着对用户目前所处的位置与聚类簇的中心点进行计算,判断用户所处于哪一个聚类簇,将该聚类簇中的标签与新闻进行匹配;基于地理位置的热门召回实时地统计该地理位置处的热门新闻。通过对两个功能进行测试,证实两者皆能提升推荐系统的点击量,同时冷启动还可以为系统吸引更多的新用户。
其他文献
随着科学技术的发展,各种各样定位设备不断涌现,可获取到轨迹数据的数量与种类迅速增长。对获取到的轨迹数据进行储存,分析在行为识别、交通规划、城市安全与防控等方面都可以发挥重要作用。其中,对人类轨迹的研究可以获取行为方式、个人偏好等关键信息,对许多领域的进一步研究都有推进作用。因此研究行人的轨迹预测算法具有重要意义。传统的轨迹预测方法基于数学统计模型对行人的运动模式建模难以适用于复杂场景。复杂场景中存
在城轨车辆运行试验过程中发现了车辆存在紧急通风逆变器不能启动的问题,针对该问题分析逆变器的启动工作原理,核查设备与车辆的接线点位及线缆的走线路径,最终确定问题的根本原因是由于设备干扰导致误触发停止信号使逆变器无法启动,经研究对电路进行改进,并经过实际运用验证表明改进措施行之有效。
现代社会,随着互联网技术的高速发展和信息化时代的到来,全球信息量暴增,人工处理信息的速度远不能满足人们的需求。自动文本摘要技术可以帮助人们快速从文本中精炼出重要信息,从而提高人们信息获取的效率。自动文本摘要技术主要分为抽取式和生成式两大类,两类方法有不同的使用场景。为了满足不同的应用需求,本文对抽取式的TextRank算法和生成式的PreSumm模型进行了研究,并对其中存在的问题提出了改进方法,提
伴随着信息技术以及各种互联网企业的迅猛发展,面对爆炸的数据以及种类繁多的新业务,传统老旧的运维方式已经不能满足一个大型企业的需求,高昂的人力成本也是人工运维必须要去面对的一个问题。在此场景下,一个高智能化的运维系统显得尤其重要。因此,针对上述问题,人们提出了一种基于机器学习的智能化运维(AIOps)技术来解决这些困难。容量分析是智能运维(AIOps)中极为重要的一个部分。本文研究的电信运维容量分析
源代码搜索是指根据自然语言查询语句获取对应的函数代码片段。其中主要涉及了自然语言处理技术,并通过将自然语言处理技术引入到源代码文本上,实现跨越自然语言与源代码两种模态形式进行搜索。现有的方法基于传统的序列表示模型分别处理自然语言语句与源代码文本输出形成向量表征形式,经过相似性比对实现搜索任务。但传统的序列表示模型例如词包模型、循环神经网络模型等对语义的特征能力抽取不足,而源代码信息含量对比自然语言
在问题规模不断增大的背景下,机器学习和深度学习的应用门槛越来越高,且需要极具经验的人工干预。然而,人工干预往往需要耗费大量的时间和计算成本。为了更好的解决上述限制,本文针对机器学习和深度学习流程中的超参数优化以及模型选择两个流程进行深入研究并实现高效的算法。对于超参数优化问题,本文以强化学习作为技术支持,实现了一种超参数优化方法。该方法通过序列选择各个超参数的方式,能够减少每一步超参数的搜索空间,
知识图谱已经在各行各业中得到了很好的应用,如法律、医疗、金融等领域。然而软件知识领域至今还没有相应的知识图谱得以建立,因此构建软件知识领域知识图谱显得十分重要。其次将软件知识图谱融入到软件领域个性化习题推荐中,可以增强推荐的科学性和可解释性。本文针对目前软件知识领域中的知识图谱构建及其相关技术问题展开了相关的研究,主要研究内容如下:对软件知识领域知识图谱的关键技术展开综述。由于目前关于领域知识图谱
近些年,人工智能已经由传统的感知智能逐渐向认知智能过渡,认知智能与自动推理成为研究的重点。如何将深度学习应用于逻辑推理,从而让机器具备思考和推理能力将是人工智能的重大突破口。本文的研究内容是基于图同构的初等数学推理引擎的设计和构建,推理引擎的系统设计理念基于产生式系统,并涉及到知识表示和实例化规则库的构建两部分。具体研究内容如下:(1)初等数学的知识表示知识表示是类人解答系统求解问题的第一步,只有
目前工业企业对于如何利用现有数据推动数字化转型,提升业务效率并没有十分明确的思路。针对这种现象,探索工业大数据的采集、分析与应用成为了大数据领域研究与发展的一个新方向,并且有必要建立一个专属的数据挖掘平台为工业数字化转型提供生态建立的支点。本文以工业大数据为基础、以工业应用场景为研究对象,挖掘工业应用场景中的通用化模块,并基于Hadoop分布式框架和Spring Cloud微服务框架实现一个能够对