【摘 要】
:
随着互联网+的提出,人工智能时代的到来,互联网中产生了越来越多的数据,这些数据就像待开发的宝藏,挖掘得当可以为从业者带来巨大收益。大数据挖掘技术也日益成为计算机学科的研究重点,这其中最热门的研究方向之一就是推荐算法的优化研究,目前各大app,如抖音、淘宝等的推荐技术保证了其app的客户忠诚度。针对物品推荐领域,先前研究人员已经做了大量工作,比如基础算法的提出,但是算法总有缺陷,该领域的数据稀疏性、
论文部分内容阅读
随着互联网+的提出,人工智能时代的到来,互联网中产生了越来越多的数据,这些数据就像待开发的宝藏,挖掘得当可以为从业者带来巨大收益。大数据挖掘技术也日益成为计算机学科的研究重点,这其中最热门的研究方向之一就是推荐算法的优化研究,目前各大app,如抖音、淘宝等的推荐技术保证了其app的客户忠诚度。针对物品推荐领域,先前研究人员已经做了大量工作,比如基础算法的提出,但是算法总有缺陷,该领域的数据稀疏性、冷启动、可拓展、用户兴趣漂移等四类问题均未得到有效解决,且一直是领域人员研究重点。本文针对传统推荐算法的不足,给出了相应改进,根据传统协同过滤推荐算法,本文提出一种以协同过滤算法为主的混合Top-N推荐算法,Top-N分析法就是通过Top-N算法从研究对象中得到所需的N个数据,并从排序列表中选取最大或最小的N个数据,从而给问题的解决提供解决方案。本文的主要内容包括以下几个方面:(1)介绍大数据平台的搭建和数据集,hadoop计算平台下载及配置,搭建完成之后对平台的有效性进行测试。处理实验所需的经典数据集movielens数据集和IMDB数据集,以上两方面的工作均为后续的实验奠定了良好的基础,算法将在大数据平台进行运行测试,既可以节约时间,又减少了硬件性能不足下带来的宕机问题,数据集主要用于算法的学习和实验结果的分析。(2)运用层叠式算法原则,采用一种混合属性聚类,实现基于商品的灵活聚簇,然后再利用强关联规则算法挖掘商品之间的关联关系,以寻找用户潜在的喜好商品,此步骤用以解决可扩展性问题和用户数据稀疏性问题。再利用加权法将上述算法与时序协同过滤算法进行融合。时序协同过滤首要考虑的是时序相关性,用以解决用户兴趣漂移问题。最后给出参数调整以及算法对比,并实现基于大数据的混合Top-N推荐算法。推荐系统使用python中的Django框架建立页面,mysql数据库连接,因本文为物品推荐,数据集采用真实女装数据集并在其中嵌入混合Top-N推荐算法形成物品推荐。
其他文献
随着雷达探测技术的飞速发展,军事装备隐身防御系统的战场生存受到了严重威胁,为了降低目标的可探测性,提高突防能力,隐身技术的发展具有重大意义。在雷达隐身技术中,涂覆型吸波材料因其优异的吸波性能和简单方便的制备工艺而备受关注。优良的吸波材料必须具有轻质量、低密度、薄涂层、强吸收、宽有效吸收带、耐高温和抗氧化等特性,将这些优异性能集成在吸波涂层中是研究人员面临的巨大挑战。研制性能优异的电磁波吸收材料和制
中国城市化进程导致建设用地的扩张严重挤压了农业及其他用地,然而如何在建设与留置之间取得最大效益的平衡,定量监测城市建设用地及其扩张趋势,是决策者的一个紧迫科学问题。本文基于多源遥感影像数据对2003-2019年区建设用地面积进行提取,分析其建成区扩张的时空特征,再利用灰色预测模型对其扩张进行预测,获得以下认识:(1)采取自然间断法确定影像阈值,建立具有一致性的遥感夜光数据时间序列,相互校正确定最优
逻辑程序设计和归纳逻辑程序设计是人工智能领域的重要方向。本文主要研究针对特定对象的逻辑归纳学习,以及在计算机围棋对弈中的应用。归纳逻辑程序设计区别于一般的深度学习和传统的机器学习,归纳逻辑程序设计结果的表达更为直观。这种学习过程具有一般知识的经典逻辑推理功能,还可以具有高阶逻辑推理功能、非单调逻辑推理功能、偏好逻辑推理功能和其他一些非经典的逻辑推理功能。本文对围棋的手法的逻辑程序表示、围棋气和领势
近年来,互联网的快速发展使得数据的价值逐渐显现,用户也越来越重视数据的处理。虽然传统的云服务能够方便快捷的解决数据处理这一问题,但是在应用的快速发布和资源高效调配方面却不能满足用户的服务需求。伴随着容器技术的诞生,容器作为一种更优质的资源虚拟化技术被广泛使用。容器云平台具有高资源利用率,弹性伸缩等优点。容器云平台下任务调度的最终目的是按照用户的多样化服务需求对其资源进行高效合理的分配,使得任务能够
人脸识别作为一种现代生物识别技术近年来已被广泛应用于交通、安保、视频监控、人机交互和网络应用等领域;随着信息科学和技术的进步,人们对于生物特征识别技术提出了更高的要求,传统人脸识别算法已无法应对越来越多变的检测和识别环境。虽然社会上基于人脸的生物特征识别产品已经很多,但大多数都是通过高规格硬件系统和云服务供给客户,进而导致部署费用很高;对识别场景要求不高的客户来说性价比很低。因此研究和开发适合中小
随着社会的不断发展与进步,框架结构以其优良的力学性能,被越来越多应用在我们的生活中。但无论是在框架结构建设初期还是服役期间,框架结构的安全性一直备受瞩目,因此越来越多的学者将精力投入到结构安全监测之中。框架结构出现损伤主要表现在材料老化、构件缺陷、环境腐蚀、疲劳荷载等几方面。当框架结构的损伤积累至一定程度时,框架结构整体承载能力以及抵抗外来灾害的能力会大大降低,极端严重的情况下甚至引发重大灾害,给
探究电离层延迟误差的产生,为GNSS信号处理和短期的震前探测提供理论和数据依据,是提升GNSS定位导航精度的一种重要方法。本文基于经典经验模态分解、排列熵、向量机与长短时神经网络的相关理论对中国地区2013年全年电离层变化以及震区短时异常构建模型,进行了全面分析与测算,并从时空维度分析了电离层变化规律性与异质性进程,主要对如下内容进行了分析总结:(1)详细介绍了电离层产品的详细内容,并利用IGS国
云计算作为新时代的技术产物,具备大容量存储以及高性能计算的特点,允许用户通过互联网设备随时随地进行数据操作,极大地减轻了用户的存储和计算压力。因此,外包数据到云服务器成为当今时代一大热潮。在云环境中,由于实现对明文数据的搜索会带来隐私担忧,因此数据须在外包之前进行加密处理,这使得传统的基于明文检索方法变得不可行。尽管现有的隐私保护多关键字搜索方案在可搜索加密技术上做了许多研究,但是由于计算复杂度很
随着计算机技术和分布式计算的快速发展,云计算作为一种成熟的技术被广泛应用于生活的各个领域。云计算强大的资源存储能力和计算能力为个人和企业带来了极大的便利,但也吸引了更多的黑客。黑客的攻击会对云计算平台的安全性和可用性造成损害,同时也会损害云计算平台用户的利益,因此,加强云计算平台的安全防护,确保用户数据不被窃取或恶意破坏,成为当下的研究重点。目前有许多保障云计算平台安全的手段,其中入侵检测技术备受