【摘 要】
:
在如今的大数据时代,购物类、服装类以及生活服务类等电商推荐系统层出不穷,系统的搜索以及推荐能力成为支撑该系统的核心技术,如何推荐给用户最满意的门店、商品也是系统的主要功能之一。然而通过研究发现:一些电商平台仍使用数据库关键词模糊查询的方式,导致搜索准确率低下;推荐系统中数据库压力日益增加导致数据提取速度降低;基于传统机器学习的推荐方式逐渐无法满足千人千面的推荐。针对上述问题,本文从数据库、搜索性能
论文部分内容阅读
在如今的大数据时代,购物类、服装类以及生活服务类等电商推荐系统层出不穷,系统的搜索以及推荐能力成为支撑该系统的核心技术,如何推荐给用户最满意的门店、商品也是系统的主要功能之一。然而通过研究发现:一些电商平台仍使用数据库关键词模糊查询的方式,导致搜索准确率低下;推荐系统中数据库压力日益增加导致数据提取速度降低;基于传统机器学习的推荐方式逐渐无法满足千人千面的推荐。针对上述问题,本文从数据库、搜索性能、推荐功能三个角度出发并进行研究,提出一种基于ELK框架及深度学习模型的推荐系统。在对数据库进行优化并改善数据提取性能的基础上,将高效的ELK搜索框架与具有优秀推荐性能的深度学习模型相结合,实现对推荐系统原型的设计与优化。首先分析系统中的基本业务需求,明确实施对象后,从用户、商家以及管理员三个角度进行设计,实现三者登录系统的基本业务功能;之后在数据库表设计的基础上,为应对数据指数级别的增长以及提高用户的使用体验,对数据库源码进行部分修改,同时采用主从部署的方式部署数据库,从而提高数据提取性能。其次针对用户搜索问题,引入ELK框架,用其替代传统的数据库搜索方式,包括分布式部署elasticsearch搜索引擎,优化查询打分方式,构建全量、增量索引,以及为适应中文环境引入并优化ik分词器。再次,在实现核心功能推荐方面,召回阶段将ALS算法与单一的协同过滤算法加权融合形成新的混合方法进行召回,排序阶段使用深度模型代替传统的LR、GBDT、LR+GBDT模型,完成推荐模块的设计开发。最后,对系统进行功能性以及非功能性测试。通过测试得出:系统中管理员、用户以及商家基本业务需求可以完美实现;在负载方面,系统在单机情况下满足负载要求;数据库优化对比方面,优化后用户进入系统后在提取数据时间上有明显下降,错误率有所下降,吞吐量有所提升,不同并发量(括号中数值)情况下用户对数据提取时间分别缩减了:110ms(300)、113ms(400)、95ms(500);算法模型实验对比方面,召回模块中设计的混合算法对用户有较好的吸引效果,点击率值由高至低为混合算法>ALS算法>基于物品协同过滤算法>基于用户协同过滤算法;排序模块中,深度模型相较于传统机器学习算法的AUC值有所不同,实验结果为:WD>LR+GBDT>GBDT>LR,对比结果表明深度模型相较于其余模型推荐性能更佳。
其他文献
学习任务群的评价实施是推动学生语文课程核心素养发展的关键。六个语文学习任务群互相作用,整体融通,强调在具体的语言环境、真实的生活情境中考查语用能力;关注过程性表现、现场表现,注重考查全过程,关注学习成果;强调针对主要的学习环节及内容制订评价量表,引导学生自我反思提升;凸显基础性、阶段性,注重情境性、整体性,体现过程性、表现性。学习任务群的评价实施策略有:改进终结性评价,设计凸显表现性评价的作业和试
该文对光伏场区牧草种植内容进行综合分析和评述,介绍光伏与畜牧业结合的背景和现状,讲述光伏场区土壤环境和空气环境的变化,对在光伏场区生长的沙打旺、羊草、狼尾草、紫花苜蓿的生长特性进行分析,对其适宜生长的位置进行综合,提出光伏场区牧草种植存在的问题及解决措施。
近年来,随着新能源汽车的飞速发展和减少全球碳排放量的要求,动力电池已成为汽车中最受欢迎的储能系统之一,但是与此同时很多主流电动车都出现了电池自燃,突然失去动力等严重故障。因此,通过电池管理系统对动力电池进行安全性、可靠性、耐用性的监视和控制就有了非常紧迫的现实性意义。传统的电池管理系统有两种方案,一种是完全基于车载单片机实现,该方案软件无法动态升级,算法一次性写入芯片无法后期迭代,所以精度和准确性
地震预警是指在地震破坏性能量抵达预警区域前快速准确地报告地震信息,其中主要的科学问题是地震事件的判断(P波到时的捡测)、地震震源的定位和震级大小的估算。本研究即围绕这三个问题开展研究,提出基于深度机器学习方法的P波捡拾算法Ppick、震源定位方法DNNLOC和震级估算算法CNN-EQMG。快速准确的P波到时捡拾对地震预警系统至关重要。传统的P波到时捡拾算法包括长短时平均法STA/LTA、赤池信息准
近年来,随着科技的进步,机器学习技术得到了飞速发展,在工业制造,医学诊断,无人驾驶等许多领域,我们都可以看到机器学习的影子。经济科技的发展使得机器学习面对的应用场景不断扩大,同时这也使得数据形式变得复杂:例如数据中含有较多噪声或者一些错误的内容,这给传统机器学习技术的应用带来了巨大的挑战。在众多机器学习技术中,Takagi-Sugeno-Kang(TSK)模糊系统作为一种常用的分类模型,凭借其优秀
数据同化是指在考虑数据时空分布以及观测场和背景场误差的基础上,在数值模型的动态运行过程中融合新的观测数据的方法。它可以有效解决随机动力系统的状态及参数估计问题,应用领域包括大气科学、海洋科学、水文、自然灾害、全球定位系统、机器人和计算机视觉等。机器学习尤其是深度学习可以从数据中学习复杂的模式和非线性关系,根据已知数据给出预测或估计。目前已经在模式识别与图像处理、控制及优化、通信、自动驾驶和机器人仿
随着国家提倡智能制造,越来越多的机器人等辅助分拣工具被用到分拣上面。但是大部分用到的机器人还是需要人工示教,并不能充分提高分拣效率和机器人的灵活性。将带有机器视觉的机械手技术,使用在物流分拣任务中会大大提高分检效率。如何让机械手移动到视觉系统识别出物体的位置,并准确抓取是本文主要解决的问题。对于上述问题,本文以VS2019作为开发平台,用LS3-B401S-V1爱普生机械手作设计了一套面向物流行业
智能工厂是智能制造的重要内容,而生产系统性能预测和评估是智能工厂生产控制和决策优化的基础。智能工厂利用传感器、物联网等技术实现物物互联、信息共享、服务协同等功能,其中利用采集的海量多源制造数据,挖掘出制造系统性能指标的演化趋势及数据间的影响规律,实现车间性能预测,有利于指导智能车间的运行优化和自主调控。因此,本文在智能工厂背景下研究基于数据驱动的生产系统性能预测,主要研究内容如下:(1)数据驱动的
现如今工业机械设备朝着精密化、自动化、大型化和系统化的方向发展,滚动轴承的微小故障就可能对大型精密机械设备造成重大损害。机械零部件故障的诊断与预测一直都是保障工业机械设备稳定运行的基本条件。滚动轴承作为机械设备中不容忽视的存在,其稳定运转更是保障机械设备安全运作的前提。鉴于滚动轴承在工业设备中的重要地位,轴承故障诊断算法应运而生。而传统轴承故障诊断算法对专家知识要求高,设计的诊断模型结构复杂,并且
疲劳状态下的驾驶(疲劳驾驶)是引起交通事故的主要原因之一,给人们的生命和财产造成了重大损失。因此,设计并实现一种能够对疲劳驾驶准确地做出预警的方法,对减少因疲劳驾驶导致的生命和财产损失有重大意义。脑电图(Electroencephalography,EEG)记录了人大脑皮层神经细胞的电活动,可以直接反映大脑的即时状态,避免人为主观因素的影响,所以被认为是最有效的精神状态检测方法。传统的基于EEG的