基于Web日志的用户行为大数据分析

来源 :沈阳师范大学 | 被引量 : 6次 | 上传用户:lcg512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大数据作为当下热门话题被人津津乐道,来自全球管理咨询公司的麦肯锡如此说道:“数据早已广泛的运用到现今的每一个职业,化为当前最紧要的生产要素。挖掘大数据所隐含的内容、有效的使用大数据,能够促进了生产力的增加”。随着“大数据时代”的到来,大数据的普遍使用,使得数据的数量成倍的增加,以前我们会认为这些数据是一些没有用的网上垃圾,但随着技术的发展和对数据的收集与分析,才深刻的认识到数据在生活中的重要作用,并且可以指导一些企业的发展方向。当下如何使用这些数据,并从这些数据当中发现一些隐含的规律,成为目前研究的一个热点问题。网络运营商就是执行网络运营和为用户供给服务的一个实体,在为用户供给服务的同时,还会保存用户查看网页的所有数据,并且依靠这些数据,用户的所有行为习惯都会被网络运营商获知,这样更加有利于针对不同的用户推销他们更加倾向于购买的产品,从而使得网站营销更加精确、有针对性。因此,本篇论文便是以某电商网站的Web日志记录为例,提取这些数据所包含的用户特征属性,并且我们可以使用对属性特征加权的朴素贝叶斯分类器,来对不同的用户的消费倾向性进行归类预测。本文通过以下几点来实现:(1)从Web日志预处理、用户特征属性提取和用户行为分析三个方面着手,挖掘出Web日志中关于大数据的用户行为记录,并详细的从这三个方面入手,重点突出地介绍前两个方面。(2)对冗余数据等不需要的数据进行清理、辨认是否为独立用户、识别是否为新操作等数据预处理操作进行详细的分析,提出了基于Spark的特征属性提取方法,对于用户访问所产生的Web日志,进行提取用户的特征属性,比如说商品的种类,用户的地理位置,访问及其等待的时间。(3)依据贝叶斯分类所需要属性之间条件独立作出更改,设计了基于特征属性加权的朴素贝叶斯分类器。使用获取的有关用户行为的属性值,利用特征属性加权的朴素贝叶斯分类器计算分析,实现对用户的高低消费行为倾向性进行分类。(4)基于Spark框架下,对不同的电商网站的Web日志,进行对网络用户的行为大数据分析,我们根据爬虫得到的用户在网站的浏览和购买记录,可以对用户的购买意向进行预测。
其他文献
竞争:“几大酒种的竞争是在消费者层面展开的”《新食品》:其他酒种的兴起。正在和白酒抢夺消费者。目前。红酒行业的年增长率达到了10%-15%。洋酒的年增长率则达到了16%-20%,保健酒
目的探讨无创呼吸机治疗慢性阻塞性肺疾病(COPD)合并睡眠呼吸暂停低通气综合征(SAHS)的效果评价。方法选取2014年10月~2019年10月我院收治的70例COPD合并SAHS患者作为研究对
目的研究急性脑出血患者通过醒脑静注射液治疗的临床效果及应用。方法抽取普内科收治的急性脑出血病患共45例,将其依循双盲法分为研究组和参照组,研究对比治疗效果。结果(1)4
对于阙光伦来说,过去的十年是他经营洋葡萄酒事业一个典型缩影。十年前,阙光伦在上海开办了首家夏朵洋葡萄酒专卖店,是洋葡萄酒专卖店模式在中国的先行者之一;十年后,阙光伦已经拥
当水井坊超高端定位成功之后,为什么国窖1573、舍得迅速跟进?当口子窖成功之后,为什么全国地方名酒马上不惜重金投入终端争夺战?这是因为酒水行业的标杆模仿思维即“运营竞争思维
黄酒,虽然被誉为世界三大古酒之一,在中国市场所占的份额却远远低于它的名气,各种营销模式和营销手法也远远没有白酒和葡萄酒成熟,这是黄酒本身的特殊性。当此轮通货膨胀压力增大
今年7月19日,以研讨福建黄酒历史文化、未来发展趋势为主的闽派黄酒论坛,在龙岩市沉缸酒厂隆重举行,同时举办的还有龙岩沉缸酒新品发布会。龙岩沉缸酒业有限公司董事长王锐军主
目的分析腹腔感染病原菌分布及耐药性,以期为临床合理用药提供依据。方法收集某院2014-2016年分离自门诊及住院患者腹腔标本的病原菌资料,应用Whonet 5.6软件进行统计分析。
采用基于密度泛函理论的第一性原理平面波赝势方法,研究本征LiNbO3晶体以及Fe、La掺杂LiNbO3的电子结构及光学性质。计算LiNbO3晶体在不同掺杂体系下的折射率、反射率、吸收