电商流量大数据处理系统设计与开发

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:liongliong510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的发展和互联网的日益普及,使得电子商务飞速发展,电商企业不断涌现,用户数量成倍增加,导致电商网站的多源流量数据也随之快速攀升。传统的电商流量数据处理方式存储数据量有限,支持的数据源格式少,亟需引入现代化的电商流量大数据处理系统,以满足企业流量数据处理的需求。论文基于Hadoop技术和Elasticsearch技术,设计并开发电商流量大数据处理系统,实现海量电商流量原始数据的快速提取、转化、加载和管理,最终计算得到电商网站的页面点击量、独立访客数、页面转化率、页面跳出率、页面导出率等流量指标。论文主要工作如下:1.在文献查阅的基础上,综述了论文研究背景与意义,以及电商流量数据处理的国内外现状,详细介绍Elasticsearch中的搜索引擎Lucene和分布式存储技术、ETL技术中的分布式文件存储系统HDFS和编程模型MapReduce以及开源框架SpringMVC、Spring和Mybatis技术。2.从市场需求、社会经济效益、功能需求等方面对系统进行总体分析,基于原始数据ETL模块和流量统计服务模块的详细需求分析,设计系统的数据导入、数据ETL、数据管理和参数统计四个功能模块,并详细介绍了各个模块的功能。3.原始数据ETL系统采用Hadoop集群中的分布式文件系统HDFS存储数据,采用MapReduce编程模型处理流量数据,同时支持Oracle、MySql和PostgreSql等关系型数据库、数据接口以及其它类型的原始数据源的处理。4.流量统计服务系统采用Elasticsearch集群作为流量数据源,可根据需要进行集群扩容,采用Oracle数据库存储系统常规数据,采用SSM框架搭建系统后台,采用Bootstrap、Jquery和Ajax等技术进行前端开发。5.原始数据ETL系统实现原始流量数据的提取、处理和管理,以及将处理后的流量数据导入到Elasticsearch集群中;流量统计服务系统基于Elasticsearch集群中的流量数据和Oracle数据库中的常规数据实现了多种流量参数的统计,同时实现了人员管理、流量报警和定时邮件等常用功能。目前,电商流量大数据处理系统已经在国内某著名大型电商企业投入运营,系统运行稳定、反应良好。
其他文献
浙能乐清发电厂1,2号机组是国产600MW超临界机组,自投产以来,6,7号低加一直存在疏水不畅问题。通过水力计算和分析,找出了问题的主要原因是管道始端与终端间的负高差太大,据此提出
地埋式入侵监测系统具有隐蔽性强、受自然因素影响小、误报率低、识别概率高等特点,在入侵监测中具有重要作用。介绍了将光纤传感用于入侵监测的主要技术方案,阐述了光纤分布
<正>1月21~22日,中国储运2014年工作会议在北京召开。2013年,中储系统积极应对低迷复杂的宏观经济形势,深入开展党的群众路线教育实践活动,稳步推进战略实施,努力拓展市场空