【摘 要】
:
当前Internet上存在着海量的日志数据,他们中蕴藏着大量可用的信息。对海量数据的存储和分析都是一个艰巨而复杂的任务,单一主机已经无法满足要求,使用分布式存储和分布式计
【机 构】
:
南通大学计算机科学与技术学院,南通航运职业技术学院
【基金项目】
:
国家自然科学基金(No.61300167);南通大学自然科学基金(10Z033)
论文部分内容阅读
当前Internet上存在着海量的日志数据,他们中蕴藏着大量可用的信息。对海量数据的存储和分析都是一个艰巨而复杂的任务,单一主机已经无法满足要求,使用分布式存储和分布式计算来分析数据已经成为了必然的趋势。分布式计算框架Hadoop已经日趋成熟,被广泛的应用于很多领域。该文描述了一个针对大日志分析的分布式集群的构建与实现过程。介绍了日志分析的现状,使用vmware虚拟机搭建了Hadoop集群和日志分析系统的构建方法,并对实验结果进行了分析。
其他文献
《数字信号处理—DSP》是该院的一门技术性和实践性较强的专业方向选修课,论文从课程开设目的、教学现状、教学内容、教学中存在的问题和改进的措施几方面对课程的教学思路进
目的 :针对当前学龄前儿童口腔保健中的问题与不足,开展多元化健康教育干预,评价干预实施效果。方法 :随机选取上海市浦东新区3所幼儿园,以其中4~5岁儿童为对象,随机抽取1所
共享型优质教学资源库的构建是高校"质量工程"和国家示范性高职院校建设的重要内容。通过引入云计算的思想,并结合当前云计算在高校教育信息化建设中的应用现状,从硬件、软件
随着城市地下空间和轨道交通的开发利用,深基坑工程所伴随的降水沉降问题越来越受到人们的关注。通过对上海地铁九号线宜山路站的室内模型试验、现场监测数据的分析以及数值
为更好地掌握社会和用人单位对我院毕业生的综合评价,广泛听取企业意见和建议,为学院教育教学改革、专业建设和就业指导服务提供参考,不断提高政府、用人单位、学生和家长的
在阐述地面沉降风险基本内涵及特征基础上,以上海市为例,详细介绍了地面沉降风险评价的工作流程、评价指标及评价方法。以地面沉降风险评价结果为基础,结合上海目前地面沉降
互联网信息时代新形势下,基于数据海量特征及司法实践通行做法于法有据之需要,公民个人信息真伪举证责任应当引入举证责任倒置规则。从适应当前严厉打击侵犯公民个人信息犯罪
作为汉赋的代表作家,司马相如通过自己的艺术实践,将赋体文学发展到相当完美的程度,成为大汉“一代之文学”。本文在前人研究基础上,另辟蹊径,从空间批评的角度,对司马相如赋
访问控制列表(ACL)被广泛应用在路由器和三层交换机上,它是用来过滤和控制数据包的一种访问控制技术。该文主要阐述了访问控制列表的基本概念、主要功能、工作过程及配置,并
历史上,呼伦贝尔地区以北方世居民族为核心,形成民族交往交流交融的基本态势。清朝政府的移民政策使移民大量增加,促进了多民族交往交流交融的发展。多民族的格局,以及近代以