数字图书馆云存储系统研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:yue_pan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为IT行业的一项新兴技术,云计算最初由亚马逊、Google等国外IT公司首先研究和应用,而后被学术界广泛研究,这些研究集中在体系结构、关键技术、编程模型、支撑平台和产业应用等方面,对关键技术和产业应用的研究是云计算领域最重要的两个方面,关键技术主要包括虚拟化技术、云中的安全机制、云检测、数据管理、能耗管理、资源调度等,产业应用涉及大数据集分析、RDF数据分析、数据库应用、医学与生物科技、地理信息系统、企业信息系统、天文学应用和云安全等领域。论文分析使用云技术搭建数字图书馆存储系统的可行性和技术准备,可行性分析包括云计算的行业适应可行性、业务适应可行性、基础设施可行性、数据库应用可行性、跨平台可行性等方面,数字图书馆采用云计算的技术准备包括规划容量、统一数据格式、调整应用程序架构、设计机器映像等工作。对商业云计算服务和开源云计算技术进行系统归纳,对三个最重要商业云计算厂商包括亚马逊、Google和微软的云计算平台从技术和市场策略、体系结构与使用流程三个方面进行对比,详细比较三个平台在数据存储与数据库服务方面的特征。分析EMC、IBM、惠普、Oracle和思科等传统硬件厂商云计算技术和产品,研究开源云计算系统的系统结构、技术特点和应用情况,而后将云技术进行归纳,从互联网云计算和IT云计算两方面进行论述,在此基础上提出云技术选择模型,认为数字图书馆可以采用虚拟化技术,用软件管理的方法提高存储系统效率。论文介绍著名开源云计算系统Hadoop,利用VMWare workstation在单台PC上搭建三台Linux虚拟机,组建虚拟局域网,并成功部署一个小型Hadoop集群,该集群包括一个NameNode和两个DataNode,阐述试验环境、搭建步骤,进行系统格式化、系统启动、添加节点、负载均衡等基本操作,其后讨论Hadoop集群的产业应用情况,包括Web搜索、大数据集分析、与数据仓库集成等,分析不同集群的规模和配置状况,指出Hadoop集群进一步推广需要在与其他文件系统兼容性和互操作、大规模小文件的管理和系统传输效率等方面进行研究和改进。最后进行总结和展望。
其他文献
命名实体的识别是自然语言处理工作的基础,更是推动信息抽取、信息检索、机器翻译等信息工作进一步发展的保证,因此,如何将各种文本中的命名实体识别出来以供检索成为一个关
信息资源的作用随着信息社会的到来更加凸显。据估计,中国的档案信息资源占到了信息资源总量的80%左右,综合档案馆作为积累国家档案资源的主渠道,保存社会历史记忆的基地,其馆藏档
一招熟与全面技术的关系以及技术训练与战术训练的关系是当前摔跤训练中两个非常重要的必须处理好的内容,本文对这两个方面训练的方法进行介绍和分析,对提高摔跤训练的质量和
OAI-PMH元数据的关联数据化是指将OAI仓储中的元数据转换为关联数据,可以解决用户在按传统方式采集这些元数据时所遇到的问题.总结现有相关研究的不足,描述OAI-PMH元数据的关
沿用国内外学者对创新气氛维度研究的成果,将团队带头人创新风格作为高校科研团队创新气氛的一个新的维度,并结合另外三个维度:参与保障、目标认同、创新追求与支持,更有效地
随着现代运动训练理论的发展,核心稳定性训练开始逐渐被引入了竞技体育运动训练领域,并得到较为理想的应用效果.鉴于此,本文就针对核心稳定性训练在青少年足球训练中的应用进
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要意义.文本分类的发展与模式识别的发展密切相关.文本分类具有的类目多、样本数目多、噪音多、各类别样本数目不
大数据的时代背景下,面对如何实现高校海量科研数据的长期保存、检索,提供、服务的功能,满足科研人员日益增长的需求,迎接学术交流危机,顺应开放获取运动的推动,体现图书馆在大数据
对需求描述工具——概念模型在信息系统开发中与用户的沟通效果问题进行研究。基于认知理论分析,得出概念模型的信息组织结构特征会影响用户理解模型的认知过程,同时根据语义
目的 分析沈阳市某院女性乳腺癌患者的临床流行病学特征,为乳腺癌防治提供依据.方法 用回顾性研究法,按ICD-10编码C50为依据,从某院病案管理系统,筛选2012-2018年就诊、病理