面向金融大数据的高效数据处理机制的研究与设计

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:laj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术在各行各业的普及,大量的数据产生于不同的行业,给大规模数据分析与计算行业带来了全新的挑战,大数据技术已经受到了各行各业的重视。在金融领域中,数据处理一直是金融IT系统中非常重要的一部分。从交易系统到管理系统,大量的数据产生于各个阶段,亟需有效的大数据处理手段来应对数据不断增加下的各种需求。Hadoop系统框架的提出,带来海量数据处理技术新的潮流。由于Hadoop具有开源、可扩展、经济适用以及处理数据的高效等特性,使得它在计算机行业得到了广泛的应用。本文基于某金融公司实际的交易日志系统,以Hadoop平台为基础,结合多种大数据处理技术,研发面向金融大数据的专用存储与处理系统,实现高效的数据加载、管理与查询。解决了现有系统中的以下问题:1.数据规模庞大,大大超过了传统数据管理与挖掘技术能够有效处理的范围;2.主流的Hadoop大数据处理平台虽然应用在该公司金融数据上存在计算资源利用率极低等。本文首先详细研究了在原始系统中使用到的Hadoop平台关键技术。主要研究了Hadoop File System、 MapReduce框架和Hive相关理论知识。其中Hive部分,分别对Hive架构、HiveQL、文件格式和UDF等进行了比较深入的研究。使用HiveQL与Linux结合的方式,对原始系统的Hadoop执行日志进行文本处理,找到系统的常用业务需求。对原始系统中的物理表结构、字段等进行分析,找到系统中的存储冗余问题。通过对系统的架构进行分析,找到系统查询性能问题。针对系统以上问题,文中提出从逻辑结构、物理结构、系统架构方面的详细优化方案。通过物理表和多视图结构的方式,优化系统逻辑结构。对于物理结构,提出了优化的存储格式Morcfile。在系统架构方面,提出了更利于数据处理的系统架构。最后,对提出的优化方案介绍了详细的实现过程,并在实际的系统中进行了效率测试和性能测试,验证了系统设计的有效性和可行性。
其他文献
随着旅游业的不断变革与改进,如何发挥绩效审计的作用,成为旅游企业必须面对的问题。本文通过分析绩效审计的内容、存在的问题,提出了综合运用传统审计方法,运用"互联网+"工
澳门回归祖国二十多年来,经济发展取得了举世瞩目的成就。同时,澳门经济仍存在着产业结构单一、抗风险能力差等现实问题。为保持澳门长期稳定繁荣,中央和特区政府在促进澳门
抗击新冠肺炎,人工智能走上一线。在杭州市委党校观察点、宁波市海曙区某隔离点、嘉兴市南湖区集中观察点,送餐机器人纷纷上岗;南京市浦口区汤泉街道出动无人机为居家隔离人
近年来,随着改革社会的高速发展,我国区域产业经济取得了良好进步。在国家政策的扶持下,区域产业结构的优化在促进市场经济发展的进程中占有一席之地。区域产业结构自身的发
国家经济发展的核心竞争力之一是技术水平提高,技术水平的来源于技术创新和对于技术溢出的吸收。技术溢出是世界技术成果进步的重要途径之一,技术溢出途径包括国际贸易、研究
我国经济的飞速发展,使工程建设也进入快速发展阶段,无论是建筑工程的规模还是数量都在不断的增加。因为建筑工程是一项很大的工程,所以资金投入巨大,造价管理就成为建筑工程
近年来,随着利率市场化改革和互联网金融冲击,资本市场竞争加剧,商业银行面临利差收窄、金融脱媒等多重压力和挑战。在激烈的市场竞争中,建设一支高素质干部队伍是决定商业银
针对疫情带来的困难,笔者送中小微企业六字箴言。一是"现金"。中国企业应对灾难的意识淡薄,这次疫情后活下来的企业一定要注意,从当下开始不仅要保障现金流为正,还要学习"现