长期生态监测数据自动校验技术研究与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wxcplayer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国生态系统研究网络(CERN)的科研人员通过观测、试验、调查等手段积累了大量的长期生态监测数据。然而,从原始数据的获取,到形成最终入库供今后科学研究分析查阅的历史资料,中间经历了多次的转抄、转发、汇总、格式转换等过程。都有可能因为人为或非人为的因素,造成数据质量问题,因此迫切需要有效方法对数据进行自动化校验,提高数据质量。   在多年的生态数据监测与校验过程中,CERN综合中心、各分中心及观测台站积累了许多宝贵的长期生态监测数据校验经验。一直以来,数据校验是以手工的方式进行,效率和准确性都不高。为此,本文对长期生态监测数据的上报流程和校验过程进行了深入的研究,根据长期生态监测数据的上报流程和数据校验过程特点,提出了基于规则的长期生态监测数据校验方法。本文的主要贡献是:   1.设计了长期生态监测数据校验规则及其参数配置的标准格式(RDF,Rule Definition Format)。规则采用XML格式,便于规则的分发、编辑与修改,且具有跨域与跨平台的特性,便于扩展和移植。   2.基于开源的模板语言Velocity,设计了数据校验的规则表达式语言。   3.设计了开放的、可扩展的规则工具箱(Rule Toolbox),用工具箱中提供的工具操作可轻松组装成一条数据校验规则,并支持规则的扩展。   4.面向CERN综合中心和土壤分中心的需求,实现了一个数据自动校验系统。   本文设计的数据自动校验方法及研发的数据自动校验系统,已在中国生态系统研究网络综合中心和土壤分中心中得到初步应用,并取得了良好的应用效果。
其他文献
网络钓鱼(Phishing)是近几年来逐渐兴起的网络犯罪。它利用多种手段欺骗用户致使用户泄露个人隐私信息,影响了互联网经济的有序发展,破坏了互联网的信任环境。因此,打击网络钓鱼
中国科学院资源规划项目(Academia Resource Planning,简称ARP)是实现中国科学院资源规划的信息系统工程,主要任务是对全院人力、资金、科研基础条件等资源进行优化配置以及对
稳态强磁场装置是国家十一五重大科技基础设施建设项目,目的是为我国的科学研究提供理想的稳态强磁场极端实验条件和满足多学科实验需求的实验测试系统。中央控制系统是稳态
学位
随着电子商务和人工智能的发展以及社交媒体用户数据的爆炸性增长,从大规模信息流中发现、分离和分析核心论点变得十分必要。论辩挖掘(Argumentation Mining)的主要目标是自动
LTE终端协议栈软件运行时需要处理大量的数据包,协议栈每收到一个新的数据包都要分配相应大小的内存来缓存该数据,待数据成功发送后释放掉该部分空间;同时也要为每一个新的数据
DNS(Domain Name System,域名系统)是Internet上重要的基础设施,承载着域名到IP地址之间的转换,DNS系统的正常运行,是web服务、电子邮件服务、ftp服务等众多互联网应用正常工作的
尽管远程显示技术已经在瘦客户计算和桌面虚拟化等研究和产品中得到了广泛应用,但面对多样的客户机/服务器计算环境,远程显示技术仍然存在诸多问题。首先,远程显示一般用于访问
学位
随着计算机技术和网络通信技术的飞速发展,计算机网络已经遍布全球,并极大地影响着人们的生活和工作,在国家经济和国家安全中也扮演着重要角色。同时,网络安全事件愈来愈多,安全问
学位
快速多极子方法(FMM)可用来加速迭代求解由Laplace方程、Helmholtz方程、Navier方程、Stokes方程、Maxwell方程组等导出的边界积分方程,将矩阵一向量乘积的复杂度由O(N2)降低
声誉机制能较好地缓解Web服务市场中提供者与使用者之间的信息不对称问题。通过对比分布式计算环境下已有的声誉机制与当前Web服务声誉机制后本文发现:目前的Web服务声誉机制
学位