【摘 要】
:
科学数据是科研工作者从事各种研究的基础,他们在无穷无尽的科学数据中发现新的规律,发现新的知识。而对科学数据的管理则是进行科学研究工作的重要保障,良好的管理可以加速科学
论文部分内容阅读
科学数据是科研工作者从事各种研究的基础,他们在无穷无尽的科学数据中发现新的规律,发现新的知识。而对科学数据的管理则是进行科学研究工作的重要保障,良好的管理可以加速科学研究的进展。然而,关于科学数据的处理浩瀚而繁琐,学术界迫切需要处理科学数据的新方法。 关于科学数据的存储是科学数据管理的一个重要方面。在科学数据的最初采集阶段,由于仪器、环境、性能等方面的原因,科学数据都是保存成文本格式,以一种半结构化的方式存储有其特有的方便、快捷等优势。而在科学数据的处理分析阶段,关系数据库技术避免了传统的以文件方式保存科学文本数据所具有的数据意义不明确、管理难度大、查询代价大、开发工具少等明显缺点,为科学数据提供了优秀的应用平台。这样,两个阶段中数据存储形式的差异矛盾就带来了如何将两种形式的数据形式进行有效的映射、转换的问题。 首先本文对科学文本数据进行了特征分析,并根据其特点提出一种科学文本数据的模型及其形式化的表达方法,以及在此模型基础下科学文本数据的抽取方法。在这之后,针对文本数据和关系数据的各自特点,建立了连接两种数据格式下数据模型的映射和转换方法。接着,以上述方法为基础,本文设计并实现了基于上述内容的执行系统,该系统的总体结构按照ETL的架构设计,核心组件由抽取器、转换器和加载器组成,该系统同时也具有ETL系统的一些其他特点。最后结合海洋科学数据的特点,建立了针对海洋科学文本数据的抽取方法和映射模型,将复杂科学文本抽取转换装载系统应用到了海洋数据中,并经测试验证了其有效性和正确性。
其他文献
随着应用需求的日趋多样化,系统芯片(System-on-a-Chip,SoC)中集成了越来越多的功能部件。与此同时,随着半导体器件特征尺寸的减小和工作频率的提高,SoC的时序收敛和功耗控制变得越
电子文件是计算机信息的基本载体,很多重要的数据、资料、报告都是以电子文件的形式在计算机终端上存储、交换和传输的。电子文件信息的安全一直是用户关心的重点。对于在终端
随着Web技术的迅速发展,基于Web的分布式计算模式已是软件应用的必然趋势。以Web服务为核心的面向服务体系结构(SOA)为在Internet上构建灵活的分布式应用提供了基础架构。用户
本文分析了数字水印的特点,讨论了数字水印的技术方案和应用方案。Contourlet是继小波分析后的新一代信号分析工具,具有多分辨率、局部化和多方向性等优良特性,更适合处理图像等
Web技术的飞速发展将地理信息系统带入一个崭新的发展阶段。GIS技术与Web技术的结合,推动了GIS领域的一个重要发展方向—WebGIS。将WebGIS技术引入到日常工作中,是城市信息化
中药的质量控制是关系到中药的现代化、产业化、国际化的关键。现行工艺采用中药指纹图谱技术实现质量控制,由于分析时间长,不能实现在线质量分析。近红外(NIR)光谱技术分析
随着移动数据库应用领域的不断扩展,在非事务性的工程应用、地理信息系统、多媒体应用等领域,基于关系模型的移动数据库技术不能提供有效的数据模型扩展性,其阻抗匹配问题增加了
大量来自功能磁共振成像(fMRI)的研究表明静息状态下解剖和功能相关的大脑区域间存在着低频自发神经元活动的同步性,这种同步活具有重要的生理意义。而且,自发活动相同步的脑
随着视频监控系统的应用日益广泛,国内外对于视频监控技术的研究亦如火如荼。但无论是模拟视频监控系统,还是数字化网络视频监控系统,甚至融合了智能图像处理之后的系统,视频
随着软件产业的深入发展,应用软件系统的开发和使用存在的问题日益突显,其中主要有可扩展性、可重用性以及可集成性差,这些问题在实现企业信息化,开发能够“随需应变”的面向