同步/异步ETL架构的比较

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:einima
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的抽取、转换和加载(ETL,Extract,Transform,Load)是构建数据仓库过程中最复杂也是至关重要的一个步骤.根据数据统计,通常的数据仓库项目有将近70%的时间需要用于ETL的工作,该部分占据了相当大的工程开发量.近来在数据仓库研究的ETL方面国内外的学者做出了很多工作,人民大学知识工程研究所的王珊教授等人实现了一个集成了数据仓库、OLAP和数据挖掘的原型系统ParaDAM,该系统还提供了一套独立的ETL工具对关系型数据库进行数据抽取.国外流行的ETL产品有Informatica和Datastage等.文介绍了国外的Winter,R和McCabe等学者对ETL技术的现状和未来的发展方向的研究.本文力图就应用领域的开发实践进行经验总结,对ETL架构理论进行比较,以达到经验交流共享的目的.通常,我们用两种办法来处理ETL流程:一种是异步(Asynchronous)ETL方式,也称为文本文件(Flat file)方式.另外一种是同步(Synchronous)ETL方式,也称为直接传输(Direct transfer)方式。 本文介绍了在数据仓库开发过程中两种ETL抽取模式的特点比较以及如何根据特定的开发条件选择相应的抽取模式。
其他文献
目的:观察紫外线照射充氧自血回输(UBI)对脑梗塞患者血浆内皮素(ET)的影响.方法:应用放射免疫分析法测定32例脑梗塞患者应用紫外线照射充氧自血回输疗法前、后血浆内皮素的含
目的:研究用HSV-1载体经猴嗅神经通路将外源基因导入中枢神经系统的方法,方法:将HSV-1载体接种于喉嗅神经末梢,在不同时间取各部位脑组织检测LACZ基因表达产物β-半乳糖苷酶活性
本文对增效射孔和高能气体压裂中出现的几个常见问题,如内置式增效射孔的炸枪进行了比较和定性的分析,其中对有的还作了定量分析,同时提出了一些解决方案和建议.
我们的祖国是著称于世界的文明古国,是有着优良传统的“礼义之邦”。对中华民族的繁衍昌盛作出了巨大贡献的祖国医学,不仅讲究医术的精湛,同时崇尚行医的高尚道德。高尚的医
ETL技术是建立数据仓库的关键过程,是数据仓库中数据质量的保证.本文提出一种融合JAVA,XML,AGENT等多技术的ETL框架,用于解决异构数据源的数据抽取,以及"脏数据"的清洗问题,
目的:观察"疏肝健脾汤"治疗慢性胰腺炎的临床疗效. 方法:以"疏肝健脾汤"内服为主,结合腹部按摩进行治疗. 结果:56例慢性胰腺炎中,治愈29例,好转25例,无效2例,总有效率9
并行分布式数据库管理系统构建于具有高连通度的多处理器系统之上.站点之间的网络通讯时延非常小,与本地磁盘存取时延具有相同或相近的数量级.由于具有较多数量的处理器,与传
会议
卡氏肺孢子虫肺炎(PNEUMOCYSTISCARINIPNEUMONIA,PCP)是免疫机能低下病人常见的并发症和死亡原因,由于AIDS病人的增多,抗癌化疗和器官移植等医疗手段的应用,PCP病人日趋增多.
该文就我校寄生虫病咨询门诊5年来诊治的56例华支睾吸虫病资料进行综合分析如下.1临床资料1.1一般资料从1991~1996年,据门诊不完全统计,有56例华支睾吸虫病人.其中男47例,女9
目的:为研究受精卵早期发育机理提供大量、同步分裂的受精卵;寻找一种更好的受精卵体外培养基.方法:小白鼠超排取卵,附睾取精,建立体外受精模型.并比较不同培养液对受精卵发