论文部分内容阅读
该文采用了理论分析和实例研究相结合的方法对数据仓库渐变维进行系统的研究.数据仓库决策系统可以从两大部分理解:数据仓库系统的体系结构和数据仓库逻辑建模方式——多维数据建模.该文的第二章介绍了数据仓库决策系统的体系结构和数据分析的流程,并阐述了涉及到处理渐变维的ETL、OLAP、元数据管理等概念和工具;论文的第三章分析了多维数据集的两个重要模型:星型模型和雪花模型,介绍了维度、量度、层次、级别、成员、立方体等建模知识,并在此基础上引出渐变维的处理需求.论文的第四章指出渐变维是在时间上维度属性值的变化.根据不同的行为方式,渐变维可以划分为覆盖历史、保存历史、保存历史视图三种基本类型.并且在这三种基础上,可以使用混合渐变维的方法.作者在总结前人研究的基础上,从行为方式、技术实现、工具支持和应用范围等角度评价了三种渐变维的处理方法,指出:第一种渐变维方法由于直接用新数据重写了历史数据,所以不能跟踪历史;而第三种渐变维由于改变了数据库的表格结构,因此在应用上较少;第二种渐变维方法由于可以准确的跟踪历史,是支持进行准确的历史属性分析的主导技术,被广泛运用在项目中.在该文的第五章中,作者改进了处理渐变维的关键技术.在ETL的维表数据更新策略上,由于传统的ETL数据更新策略对于渐变维的更新速度比较缓慢,论文提出了使用循环冗余校验和(CRC)技术来加快数据的史新.在OLAP服务器对第一种渐变维的处理技术中,由于物理视图问题引起了Cube的更新难题,论文在改进相关技术后,采用了类似会计学中的记账方法,分成四个步骤解决了该问题.同时论文采用"计算成员"方法来粘合同一渐变维在不同层次上的统计值,部分解决了第二种渐变维的"历史片断"问题,并改进了相关的聚合表达式,可以更快的进行聚合计算.论文的第六章是该论文的案例部分.以某一社区决策支持系统建设为背景,"社区"维度是一个渐变维.该章节以该社区渐变维为例,分析了社区渐变维由于社区分拆、社区合并、社区撤销、社区所属上级单位变化等行为造成统计分析失真,起不到准确反映历史变化的功能,我们设计的决策系统采用第二种渐变维方法处理该维度.该章阐述了项目的体系结构和一个涉及到社区维的分析数据模型,随后完整的完成了渐变维的处理流程.其中在ETL数据更新上,结合具体的ETL工具——Informatica实现渐变维数据的更新;在OLAP和展示上使用Cognos工具解决了两个需求问题,即在时间切片上正确反映社区信息和保证社区在时间区间内的有效性.在该章的最后一节,作者就当前各种展示工具对渐变维的展示效果支持不够完善,提出了几条建议,主要有:①给出渐变维变化前后的上下文含义,②在第二种渐变维处理时,在同一张图表内给出展示渐变维的前后变化情况.