论文部分内容阅读
基于Internet上数据分布的特点,人们提出了合并查询(Fusion Query)的概念并且给出了相应的查询方案和相应的查询优化算法。但查询方案没有对数据量的分布情况加以考虑,这导致大量的冗余数据在各个数据源之间反复的传递,这样就大大地降低了方案的执行效率。目前多数研究集中于数据在均匀分布状态下的优化。但实际应用中数据多为不均匀分布,并且有很大的偏差。该文以此给出了在不均匀数据分布上的查询优化方案。并分析了其性能和比较。