实体数据库中多相似连接顺序选择策略

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:melancholy111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  按照元组描述的实体对其进行组织和查询处理是一种管理劣质数据的有效方法。考虑到同一个实体的同一属性存在多个描述值,因此基于实体的数据库上的连接是支持多个值的相似性连接。由于多表连接操作的连接顺序对连接性能有着重要的影响,研究了实体数据库上多表连接顺序选择方法,采用基于实体的马尔可夫链蒙特卡洛(MCMC)方法估计出实体数据库的相似性连接操作的结果大小,并以连接结果大小和有无索引作为主要代价,提出了基于实体的多连接顺序优化策略。进一步,通过实验证明了估计连接结果大小的算法在大规模数据上有着显著的优势。
其他文献
能源危机和变革给传统的输电模式带来了巨大的挑战.柔性直流电网以其灵活、可控、高效等特点,成为新的电力输送方式之一,但在关键技术与装备等方面仍存在较多问题有待解决.文
  变异测试是一种基于缺陷的软件测试技术,在近四十年得到国内外学者的广泛关注,并取得了一些研究成果。对已有的研究工作进行总结,将其分为变异测试原理、优化和应用三个模块
会议
  微博不同于传统的社会网络和电子商务网站,存在用户活跃程度低,微博数据稀疏和用户兴趣动态变化等特点,将传统推荐算法应用于微博推荐时,效果并不理想。提出了一种基于贝叶斯
会议
1922年生于广东汕头的吴南生,是改革开放第一批“闯将”、广东省经济特区早期的主要拓荒者。他于1979年3月向中央提议,“广东应在改革开放中先走一步,划出一块地方,用各种优
  DBSCAN算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正
  数据空间是一个异构的环境,并且数据及模式具有随时间演化的特性.已有的实体识别技术很少考虑时间信息在识别中所起的作用,并且没有考虑实体随时间演化的特性.针对数据空间
  针对闪存缓冲区置换算法的性能验证基本采用仿真模拟的现状,提出了一种基于PostgreSQL的有说服力的性能验证方法,重点讨论了在PostgreSQL上扩展闪存缓冲区置换算法的方法和
  本文建立了苯并咪唑类农药多菌灵残留的快速支撑介质液液萃取-高效液相色谱分析方法.以经过特殊工艺处理的硅藻土为介质液液萃取的吸附填料,对苯并咪唑类农药中有代表性
会议
  利用人眼视觉感知特性评价图像的质量一直是图像处理领域的研究热点,但是目前很多客观评价方法未能充分考虑视觉感知特性。针对当前工作的不足,提出了基于边缘梯度信息的图
一起因食用“鲜奶豆腐”引起的蜡样芽胞杆菌食物中毒金彩,王亚宾,王慧群,李静028000内蒙古自治区哲里木盟卫生防疫站蜡样芽胞杆菌引起的食物中毒国内外均有报告。在我国引起中毒的食物