【摘 要】
:
随着数据时代的发展,劣质数据越来越普遍存在于数据库中,严重影响了数据的质量,这给数据管理带来了新的挑战.目前,已经有很多管理劣质数据的数据模型面世,实体数据模型就是其
【机 构】
:
哈尔滨工业大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金(61133002),国家重点基础研究发展计划(973)(2012CB316202).
论文部分内容阅读
随着数据时代的发展,劣质数据越来越普遍存在于数据库中,严重影响了数据的质量,这给数据管理带来了新的挑战.目前,已经有很多管理劣质数据的数据模型面世,实体数据模型就是其中一种,模型以每条元组表示一个现实世界中的实体,允许劣质数据的存在,鉴于该模型的特点,在进行查询操作时,要根据查询语句和数据的相似程度判断数据是否满足用户需求,因此在实体数据模型相似判断的查询操作中,统计数据库中某条记录大约可以和多少记录相似即能为查询优化工作做一定的贡献,本文就如何获取这个统计量展开研究并提出一种有效的聚类算法解决这个问题.
其他文献
目的:观察循证护理在手术室急诊患者护理中的应用情况。方法:研究对象为在2015年3月到次年3月期间于我院当中就诊的手术室急诊患者当中的56名比较典型性的患者病例,将其按照随
文章首先对“潜能生”和工匠精神进行了概述,然后论述了在高等职业院校“潜能生”转化教育中彰显教师工匠精神的策略,包括教师的自律与细心、教师的厚德与敬业、教师的思进与
目的:随着糖尿病(diabetes mellitus,DM)患病人数逐年增长,糖尿病性心肌病(diabetic cardiomyopathy,DCM)患者也在逐年增加,分子机制尚未阐明。因此,本课题利用H9c2心肌细胞建立DCM体外模型,结合转录组测序(RNA-seq)技术及生物信息学分析,以期揭示DCM的发病机制。此外,对于中医药治疗DCM潜在作用机制,相关研究涉及较少,已有研究也多为复方制剂,
目的:探讨保乳手术治疗早期乳腺癌患者的临床疗效。方法:回顾性分析瓦房店市泡崖乡卫生院2013年3月至2014年11月期间收治的74例早期乳腺癌患者的临床资料,采用数字单双号的模式
目的 :探讨预防性护理对血液透析中心静脉导管血栓形成的干预价值。方法 :选取2016年4月~2017年6月来我院进行维持性血液透析治疗的44例患者为对照组(行常规护理),选取2017年
“恢复华夏衣冠”既包括在政治和思想意识上,恢复华夏民族的统治地位;又指恢复华夏族人的外在形象、仪容即服饰。清末民初的政局变化为汉族传统服装的复兴提供了一次历史机遇
教育变革是近代社会变迁的重要面向,创建京师大学堂是重塑教育体系的重要环节。本文以经费为切入点,考察京师大学堂与晚清变局的互动,探究影响京师大学堂经费的因素与经费对
罹患急性冠脉综合征(ACS)时常伴有高血糖症;已证实其高水平血糖与ACS患者院内近期死亡危险增加有关。现就ACS患者所伴有的血糖升高与其远期死亡风险间关系进行分析。
随着社会经济的高质量发展和科学技术的不断创新,越来越多的工业厂房、办公楼和公寓楼等旧建筑不能满足新的功能需求,需要进行改造加固。而旧建筑的改造加固方案是否具有合理性和可行性,改造后的建筑是否能够满足使用功能要求和安全性,是工程加固改造的关键。针对以上问题,结合某多层工业厂房改造为医院门诊楼的实际改造加固工程,对结构改造加固的方案优选做了探讨,主要研究内容如下:(1)总结改造加固及方案优选的国内外研
摘要:针对基于有监督学习的依存句法分析模型的研究现状与进展进行了总结。重点综述了标注语料匮乏、特征选择与提取、模型一体化三个问题的相关研究内容。首先,详细介绍人们借助依存关系映射和主动学习摆脱标注语料匮乏困境的相关研究;其次,重点总结了不同特征对构建依存句法分析模型的贡献,例如句子级特征、词类别特征、语言形态特征和高阶特征等;最后,分析了依存句法分析模型一体化的优势与不足;此外,详细总结了如何借助