【摘 要】
:
作为检测数据集中不一致数据的方法,函数依赖受到了广泛的关注.近年来,硬约束、等值约束、编辑规则、差分约束等被相继提出,用于发现更多的不一致数据.然而,这些约束规则仅适
【机 构】
:
三江学院 计算机科学与工程学院,南京210012;南京航空航天大学 电子与信息工程学院,南京211100
论文部分内容阅读
作为检测数据集中不一致数据的方法,函数依赖受到了广泛的关注.近年来,硬约束、等值约束、编辑规则、差分约束等被相继提出,用于发现更多的不一致数据.然而,这些约束规则仅适用于静态数据集中不一致数据的检测,而实际应用中,存在着大量随时间演化的动态数据,已有的规则忽略了具有时态语义数据的描述.该文首先提出了时态数据质量规则的形式化表达,为了提升检测效率,给出一套规则相关的性质,利用性质去除规则集中冗余规则;其次给出了不一致数据检测算法,并通过剪枝的策略对算法优化,再利用算法和不一致数据查询语言获取冲突数据;最后,通过实验验证,本文提出的方法能够检测出更多的不一致数据,经过优化后的算法执行效率较高.
其他文献
高效视频编码(HEVC)在H.264之上实现了显著的编码性能.但是却以明显的编码复杂度为代价获得了性能上的提高,其中,由于对所有可能的编码单元(CU)进行基于率失真优化的遍历搜索
颅内出血区域结构不明确且存在伪影和其他脑组织等噪声对分割任务造成了极大的影响.针对这类问题,为提高颅内出血分割的性能,本文提出了融合密集连接与注意机制的颅内出血分割方法,在全卷积网络的编码器部分引入密集连接块进行颅内出血特征提取,但从编码器中提取的特征并非所有都可用于分割,为此,本文将融合空间和通道注意力的注意力机制融入网络架构中,在空间和通道方面对颅内出血特征进行加权,捕获丰富的上下文关系,获取
为了降低下一代通用视频编码(VVC)帧内预测编码单元(CU)划分的计算复杂度,提出一种基于梯度幅值相似度的CU快速划分方法.首先,计算当前编码单元下层的四个子编码单元的平均梯度幅值相似度偏差(M GM SD),根据该信息来确定当前编码单元是否进行四叉树划分或不划分.其次,当不满足四叉树划分和不划分的条件时,通过遍历得到三叉树划分和二叉树划分的子块像素方差的方差,根据该信息来选择二叉树和三叉树中最佳的划分方式.在全I帧条件下,本文方法与VTM7.0(VVC Test Model 7.0)标准模型相比,编码时
RDMA是在高性能计算中应用最广泛的网络通信技术,以高吞吐、低延迟、低CPU占用而著称.随着高性能计算向云环境迁移,如何在虚拟机环境下高效地利用RDMA通信成为一个研究热点.本文针对高性能应用最常使用的MPI/RDMA通信库,提出在虚拟机环境下的通信优化方案VMPI.VMPI采用连接虚拟化、控制路径与数据路径分离等技术来满足云环境的要求,通过在数据路径上实现对大消息的零拷贝传输来降低端到端通信延迟.实验表明,相比于传统的RDMA虚拟化实现,VMPI可将MPI的点对点通信延迟减少40%左右,并可降低应用基准
光伏产业的面积统计是一个具有挑战性的问题,通过深度学习自动获取光伏面板的面积是一个可行的方案.为了快速准确地获取光伏面板的分布情况,本文设计了一个卷积神经网络模型用于提取遥感图像中的光伏面板.首先,以Res Net作为主干网络,结合金字塔池化模块构建了一个多尺度模型,以此表达各种尺度的光伏面板的视觉特征.然后,引入了非局部操作,融合长距离的上下文依赖关系,利用目标之间空间上的相关性更准确的提取前景
基于卷积神经网络的去噪方法对图像的加性高斯白噪声去除效果良好,但对图像的真实噪声去除效果欠佳.本文对加性高斯白噪声和真实噪声的灰度直方图进行统计分析,根据两者之间的分布差异构建出一个基于注意力机制的端到端盲去噪网络LDFNet,有利于学习真实噪声图像的复杂像素分布特征.LDFNet网络包含3个部分:特征自适应学习模块(L)、多尺度残差密集模块(D)与特征多路径融合模块(F).其中,模块L基于通道注
渗出液是糖尿病视网膜病变(Diabetic Retinopathy,DR)早期出现的特征之一,也是判断糖尿病视网膜病变严重性的重要指标.由于渗出液在亮度特征上与视盘具有很大的相似性,渗出液的分割通常需去除视盘的干扰.为了加强图像的细微特征,本文提出了一种新的图像增强方法预处理方法,使得渗出液比视盘具有更高的对比度.深度U-net在训练样本较少且对稀疏性目标分割时具有较好的效果.本文在U-net结构
社交网络的关键节点识别是网络数据挖掘的基本研究问题,根据用户角色辨识网络的关键用户对提升网络拓扑结构的稳定性具有重要意义.针对有向社交网络的节点重要度分析和用户角色识别,本文考虑网络的拓扑结构、节点的属性和节点之间的相互影响,提出新度量—拓扑势距离TPD,挖掘网络中的关键节点;提出一种基于二维有向拓扑势的用户角色识别模型,根据节点的有向拓扑势和局部影响力划分4类用户角色.以3个真实有向社交网络为例,剖析用户角色识别结果,分析拓扑势距离与7项常用的节点重要度指标(中心性指标、PageRank等)间的相关性,
通过把大量信息按照各自特点进行分块,简化庞大信息和数据的规模,粒计算为处理大数据提供了一种有效的方法.决策形式背景通过对象集和属性集以及他们之间的关系定义算子,从而
针对实际应用中用户在真实路网上进行移动服务(如出租车,救护车,外卖等)的查询需求,提出反向时间依赖路网上移动对象的k近邻查询问题.在分析现有查询算法的不足后,建立了反向时间依赖路网和基于标记点的最短路径树.并在此基础上,给出了一种针对反向时间依赖路网上移动对象的k近邻查询算法TDSPT-k NN.通过采用基于最短路径树的启发式函数等剪枝策略,进一步提升查询效率.最后,通过仿真实验对TDSPT-k NN算法和已有算法在多种情况下的对比分析,结果表明相比现有算法,TDSPT-k NN算法查询效率平均提升65.