Computing rarity on uncertain data

来源 :Science China(Information Sciences) | 被引量 : 0次 | 上传用户:taiguomin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
The essence of uncertain data management has been well adopted since data uncertainty widely exists in lots of applications,such as Web,sensor networks,etc.Most of the uncertain data models are based on the possible world semantics.Because the number of the possible worlds will blowup exponentially with the growth of the data set,it is much more challenging to handle uncertain data than deterministic data.In this paper,we take the first attempt to study the rarity,an important statistic that describes the proportion of items with the same frequency,upon uncertain data.We have proposed three novel solutions,including an exact method and an approximate method to compute the rarity of a given frequency respectively,and a method to find the frequency of the maximum rarity.Analysis in theorem and extensive experimental results demonstrate the effectiveness and efficiency of the proposed solutions. The essence of uncertain data management has been been applied since data errors widely exists in lots of applications, such as Web, sensor networks, etc. More of the uncertain data models are based on the possible world semantics. Number of the possible worlds will blowup exponentially with the growth of the data set, it is much more challenging to handle uncertain data than deterministic data. In this paper, we take the first attempt to study the rarity, an important statistic that describes the proportion of items with the same frequency, upon uncertain data. We have proposed three novel solutions, including an exact method and an approximate method to compute the rarity of a given frequency respectively, and a method to find the frequency of the maximum rarity. Analysis in theorem and extensive experimental results demonstrate the effectiveness and efficiency of the proposed solutions.
其他文献
随着我国经济的不断发展,交通运输业也进行了技术等方面的调整,近几年,地铁在大城市中起到了不可或缺的作用,大大节省了地面资源,但随着地铁的发展,也出现了新的问题,B A S系
我国的交通事业随着经济的发展在一定程度上提升了交通运行质量,在地铁中的相关运行配置和应急配置的防护与管理也做得越来越好,尤其是地铁火灾自动报警系统的完善和安装在一
近几年,随着国内外环境的不断变化,世界经济逐步趋于一体化,尤其是在我国加入世贸组织之后,与国际经济接轨的要求更为紧迫,如何加强学习,已使国人感到是日益紧迫的当务之急。  学习型组织是现代管理的重要表现形式。该概念最早见于西方学者赫钦斯1968年出版的《学习社会》一书; 1990年,美国学者彼得·圣吉推出《第五项修炼》一书,系统地阐述了如何掌握好进行学习的客观规律,而且不仅针对个人如何学习,更进一步
本文详细阐述了根据矿石硬度正确选用不同硬度的钢球和球磨机衬板,可以获得最低的单耗和最好的球磨机单机处理量.对高硬度矿石如何选用钢球、衬板提出了几点看法. This pape
作为高等教育信息化的重要组成部分,虚拟仿真实验室是多学科多专业与现代信息术相互融合的必然产物.在其蓬勃发展的过程中,存在信息集成不够、共享程度低、与传统实验整合不
【摘要】:道德激励机制是对人们的道德行为进行强化激励的社会机制,科学地运用道德激励机制于高校教育之中,对于充分发挥大学生的主观能动作用,使他们全身心地投入到学校学习和社会发展具有重要作用。可以说,建立和完善道德激励机制,是我们当前高校教育中的一件大事。  【关键词】:道德激励机制 高校教育 作用    所谓激励过程就是引起需要、激发动机、指导行为、实现目标的心理过程,也是调动人的积极性的过程。激励
在粗苯加氢精制项目中萃取精馏工段首先需要通过溶剂回收塔的处理从混合溶液中分离溶剂与芳烃以进行后续的生产加工流程,所以实际的生产过程中对塔温的控制精度提出了很高的要求。溶剂回收塔具有非线性、大时滞及不确定性等特点,目前对塔温的控制大多采用成本高、体积大以及响应慢的常规PLC设备,难以达到控制系统性能指标的最佳。首先根据现场采集的数据抽象出溶剂回收塔数学模型,利用MATLAB软件分别对常规PID和搜索
随着经济的发展,公共运输系统也逐步完善,地铁作为人们出行最常乘坐的公共交通之一,要对其进行严格的安全防护,地铁人流密集,且线路复杂,对于地铁消防安全系统提出了极大的考
随着科技的不断发展,为实现税收信息管理的方便、快捷,将计算机处理信息技术与其结合发展成为数据库形式的新型管理信息技术,这种数据仓库的形成在数据的组织、查询、报表都
在现代通信技术快速发展的背景下,在考试中应用无线电进行作弊的案例不断增加,出现了越来越多的作弊手段,考试无线电作弊呈现出商业化、专业化和网络化特征,破坏了公正的考试