不确定性数据中概率图模型的构建

来源 :云南大学 | 被引量 : 0次 | 上传用户:likeren1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据采集和处理等相关领域,比如金融,军事,财务,通讯等方面的发展,不确定性数据的重要性渐渐为人们所认同。   在不确定性数据的研究领域,所面对的挑战可归结为:需要一种有效的机制来表达不确定性数据中元组间的复杂关系,需要一种有效的方法支持不确定性数据上的查询和世系分析,需要一种适应不确定性数据的推理方法。亦即,考虑到不确定性数的特性,从不确定性数据中发现不确定性知识,并将其以某种结构存储下来,以支持关于不确定性数据的一系列操作,如查询处理,世系分析,决策支持等操作。   而本文的目的正是将不确定性数据中所蕴含的概率知识以贝叶斯网这一重要的概率图模型保存下来。考虑到贝叶斯网有成熟的理论背景和大量应用,及强大的概率知识表达能力,所以将贝叶斯网应用到不确定性数据领域是自然而然的。   贝叶斯网的依赖分析方法是一个重要和有效的贝叶斯网结构学习方法。本文实践的重点正是将依赖分析方法引入不确定性数据的贝叶斯网结构学习。在实际应用中,以本文方法学出的贝叶斯网是以x-relation的属性为结点,而每一属性相应取值即为该结点所对应的随机变量的取值。x-relation属性间概率依赖的关系就通过贝叶斯网结点间的有向边记录下来。   为将贝叶斯网引入不确定性数据研究领域,本文的主要工作可归结为以下几方面:   贝叶斯网相关理论和方法要求所处理的数据,必须满足蕴含作为其来源的概率空间中所有样本事件的前提要求。而对于不确定性数据,因为数据缺失或其它原因,并不能满足这一要求。为此,本文提出一个通过缩小不确定性数据来源的概率空间的转化方法,使其满足贝叶斯网的前提要求。   由于不确定性数据是内部关联的数据,本文提出一个相适应的概率计算框架,以有效进行相关概率值的计算,包括条件独立测试的计算。   ●依赖模型是展开贝叶斯网相关讨论的前件。通过平移确定数据上依赖模型的定义到不确定性数据,本文给出与不确定性数据相适应的依赖模型定义。   ●考虑到不确定性数据的特性,如数据缺失和数据内部关联等,不能将传统的贝叶斯网学习方法直接作用于不确定性数据。经替换传统贝叶斯网学习方法中一部分构成要素,本文给出适应用于不确定性数据的贝叶斯网学习方法。
其他文献
计划调度评审技术(ProgramEvaluationandReviewTechnique,PERT)是系统工程中对潜在任务进行分析的一种方法,是一种科学的组织管理技术,其建立的目的是为了简化大而复杂项目的计划
在聚变实验的数据分析中,分析等离子体行为往往需要查找某些波形的相似波形。目前寻找相似波的方式为研究人员利用可视化数据访问工具逐个查看波形的结构形状。但是随着实验数
图像变形是指初始物体(数字图像、曲线、曲面、网格等)到目标物体的连续、光滑、自然的过渡。在图像或图形上设置有限个数的控制点,通过对这些控制点的约束以及过程设计,从而使整
无论是巨型的超级计算机,还是飞速发展的移动终端,功耗都成为了衡量处理器优劣的一项重要指标。从处理器功耗的统计结果可以看出,在功耗被广泛重视之前,通用处理器的功耗密度
智能电视同步内容服务是指通过对电视节目状态进行监控,智能地向观众提供同步于所观看节目(包括电视节目和广告)的扩展内容。相应系统可以丰富用户获取的信息,大大提升用户的
作为具有极大潜力的计算硬件设备,GPU正越来越多的被用于科学计算领域,对具有大量并行性的高吞叶量计算等应用进行计算加速。但在GPU上运行的通用计算程序的编写和优化往往较
代理移动IPv6(Proxy Mobile Internet Protocol Version 6,PMIPv6)协议是一个基于网络的本地移动管理协议。在移动管理协议的信令交互中,基于网络的移动管理协议不需要移动节点
随着半导体芯片技术的快速发展,处理器芯片的集成度和性能越来越高,而体积越来越小。这直接导致处理器单位面积功耗呈指数级增加,能耗问题日益突出。尤其在嵌入式实时系统领域,实
软件即服务(Software as a Service)的出现将软件商业模式从商品供需模式转换为服务供需模式,这符合行业发展的潮流,必将成为软件行业未来发展的方向。多租户是SAAS的核心技术,
基于质谱数据的蛋白质鉴定已经成为蛋白质组学的基础技术。规模化的蛋白质鉴定通常采用“鸟枪法”,其基本思路是将生物样品中的蛋白质酶切成肽段,经过色谱分离进入质谱仪,质