高维缺失数据因果推断方法研究

来源 :南华大学 | 被引量 : 0次 | 上传用户:pengtao0615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能、大数据的发展,从观察到的数据中发现因果关系是许多研究领域的一个重要问题。因果关系推断是解释分析的一个强大的建模工具,使当前的机器学习具有可解释性。在医疗、通信、互联网、统计和经济等许多领域都有重要的应用。目前,因果关系推断已从二维变量的研究基础上开始研究对高维数据中因果网络结构的学习。但是利用传统的因果关系推断算法在高维数据中学习因果网络结构和提高学习准确率是目前研究的难点。在复杂的高维数据中,常存在大量的缺失、异常数据,如果处理不好,将会直接影响因果关系推断的准确率。基于以上的问题,本文按照两部分研究思路逐步改进高维数据下的因果推断算法。这两个部分研究思路及创新点分别是:1、基于高维数据异常值问题,本文在引入耦合相关系数(copula dependence coefficient,CDC)的基础上,提出了一种适用于高维数据的两步骤因果关系推断算法。首先该算法引入对异常值数据具有鲁棒性的CDC,对变量间的关联度进行检测,提高目标点的父子节点集的准确,再利用条件独立测试(CI)对父子集点集进一步提炼,删除无关节点;然后使用非线性最小二乘独立回归算法,为图中的目标点与其父子节点之间标注因果方向;最后迭代所有的节点完成完整的因果网络结构。2、部分缺失的高维数据直接执行现有的因果关系推断算法可能会导致不正确的推断。近年来,深度学习针对缺失数据的填充技术也日益成熟可靠。基于此本文结合了深度学习中GAN和GAE两个框架,分别用于执行迭代缺失数据填充和因果关系骨架学习。实验结果表明,算法提高了高维数据下因果网络结构学习的准确率。同时在大样本数据集中,算法的时间复杂度优于传统算法,对异常值具有鲁棒性。通过对合成数据的仿真,本文也证明了在不同缺失数据机制下的因果关系推断性能优于现有方法。
其他文献
近年来,中国GDP和人口城镇化的迅速增长,促使中国政府加大了交通行业的投资,城市路网规模得到了相应发展,但由于城市地形地貌、大型建筑物等外部环境因素的影响,导致城市路网
地面目标的立体视觉效果能够对城市规划和森林监测提供很大的帮助,合成孔径雷达(Synthetic Aperture Radar,SAR)的干涉成像技术,能够利用遥感的手段获取地面的高程信息,因此
随着科学技术的不断进步,各类电子产品层出不穷,对电子产品的质量要求也越来越高。电子产品在焊接过程会出现各种缺陷(如漏焊、焊锡粘连等),因此,对焊点进行缺陷检测是必不可
爆破块度是评价爆破效果的重要指标,建立爆破块度快速检测与评价的方法对矿山生产有着重要的现实意义。为此,本文将计算机图像识别技术引入爆堆块度的信息检测,针对露天矿山
基于柔性压力传感阵列的图形化成像技术在运动监测、人工皮肤和人机交互等领域有广泛应用。传统柔性压力传感阵列大都以高分子薄膜为基底,采用平面马赛克结构,器件与人体体表
随着科学技术的发展,智能人机交互技术的发展有望辅助不同程度失能患者恢复其生活自理,帮助失能患者与外界正常交流,减轻社会和家庭负担。在失能患者中轻中度完全失能患者虽
在数字多媒体时代,随着手机、照相机等拍摄设备的日益普及,图像越来越成为重要的信息载体,但是在图像的成像过程中,拍摄设备与成像物体之间很难保持相对静止状态,所以会造成
目前预付费刷卡终端在公共事业收费领域得到了广泛应用,然而采用GPRS传输数据的预付费终端多采用明文传输,存在数据传输的安全性和可靠性问题。论文采用嵌入式技术和基于混沌
在线决策是智能实体在非人为干预的情况下,进行自主决策的一种方式,在无人机机动决策、机器人控制和汽车无人驾驶等军用和民用领域都具有广泛的应用前景。相对于专家系统等传
语音增强技术作为语音信号前端的预处理方法之一,是目前数字语音信号研究领域内的一个热门方向,旨在从含噪语音信号中重构出接近原始语音信号的纯净信号。按照采集信号的麦克