线性模型中的参数估计及稳健变量选择方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lyaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
参数估计是建立线性模型最为关键的部分之一,其直接影响统计模型的正确性,因此很多研究者对如何提高参数估计的准确度做了大量研究工作。在数据正常情况下,目前已有很多切实可行的参数估计方法,而本文主要研究当数据中同时存在复共线性数据和异常值或数据来自于重尾分布时,如何进行参数估计。本文主要研究以下两种情况下线性模型中如何进行参数估计。  第一种情况,当所有解释变量都是重要变量,数据中同时存在复共线性和异常值时,本文结合前人提出的估计,提出了一种新的估计形式----带约束的双参数稳健岭估计(RTRME)。该新估计具有岭估计、双参数估计、稳健估计的优良性质,能同时克服数据中复共线性和异常值的影响。本文在均方误差矩阵准则下从理论上将新估计RTRME与RTRE和TRME做比较。数值模拟实验表明,不同的参数条件下,新估计RTRME几乎总是优于RTRE和TRME,随后给出的数据实例同样证明RTRME优于另两种估计,说明本文提出的新估计具有实际操作可行性。  第二种情况是,当解释变量中存在冗余变量,数据中存在复共线性和异常值时,我们采用稳健变量选择法进行参数估计。本文首先介绍了传统稳健变量选择法LAD-lasso和稳健估计PWLS,结合二者的优点,本文提出了新的稳健变量选择方法PWLS-LAD。本文介绍了该新方法的实现思想和算法,并讨论了如何进行截断参数的选取。本文通过数值模拟实验,在正常数据、包含异常值的数据、重尾分布数据三种情况下,将新方法PWLS-LAD与传统变量选择法LASSO、SCAD、LAD-lasso进行了比较。主要比较了各方法选择非0系数变量的准确率、模型预测误差、参数估计的MSE值。实验结果表明,在数据正常时,新方法与传统方法效果没有明显差距,当数据中存在异常值或数据服从重尾分布时,传统变量选择法不及稳健方法变现好,同时稳健方法中,新方法PWLS-LAD又优于一般LAD-lasso,说明本文提出的新方法PWLS-LAD具有广泛的适应性,并且具有良好的稳健性。
其他文献
随着设计复杂度的增加,以及SoC 应用的普及,功能验证的重要性在日益增加。传统的基于仿真的验证需要数百万的测试向量来验证一个行为,而且仿真一般都处于系统集成完成后,因
党员干部把握好学习、实干和廉政三大关键,恪守从政道德,让组织放心,让群众信赖。 Party members and cadres grasp the three key points of learning, doing hard work an
期刊
工控系统成为关键基础设施安全的重要组成部分rn工控系统作为关键基础设施安全的重要组成部分,工控系统信息安全已经影响到关键基础设施运行.信息化系统的安全措施常常不能够
失业保险制度是国家通过立法强制实施,由社会集中建立基金,对非因本人意愿中断就业而暂时失去生活来源的劳动者提供基本生活保障和就业援助的一项社会保险制度。自1986年建立实施以来,该项制度在保障失业人员的基本生活,促进再就业,健全劳动力服务市场体系,维护社会稳定等方面发挥了积极的作用。然而,近年来屡禁不止的失业保险欺诈行为正威胁着失业保险制度的有效运行。本文运用信息不对称理论对当前失业保险欺诈进行研究
随着我国医师多点执业政策的放开,优质医师资源开始流动起来,这对于解决我国医疗行业出现的一些问题有很大的帮助.然而我国医师多点执业实施的真实状况却是“叫好不叫座”,来
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
实现工业过程控制系统信息安全需要多层保护,如信息安全计划、网络分离,纵深防御是实现工业控制系统信息安全的最佳方法。随着工业控制系统向网络化、智能化发展,工业以太网
利用SolidWorks软件建立大型梭车刮板运输机链轮和滚子的三维参数化模型,借助有限元分析软件ANSYS Workbench对导入的链轮与滚子模型进行有限元接触分析,得到链轮的应力与接
期刊