基于分位数回归的自适应组Lasso变量选择

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:syyyqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Koenker提出的分位数回归在理论和方法上都得到了广泛的发展与应用。分位数回归与均值回归相比,其不需要对误差分布做特定假设,损失函数是一个绝对偏差的加权和,因此估计的回归系数对异常值不敏感,相比于最小二乘方法具有稳健性,而且能更加全面地刻画解释变量对响应变量不同分位点的影响。故作为均值回归分析的一种稳健替代方法,分位数回归被普遍地用于研究响应变量和解释变量之间的潜在关系。研究变量维数p值固定时,组解释变量的线性模型的惩罚分位数回归。为了能同时选择非零变量组和估计回归系数,考虑了带有自适应组Lasso惩罚项的分位数估计,并证明了估计变量选择具有相合性,而且估计的非零系数满足渐近正态性,进而证明了自适应组Lasso估计的Oracle性质。在数值模拟中,对于随机误差项服从尖峰厚尾分布(如柯西分布)时,验证了自适应组Lasso分位数估计(agLasso-Q)相比自适应组Lasso估计(agLasso-LS)能更准确地选择出零系数,且随样本数增大表现更好。针对所提出的自适应组Lasso分位数回归中调节参数的选取,不同于以往惩罚分位数回归常用的AIC、BIC等信息准则,考虑了一种惩罚交叉验证方法PCV,以带有对模型复杂程度做惩罚的SIC准则形式作为十折交叉验证方法的损失函数,从理论上证明了 PCV变量选择具有相合性,并讨论比较了该准则与其他调节参数选择准则的效果。通过对不同分位点进行模拟,发现当随机误差项s来自尖峰厚尾分布时,且在τ = 0.05和τ = 0.95分位点时,PCV准则相较于施瓦茨信息准则和交叉验证能更好地估计组回归系数,主要体现在有更小的均方误差。
其他文献
期刊
在文化馆总分馆制建设已经成为大势所趋的情况下,纵观现今文化馆发展现状,不难发现仍存在以下几个问题:一是“文化馆”这一名词概念未被群众熟知;二是部分群文工作者对于“群
基于ARM的嵌入式系统的核心部分包括处理器、存储器、JTAG电路和电源部分.存储器主要由SDRAM、FLASH和EEPROM等组成,本文给出了具体电路.JTAG电路包括复位电路和JTAG接口电路
摘要:当前,在高校不断推进教学改革的过程中,传统的计算机程序设计实验教学方式急需改革,如何提高学生学习的积极性,提高学生的动手能力,减轻教师的工作量,提高教学效果,是计算机程序设计实验教学面临的一个重要问题,为解决这些问题,该文对高校计算机程序设计实验教学过程进行了分析研究,设计并实现了计算机程序设计课程的实验教学系统。  关键词:计算机程序设计;实验教学系统;数据库  中图分类号:G642文献标
“十一五”是全面建设小康社会,发展资源节约型和环境友好型社会的关键时期,节约建筑用能是贯彻可持续发展战略,开展资源节约、发展循环经济、保护环境的重要组成部分.为实现
文章从质量检验的概念步骤以及计划与实施流程等全方位作以综述.
随着大数据时代的来临,人们每天都会产生大量的数据,也会接受大量的数据,通过对这些数据进行分析,能够了解一个人的行为习惯与兴趣喜好,进而制定相应的服务措施.因此,在今后
随着社会经济的发展、人们生活水平的提高和生活方式的变化,精神压力比以往加大,人群平均的血清总胆固醇水平正逐步升高。全世界每天因高脂血症引发的心脑血管疾病死亡人数近