广义偏线性模型变量选择中的算法研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:liongliong547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义偏线性模型是将非参数估计与参数估计结合的半参数模型,能够解决离散因变量的建模问题。由于其兼具解释性与精确性的双重优势,被广泛应用于经济、医学等研究领域。变量选择是在数据大爆炸的背景下建模人员所面临的最重要的问题之一。其中,罚函数法是被统计学者研究最多的变量选择理论,它能够同时进行变量选择与参数估计,具有算法高效的主要特点。  Li(2008)与Wang等学者提出了广义偏线性模型变量选择的算法,但将非参数部分的估计与参数部分的变量选择独立进行。若存在冗余变量会影响非参数部分的估计精度,从而使变量选择的结果失去有效性。本文将通过理论研究与蒙特卡洛模拟,旨在探讨以下三个问题:①全模型的非参数部分估计是否有效?②能否将非参数部分估计与变量选择同时进行?③用于变量选择的罚函数并不唯一,如何选择?  本文将普通广义偏线性模型的估计算法与Fan(2001)提出的二次迭代算法相结合,基于Li(2008)提出的One-step Back-fitting Algorithm(OBA),提出新的改进算法—Iterative Back-fitting Algorithm(IBA),使非参数部分的估计以及参数部分的估计和变量选择得以同时进行,并将IBA算法推广到局部多顶式估计,提出IBA-LP。本文通过蒙特卡洛模拟,从样本量、自变量相关及个数等三方面讨论IBAs算法的改进效果,结果表明:①当自变量具有较高相关性时全模型的非参数部分估计将失去有效性,从而OBA算法也将失效;②IBA(S)算法在自变量较高相关的情况下,估计结果依然有效;③SCAD是兼具算法高效性与结果有效性的相对最优的罚函数,Lasso得到的结果劣于SCAD、Bridge、Elastic Net,Bridge与Elastic Net在超参数选择上具有计算复杂性。
其他文献
文言文是国学的精华之一,也是让学生了解我国古文化的重要部分,更是学生健全发展中不可缺少的一部分。所以,为了提高学生的人文素养,也为了保护学生长久的学习兴趣,更为了提
期刊
美国是当今世界唯一的超级大国,也是军事实力最为强大的国家,它的武器装备采办制度更被认为是世界武器装备采办制度的先进代表。进入21世纪以来,美国国防部先后于2001年、2003年
股权分置改革是我国资本市场一项重要的制度改革。股利政策是上市公司非常重要的财务决策,它与股东的自身利益密切相关。由于我国上市公司股权结构长期以非流通股和流通股两种
我国教育学家对初中生语文阅读能力的要求是,初中生阅读应当具有独立的阅读能力,应当注重阅读的情感体验以及应当学会利用多种阅读方法。 The requirement of Chinese educa
抓住当前世界产业格局深刻调整的历史机遇,在更高起点上实施“走出去”战略,是我国积极应对经济全球化挑战、全方位提升对外开放水平的重大战略选择。改革开放特别是进入21世纪
目的为了解集安市医疗机构消毒工作质量及存在的问题,找出相关影响因素,以提高消毒质量高,减少医源性感染的发生。方法连续6年对集安市180家医疗机构手术室、供应室、母婴同
一个组织要生存、发展、壮大,并不断趋于成熟,不断取得成就,就必须依据外部环境及内部因素的变化而适时调整组织目标与结构。组织不能一成不变,否则就会快速老化、衰弱乃至灭
我是山东菏泽市安兴镇东张庄农民张风刚,2006年抱着试试的心里,花180元购买了9千克)山5号小麦原种,消息传开后老少爷们议论纷纷,说三道四,甚至有人说我“傻”。我心里也犯嘀
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
目的验证工作场所空气中氧化钙测定的标准方法在实验室的可靠性,进一步了解检测方法的检测质量。方法严格依照国家职业卫生标准《工作场所空气有毒物质钙及其化合物》(GBZ/T1