高维数据下组群降维技术与半参数模型的统计推断

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:binfeb91
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维统计问题目前在科学研究和技术发现领域引起了高度重视并且已经广泛的应用到许多领域,比如说医学,金融分析和风险控制等等.其中变量选择在高维数据分析和科学发现中扮演着重要的角色.在本论文中,我们将致力于高维数据分析中变量选择和估计的问题研究.  首先,在本文中我们将简要地概述一下高维数据分析在统计学中的发展现状.其次,我们考虑了在高维数据下变系数模型的变量选择和估计问题,对于这个问题我们发展了一种非凸组群选择方法,对于系数函数使用样条基函数的近似展开并研究了它们的理论性质.同时对于这个模型我们运用了组群Lasso和组群MCP的惩罚方法进行变量选择和估计.在适当的条件下,我们分别证明了组群Lasso和组群MCP的理论性质.接下来,我们考虑了高维数据下半参变系数模型的变量选择和估计问题及其确定该系统是线性和非线性部分的区分,并在该模型下我们运用了投影追踪,剖面似然和惩罚函数MCP的方法用来识别协变量有常数,线性或非线性效应.在一些假设条件下,我们证明了这种常数、线性和非线性估计能正确识别真正的模型结构,其中常数或线性估计的收敛速度被建立,并证明了其渐近正态性.  在前面两章中,我们主要考虑的是在协变量和响应变量都是完全数据情形下高维数据降维技术的理论与方法.由于生存分析和生物统计中,由于数据经常是删失变量,从而对于高维数据降维技术的发展带来挑战,为了将来进一步研究高维协变量下生存分析模型的变量选择或变量筛选,我们在这一章中研究了一类非常灵活的剩余均值寿命模型下的半参变系数生存模型,此模型由于带有半参数结构,因此具有较好降维特性.而且此部分的研究成果能作为未来进一步研究生存分析模型降维技术奠定基础,半参数变系数剩余均值寿命模型,依赖一个主要风险暴露变量,其中有些效应有可能是暴露变量的函数,有些效应可能是常数.在右删失情形下,从理论上我们发展了三阶段估计程序来估计在半参变系数剩余均值寿命下参数部分和非参数部分.第一阶段,我们通过逆概率删失加权的方法来建立局部估计方程来估计参数部分和非参数部分,在第二阶段,代入非参数估计部分到估计方程,我们能得到全局参数估计方程来估计参数部分和建立参数估计的渐进正态性.在第三阶段,代入参数估计到局部估计方程,我们能得到更新局部非参数估计方程来估计非参数部分和证明非参数估计的渐进正态性.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
本文通过对荣华二采区10
期刊
要提高投资经济效益,就要研究投资过程中出现的问题,采取各种措施,减少投资失误.按照经济规律,对投资项目的评价和论证应当有两种可能的结果,即可行与不可行,两者应各占一定
通过对本地电话网范围经济性和全球信息通信网整合趋势的分析得出范围经济对中国电信业改革的启示.提高本地电话网规模经济性和范围经济的途径.转变观念,变革普通电话时代的
黑白文档图像不同于常规的文本文件和图像文件,使用常规的压缩算法难以取得较高的压缩倍数.文中分析了常规文档的特性及使用常规算法的优缺点;并针对其特殊性,提出了一种无失真压缩算法,大大提高了压缩倍数,它采用文中提出的分块编码和游程编码的混合编码方法.实验证明,该方法的压缩比字典序压缩(ARJ,PKZIP,LZW等)约提高0.5~1.2,比常规游程编码提高约0.3~0.8.
期刊
该文针对高新技术产品营销策略进行了研究,并分析了国内在此方面的现状,进而提出了一些针对性的具体建议.
该文共分三章.第一章简要回顾了前人对内幕交易的认识和研究;第二章是对中国1997个股票交易的的实证研究过程;第三章总研究结果,对中国股标市场内幕交易的状况作出结论,并就
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
摘 要:实验教学是科学教学的一种重要手段。那么,怎样在实验教学中培养学生的情感态度与价值观呢?建议从如何激发学生科学学习的热情、培养学生的问题意识、激励学生的科学志趣等方面来实现情感态度的渗透教育。  关键词:科学实验;学习热情;问题意识;科学志趣;语言表达  一、了解科学实验,激发学生科学学习的热情  1.参观实验室,走进神奇的科学王国  实验室对于三年级的学生来说曾经是一个神秘的地方,里面有着
本文首先介绍了基于Delphi的MIDAS多层分布式数据库技术的基本特点及其发展历程,然后阐述了MIDAS三层分布式体系结构工作流程及典型构建过程,最后结合开发实例给出了MIDAS的