多元函数线性模型的两种变量选择方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bluesnail2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
函数数据是一种新兴的数据类型,其观测单元为定义于一定区间上的函数曲线,金融市场中股票每日的价格曲线、生物化学中肉类的光谱数据、地磁学中某地一段时间内的磁场强度都可以做为函数数据处理。在多元统计分析因维度过高处理难度增加时,函数数据为其提供了一个新的切入点,将相关度较高的多元数据串联成函数数据还能解决多重共线性问题。当模型有多个可供选择的解释变量时,为了保证预测效果的同时构建简洁的模型,需要鉴别具有显著贡献的解释变量,变量选择方法应运而生。相应于多元统计分析,函数数据分析的发展处于起始阶段,变量选择方面的研究结果尚不够丰富,尤其是解释变量是超高维的情形。针对这一迫切需要,本文深入探讨了部分现存于多元统计分析中的变量选择方法在函数数据中的应用,并通过大量的数值实验说明方法的有效性,以实际应用展示方法的适当性。  从函数线性模型出发,基于现在已十分成熟罚函数方法和逐渐完善的特征扫描方法,研究了如何从带有自回归误差的多元函数线性模型中选择重要变量,为了贴近实际,我们的理论结果允许解释变量存在弱的序列相关性,这在金融数据上十分常见,我们的方法能如独立同分布的函数线性模型一样在进行收缩估计的同时渐近选出真正重要的解释变量。  为了完备超高维函数线性模型变量选择的理论工作,研究了特征扫描方法在函数数据中的应用,并证明了即便在函数数据下,特征扫描方法依然能大大缩小重要解释变量的备选范围,是超高维变量选择的有效第一步。用有限基近似表示函数数据,将多元函数线性模型化为近似等价的多元线性模型,再使用群变量选择的方法做后续处理。考虑了两种基,固定标准正交基和基于样本的特征函数基,后者基于主成分估计,其中在固定基表示的方法中,允许解释变量是α-混合的。在控制模型的错误选择率(FP,FN)上,在特征扫描的基础上修改现有结果得到迭代扫描法。在主成分分析的框架下,提供了特征扫描法的理论证明,一般而言,由于不同样本的估计主成分得分不具有独立性,难以构建理论结果,在本文的第四章,通过采用一个广泛意义下的指数不等式巧妙地解决了这个问题。
其他文献
随着科学的进步,信息技术在当今教学过程中占据着举足轻重的地位.信息技术发展飞速,教学方式灵活多样.作为网络时代下的信息技术教师,我们在教学过程中要立足课堂,创造有利条
本文主要讨论的是多元多项式的近似因式分解和有关单变元和多变元多项式的近似最大公因子的一些问题。所得到的主要结果包括三个方面:   第一,计算多变元多项式的近似因式分
凭借最新的PMI(Pilz人机界面)6 Control产品系列,Pilz自动化公司推出了配备PLC软件(符合IEC 61131-3标准)的首款操作终端。此终端不仅可以提供专业诊断和可视化,还可以在一个
在一些实际问题中,群体的数目是已知的.但在有些科学研究的统计问题中,群体数目和相关参数是未知的,这就需要进行估计.本文研究了一个带异质性的捕获移出frailty模型,在个体间
本文研究的是二维调和映照热流方程与四维Yang-Mills热流方程解的长时间行为,主要探讨内容如下所示:  第一章为绪论,简单介绍了二维调和映照热流方程与四维Yang-Mills热流方
实代数曲线曲面的拓扑结构确定和表示不仅是一个有趣的数学问题,也是计算机图形学和计算机辅助几何设计的一个核心问题。论文的内容由三部分组成:三角列多项式系统的实根隔离算
为了使Hilbert变换在信号分析的应用中具有坚实的数学基础,本文研究了乘积函数的Hlibert变换问题。在前人研究结果的基础上,给出了L2(R)上的Bedrosian恒等式成立的新的充要条件
快速、准确且稳定地求解大型稀疏、非奇异非对称线性代数方程组是科学与工程计算研究领域中的最基本问题之一。研究关于这类问题的预处理迭代算法,特别是预处理子的构造和性质
保面积单调扭转映射的动力学研究可以追溯到Pioncaré[Pol],Poincaré证明在保面积映射与两个自由度的Hamiltonian系统的动力学之间有着本质的联系. 考虑定义在具有辛结构ω
近二十年来,集值优化理论的研究吸引了大批优秀的数学家和数学工作者,出版了许多著作和论文。目前,这一理论的知识己广泛应用于现代经济,军事、工程、运筹、对策、控制和决策等方