基于纵向数据的维数折叠降维方法研究及其实例应用

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:xiaov705
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年,随着大数据的应用逐渐融入人们的生活,对于能保留数据内部结构的降维方法逐渐引起重视,特别是在纵向数据上有着广泛的需求。本文主要讨论纵向数据的降维,以及其在实际医学疾病领域的应用。针对纵向数据,本文提出维数折叠主成分分析方法进行降维。该方法在实现指标变量和时间两维度降维的同时,能保留原始数据固有的结构,不破坏数据的相关性。具体而言,将原始纵向数据视为矩阵值数据,在横纵两个方向上通过极大似然估计方法估计出中心维数折叠子空间,从而在两维度上实现降维同时也保留了数据的原始结构。进一步地,通过仿真实验,考虑两种数据相关情况下的纵向数据降维:(1)组内观测值相互独立的情况;(2)组内观测值相关的情况。将所提方法与传统的主成分分析方法进行比较,模拟结果表明所提方法无论是在组内观测值相互独立还是相关的情况下,都拥有较小的降维估计误差,从而在数值上证实了所提方法的有效性。进一步,本文将所提的维数折叠主成分分析方法用于原发性胆汁肝硬化疾病数据,对病人的生存期进行预测分析。基于降维后的降维方向对数据进行低维投影,并建立非参数模型来预测生存期,与传统的线性混合效应模型的预测效果进行比较,结果表明基于所提方法寻找的降维方向进行的非参数建模具有更小的预测误差,体现了本文所提的降维方法在纵向分析中的合理性和优越性。
其他文献
基于TIGGE资料中的欧洲中期天气预报中心(ECMWF)、英国气象局(UKMO)、美国国家环境预报中心(NCEP)、韩国气象厅(KMA)、和日本气象厅(JMA)五个中心2015年1月1日—9月30日中国
“以租代征”是对我国存在的一种土地征占形式的称谓,即政府部门或企事业单位等绕过法定的农用地转用和土地征收审批手续,通过租用农民集体土地进行非农业建设的行为。该用地模式因为能够规避繁琐用地手续及巨额税金,快速获得经济效益,为地方政府树立政绩,所以即使是在国家明确表示对该种用地模式坚决抵制、严厉打击的情况下仍屡禁不止。而政府或经其授权的有关部门作为国家行政机关,却在该种用地模式中扮演了主体角色。在这场
埕东北坡位于渤海湾盆地济阳坳陷的东北部。研究区已经在东营组发现油气显示,但是对于东营组的地层超覆线位置、储层发育特征尚不清楚,前人在该区域研究成果稀少,制约了进一
目的:探讨内皮细胞微粒(endothelial microparticles,EMPs)在脓毒症(sepsis)预后中的作用及连续性静脉-静脉血液滤过(Continuous veno-venous Hemofiltration,CVVH)治疗对脓
氧还原反应(Oxygen Reduction Reaction,ORR)作为燃料电池理想的阴极反应很大程度地决定了燃料电池的产电效率。目前商业Pt/C催化剂是燃料电池中应用最广泛的ORR催化剂,由于其
生物反应器是动物细胞培养的关键设备,而细胞的培养效率取决于反应器内流体的流场特性。振荡式生物反应器是近些年发展起来的新型生物反应器,培养液在反应器内作周期性圆周振
宽衣文化在以中国为代表的东方国家中已经有了上千年的历史,宽袍大袖的服装可以说是本土传统服装中最具代表性的样式之一。近年来,越来越多的设计师希望可以通过对东方传统服装特征的提取,再与现代服装设计相融合,创造出既符合时代潮流又具有民族特色的服装。比如从最初的盘扣、中国结、龙凤图案等极具明显的符号设计表达,到追求去符号化的设计探索,东方服装设计师一直在寻找如何能更好地体现东方服装独特气质内涵的设计方法。
本论文使用郯庐断裂带潍坊地区302个短周期数字地震台站自2017年8月到10月期间记录的连续波形数据,采用背景噪声互相关的方法,由垂直分量的数据记录计算得到了经验格林函数并
塔河油田位于塔里木盆地北部,作为岩溶缝洞型油藏以其过亿吨的巨大储量和区内丰富的岩溶现象而备受瞩目,但其缝洞充填特征及规律认识不清,严重制约该地区的储层预测及评价。
研究目的:探讨在子宫内膜癌组织中检测错配修复蛋白的表达情况,并进行相关临床病理学特征分析及追踪预后情况。分析错配修复蛋白对子宫内膜癌的诊断、治疗及预后中的作用。研究利用分析临床病理学特征及错配修复蛋白表达缺失情况,对有遗传倾向的Lynch综合征相关的子宫内膜癌患者进行初步筛查,尽早诊断Lynch综合征患者,减低自身及其家系成员患者Lynch相关肿瘤的发病率,并进行预防,以改善患者的预后及提高患者的