论文部分内容阅读
目的:生存分析中,Cox模型是分析生存数据的经典模型。随着高通量技术的飞速发展,实现了数以万计的基因位点测定,而样本量往往较小,如何高效地从繁多的基因位点中筛选出与所研究疾病相关的基因位点就显得尤为重要,传统的Cox模型并不适用于处理高维数据,并且高维数据中自变量间往往存在较强相关性。经典的Lasso法虽然可以实现高维数据的变量选择和系数估计,较好地处理Cox模型的变量选择问题,但是该方法采用的是对所有的变量施加相同的惩罚,使其得到的估计量往往是有偏的,并且该方法对于强相关变量的处理效果较差。本文为