论文部分内容阅读
零膨胀模型在医疗卫生、膳食摄入、临床试验等众多领域都有着广泛应用。目前,国内学者对于零膨胀模型的研究主要集中在离散分布领域,而对连续分布的研究略显空白,因此本文拟在零膨胀连续模型的假设检验方面有所突破。
首先,根据数据的特点,本文提出了ZILN、ZIE和ZIG三种模型。然后基于均值相等和分布相同的两种考虑建立原假设,并在三种模型下均进行假设检验。最后,通过随机模拟比较T、Wilcoxon、Wald、LR和Score五种检验在上述条件下的第一类错误和功效水平。模拟结果表明,在均值相等的原假设下,三种模型在除Wilcoxon检验以外的其他四种检验均能将第一类错误控制在0.05附近。就功效而言,Wald对ZIG、ZIE模型的检验结果最好,其后依次为LR、Score和T;而在ZILN模型中,p=0和p?0检验结果有不同的表现。在分布相同的原假设下,第一类错误均能控制在0.05左右,并随着样本的增大趋于稳定。就检验效果而言,在一般情况下,LR检验明显优于其他检验,当样本足够大时,除Wilcoxon检验以外,其余检验功效均接近1。
在得到上述结果后,本文将上述方法应用到纵向饮食干预的实例中。一型糖尿病青少年患者的某些膳食指标(例如总水果、全水果、深绿色橙色蔬菜和豆类和全谷物)出现过多的零值,加大了分析的难度。本文引入了零膨胀模型,根据AIC信息准则,对比了ZILN,ZIE,ZIG三种模型分别在四个指标下的AIC值,最终选定采用ZIG模型对数据进行建模分析。
本文针对零膨胀连续数据,在三类模型和两种原假设下对比了五种常用的假设检验方法。本文的研究结果为临床实验、医疗卫生等领域的工作者,针对零膨胀连续数据的检验问题提供理论指导。根据数据所拟合的模型,统计工作者可直接运用最优的检验方法,来提高统计检验的功效。
首先,根据数据的特点,本文提出了ZILN、ZIE和ZIG三种模型。然后基于均值相等和分布相同的两种考虑建立原假设,并在三种模型下均进行假设检验。最后,通过随机模拟比较T、Wilcoxon、Wald、LR和Score五种检验在上述条件下的第一类错误和功效水平。模拟结果表明,在均值相等的原假设下,三种模型在除Wilcoxon检验以外的其他四种检验均能将第一类错误控制在0.05附近。就功效而言,Wald对ZIG、ZIE模型的检验结果最好,其后依次为LR、Score和T;而在ZILN模型中,p=0和p?0检验结果有不同的表现。在分布相同的原假设下,第一类错误均能控制在0.05左右,并随着样本的增大趋于稳定。就检验效果而言,在一般情况下,LR检验明显优于其他检验,当样本足够大时,除Wilcoxon检验以外,其余检验功效均接近1。
在得到上述结果后,本文将上述方法应用到纵向饮食干预的实例中。一型糖尿病青少年患者的某些膳食指标(例如总水果、全水果、深绿色橙色蔬菜和豆类和全谷物)出现过多的零值,加大了分析的难度。本文引入了零膨胀模型,根据AIC信息准则,对比了ZILN,ZIE,ZIG三种模型分别在四个指标下的AIC值,最终选定采用ZIG模型对数据进行建模分析。
本文针对零膨胀连续数据,在三类模型和两种原假设下对比了五种常用的假设检验方法。本文的研究结果为临床实验、医疗卫生等领域的工作者,针对零膨胀连续数据的检验问题提供理论指导。根据数据所拟合的模型,统计工作者可直接运用最优的检验方法,来提高统计检验的功效。