新疆肺结核发病情况分析预测研究及发病相关因素探讨

来源 :新疆医科大学 | 被引量 : 0次 | 上传用户:persistence2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:目前中国是22个结核病高负担国家之一,结核病发病数仅次于印度而位居世界第二,据中国公共卫生数据显示,新疆自2005年至2013年肺结核年发病率始终位居全国31省市首位,在新疆肺结核发病形式如此严峻的情况下,做好新疆肺结核的预防控制工作迫在眉睫,鉴于此,本研究对新疆肺结核现状作了分析,探讨了新疆肺结核发病的空间分布,研究了新疆肺结核发病预测模型,进一步建立新的回归模型-绝对最小二乘回归模型研究新疆肺结核发病的相关因素,以便于为新疆肺结核病的预防控制工作提供科学参考。  方法:⑴采用描述性统计分析及探索性空间数据分析方法,首先从全国层面分析新疆肺结核发病现状情况,其次分析新疆14地州市肺结核涂阳登记率及活动性肺结核登记率的空间分布、空间全局相关性及空间局部相关性;⑵通过对新疆肺结核发病率的历史规律分析及对一些经典的预测预警方法分析,选取三种目前较流行且较适合于新疆肺结核发病率数据特点的预测模型方法(时间序列Box-Jenkins方法,时间序列异方差模型方法及神经网络GRNN模型方法)构建较精确的新疆肺结核发病率预测模型。首先采用Box-Jenkins模型方法建立了单一模型中最优的SARIMA(1,1,2)(1,1,1)12模型,为提高模型预测精度,进一步对SARIMA(1,1,2)(1,1,1)12模型的残差作分析,建立了SARIMA(1,1,2)(1,1,1)12-ARCH(1)组合模型,考虑到残差数据的非线性特征,也建立了SARIMA(1,1,2)(1,1,1)12-GRNN组合模型,采用均方误差(Root mean square error,RMSE)、平均绝对误差(Mean absolute error,MAE)以及平均误差率(Mean absolute percentage error,MPAE)检验三个模型的拟合及预测效果;⑶为较全面地分析新疆肺结核发病相关影响因素,改进经典线性回归模型不能处理庞大指标变量及指标间存在相关性导致分析结果存伪的情况,建立了新的回归模型-绝对最小二乘回归模型,使用该模型分三个层面(从全国层面,新疆历史变化特点层面及新疆各地州层面)并选取经济发展水平方面的、社会经济方面的、环境污染方面的、气候环境方面的、人口结构方面的、医疗卫生服务方面的、地理环境方面的及传染病等方面一百多个指标较详细地分析了新疆肺结核发病相关影响因素。  结果:①2008至2013年新疆肺结核年发病率是全国肺结核平均年发病率的2至3倍;新疆自2005年至2013年肺结核发病率连续9年居各省市首位;在显著性水平为0.05的情况下,2010、2012及2013年新疆14地区肺结核新涂阳登记率全局Moran’s I值显著大于零,2011及2014年Moran’s I值接近零;在显著性水平为0.01的情况下,2010至2014年新疆14地区活动性肺结核登记率Moran’s I值较大;在显著性水平0.05的情况下,肺结核新涂阳登记率的局部Moran’s I及活动性肺结核的局部Moran’s I分析发现,2010年至2014年存在HH(High-High)区、LL(Low-low)地区、LH(Low-High)区及 HL(High-Low)区;②SARIMA(1,1,2)(1,1,1)12-ARCH(1)组合模型的AIC和SC(Akaike information criterion,AIC=4.68;SC=4.92)小于单一SARIMA(1,1,2)(1,1,1)12模型的AIC和SC(AIC=5.09,Schwaz criterion,SC=5.252);SARIMA(1,1,2)(1,1,1)12模型预测误差的三个指标值分别为RMSE=2.58,MAE=2.14,MPAE=9.51;SARIMA(1,1,2)(1,1,1)12-ARCH(1)组合模型预测误差的三个指标分别为RMSE=1.7,MAE=1.56,MPAE=6.85;SARIMA(1,1,2)(1,1,1)12-GRNN组合模型预测误差的三个指标值分别为RMSE=2.71,MAE=2.1,MPAE=9.05;③建立了新的回归模型-绝对最小二乘回归模型,模型包括9个定理及8个推论;采用所建模型从全国层面考察分析可能影响肺结核发病的指标115个,其中54个自变量与肺结核发病率呈正相关,61个自变量与肺结核发病率呈负相关,经过绝对最小二乘回归模型的三次变换后建立的基变量的增回归模型为Y=-0.696X1-0.333X2+0.229X3+ε,增模型的复测定系数为R2=0.648,复测定系数变化量△R=0.05,检验F统计量值为4.31,在显著水平为0.01的条件下拒绝第三基变量进入模型,最终的绝对最小二乘回归模型为:Y=-0.696X1-0.333X2+ε;从新疆纵向发展变化情况考察肺结核相关影响指标84个,其中67个自变量与新疆肺结核发病率呈正相关,17个自变量与新疆肺结核发病率呈负相关,经过六次变换后建立的基变量的增回归模型为:Y=0.833X1+0.384X2+0.261X3-0.215X4-0.141X5+0.084X6+ε,检验F统计量值为4.17,在显著水平为0.01的条件下拒绝第六基变量进入模型,Y=0.833X1+0.384X2+0.261X3-0.215X4-0.141X5+ε为最终的绝对最小二乘回归模型;从新疆横向发展变化情况考察肺结核相关影响指标66个,其中19个自变量与新疆肺结核发病率呈正相关,47个自变量与新疆肺结核发病率呈负相关,经过三次变换后建立的基变量的增回归模型为Y=0.875X1+0.317X2+0.213X3+ε,检验F统计量值为6.11,在显著水平为0.01的条件下拒绝第三基变量进入模型,Y=0.875X1+0.317X2+ε为最终的绝对最小二乘回归模型。  结论:⑴近年来新疆是我国肺结核发病率最高的省,Moran’s I分析显示,新疆各地州肺结核发病率存在空间聚集性,对发病率高高聚集的热点区域(喀什、阿克苏及和田)应重点分析并与发病率低的区域(昌吉、乌鲁木齐、塔城及吐鲁番地区)对比分析找到发病原因,对局部Moran’s I分析的HL及LH区的阿勒泰地区及克州地区情况要给予重点关注,找出原因,可为今后的预防控制工作提供科学参考;⑵与SARIMA(1,1,2)(1,1,1)12模型及SARIMA(1,1,2)(1,1,1)12-GRNN组合模型相比,SARIMA(1,1,2)(1,1,1)12-ARCH(1)组合模型是精度最高的模型,该模型可用于对新疆肺结核发病率的短期预测预警;⑶建立的绝对最小二乘回归模型,有效克服了传统回归模型无法处理庞大指标及建模指标相关性的问题。采用新模型较系统全面地分析了新疆肺结核发病的一些相关影响因素。研究发现,经济发展水平低是影响新疆肺结核发病高的最重要因素;环境污染越严重,肺结核发病率越高,恶劣的自然环境是导致新疆肺结核发病率高的又一重要原因;医疗卫生服务力量偏弱也是导致新疆肺结核发病高的重要原因;等等。本文研究结果可为新疆肺结核的预防控制提供一定的科学参考。
其他文献
通过问卷调查和访谈,对杭州师范学院420名女大学生运用体育健身路径的现状、存在问题及需要的服务管理等进行了分析讨论,并就体育健身路径在女大学生体育锻炼中如何更好地发
阐述了小区住宅景观设计的设计理念和关键,通过杭州“钱塘春晓”项目中的实践,对住宅景观设计中重点关注的竖向设计、道路系统、自然水景和植物配置等问题进行了较为详尽的分
计算机控制系统实现三氧化硫磺化过程的控制,已是合成洗涤剂工业广大生产、科技、管理人员的共识。利用已有的计算机控制系统,实现对生产设备、生产过程、产品质量等的管理,将是
通过对08、09年高考化学工业流程题考查的内容及相关知识点的汇总,并对近两年高考工业流程题的分值及所占比重分析,总结工业流程题的特点,分析工业流程题与新课程教材的关系,
本文研究的内容可分为两个方面,一是不同群体中产量结构各因素间相互影响的研究,二是对有关产量因素空间分布规律的研究。其目的是通过研究,探讨不同群体的适宜结构及其有关
1977—1979年间在江苏扬州、南通和西藏乃东等地进行了向日葵冬播和播种期对植株性状影响的研究。结果说明,春葵花品种属感温性较强而感光性较弱的类型;秋葵花品种属感光性较
一、目的和意义微囊藻毒素(Microcystins, MCs)是淡水湖泊中由蓝细菌产生的一类天然毒素。其中以微囊藻毒素-LR (Microcystin-LR, MC-LR)急性毒性最强,危害最大。目前已有多
对非线性离散系统的学习控制方法进行了研究,引进了离散的λ(ξ)-范数,给出了新的学习控制算法,实现了不依赖于学习控制初始数据的目标跟踪问题.为离散系统的学习控制方法的顺利发展
住房城乡建设部近日下发通知,决定于今年下半年开展加强和改进住房公积金服务专项督察工作。通过开展专项督察,构筑方便快捷的住房公积金管理服务体系,全面提升服务质量,重点
引言对春化和光周期的要求是小麦品种发育快慢的两个决定性的习性。一个好的品种引到一个地区后,可以因为春化要求没有满足或日长太短,使其发育延迟而产量降低。另一方面,也