论文部分内容阅读
控制图有着很长的统计历史,可以追溯到上个世纪二十年代。Shewhart于1924进行了开创性的工作。Page和Robert分别于1954年和1959年提出了经典的累积和(CUSUM)控制图和指数加权滑动平均(EWMA)控制图,用来改善Shewhart控制图对中小漂移的监控。在最近几年,对离散变量的监控日益引起统计过程控制(SPC)领域内研究者的关注。本文从第2至第5章分别针对排队系统、profile数据、医疗保健系统和数据质量等四个方面进行了第Ⅱ阶段的监控。 首先,Chen and Zhou(2014)为了对排队系统进行统计监控考虑了两种抽样方案,一种是部分抽样,另一种是完全抽样。部分抽样方案是指仅当有顾客离开时,比如第n个顾客离开时,观察队长(系统内的顾客数)Qn。而完全抽样方案是指在有顾客到达或者有顾客离开时都进行观察,不仅要观察队长还要记录系统时间。我们以M/M/1排队系统为例来说明我们的监控方法。我们检测排队系统服务强度ρ的变化。在部分抽样下,由排队论可知队长Qn和Qn-1是相关的。如果忽略这种相关性,将会给控制图的表现带来不利的影响。于是,为了检测服务强度ρ的变化,我们监控在第n个服务时间段内到达的顾客数An(An构成的序列是独立同分布的)。为了能够对一定范围内的漂移进行有效地监控,我们基于加权似然比检验(WLRT)建立了一个WLRT控制图。在第2章,我们使用WLRT控制图而不是传统的EWMA控制图主要是因为这里的WLRT控制图可以很容易地推广到完全抽样方案的情形或者被应用于其它排队系统。在应用于M/M/1系统时,该控制图形式简单,而且可以迭代计算。从相对平均指数(RMI)这一标准来看,我们所提出的WLRT控制图能够对一定范围内的漂移进行有效地监控。 其次,我们把第2章所提出的WLRT控制图分别推广到用来监控广义线性的profile数据和手术的性能。profile数据是指观测值可以看作是一些变量的回归曲线.对响应变量是泊松的、二元的、多项的和次序变量等离散型的profile数据进行有效地监控越来越受到研究者的关注。而以上这几种类型的profile数据都属于广义线性模型的特例。在第3章,我们的主要目的是试图提供一个监控广义线性的profile数据的统一框架。这里,不同profile的解释变量可以取固定值也可以是随机的,但我们并不关心对解释变量的监控。在似然函数可求的情况下,该控制图可以很容易地推广到用来监控其它类型的profile数据,包括预测是随机的profile。模拟结果表明,在过程受控时,该WLRT控制图运行长度的分布是较理想的,在过程失控时,该WLRT控制图又能尽早地报警。在第4章,我们关注病人手术后特定时间段内的二元生存状况。基于风险调整后的逻辑斯谛回归,我们建立了两个来自变点模型的风险调整后的几何控制图,分别称为CUSUM和WLRT。数值模拟表明所提出的控制图的表现是令人满意的。 最后,我们考虑应用控制图的方法来提高数据质量。在相关的研究中,对多维数据质量过程的监控都没有采用多元控制图,而是依赖于多个单变量控制图的复合。这类方法有如下三个缺点:第一,如此应用(多个单变量控制图的复合)会有相当高的误报率,从而使得检测实际过程中的变化的功效很低(Jones-Farmeret al.,2014)。第二,采用多个单变量控制图的复合这种方法会使得通过模拟来确定控制线变得很复杂(Li et al.,2014a)。第三,多元控制图能够充分利用变量之间的内在关系(Woodall and Montgomery,2014)。在第5章,我们关心的是对高维数据流的数据质量进行在线监测。在每个时刻t,我们对Nt个数据流的数据质量进行监控,这里的Nt非常大。对第n个数据流,我们观测mn个数据质量,例如准确性、一致性、完整性等等。对每个数据流,我们假定其观测值(数据质量)来自边际分布是伯努利分布的多元变量。如果我们怀疑某个数据流的数据质量变差,就暂时停止对该数据流的监控。基于一种新的单边的多元指数加权移动平均(MEWMA)控制图,我们提出了一个利用条件错误发现率(CFDR)的调整方案,在线监测高维数据流的数据质量。我们选择错误发现率(FDR)和功效两个标准用于评价控制图的表现。数值结果表明,所提出的方案具有更小的保守的错误发现率和更高的平均功效。 第6章总结了本文的工作,包括我们在研究过程中未涉及到的问题以及未来的研究课题。 三个主要创新点如下: 第一,我们基于加权似然比检验(WLRT)为监控排队系统和profile数据提供了一个的统一的框架。使用伪样本来保证控制图的短程误报达到令人满意的程度。与传统的EWMA控制图一样,时间越近的样本获得的权重越大,所有权重的和等于1,权重随着时间指数衰减。所提出的WLRT控制图能够对一定范围内的漂移进行有效地监控。在过程受控时,该WLRT控制图运行长度的分布是较理想的,在过程失控时,该WLRT控制图又能尽早地报警。 第二,为了对医疗保健系统进行第Ⅱ阶段的监控,我们基于风险调整后的逻辑斯谛回归建立了两个来自变点模型的风险调整后的几何控制图,分别称为CUSUM和WLRT。数值模拟表明所提出的控制图的表现是令人满意的。 第三,在不同数据流的数据质量相互独立这一假设下,我们提出了一个新的监控数据质量的框架。我们的贡献包括:1.在线监控高维数据流的数据质量。2.采用多元控制图监控多维数据质量过程。3.使用CFDR调整方案保证更小的保守的错误发现率和更高的平均功效。