论文部分内容阅读
在工农业生产和科学研究中,经常需要做试验,要科学地、有效地进行试验,就离不开试验设计。试验设计是指经济地、科学地制定试验方案,以便收集的数据适合于用统计方法分析。传统的试验都是在实验室、工厂或者农田等地方实施的,我们称这样的试验为实体试验。实体试验的试验结果会受随机误差的影响,因此它要遵循三个原则——重复、随机化和分区组。随着计算机技术的快速发展,一些实体试验可以用复杂的计算机代码进行模拟,从而获得试验数据,这样的试验称之为计算机试验。与实体试验相比,计算机试验的结果没有随机性,即相同的输入值只会产生相同的输出值。空间填充设计便是一类能够很好地适应于计算机试验结果没有随机性这一特点的设计。常见的空间填充设计包括拉丁超立方体设计(McKay,Beckman,and Conover(1979))和均匀设计(Fang,Li,andSudjianto(2006))。大批学者致力于空间填充设计的研究,并对上述两种设计进行了一系列的改进(Tang(1993),Ye(1998)和Fang,Ge,and Liu(2002))。本文研究空间填充设计中的一些最新课题,构造了一系列具有低维投影均匀性的空间填充设计。 空间填充设计,顾名思义,就是试验点均匀分布在试验区域的设计。衡量均匀性的准则有很多,例如:最大最小距离和最小最大距离准则(Johnson,Moore,andYlvisaker(1990)),各种不同的偏差准则(Fang,Lin,Winker,and Zhang(2000))。对于一个高维输入空间,将低维投影均匀性作为选择空间填充设计的准则是可行的,增加低维投影均匀性能够减小预测的方差。拉丁超立方体设计就是这样的一类设计,它具有一维投影均匀性。当拉丁超立方体设计投影到一维时,它达到了最大的分层,即试验次数与因子的水平数相等。从该设计被提出以来,便有一些学者从低维投影均匀性的角度改进了该设计,他们在保留设计一维投影均匀性的同时,增加了设计两维甚至更高维的投影均匀性。比如:Tang(1993)基于强度为t的正交表构造出了拉丁超立方体设计,这样的设计不仅具有一维分层性质,在t维边际上也具有分层均匀性。He and Tang(2013)提出了一类新的表,称为强正交表,并扩展该表的水平使其变成拉丁超立方体设计。强度为t的强正交表能在g维(g≤t)好格子点上达到分层均匀性,而基于该强正交表的拉丁超立方体设计则保留了这样的分层均匀性。 列正交性可以看作是空间填充设计的一块垫脚石。Steinberg and Lin(2006)指出因子之间的高相关性会使得后续数据分析变得复杂,而且更难识别出最重要的因子。由此可见,构造列正交的拉丁超立方体设计是非常必要的。在拟合一阶回归模型时,列正交性确保了主效应的估计是不相关的。但此时如果存在二阶效应,仅主效应之间具有列正交性是不够的,还需要主效应与二阶效应之间存在列正交性。目前已有不少文献提出了构造同时具有主效应之间相互正交和主效应与二阶效应相互正交两种性质的拉丁超立方体设计,例如:Ye(1998),Cioppaand Lucas(2007),Georgiou(2009),Sun, Liu, and Lin(2009,2010),Yang andLiu(2012)和Ai,He, and Liu(2012)等。 对于计算机试验设计而言,有时候没有必要要求试验次数一定要与因子水平数相同。而拉丁超立方体设计虽然在一维投影上达到了最大分层,却也导致了它难以达到列正交性。因此,Sun,Pang,and Liu(2011)构造了一些适合于计算机试验的列正交设计,这些设计虽然在一维投影上没有达到最大分层,却也是均匀的。从这个角度出发构造适合于计算机试验的具有多维投影均匀性的列正交设计是值得考虑的。 有时候,试验的背景知识或先验信息可能会提示人们某些因子或者某些因子之间的交互比较重要,人们也可能只对某些因子比较感兴趣。这时候,我们希望能够充分利用这些信息得到更具有代表性的试验数据。对应于这种情况,一种新的设计应运而生,可以将它的列划分成几个子设计,每个子设计在某种准则下优于整个设计。将潜在重要的因子、有潜在重要交互的因子或某些感兴趣的因子安排在同一个子设计里,较优的子设计可以更好地刻画响应与这些因子之间的关系。Liu and Cai(2009)构造了一类超饱和设计,它可以分成若干个子设计,每个子设计都达到了近似列正交性,且优于总设计的正交性。Lin(2012)提出了变分辨度设计,该设计的每个子设计的分辨度高于整个设计的分辨度。从低维投影均匀性的角度来考虑这类可分成更优子设计的设计是空间填充设计的一个新方向。 下面简要介绍本论文中各章的主要内容。 第一章简要介绍了一些与本文相关的背景知识和概念。 第二章给出列正交的强正交表的构造方法。强度为t的强正交表能够在g维(g≤ t)好格子点上达到分层均匀性。因此,强正交表可以看作一类空间填充性比较好的设计。而列正交性是空间填充设计值得拥有的一个性质。但He andTang(2013)提出强正交表时并没有讨论列之间的相关性。于是,本章构造了列正交的强正交表,所构造的设计不仅列数与He and Tang(2013)构造设计的列数差不多,甚至能够达到3-正交性。另外,我们还根据强正交表的可分解性和空间填充性,构造了一类新的分片填充设计,即分片的强正交表。 第三章给出了可映射的近似正交表的构造。Mukerjee,Sun,and Tang(2014)提出了可映射的近似正交表(MNOA),该表具有很好的2维投影均匀性。该表大部分的列对能够达到组合正交性,从而达到列正交性,而剩下的那一部分列对的2维投影均匀性和列正交性都不好。这一章就是从多维投影均匀性和列正交性这两方面改进剩下的那一部分列对,得到了列正交的MNOA和强的MNOA,并扩展MNOA的水平,使得所构造的新设计不仅保留了被扩展设计的多维投影均匀性和列正交性,并且在一维投影上具有更大的分层。 第四章以强正交表作为子设计构造了基于正交表的空间填充设计。本章构造了可以将其列划分成几个子设计的空间填充设计,该设计是基于强度为t的正交表构造的,而且每个子设计都是强度为t的强正交表。这样的设计不仅能充分利用某些先验信息,还弥补了强正交表列数少的缺点。另外,我们还提出了从整体上提高该设计的低维投影均匀性的方法。 第五章对本文的工作进行了简要的总结与讨论。