如何设计基本的正交实验设计
如何设计基本的正交实验设计
默认分类 2010-01-26 16:07:17 阅读408 评论1 字号:大中小
南山人开始研究蒸饺实验楼,通过蒸饺实验,知道如何合理地蜡版车塞,知道如何花小力气蜡版车塞。没有想到蒸饺真管用,粮食多收了好击败公斤呢! 快来事实八。
遗憾腮,没有上标、下摆塞。矮,这拨棵版图设计也查强仁义塞。
人们在长期的实践中发现,要得到理想的结果,并不需要进行全面试验,即使因素个数、水平都不太多,也不必做全面试验.尤其对那些试验费用很高,或是具有破坏性的试验,更不要做全面试验.我们应当在不影响试验效果的前提下,尽可能地减少试验次数。正交设计就是解决这个问题的有效方法。正交设计的主要工具是正交表,用正交表安排试验是一种较好的方法,在实践中已得到广泛的应用。 1 正交表及其用法
正交表是一种特制的表格.这里先介绍表的记号、特点及用法.下面以L。(3‘)为例来说明.这个正交表的格式如表1. 表1 正交表L9(34)列号 试验号 1 2 3 4 5 6 7 8 9 L9(34)
1 2 3 4 1 1 1 1 1 2 2 2 1 3 3 3 2 1 2 3 2 2 3 1 2 3 1 2 3 1 3 2 3 2 1 3 3 3 2 1
是什么意思呢?字母L表示正交表;数字9表示这张表共有9行,说明用这张表来
安排试验要做9次试验;数字4表示这张表共有4列,说明用这张表最多可安排4个因素;数字3表示在表中主体部分只出现1,2,3三个数字,它们分别代表因素的3个水平,说明各因素都是3个水平的.一般的正交表记为Ln(mk),n是表的行数,也就是要安排的试验次数;k是表中列数,表示因素的个数;m是各因素的水平数。 常见的正交表如下:
(1)2水平正交表——L4(23),L8(27),L12(211),L16(215)等。
这几张表中的数字2表示各因素都是2水平的;试验要做的次数分别为4,8,12,16;最多可安排的因素分别为3,7,11,15。 (2)3水平的正交表——L9(34),L27(313)。
这两张表中的数字3表示各因素都是3水平的,要做的试验次数分别为9,27;最多可安排的因素分别为4,13。
(3)4水平的正交表——L14(45)。 (4)5水平的正交表——L25(56)。 正交表有下面两条重要性质:
(1)每列中不同数字出现的次数是相等的,如L9(34),每列中不同的数字是1,2,3,它们各出现3次;
(2)在任意两列中,将同一行的两个数字看成有序数对时,每种数对出现的次数是相等的,如L9(34),有序数对共有9个:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),它们各出现一次。
由于正交表有这两条性质,用它来安排试验时,各因素的各种水平的搭配是均衡的,这是正交表的优点。
下面通过具体例子来说明如何用正交表进行试验设计。
例1 某炼铁厂为了提高铁水温度,需要通过试验选择最好的生产方案。经初步分析,主要有3个因素影响铁水温度,它们是焦比、风压和底焦高度,每个因素都考虑3个水平,具体情况如表2。问对这3个因素的3个水平如何安排,才能获得最高的铁水温度? 表2 实验因素与水平
解: 正交表L9(34)列号 试验号 1 2 3 4 5 6 7 8 9
A B C 1 1 1 1 2 2 1 3 3 2 1 2 2 2 3 2 3 1 3 1 3 3 2 1 3 3 2
这九个实验代表了全部27个实验。按照9个实验方案进行实验,结果见表3。 为了便于分析,将结果与正交表合编,以便利于计算。由于铁水温度数值较大,可把每一个铁水温度的值减去1350,得到9个较小的数,这样使计算简单(表4)。
表4
表4中下面的8行是分析计算过程中需要分析的内容。 K1这一行的3个数,分别是因素A,B,C的第1水平所在的试验中对应的铁水温度(减去1350以后)之和。比如对因素A(第1列),它的第l水平安排在第1,2,3号试验中,对应的铁水温度值(减去1350以后)分别为15,45,35,其和为95,记在K1这一行的第1列中。 对于因素B(第2列),它的第1水平安排在第1,4,7号试验中,对应的铁水温度值(减去1350以后)分别为15,40,40,其和为95,记在K1这一行的第2列中。 对于因素C(第3列),它的第l水平安排在第1,6,8号试验中,对应的铁水温度值(减去1350以后)分别为15,30,40,其和为85,记在K1这一行的第3列中。
类似地,K2这一行的3个数,分别是因素A,B,C的第2水平所在的试验中对应的铁水温度(减去1350以后)之和。K3这一行的3个数,分别是因素A,B,C的第3水平所在的试验中对应的铁水温度(减去1350以后)之和.
K1,k2,k3这3行的3个数,分别是K1,K2,K3这3行中的3个数除以3所得的结果,也就是各水平所对应的平均值.
同一列中,K1,k2,k3这3个数中的最大者减去最小者所得的差叫做极差。
一般地说,各列的极差是不同的,这说明各因素的水平改变时对试验指标的影响是不同的。极差越大,说明这个因素的水平改变时对试验指标的影响越大。极差最大的那一列,则那个因素的水平改变时对试验指标的影响就最大,那个因素就是我们要考虑的主要因素。
这里算出3列的极差分别为15.0,11.6,20.0,显然第3列即因素C的极差20.0最大。这说明因素C的水平改变时对试验指标的影响最大,因此因素C是我们要考虑的主要因素。它的3个水平所对应的铁水温度(减去1350以后)平均值分别为28.3,48.3,40.O,第2水平所对应的数值48.3最大,所以取它的第2水平最好。
第1列即因素A的极差为15.0,仅次于因素C,它的3个水平所对应的数值分别为31.7,
38.3,46.7,第3水平所对应的数值46.7最大,所以取它的第3水平最好。
第2列即因素B的极差为11.6,是3个因素中极差最小的,说明它的水平改变时对试验指标的影响最小,它的3个水平所对应的数值分别为31.7,43.3,41.7,第2水平所对应的数值43.3最大,所以取它的第2水平最好。
从以上分析可以得出结论:各因素对试验指标(铁水温度)的影响按大小次序来说应当是C(底焦高度)A(焦比)B(风压);最好的方案应当是C2A3B2,即
C2:底焦高度,第2水平,1.5, A3:焦比,第3水平,1:14, B2:风压,第2水平,230。 可以看出,这里分析出来的最好方案在已经做过的9次试验中没有出现,与它比较接近的是第9号试验.在第9号试验中只有风压B不是处在最好水平,而且风压对铁水温度的影响是3个因素中最小的。从实际做出的结果看出,第9号试验中的铁水温度是1410℃,是9次试验中最高的,这也说明我们找出的最好方案是符合实际的。
为了最终确定上面找出的试验方案C2A3B2是否为最好方案,可以按这个方案再试验一次,看是否会得出比第9号试验更好的结果。若比第9号试验的效果好,就确定上述方案为最好方案,若不比第9号试验的效果好,可以取第9号试验为最好方案。如果出现后一种情况,说明我们的理论分析与实践有一些差距,最终还是要接受实践的检验。 现将利用正交表安排试验并分析试验结果的步骤归纳如下: (1)明确试验目的,确定要考核的试验指标。
(2)根据试验目的,确定要考察的因素和各因素的水平。要通过对实际问题的具体分析选出主要因素,略去次要因素,这样可使因素个数少些。如果对问题不太了解,因素个数可适当地多取一些,经过对试验结果的初步分析,再选出主要因素。因素被确定后,随之确定各因素的水平数。
以上两条主要靠实践来决定,不是数学方法所能解决的。
(3)选用合适的正交表,安排试验计划。首先根据各因素的水平选择相应水平的正交表。同水平的正交表有好几个,究竟选哪一个要看因素的个数。一般只要正交表中因素的个数比试验要考察的因素的个数稍大或相等就行了。这样既能保证达到试验目的,又使试验的次数不至于太多,省工省时。
(4)根据安排的计划进行试验,测定各试验指标。 (5)对试验结果进行计算分析,得出合理的结论。
上述方法一般称为直观分析法.这种方法比较简单,计算量不大,是一种很实用的分析方法。
最后再说明一点,这种方法的主要工具是正交表,而在因素及其水平都确定的情况下,正交表并不是惟一的。 2 多指标的分析方法
在上节的问题中,试验指标只有一个,考察起来比较方便.但在实际问题中,需要考察的指标往往不止一个,可能有两个、三个,甚至更多,这都是多指标的问题.下面介绍两种解决多指标试验的方法:综合平衡法和综合评分法.这两种方法都能找出使每个指标都尽可能好的试验方案。 2.1 综合平衡法
下面通过具体例子来说明这种方法.
例2 为提高某产品质量,要对生产该产品的原料进行配方试验.要检验3项指标:抗压强
度、落下强度”和裂纹度,前两个指标越大越好,第3个指标越小越好。根据以往的经验,配方中有3个重要因素:水分、粒度和碱度.它们各有3个水平,具体数据如表2.1所示。试进行试验分析,找出最好的配方方案。 解
这是3因素3水平问题,应当选用正交表L9(34)来安排试验。把这里的3个因素依
次放在L9(34)表的前3列(第4列不要),把各列的水平和该列相应因素的具体水平对应起来,得出一张具体的试验方案表。按照这个方案进行试验,测出需要检验的指标的结果,列在表2.2中,然后用直观分析法对每个指标分别进行计算分析。 表2.1
图 2.1
用和例1.1完全一样的方法,对3个指标分别进行计算分析,得出3个好的方案:对抗压强度和裂纹度都是A2B3C1;对落下强度是A3B3C3。这3个方案不完全相同,对一个指标是好方案,而对另一个指标却不一定是好方案。如何找出对各个指标都较好的一个共同方案呢?这正是我们下面要解决的问题。
为便于综合分析,我们将各指标随因素水平变化的情况用图形表示出来,画在图2.1中(为了看得清楚,将各点用线段连起来,实际上并不是直线)。
把图2.1和表2.2结合起来分析,看每一个因素对各指标的影响。 (1)粒度B对各指标的影响
从表2.2看出,对抗压强度和落下强度来讲,粒度的极差都是最大的,也就是说粒度是影响最大的因素,从图2.1看出,显然取8最好;对裂纹度来讲,粒度的极差不是最大,即不是影响最大的因素,但也是取8最好。总之,对3个指标来讲,粒度都是取8最好。 (2)碱度C对各指标的影响
从表2.2看出,对于3个指标,碱度的极差都不是最大的,也就是说,碱度不是影响最大的因素,是较次要的因素。从图2.1看出,对抗压强度和裂纹度来讲,碱度取1.1最好,对落下强度来讲,碱度取1.3最好,但取1.1也不是太差,对3个指标综合考虑,碱度取1.1为好。
(3)水分A对各指标的影响 从表2.2看出,对裂纹度来讲,水分的极差最大,即水分是影响最大的因素.从图2.1看出,水分取9最好,但对抗压强度和落下强度来讲,水分的极差都是最小的,即是影响最小的因素。从图2.1看出,对抗压强度来讲,水分取9最好,取7次之;对落下强度来讲,水分取7最好,取9次之.对3个指标综合考虑,应照顾水分对裂纹度的影响,还是取9为好。 通过各因素对各指标影响的综合分析,得出较好的试验方案是 B3:粒度,第3水平,8; Cl:碱度,第1水平,1.1; A2:水分,第2水平,9。
由此可见,分析多指标的方法是:先分别考察每个因素对各指标的影响,然后进行分析比较,确定出最好的水平,从而得出最好的试验方案,这种方法叫做综合平衡法。
对多指标的问题,由于各指标的重要性不同,即所处的地位不同,要做到真正好的综合平衡,是很困难的,这是综合平衡法的缺点。
下面要介绍的综合评分法,在一定意义上讲,可以克服综合平衡法的这个缺点。 2.2 综合评分法
例3 某厂生产一种化工产品.需要检验两个指标:核酸纯度和回收率,这两个指标都是越大越好。有影响的因素有4个,各有3个水平,具体情况如表2.3所示。试通过试验分析找出较好方案,使产品的核酸含量和回收率都有提高。
解
这是4因素3水平的试验,可以选用正交表L9(34)
。和例1.1一样,按L9(34)表
排出方案(这里有4个因素,正好将表排满),进行试验,将得出的试验结果列入表2.4中。
综合评分法就是根据各个指标重要性的不同,按照得出的试验结果综合分析,给每一个试验评出一个分数,作为这个试验的总指标,根据这个总指标(分数),利用例1.1的方法(直观分析法)作进一步的分析,从而选出较好的试验方案。 这个方法的关键是如何评分,下面着重介绍评分的方法。
在这个试验中,两个指标的重要性是不同的,根据实践经验知道,纯度的重要性比回收率的重要性大,如果化成数量来看,从实际分析,可认为纯度是回收率的4倍,也就是说,论重要性若将回收率看成1,纯度就是4。这个4和1分别叫两个指标的权,按这个权给出每个试验的总分为:
总分 = 4×纯度+1×回收率
根据这个算式,算出每个试验的分数,列在表2.4最右边。再根据这个分数,用直观分析法作进一步的分析,整个分析过程都记录在表2.4中。
根据综合评分的结果,直观上看,第1号试验的分数是最高的,那么能不能肯定它就是最好的试验方案呢?还要作进一步的分析。
从表2.4看出,A,D两个因素的极差都很大,是对试验影响很大的两个因素,还可以看出,A,D都是第l水平为好;B因素的极差比A,D的极差小,对试验的影响比A,D都小,B因素取第3水平为好;C因素的极差最小,是影响最小的因素,C取第2水平为好。综合考虑,最好的试验方案应当是A1B3C2D1,按影响大小的次序列出应当是 A1:时间,第1水平,25h, D1:加水量,第1水平,1:6,
B3:料中核酸含量,第3水平,6.O, C2:pH值,第2水平,6.0。
可以看出,这里分析出来的最好方案,在已经做过的9个试验中是没有的。可以按这个方案再试验一次,看能不能得出比第1号试验更好的结果,从而确定出真正最好的试验方案。
总的来讲,综合评分法是将多指标的问题,通过加权计算总分的方法化成一个指标的问题,这样对结果的分析计算都比较方便、简单.但是,如何合理地评分,也就是如何合理地确定各个指标的权,是最关键的问题,也是最困难的问题.这一点只能依据实际经验来解决,单纯从数学上是无法解决的。 3混合水平的正交试验设计
前两节介绍的多因素试验中,各因素的水平数都是相同的,解决这类问题还是比较简单的。但是在实际问题中,由于具体情况不同,有时各因素的水平数是不相同的,这就是混合水平的多因素试验问题。
解决混合水平这类问题一般比较复杂。在这里介绍两个主要的方法: (1)直接利用混合水平的正交表;
(2)拟水平法——把水平不同的问题化成水平数相同的问题来处理。 3.1 混合水平正交表及其用法
混合水平正交表就是各因素的水平数不完全相等的正交表。这种正交表有好多种,比如L8(41×24)就是一个混合水平的正交表,如表3.1。 表3.1
这张L8(41×24)
表有8行,5列(注意5=1+4),表示用这张表要做8次试验,最多可安排5个因素,其中一个是4水平的(第1列),4个是2水平的(第2列到第5列)。 L8(41×24)表有两个重要特点:
(1)每一列中不同数字出现的次数是相同的。
例如,第1列中有4个数字1,2,3,4,它们各出现两次;第2列到第5列中,都只有两个数字1,2,它们各出现4次。
(2)每两列各种不同的水平搭配出现的次数是相同的。但要注意一点:每两列不同水平的搭配的个数是不完全相同的。
比如,第1列是4水平的列,它和其他任何一个2水平的列放在一起,由行组成的不同的数对一共有8个:(1,1),(1,2),(2,1),(2,2),(3,1),(3,2),(4,1),(4,2),它们各出现1次;第2列到第5列都是2水平列,它们之间的任何两列的不同水平的搭配共有4个:(1,1),(1,2),(2,1),(2,2),它们各出现两次。
由这两点看出,用这张表安排混合水平的试验时,每个因素的各水平之间的搭配也是均衡的。其他混合水平的正交表还有L16(41×212),L16(42×29),L18(21×37)等(见附表6),它们都具有上面所说的两个特点。
例3.1 某农科站进行品种试验。共有4个因素:A(品种)、B(氮肥量)、C(氮、磷、钾肥比例)、
D(规格)。因素A是4水平的,另外3个因素都是2水平的,具体数值如表3.2所示。试验指标是产量,数值越大越好。试用混合正交表安排试验,找出最好的试验方案。 表3.2
解 这个问题中有4个因素,1个是4水平的,3个是2水平的,正好可以选用混合正交表L8(41×24),因素A为4水平,放在第1列,其余3个因素B,C,D,都是2水平的,顺序放在2,3,4列上,第5列不用。按这个方案进行试验,将得出的试验结果放在正交表L8(41×24)的右边,然后进行分析,整个分析过程记在表3.3中。
这里分析计算的方法和例1.1基本上相同。但是要特别注意,由于各因素的水平数不完全相等,各水平出现的次数也不完全相等,因此计算各因素各水平的平均值k1,k2,k3,k4时和例1.1中有些不同。
比如,对于因素A,它有4个水平,每个水平出现两次,它的各水平的平均值k1,k2,k3,k4是相应的K1,K2,K3,K4分别除以2得到的。
而对于因素B,C,D,它们都只有两个水平,因此,只有两个平均值k1,k2,又因为每个水平出现4次,所以它们的平均值k1,k2是相应的K1,K2分别除以4得到的。这样得出的平均值才是合理的。
从表3.3看出,因素A的极差最大,因此因素A对试验的影响最大,并且以取2水平为好;
因素B的极差仅次于因素A,对试验的影响比因素A小,也是以取2水平为好;因素C,D的极差都很小,对试验的影响也就很小,都是以取2水平为好。
总的说来,试验方案应以A2B2C2D2为好。但这个方案在做过的8个试验中是没有的。按理应当照这个方案再试验一次,从而确定出真正最好的试验方案。但是,因为农业生产受节气的制约,只有到第二年再试验。
事实上,在这里因为因素D的影响很小,这个方案与8个试验中的第4号试验A2B2C2D1很接近,从试验结果看出,第4号试验是8个试验中产量最高的,因此完全有理由取第4号试验作为最好的试验方案加以推广。 3.2 拟水平法
例3.2 现有某一试验,试验指标只有一个,它的数值越小越好。这个试验有4个因素A,B,C,D,其中因素C是2水平的,其余3个因素都是3水平的,具体数值如表3.4所示。试安排试验,并对试验结果进行分析,找出最好的试验方案。 表3.4
解
这个问题是4个因素的试验,其中因素C是2水平的,因素A,B,D是3水平的。
这种情况没有合适的混合水平正交表,因此不能用例3.1的方法解决.对这个问题我们可以设想:假若因素C也有3个水平,那么这个问题就变成4因素3水平的问题,因此可以选正交表L9(34)来安排试验。但是实际上因素C只有两个水平,不能随便安排第3个水平。 如何将c变成3水平的因素呢?我们是从第1、第2两个水平中选一个水平让它重复一次作为第3水平,这就叫做虚拟水平。
取哪个水平作为第3水平呢?一般来讲,都是根据实际经验,选取一个较好的水平。比如,如果认为第2水平比第1水平好,就选第2水平作为第3水平。这样因素水平表3.4就变为表3.5的样子,它比表3.4多了一个虚拟的第3水平(用方框把它围起来)。 表3.5
下面就按L9(34)表安排试验,测出结果,并进行分析,整个分析过程记录在表3.6中。
这里要注意的是,因素C的“第3水平”实际上就是第2水平,我们把正交表中第3列的C因素的水平安排又重写一次,两边用虚线标出,对应地列在右边,这一列是真正的水平安排。由于这一列没有第3水平,因此在求和时并无K3,只出现K1,K2。又因为这里C的第2水平共出现6次,因此平均值k2是K2除以6,即k2=K2/6;C的第l水平出现3次,平均值k1是K1除以3,即k1=K1/3。
因素A,B,D都是3水平的,各水平都出现3次,因此求平均值k1,k2,k3时,都是K1,K2,K3除以3。
从表3.6中的极差看出,因素D对试验的影响最大,取第3水平最好;其次是因素A,取第3水平为好;再者是因素B,取第l水平为好;因素C的影响最小,取第1水平为好。
总之,这个试验的最优方案应当是A3B1C1D3。但是这个方案在做过的9个试验中是没有的。从试验结果看,效果最好的是第8号试验,这个试验只有因素B不是处在最好情况,而因素B对试验的影响是最小的。因此我们选出的最优方案是合乎实际的。我们可以按这个方案再试验一次,看是否会得到比第8号试验更好的结果,从而确定出真正的最优方案。
从上面的讨论可以看出,拟水平法是将水平少的因素归入水平数多的正交表中的一种处理问题的方法。在没有合适的混合水平的正交表可用时,拟水平法是一种比较好的处理多因素混合水平试验的方法.这种方法不仅可以对一个因素虚拟水平,也可以对多个因素虚拟水平,具体做法和上面相同,不再重复。这里要指出的是:虚拟水平以后的表对所有因素来说不具有均衡搭配性质,但是,它具有部分均衡搭配的性质(部分均衡搭配的精确含义这里就不细讲了),所以拟水平法仍然保留着正交表的优点。