1、1试验设计方法讲稿主讲:何为 张怀武 薛卫东 唐斌 胡文成 唐先忠绪言课程度的性质:试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。课程的任务:让学生熟悉并掌握近代最常用、最有效的几种优化试验设计方法的基本原理及其应用。什么叫做(优化)试验设计方法?把数学上优化理论、技术应用于试验设计中,科学的安排试验、处理试验结果的方法。采用科学的方法去安排试验,处理试验结果,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果的最有效的技术方法。优化试验设计方法起源 上世纪 30 年代,由于农业试验的需要,费歇(R.A.Fisher)在试验设计和统计分析方面做出了一
2、系列先驱工作,从此试验设计成为统计科学的一个分支。 上世纪 40 年代,在二次世界大战期间,美国军方大量应用试验设计方法。 随后,F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox 和 G.E.P.Box 对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。 50 年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。我国优化试验设计方法 60 末期代,华罗庚教授在我国倡导与普及的“优选法” ,如黄金分割法、分数法和斐波那契数列法等。 数理统计学者在工
3、业部门中普及 “正交设计”法 。 70 年代中期,优选法在全国各行各业取得明显成效。 1978 年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于 10,而试验总数又不超过 50,显然优选法和正交设计都不能用,随后,方开泰教授(中国科学院应用数学研究所)和王元院士提出 “均匀设计”法,2这一方法在导弹设计中取得了成效。优化试验设计试验设计在科学研究中的地位与意义 :1. 试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。2. 科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果。简称为:多、快、好、省。可应用于
4、:提高试验效率、优化产品设计、改进工艺技术、强化质量管理。试验设计在工业生产和工程设计及科学研究中能发挥重要的作用,例如: 提高产量 减少质量的波动,提高产品质量水准 大大缩短新产品试验周期 降低成本 延长产品寿命多用在化工、电子、材料、建工、建材、石油、冶金、机械、交通、电力第一章 正交试验基本方法1-1 问题的提出-多因素的试验问题例 11 为提高某化工产品的转化率,选择了三个有关的因素进行条件试验,反应温度(A) ,反应时间(B) ,用碱量(C) ,并确定了它们的试验范围:A:80-90 B:90-150MinC:5-7%试验目的是搞清楚因素 A、B、C 对转化率的影响,哪些是主要因素,
5、哪些是次要因素,从而确定最优生产条件,即温度、时间及用碱量各为多少才能使转化率提高。试制定试验方案。这里,对因素 A、B、C 在试验范围内分别选取三个水平A:A180、A285、A390B:B190Min、B2120Min、B3150MinC:C15%、C26%、C37%正交试验设计中,因素可以定量的,也可以使定性的。而定量因素各水平间的距离可以相等也可以不等。取三因素三水平,通常有两种试验方法:(1)全面实验法:A1B1C1 A2B1C1 A3B1C1A1B1C2 A2B1C2 A3B1C2A1B1C3 A2B1C3 A3B1C33A1B2C1 A2B2C1 A3B2C1A1B2C2 A2B
6、2C2 A3B2C2A1B2C3 A2B2C3 A3B2C3A1B3C1 A2B3C1 A3B3C1A1B3C2 A2B3C2 A3B3C2A1B3C3 A2B3C3 A3B3C3共有 3=27 次试验,如图所示,立方体包含了 27 个节点,分别表示 27 次试验。 全面试验法的优缺点: 优点:对各因素于试验指标之间的关系剖析得比较清楚 缺点:1. 试验次数太多,费时、费事,当因素水平比较多时,试验无法完成。2. 不做重复试验无法估计误差。3. 无法区分因素的主次。例如选六个因素,每个因素选五个水平时,全面试验的数目是 56 15625 次。又如绪言里所提到的,1978 年,七机部由于导弹设计
7、的要求,提出了一个五因素的试验,希望每个因素的水平数要多于 10,此时靠全面试验法是无法完成的。(2)简单比较法变化一个因素而固定其它因素,如首先固定 B、C 于 B1、C1,使 A 变化之,则:如果得出结果 A3 最好,则固定 A 于 A3,C 还是 C1,使 B 变化,则:4得出结果 B2 最好,则固定 B 于 B2,A 于 A2,使 C 变化,则:试验结果以 C3 最好。于是得出最佳工艺条件为 A3B2C2。简单比较法的优缺点: 优点:试验次数少 缺点:(1)试验点不具代表性。考察的因素水平仅局限于局部区域,不能全面地反映因素的全面情况。(2)无法分清因素的主次。(3)如果不进行重复试验
8、,试验误差就估计不出来,因此无法确定最佳分析条件的精度。(4)无法利用数理统计方法对试验结果进行分析,提出展望好条件。正交试验的提出:考虑兼顾全面试验法和简单比较法的优点,利用根据数学原理制作好的规格化表正交表来设计试验不失为一种上策。用正交表来安排试验及分析试验结果,这种方法叫做正交试验法。事实上,正交最优化方法的优点不仅表现在试验的设计上,更表现在对试验结果的处理上。正交试验法优点:(1)试验点代表性强,试验次数少。(2)不需做重复试验,就可以估计试验误差。(3)可以分清因素的主次。(4)可以使用数理统计的方法处理试验结果,提出展望好条件。正交试验(表)法的特点:(1)均衡分散性代表性。(
9、2)整齐可比性可以用数理统计方法对试验结果进行处理。用正交表安排试验时,对于例 11:(见书)1-2 用正交表安排试验5一、指标、因素和水平试验需要考虑的结果称为试验指标(简称指标)可以直接用数量表示的叫定量指标;不能用数量表示的叫定性指标。定性指标可以按评定结果打分或者评出等级,可以用数量表示,称为定性指标的定量化试验中要考虑的对试验指标可能有影响的变量简称为因素,用大写字母 A、B、C表示每个因素可能出的状态称为因素的水平(简称水平)二、正交表符号的意义三、正交表的正交性(以 L9 (34 )为例)正交表的特点:每个列中, “1”、 “2”、 “3”出现的次数相同;任意两列,其横方向形成的
10、九个数字对中,恰好(1,1) 、 (1,2) 、 (1、3) 、 (2,1)(2,2) 、 (2,3) 、 (3,1) 、 (3,2) 、 (3、3)出现的次数相同 这两点称为正交性: 均衡分散,整齐可比,代表性强,效率高 均衡分散:试验点在试验范围内排列规律整齐 整齐可比:试验点在试验范围内散布均匀 四、用正交表安排试验(以例 11 为例)(1)明确试验目的,确定试验指标例 11 中,试验目的是搞清楚 A、B、C 对转化率的影响,试验指标为转化率(2)确定因素水平表(3)选用合适正交表本试验可选取正交表 L9 (34 ) 安排试验(4)确定试验方案“因素顺序上列,水平对号入座,横着做”1-3
11、 正交试验结果分析极差分析法以例 11 为例分析内容:3 个因素中,哪些因素对收益率影响大,哪些因素影响小;如果某个因素对试验数据影响大,那么它去哪个水平对提高收益率有利。利用正交表的“整齐可比”性进行分析:对于因素 A 从表中可以看出, A1、A2、A3 各自所在的那组试验中,其它因素(B 、C、D)的 1、2、3 水平都分别出现了一次。计算方法如下:K1A = x1 + x2 + x3 = 31+54+38=123k1A = K1A/3=123/3=41K2A = x4 + x5+ x6 =53+49+42=1446k2A = K2A/3=144/3=48K3A = x7 + x8+ x9
12、 = 57+62+64=183k3A = K3A/3=183/3=61我们比较 K1A、 K2A、K 3A 时,可以认为 B、C 、D 对 K1A、 K2A、K 3A 的影响是大体相同的。于是,可以把 K1A、 K2A、K 3A 之间的差异看作是 A 取了三个不同水平引起的。正交设计的整齐可比性对于因素 B同理可以算出:K1B = x1 + x2 + x3 = 31+53+57=141k1B = K1B/3=141/3=47K2B = x4 + x5+ x6 =54+49+62=165k2B = K2B/3=165/3=55K3B = x7 + x8+ x9 = 38+42+64=144k3B
13、 = K3B/3=183/3=48我们比较 K1B、 K2B、K 3B 时,可以认为 A、C 、D 对 K1B、 K2B、K 3B 的影响是大体相同的。于是,可以把 K1B、 K2B、K 3B 之间的差异看作是 B 取了三个不同水平引起的。对于 C 与此同理(1)确定因素的主次将每列的 k1 、 k2 、k 3 中最大值于最小值之差称为极差即:第一列(A 因素) k3A k1A614120第二列(B 因素) k2B k1B55478第三列(C 因素) k2C k1C574512影响大,就是该因素的不同水平对应的平均收益率之间的差异大直观看出:一个因素对试验结果影响大,就是主要因素本例中:因素主
14、次为 A-C-B(2)确定各因素应取的水平也可以选取图形中最高的水平点得到最优生产条件:选取原则:(1)对主要因素,选使指标最好的那个水平于是本例中 A 选 A3,C 选 C2(2)对次要因素,以节约方便原则选取水平本例中 B 可选 B2 或者 B1于是用 A3B2C2、A3B1C2 各做一次验证试验,结果如下:典型范例(13):2,4二硝基苯肼的工艺改革试验目的:2,4二硝基苯肼是一种试剂产品。过去的工艺过程长,工作量大且产品经常不合格。北京化工厂改革了工艺,采用 2,4二硝基氯化苯(以下简称氯化苯) 与水合肼在乙醇作溶剂的条件下合成的新工艺。小的试验已初步成功,但收率只有 45%,希望用正
15、交试验法找出好的生产条件,达到提高生产效率的目的。试验指标:产率(%)与外观颜色。 1. 制定因素水平表2. 选择合适的正交表3. 确定试验方案7将本试验的 6 个因素及相应水平按因素顺序上列、水平对号入座原则,排入 L8(27)表中前 6 个直列。试验方案如下表 19。4.结果分析(1) 直接看,可靠又方便(2) 算一算,重要又简单(3) 可能好配合A2B1C2D2E2F2。5 第二批撒小网在第一批试验的基础上,为弄清产生不同颜色的原因及进一步如何提高产率,决定再撒个小网。做第二批正交试验。(1) 制定因素水平表对最重要的因素 B,应详加考察 ,从趋势上看,随水合肼用量的增加产率提高。现决定
16、在好用量两倍的周围,再取 1.7 倍与 2.3 倍两个新用量继续试验这即是有苗头处着重加密原则。 (2)利用正交表确定试验方案(3) 试验结果的分析投产效果是:平均产率超过 80%,从未出现过紫色外形,质量达到出口标准。总之,这是一个最优方案,达到了优质、高产、低消耗的目的。下面将正交试验法的一般步骤小结如下:第一步:明确试验目的,确定试验指标。第二步:确定因素水平表后 ,选择合适的正交表,进而确定试验方案。第三步:对试验结果进行分析 ,其中有:(1)直接看(2)算一算()各列的 K、 k 和 R 计算R(第 j 列)=第 j 列中的 k1、k2中最大的减去最小的差。()画趋势图(指标因素图)
17、对于多于两个水平的因素画指标因素图。()比较各因素的极差 R,排出因素的主次。(3)选取可能好的配合综合直接看与算一算这两步的结果,并参照实际经验与理论上的认识选取可能好的配合。若所选取的可能好的配合在正交试验中没有出现过,则需做验证试验。1-11 试验1-4 有交互作用的正交试验一、交互作用有些因素间各水平的联合搭配对指标也产生影响,我们称这种联合作用为交互作用。例:考虑氮肥(N)和磷肥( P)对豆类增产的效果正交表交互作用表的使用(以 L8 (27)为例)二、关于自由度和正交表的选用原则选表必须遵循一条原则:要考察的因素及交互作用的自由度综合必须不大于所选用正交表的总自由度8自由度的两条规
18、定:(1)正交表的总自由度 f 总 试验次数1;正交表每列的自由度 f 列 此列水平数1(2)因素 A 的自由度 fA 因素 A 的水平数1;因素 A、B 间交互作用的自由度 fAxB fAfB三、有交互作用的正交试验及结果分析例 1-4 乙酰胺苯磺化反应试验试验目的:提高乙酰胺苯的产率自由度考虑:4 因素及交互作用 AB、AC ,总自由度数41216。而 L8 (27)共有 81 7 个自由度,可以安排表头设计:把需要试验的各因素的各水平安排入正交表内一定列,得到试验设计表的过程(1)考虑交互作用的因素 A 和 B,将 A 放第 1 列,B 放第 2 列。则由 L8(27)的交互作用表查得
19、AB 在第 3 列(2)考虑要照顾到交互作用的因素 C,将 C 放在第 4 列,此时 AC 由 L8(27)的交互作用表查得占第 5 列,第 6、7 列为空,D 可排其中任意一列,我们将其排在第 6 列。则:这样就产生了混杂,是不合理的4 因素及 6 个交互作用,自由度总和为 416110,而 L8 (27)表却只有 817个自由度,容纳不下,只能选用更大正交表的 L16 (215)来做表头设计,如下所示两点启示:(1)在安排表头时,应使要考虑的交互作用和因素不致发生混杂;(2)对试验结果的数据进行计算后,在优选各个因素的水平时,有交互作用的因素,他们的水平不能单独考虑,必须用二元表和二元图进
20、行综合考虑。(三)交互作用在试验中的地位第二章 正交试验结果的统计分析方法2-1 试验数据结构模型一、单因素试验方差分析的数学模型(一)数学模型 iijijij_AprAjX(21) 设 因 素 去 了 个 水 平 , 每 个 水 平 重 复 了 次 试 验 。 则 水 平 下 次 试 验结 果 可 以 分 解 为 : 式 中 : 水 平 真 值 ;数 据 中 包 含 的 误 差 值 。9ij ijij iii11 N()(21)pi aa 2规 律 表 现 在 :( ) 正 的 和 负 的 个 数 差 不 多 , 多 个 的 平 均 近 于 零 ;( 2) 误 差 小 的 比 误 差 大 的
21、 多 ;( 3) 不 同 试 验 之 间 , 误 差 的 大 小 是 不 相 关 的 , 即 之 间 是 彼 此 独 立 的 。用 一 句 话 来 说 , 是 相 互 独 立 的 随 机 变 量 。 遵 从 正 态 分 布 ( , )式 (-)中 和 都 是 未 知 的 。 而 真 值 可 表 达 为 :式 中 ,.pi iiipi i=1AXa,2.(13)a04_ijjj p称 为 一 般 平 均 。 是 对 于 的 偏 移 , 为 的 水 平 效 应 或 主 效 应 。所 以 把 理 解 为 : ( 一 般 平 均 ) ( 平 均 效 应 )即 : ( 一 般 平 均 ) ( 平 均 效
22、 应 ) ( 误 差 )显 然 之 间 有 关 系 表 示 水 平 对 试 验 结 果 产 生 的 影 响 。ipi=1j ,2.j,r2a03Njjip 2方 差 分 析 的 数 学 模 型 的 几 条 假 定( )( )( ) 是 相 互 独 立 且 遵 从 正 态 分 布 ( , )由 这 三 条 建 立 的 模 型 叫 做 线 性 模 型建 立 数 学 模 型 后 , 统 计 分 析 需 要 解 决 两 个 问 题( ) 参 数 估 计( ) 统 计 检 验10例 21 考察温度对一化工产品的得率的影响,选了五种不同的温度,同一温度做了三次试验,结果如下:对其它数据也进行类似分解 ,通
23、过对数据的分解,可以看到分组因素(温度)影响的大小和试验误差的大小。(三)统计检验_ _i 218a (9)0iiijijxxxallj是 的 一 个 无 偏 估 计 量 , 记 作 ( )的 无 偏 估 计 是 即于 是 (2-13)可 以 改 写 为 :式 中 反 映 了 误 差根 据 0对 试 验 数 据 进 行 分 解 , 通 过 数 据 的 分 解 可 看 出水 平 效 应 和 误 差 大 小 。_()(21)ijijiixalxijij因 :即 :移 项 :上 式 说 明 , 测 量 值 与 总 平 均 的 变 差 , 是 组 平 均 值 与 总 平 均 值之 变 差 已 经 测 量 值 与 组 平 均 值 之 变 差 的 和 。_21_AH()(213)/ 4prijixSei 0如 果 统 计 假 设 是 对 的 , 即 因 素 对 测 量 指 标 没 有 影 响 , 则 效 应a全 为 零 。 设 为 统 计 假 设、 组 内 变 差 平 方 和 的 平 均 值 :组 内 平 方 和组 内 差 方 和 的 平 均 值又 称 为 组 内 均 方