第 13 章 實驗設計與 變異數分析 © 2020 Cengage 版權所有,為課本著作之延伸教材,亦受著作權法之規範保護,僅作為授課 教學使用,禁止列印、影印、未經授權重製和公開散佈 本章內容 • 13.1 實驗設計與變異數分析介紹 • 13.2 變異數分析與完全隨機設計 • 13.3 多重比較程序 • 13.4 隨機區集設計 • 13.5 因子實驗 第13章 實驗設計與變異數分析 第467頁 13.1 實驗設計與變異數分析介紹 • 資料蒐集 • 變異數分析的假設 • 變異數分析:觀念簡介 實驗設計與變異數分析介紹 • 統計研究可分為實驗或觀察兩類。 • 在實驗統計研究中,須先界定感興趣之變數,而後控制 研究中另一個或更多個其他因素,即可獲得這些因素如 何影響欲探討變數之資料。 • 在觀察研究中,則不需控制實驗,而是從實地訪查中取 得資料。 • 在觀察研究中,要建立因果關係是有困難的。實驗研究 則較容易建立。 第13章 實驗設計與變異數分析 第468-469頁 實驗設計實例 • Chemitech 公司發展出一套新的自來水過濾系統。該系統 的零件必須向數個供應商購買,Chemitech 公司將在位於 南卡羅來納州哥倫比亞市的工廠組裝這些零件。工業工 程部門須負責決定此套新過濾系統的最佳組裝方法。在 考慮很多可行的組裝方法後,工業工程部門選出 3 種較 佳的方法:方法 A、方法 B 及方法 C。這些方法在組裝產 品的先後順序上會有所差異。Chemitech 公司的經理希望 知道何種組裝方法可在每週生產數量最多。 第13章 實驗設計與變異數分析 第469頁 實驗設計實例 • 在實驗中,組裝方法被視為是一個自變數或因素 (factor) ,因為此因素包含 3 種組裝方法,我們稱此實驗有 3 個 處理,每個處理 (treatment) 對應 1 種組裝方法。 • Chemitech公司之問題是有關類別因素 ( 組裝方法 ) 的單 因素實驗 (single-factor experiment) 的實例。其他更複雜 的實驗可能包含多個因素,其中有些是類別因素,有些 則是定量因素。 第13章 實驗設計與變異數分析 第469頁 實驗設計實例 • 這 3 種組裝方法 ( 或處理 ) 定義了此次 Chemitech 實驗中 的 3 個研究母體:第 1 個母體是使用方法 A 的所有員工 、第 2 個母體為使用方法 B 的所有員工、第 3 個母體則 為使用方法 C 的所有員工。 • 對每個母體而言,應變數或反應變數 (response variable) 為每週組裝的過濾系統數目。而此次實驗的目的則是決 定 3 個母體 ( 方法 ) 每週之平均產量是否相等。 第13章 實驗設計與變異數分析 第469頁 實驗設計實例 • 假設我們從 Chemitech 公司的所有裝配工人中,任意選 取 3 名員工組成 1 組隨機樣本,這 3 名員工稱為實驗單 位 (experimental units)。 • 在 Chemitech 公司之問題中,使用的實驗設計稱為完全 隨機設計 (completely randomized design)。此種設計方式 要求 3 個實驗單位 ( 即裝配工人 ) 均被隨機指派 1 種組裝 方法 ( 或處理 )。 • 例如,第 2 個工人被指定以方法 A 組裝,第 1 個工人被 指定方法 B,第 3 個工人則採用方法 C。此例子中的隨機 化 (randomization) 概念是所有實驗設計的重要原則。 第13章 實驗設計與變異數分析 第469頁 實驗設計實例 • 值得注意的是,在該實驗中,1 個處理將只含 1 個測量值 ( 即組裝的產品數量 )。為了獲得更多資料,我們必須重 複上述實驗程序。例如,我們不要一次只隨機選取 3名 員工,而改為選取 15 名員工,然後各隨機指派 5 名員工 採用某種組裝方式。既然每種組裝方式都有 5 名員工, 我們即可說:重複 5 次實驗。這種重複 (replication) 的過 程為實驗設計的另一重要原則。 • 圖 13.1 說明此次 Chemitech 實驗的完全隨機設計。 第13章 實驗設計與變異數分析 第469頁 實驗設計實例 第13章 實驗設計與變異數分析 第470頁 實驗設計實例 • 在 Chemitech 公司的例子中,我們須先指導員工如何執 行所被指派的組裝方法,而後令其使用此種組裝方法開 始組裝新的過濾系統。完成這項指派和培訓後,1 週內 每名員工組裝的數量、各種組裝方式所生產的產品數量 的樣本平均數、樣本變異數與樣本標準差等如表 13.1。 其中使用方法 A 的樣本平均數為 62,方法 B 為 66,方法 C 則為 52。 • 就上述資料而言,方法 B 的生產率似乎高於其他兩種方 法。 第13章 實驗設計與變異數分析 第469-470頁 實驗設計實例 第13章 實驗設計與變異數分析 第470頁 實驗設計實例 • 真正的問題是,這 3 個樣本平均數之差異是否大到可以 使我們下結論,即 3 種組裝方法之產量不同。為了以統 計名詞表達此問題,我們先介紹下列符號: μ1=方法 A 平均每週產量 μ2=方法 B 平均每週產量 μ3=方法 C 平均每週產量 • 雖然我們不可能知道 μ1、μ2 及 μ3真正的值,但我們可使 用樣本平均數檢定下列的假設: H0:μ1= μ2=μ3 Ha:所有母體平均數不全相等 第13章 實驗設計與變異數分析 第470-471頁 變異數分析介紹 我們可使用樣本平均數檢定下列的假設: H0: 1 = 2 = 3 Ha: 所有母體平均數不全相等 第13章 實驗設計與變異數分析 第470-471頁 變異數分析介紹 H0: μ1=μ2=μ3 Ha: 所有母體平均不全相等 如果不拒絕 H0,我們不能下結論說所有的母體平均數 都不相等。 拒絕 H0 意指至少有兩個母體平均數不相等。 第13章 實驗設計與變異數分析 第471頁 變異數分析的假設 1. 每個母體的反應變數均為常態分配。 2. 所有母體反應變數的變異數 σ2 均相等。 3. 由每個母體抽取之樣本必須互為獨立。 第13章 實驗設計與變異數分析 第471頁 變異數分析介紹 第13章 實驗設計與變異數分析 第472頁 變異數分析介紹 第13章 實驗設計與變異數分析 第472頁 變異數分析介紹 • 每一組樣本之樣本內差異也將影響變異數分析的結論。 當由每個母體中抽取 1 組隨機樣本時,每一組的樣本變 異數均應為共同變異數 σ2 的不偏估計值。因此,我們將 結合共同變異數 σ2 的每個個別估計值,成為一個總樣本 估計值。以此方式獲得的母體變異數 σ2 的估計值稱為 σ2 之混合或處理內估計值 (pooled or within-treatments estimate)。 • 由於 σ2 之處理內估計值乃是每組樣本組內變異所計算而 得的樣本變異數,故不受母體平均數是否相等之影響。 當樣本大小相等時, σ2 之處理內估計值可由計算各個樣 本變異數之平均數而得。 第13章 實驗設計與變異數分析 第472-473頁 變異數分析實例 • 在 Chemitech公司的例子中,我們可得 27.5 26.5 31.0 85 之處理內估計值 28.33 3 3 2 • σ2 的處理間估計值 (260) 遠大於處理內估計值(28.33),事 實上,這兩個估計值之比為 260/28.33=9.18。 • 有關σ2 的處理間估計值 (260) 的計算,請參考課本P.471 最下面到P.472上面的內容。 第13章 實驗設計與變異數分析 第473頁 變異數分析介紹 • 只有當虛無假設為真時,處理間估計值方為 σ2 的一個好 的估計值;若虛無假設為偽,處理間估計值將高估 σ2。 但處理內估計值則不論在何種情況下,均為共同母體變 異數 σ2 的良好估計值。因此,若虛無假設為真,此兩個 估計值應極為接近,它們的比也應接近 1;如果虛無假 設為偽,處理間估計值應大於處理內估計值,且它們的 比應該較大。 第13章 實驗設計與變異數分析 第473頁 變異數分析介紹 • ANOVA 背後的邏輯乃基於共同母體變異數 σ2 的兩種獨立 估計方式發展而成。 • 一種 σ2 的估計方式係基於各種樣本平均數間之差異計算 而得(between-treatment estimate)。 • 另一種方式則由每組樣本的組內變異數計算而得(withintreatment estimate)。藉由比較上述兩個 σ2 的估計值,我 們將可決定母體平均數是否相等。 第13章 實驗設計與變異數分析 第473頁 評註 1. 實驗設計的隨機化與觀察研究之機率抽樣在本質上是 相似的。 2. 在許多醫藥實驗中,雙盲實驗設計可消除許多潛在誤 差。在此類設計中,醫生與病患均不知用了何種處理 。此類設計亦適用於許多其他類型的實驗。 3. 本節中,我們介紹在完全隨機實驗設計中,如何使用 變異數分析進行 k 個母體平均數是否相等的檢定,這 些程序亦可適用在觀察(非實驗)研究上。 第13章 實驗設計與變異數分析 第473頁 評註 4. 在 10.1 節及 10.2 節中,我們曾介紹用以檢定兩母體平 均數相等之假設的統計方法。ANOVA 亦可用來檢定兩 母體平均數相等之假設。然而,在實務運用上,變異 數分析通常只用來檢定 3 個或 3 個以上母體平均數相 等的假設。 第13章 實驗設計與變異數分析 第473頁 13.2 變異數分析與完全隨機設計(P.473) • 母體變異數之處理間估計值 • 母體變異數之處理內估計值 • 比較變異數之估計值:F 檢定 • ANOVA 表 • 檢定 k 個母體平均數是否相等:一個觀察研究的實例 • 變異數分析之電腦結果 變異數分析 • 變異數分析來檢定 k 個母體平均數是否相等。 • 其假設檢定之一般形式為 H0:1=2= . . . =k Ha:所有母體平均數不全相等 其中 j=第 j 個母體平均數 第13章 實驗設計與變異數分析 第473頁 變異數分析 • 樣本資料 xij=第 j 個處理的第 i 個觀察值 nj=第 j 個處理的觀察值個數 𝑥𝑗ҧ =第 j 個處理的樣本平均數 𝑠𝑗2 =第 j 個處理的樣本變異數 sj=第 j 個處理的樣本標準差 第13章 實驗設計與變異數分析 第473-474頁 變異數分析 • 第 j 個處理的樣本平均數公式: n j xij x j i1 nj • 第 j 個處理的樣本變異數公式: nj 2 ( x x ) ij j s 2j i 1 n j 1 第13章 實驗設計與變異數分析 第474頁 變異數分析 • 總樣本平均數 n k j xij x j1 i1 nT 其中 nT =n1+n2+. . .+nk • 如果每組樣本數均為 n,則 nT=kn k x n j xij j 1 i 1 kn k n j xij / n j 1 i 1 k k xj j1 k 第13章 實驗設計與變異數分析 第474頁 檢定 k 個母體平均數是否相等 (Chemitech公司實例) • 在 Chemitech 公司的例子中,每個樣本數均為 5。利用表 13.1 的資料,我們可以得到下列結果 x 62 66 52 60 3 如果虛無假設為真 (1=2=3=),總樣本平均數 60 即 為母體平均數 μ 的最佳估計值。 第13章 實驗設計與變異數分析 第474頁 母體變異數之處理間估計值 • 處理間平方和 (sum of squares due to treatments),記作 SSTR。 k SSTR n j ( x j x ) 2 j 1 • 處理間均方 (mean square due to treatments),記作MSTR 。 k 2 nj (xj x ) MSTR j1 k 1 第13章 實驗設計與變異數分析 第474-475頁 母體變異數之處理間估計值 • 2 之處理間估計值,稱為處理間均方 (mean square due to treatments),記作 MSTR,計算 MSTR 的公式為 k nj (xj x ) MSTR j1 k−1為 SSTR 的自由度 2 k 1 處理間平方和(sum of squares between treatments 或sum of squares due to treatments),記作 SSTR 第13章 實驗設計與變異數分析 第474-475頁 母體變異數之處理間估計值 (Chemitech 公司實例) • 若 H0 為真,則 MSTR 為 σ2 的不偏估計值。 • 當 k 個母體平均數不相等時,MSTR 將不再是 σ2 的不偏估 計值。事實上,此時 MSTR 將高估 σ2 。 • 由表 13.1 Chemitech 公司的資料,我們可得到下列的結 果。 k SSTR n j ( x j x ) 2 5(62 60) 2 5(66 60) 2 5(52 60) 2 520 j 1 MSTR SSTR 520 260 k 1 5 第13章 實驗設計與變異數分析 第475頁 母體變異數之處理內估計值 • 誤差平方和 (sum of squares due to error),記作 SSE。 k SSE (n j 1) s 2j j 1 • 誤差均方 (mean square due to error),記作 MSE。 k 2 ( n 1 ) s j j MSE j 1 nT k 第13章 實驗設計與變異數分析 第475頁 分母為 SSE 的 自由度 母體變異數之處理內估計值 (Chemitech 公司實例) • MSE 來自於每個處理內的差異,它不會受虛無假設是否 為真的影響。因此,MSE 恆為 σ2 的一不偏估計值。 • 由表 13.1 Chemitech 公司的資料,我們可以得到下列的 結果。 k SSE (n j 1) s 2j (5 1)27.5 (5 1)26.5 (5 1)31 340 j 1 MSE SSE 340 340 28.33 nT k 15 3 12 第13章 實驗設計與變異數分析 第475-476頁 比較變異數之估計值:F 檢定 • 若虛無假設為真且 ANOVA 之假設均成立,MSTR/MSE 的 抽樣分配將會服從分子自由度為 k-1、分母自由度為 nT -k 的 F 分配。換言之,若虛無假設為真,MSTR/MSE 的 值會是從此 F 分配抽樣而得的結果。 • 若虛無假設為假,則因 MSTR 高估 σ2,MSTR/MSE 的值將 提高。 • 因此,當 MSTR/MSE 的值太大,使其不似來自分子自由 度為 k-1,分母自由度為 nT-k 的 F 分配時,我們將拒 絕 H0。 第13章 實驗設計與變異數分析 第476頁 比較變異數之估計值:F 檢定 • 假設檢定 H0:1=2= . . . =k Ha:所有母體平均數不全相等 • 檢定統計量 MSTR 𝐹= MSE 第13章 實驗設計與變異數分析 第477頁 比較變異數之估計值:F 檢定 • 拒絕法則 p 值法: 若 p 值 ≤ α,則拒絕 H0 臨界值法: 若 F ≥ Fα,則拒絕 H0 其中 Fα 值(臨界值)係由分子自由度 k-1,分母自由度 nT -k 之 F 分配查表而得。 第13章 實驗設計與變異數分析 第477頁 比較變異數之估計值:F 檢定 (Chemitech 公司實例) • 若使用顯著水準 α=0.05 來進行假設檢定,則檢定統計 量的值 MSTR 260 F 9.18 MSE 28.33 其分子自由度為 k-1=3-1=2,分母自由度為 nT-k= 15-3=12。由於我們只在檢定統計量的值夠大時,才會 拒絕虛無假設,因此 p 值為 F 分配在檢定統計量 F=9.18 的右尾區域的面積值。 • 圖13.4為 F=MSTR/MSE 的抽樣分配、檢定統計量的值及 此假設檢定右尾區域的 p 值。 第13章 實驗設計與變異數分析 第476頁 比較變異數之估計值:F 檢定 (Chemitech 公司實例) 第13章 實驗設計與變異數分析 第477頁 比較變異數之估計值:F 檢定 (Chemitech 公司實例) • 查附錄 B 的表 4,分子自由度為 2、分母自由度為 12的 F 分配,其右尾區域的範圍如下。 • 由於 F=9.18 大於 6.93,因此 F=9.18的右尾面積會小於 0.01,亦即 p 值小於 0.01。因為 p 值 ≤ α=0.05,所以拒 絕 H0。 • 此檢定提供充分的證據顯示 3 個母體平均數不相等。換 言之,變異數分析支持 Chemitech 公司 3 種組裝方法每 週產量的母體平均數不全相等之結論。 第13章 實驗設計與變異數分析 第476-477頁 比較變異數之估計值:F 檢定 (Chemitech 公司實例) • 我們也可以使用臨界值法進行此假設檢定的程序。假設 α=0.05,在自由度為 2 與 12 的 F 分配,其右尾區域的面 積為 0.05 處,可找到臨界 F 值,查 F 分配表,可得 F0.05 =3.89。因此,Chemitech 公司的例子其右尾拒絕法則 若 F ≥ 3.89,則拒絕 H0 由於 F=9.18,故拒絕 H0,結論為三個母體的平均數不全 相等。 第13章 實驗設計與變異數分析 第477頁 ANOVA表 第13章 實驗設計與變異數分析 第478頁 ANOVA表 SST 可分解為兩個平方和:處理間平方和與誤差平 方和。SST 之自由度 nT-1 亦可分解為 SSTR 之自由 度 k-1 與 SSE 之自由度 nT-k。 若將所有觀察值視為同一組樣本,則 SST 的計算公式 為 k n j SST ( xij x ) 2 SSTR SSE j 1 i 1 第13章 實驗設計與變異數分析 第478頁 ANOVA表 我們可將變異數分析視為分割 (partitioning) 總平方和 與自由度為兩種不同來源:處理與誤差的一個過程。 將平方和除以相對應之自由度即為變異數之估計值。 由此得到的 F 值與 p 值可用以檢定母體平均數是否相 等之假設。 第13章 實驗設計與變異數分析 第478頁 ANOVA表 (Chemitech 公司實例) • 表 13.3 即為 Chemitech 公司之 ANOVA 表。 第13章 實驗設計與變異數分析 第477-478頁 變異數分析之電腦結果 第13章 實驗設計與變異數分析 第479頁 評註 1. 總樣本平均數可由 k 個樣本平均數之加權平均計算而 得: n1 x1 n2 x2 ... nk xk x nT 若已知各樣本平均數,則使用上述公式計算總樣本平 均數,將較使用式 (13.3) 來得簡單。 第13章 實驗設計與變異數分析 第480頁 評註 2. 如果每組樣本均含 n 個觀察值,則式 (13.6) 可改寫為 ( x j x )2 n ( x j x ) ns 2 MSTR j1 n j1 x k 1 k 1 k 2 k 我們在 13.1 節介紹 σ2 之處理間估計值的概念時, 亦 得到上述的結果。式 (13.6) 乃是將此一結果推廣至樣 本大小不相等的情形。 第13章 實驗設計與變異數分析 第480頁 評註 3. 如果每組樣本均含 n 個觀察值,則 nT=kn;故 nT-k= k(n-1),則式 (13.9) 可改寫 k (n 1) s 2 j k (n 1) s 2 j k sj 2 j 1 MSE j 1 j 1 k (n 1) k (n 1) k 換言之,若每組樣本大小相同,則 MSE 即為 k 個樣本 變異數之平均值。我們在 13.1 節介紹 σ2 之處理內估計 值時,亦得到此結果。 第13章 實驗設計與變異數分析 第481頁 13.3多重比較程序 • 費雪 LSD (Least Significant Difference) • 型 I 誤差率 多重比較程序 • 假設變異數分析已提供拒絕母體平均數相等之虛無假 設的統計證據。 • 費雪最低顯著差異 (least significant difference, LSD) 程序 可用以決定哪些母體平均數間存在差異。 第13章 實驗設計與變異數分析 第484頁 費雪 LSD 程序 • 費雪 LSD 程序 𝐻0 :𝜇𝑖 = 𝜇𝑗 𝐻a :𝜇𝑖 ≠ 𝜇𝑗 • 檢定統計量 t xi x j 1 1 MSE n n j i 第13章 實驗設計與變異數分析 第484頁 費雪 LSD 程序 • 拒絕法則 p 值法: 若 p 值 ≤ α,則拒絕 H0 臨界值法: 若 t ≤ −tα/2 或 t ≥ tα/2,則拒絕 H0 其中 tα/2 值係查自由度為 nT-k 之 t 分配表而得。 第13章 實驗設計與變異數分析 第484頁 費雪 LSD 程序實例 • 利用費雪 LSD 程序檢定在 α=0.05 的顯著水準下,母體 1 (方法 A) 與母體 2 (方法 B) 之平均數間是否存在顯著差異 • 由表 13.1 得知,方法 A 之樣本平均數是 62,方法 B 為 66 • 表 13.3 則顯示母體變異數之估計值 MSE,為 28.33,其 為 σ2 之估計值且對應之自由度為 12。根據 Chemitech 公 司的資料,檢定統計量的值為 t 62 66 1 1 28.33 5 5 1.19 第13章 實驗設計與變異數分析 第484頁 費雪 LSD 程序實例 • 由附錄 B 的表 2 可知,自由度 12 的 t 分配表如下所示: 第13章 實驗設計與變異數分析 第485頁 費雪 LSD 程序實例 • t 分配表只有正的 t 值,但 t 分配是左右對稱,我們可以 找 t=1.19 右尾的面積,此面積的 2 倍即是 t=−1.19 對應 的 p 值。當 t=1.19,其面積介於 0.20 與 0.10 之間,將 之乘以 2,可知 p 值一定介於 0.40 與 0.20 之間。 • 利用統計軟體可以算出 p 值為 0.2571。由於 p 值大於 α =0.05,我們不能拒絕虛無假設,因此不能下結論為方 法 A 母體的每週平均產量與方法 B 母體的每週平均產量 不相等。 第13章 實驗設計與變異數分析 第485頁 ഥ𝒊 − 𝒙 ഥ𝒋 為基礎之費雪 以檢定統計量 𝒙 LSD 程序 𝐻0 :𝜇𝑖 = 𝜇𝑗 𝐻a :𝜇𝑖 ≠ 𝜇𝑗 • 檢定統計量 xi x j • 拒絕法則 若| 𝑥ҧ𝑖 − 𝑥𝑗ҧ | ≥ LSD,拒絕 H0 其中 LSD t / 2 1 1 MSE ni n j 第13章 實驗設計與變異數分析 第485頁 費雪 LSD 程序實例 • 就 Chemitech 公司之例子而言,LSD 之值為 1 1 LSD 2.179 28.33 7.34 5 5 • 當樣本大小均相同時,我們只需計算一個 LSD 值。在此 情況下,我們僅需將兩樣本平均數之差異值與 LSD 值進 行比較。 第13章 實驗設計與變異數分析 第485頁 費雪 LSD 程序實例 • 例如,母體 1 (方法 A) 與母體 3 (方法 C) 之平均數差為 62 -52=10。由於此值大於 LSD=7.34,我們可以拒絕方法 A 與方法 C 之母體每週平均產量相等之假設。同樣地, 由於母體 2 與母體 3 的樣本平均數差為 66-52=14 > 7.34,我們也拒絕方法 B 與方法 C 之母體平均數相等之 假設。事實上,我們的結論是方法 A 、方法 B 與方法 C 存在差異。 第13章 實驗設計與變異數分析 第485-486頁 費雪 LSD 程序 • 使用費雪 LSD 程序估計兩母體平均數差之信賴區間 xi x j LSD 其中 LSD t / 2 1 1 MSE ni n j ta/2 係查自由度為 nT-k 之 t 分配表而得。 • 信賴區間包含 0 在內,我們將無法拒絕兩母體平均數相 等之假設。當信賴區間不含 0 時,我們可得到兩母體平 均數確實存在差異之結論。 第13章 實驗設計與變異數分析 第486頁 費雪 LSD 程序實例 • 在 Chemitech 公司的例子中,LSD=7.34 (對應 t0.025= 2.179)。 • 因此,母體 1、母體 2 之平均數差的 95% 信賴區間估計 值為:62-66 ± 7.34=−4 ± 7.34=−11.34 到 3.34。 • 由於此一信賴區間包含 0,故無法拒絕此兩母體平均數 相等之假設。 第13章 實驗設計與變異數分析 第486頁 型 I 誤差率 • 比較的型 I 誤差率 (comparisonwise Type I error rate) 即是 進行單一的一對母體平均數比較時的顯著水準。 • 實驗的型 I 誤差率 (experimentwise Type I error rate) 表示 為αEW。 aEW = 1 – (1 – a)C(k ,2) • 當檢定問題所牽涉之母體數愈多時,實驗的型 I 誤差率將 愈大。 第13章 實驗設計與變異數分析 第486-487頁 13.4 隨機區集設計(P.489) • 飛航管制員壓力測試 • ANOVA 程序 • 計算與結論 隨機區集設計 • 為檢定不同處理之平均數間是否存在差異,我們使用下 列比率計算 F 值。 MSTR F MSE • 當外在因素 ( 非實驗欲探討之變數 ) 產生之差異引起上述 比率之 MSE 變大時,將會產生問題。在此情形下,F 值 將會變小,故即使處理間存在差異,亦可能得到處理間 沒有顯著差異之結論。 第13章 實驗設計與變異數分析 第489-490頁 隨機區集設計 • 隨機區集設計 (randomized block design),此設計的目的 在於藉由控制某些外在的變異來源,消除 MSE 項之誤差 。隨機區集設計可提供真正的誤差變異數之較佳估計值 ,使假設檢定在探查處理平均數差異時,變得更具檢定 力。 • 當實驗單位的性質相類似時,可以使用 完 全 隨 機 的 設 計。如果實驗單位的性質互異,則可以區集 (blocking) 的 方法使其同質化。 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 • 一項測量飛航管制員的疲累與壓力的研究,建議應修改 並重新設計航管員的工作站。在考量數個工作站的設計 案後,選出其中 3 個可降低航管員壓力的較佳方案。現 在面對的主要問題為:這 3 個方案對航管員壓力的影響 程度為何?為解答此問題,我們需先設計一個實驗,以 測量在 3 個設計案下,航管員的壓力。 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 • 在完全隨機設計中,我們各指派一組隨機樣本之航管員 至 3 個不同工作站的設計案。然而,航管員處理壓力之 能力各有差異,對某個航管員而言為高壓力,對另一航 管員可能只是中度甚至輕度之壓力。因此,在測量群體 內之變異來源 (MSE) 時,我們必須瞭解此變異可能包含 隨機誤差與個別航管員之差異兩部分。事實上,航管員 之個別差異可能是構成 MSE 之主要部分。 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 • 分離出航管員個別差異的一種方法即為隨機區集設計。 此設計乃先界定航管員個人差異造成之變異,而後設法 將其自 MSE 項中分離出來。隨機區集設計乃先隨機抽取 一組樣本,然後將樣本內每位航管員均置於 3 個工作站 設計案中各做一次測試。以實驗設計之術語而言,工作 站被稱為欲探討之因素 (factor of interest),航管員則稱為 區集 (blocks),工作站因素的 3 個處理 ( 母體 ) 即對應至 3 個工作站設計案。為簡化起見,我們稱 3 個工作站設計 案為系統 A、系統 B 及系統 C。 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 • 隨機區集設計中,隨機 (randomized) 一詞意指航管員樣 本以「隨機次序」被安排至不同處理 ( 系統 )。如果每個 航管員均依照相同次序分別在 3 個系統進行測試,則觀 察到的差異可能並非因系統差異所致,而係導因於受測 次序。 • 為了得到所需資料,我們在俄亥俄州奧伯林的克利夫蘭 控制中心設置 3 種不同的工作站,並隨機選取 6 名航管 員,均輪流至 3 個工作站工作。我們以追蹤訪談及醫學 檢驗方式測量 6 名航管員在每個系統的壓力值,所得到 的資料如表 13.5。 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 第13章 實驗設計與變異數分析 第490頁 飛航管制員壓力測試 • 表 13.6 為壓力資料之彙整。表中包含欄總和 ( 處理 ) 與 列總和 ( 區集 ),以及有助 ANOVA 程序中平方和計算之樣 本平均數。壓力值愈低愈好,樣本資料顯示系統 B 較佳 ,因其平均壓力值僅 13。然而,我們的問題依然是:這 些抽樣結果可使我們得到 3 個系統之平均壓力值存在差 異之結論嗎?亦即,這些差異具統計上的顯著性嗎?我 們曾在完全隨機設計中使用的變異數分析可用以回答此 一統計問題。 第13章 實驗設計與變異數分析 第491頁 飛航管制員壓力測試 第13章 實驗設計與變異數分析 第491頁 ANOVA 程序 • 隨機區集設計之 ANOVA 程序將總平方和 (SST) 分割為三 部分:處理間平方和、區集造成的平方和及誤差平方和 。公式如下。 SST=SSTR+SSBL+SSE • ANOVA 表亦顯示總自由度 nT-1 為處理之自由度 k-1、 區集之自由度 b-1 及誤差項之自由度 (k-1)(b-1) 之和 。 第13章 實驗設計與變異數分析 第491頁 ANOVA 程序 第13章 實驗設計與變異數分析 第491頁 計算與結論 • 為計算用以檢定隨機區集設計中處理平均數間差異的 F 統計量,我們需先計算 MSTR 與 MSE。為得 MSTR 與 MSE ,則必須先計算 SSTR 與 SSE,然而算出 SSTR 與 SSE 前尚 須計算 SSBL、SST。 • 除先前定義的 k、b、nT 外,我們再使用下列符號: 𝑥𝑖𝑗 =區集 i 中第 j 個處理的觀察值 𝑥ҧ∙𝑗 =第 j 個處理的樣本平均數 𝑥ҧ𝑖∙ =第 i 個區集的樣本平均數 𝑥=總樣本平均數 Ӗ 第13章 實驗設計與變異數分析 第492頁 計算與結論 • 為簡化起見,我們分四步驟執行上列計算。 • 步驟 1. 計算總平方和 (SST) b k SST ( xij x ) 2 i 1 j 1 • 步驟 2. 計算處理間平方和 (SSTR) k SSTR b ( x. j x ) 2 j 1 第13章 實驗設計與變異數分析 第492頁 計算與結論 • 為簡化起見,我們分四步驟執行上列計算。 • 步驟 3. 計算區集造成的平方和 (SSBL) b SSBL k ( xi x ) 2 i 1 • 步驟 4. 計算誤差平方和 (SSE) SSE SST SSTR SSBL 第13章 實驗設計與變異數分析 第492頁 隨機區集設計實例 • 就表 13.6 飛航管制員之資料而言,上述步驟所得之值如 下: 步驟 1. SST=(15-14)2+(15-14)2+(18-14)2+ ··· + (13-14)2=70 步驟 2. SSTR=6[(13.5-14)2+(13.0-14)2+(15.5-14)2] =21 步驟 3. SSBL=3[(16-14)2+(14-14)2+(12-14)2+(14 -14)2+(15-14)2+(13-14)2]=30 步驟 4. SSE=70-21-30=19 第13章 實驗設計與變異數分析 第492頁 隨機區集設計實例 • 上述之平方和各除以對應之自由度,則得表 13.8 的均方 值。 第13章 實驗設計與變異數分析 第492、493頁 評註 • 隨機區集設計會因 b 個區集而失去 b-1 個自由度,此導 致其誤差的自由度會比完全隨機設計時的自由度來得少 。當 n 小時,區集的潛在效果會因誤差自由度的失去而 被掩蓋;當 n 大時,此效果也會變小。 第13章 實驗設計與變異數分析 第493頁 13.5因子實驗(P.495) • ANOVA 程序 • 執行因子實驗 • 計算過程 • 電腦報表解讀與結論 因子實驗 • 在一些實驗中,我們需對 1 個以上的變數或因素做出統 計結論。 • 因子實驗 (factorial experiments) 即是同時針對兩個或以 上因素做出結論的實驗設計。 • 我們之所以使用因子 (factorial) 一詞乃因實驗條件包含這 些因素所有可能的組合。 • 例如,若因素 A 含 a 個水準 (level),因素 B 含 b 個水準, 則此實驗即需要蒐集 ab 個處理組合之資料。 第13章 實驗設計與變異數分析 第495-496頁 因子實驗實例 • 以研究生管理學門入學測驗 (Graduate Management Admissions Test, GMAT) 之研究為例,來說明兩因素之因 子實驗,這是商學研究所用來評估申請人在該領域攻讀 研究所課程的能力的標準化考試。GMAT 之分數由 200 分 至 800 分,分數愈高表示才能愈佳。 • 為了提高學生的 GMAT 成績,一所德克薩斯州的大學正 考慮開設以下 3 種 GMAT準備課程。 1. 針對 GMAT 考題類型的 3 小時複習課程。 2. 包含複習相關考試內容與模擬測驗,為期 1 天的課 程。 3. 針對各個學生的缺點設計 10 週的密集加強課程。 第13章 實驗設計與變異數分析 第496頁 因子實驗實例 • 因此,此研究的 1 個因素是「GMAT 準備課程」,其中包 含 3 個處理:3 小時複習、1 天課程及 10 週課程。在選 擇該採用何種準備課程前,我們須做進一步研究,以確 定不同課程是否會影響 GMAT 成績。 • 接受 GMAT 測驗之學生通常來自商學院、工學院與文理 學院等 3 個學院。因此,此實驗第 2 個欲探討的因素為 學生就讀的大學學院是否會影響 GMAT 成績。所以第 2 個因素是「大學學院」,亦有 3 個處理:商、工及文理 。 第13章 實驗設計與變異數分析 第496頁 因子實驗實例 • 該實驗之因子設計包含因素 A:準備課程的 3 個處理, 及因素 B:大學學院的 3 個處理,共有 3 × 3=9 個處理 組合,這些處理組合或實驗條件彙整於表 13.9。 第13章 實驗設計與變異數分析 第496頁 因子實驗實例 • 假設表 13.9 中的 9 個處理組合均含 2 個學生組成之隨機 樣本:即商學院學生中有 2 個接受 3 小時複習課程,2 個 接受 1 天課程,另外 2 個接受 10 週課程。此外這 3 種課 程中的每一種課程亦各有 2 個工學院學生及 2 個文理學 院學生接受測試。 • 以實驗設計的術語而言,每個處理組合均含兩個觀察值 之樣本稱為有兩個重複數 (replications) 。我們亦可選擇 更多重複數及更大的樣本數,但為了簡化範例的計算過 程,現在只選擇兩個重複數。 第13章 實驗設計與變異數分析 第496頁 因子實驗實例 • 在實驗設計中,我們各從 3 個學院計劃申請商學研究所 的所有學生中隨機選取 6 個學生。而後,每個學院各隨 機指派 2 名學生參與每一個準備課程,故整個研究共有 18 個學生樣本。 • 假定這些被隨機選取的學生已經參與準備課程,並參加 GMAT 考試,所得分數列於表 13.10。 第13章 實驗設計與變異數分析 第496-497頁 因子實驗實例 • 利用表 13.10 之資料,經由變異數分析計算程序可提供 下列問題的答案。 • 主效果 (因素 A):這些準備課程對提高 GMAT 成績之效 果是否不同? • 主效果 (因素 B):大學學院是否會影響 GMAT 成績? • 交互作用效果 (因素 A 與因素 B):是否有些學院學生 適用某些準備課程,而另一學院之學生則適用另一種 準備課程? • 交互作用 (interaction) 一詞是指在因子實驗中出現之新效 果。若此交互作用效果對 GMAT 成績有顯著影響,則可 得到「準備課程的效果與大學學院有關」之結論。 第13章 實驗設計與變異數分析 第497頁 ANOVA 程序 • 兩因素因子實驗之 ANOVA 程序與完全隨機實驗及隨機區 集實驗類似。 • 均須將總平方和 (SST) 與自由度分割成 4 個部分,公式如 下。 SST=SSA+SSB+SSAB+SSE 第13章 實驗設計與變異數分析 第497頁 兩因素因子實驗 第13章 實驗設計與變異數分析 第497頁 兩因素因子實驗 • 步驟 1. 計算總平方和 a b c SSS ( xijk x ) 2 i 1 j 1 k 1 • 步驟 2. 計算因素 A 之平方和 a SSA br ( xi . x ) 2 i 1 • 步驟 3. 計算因素 B 之平方和 b SSB ar ( x. j x ) 2 j 1 第13章 實驗設計與變異數分析 第498頁 兩因素因子實驗 • 步驟 4. 計算交互作用之平方和 a b SSAB r ( xij xi x j x ) 2 i 1 j 1 • 步驟 5. 計算誤差造成的平方和 SSE=SST-SSA-SSB-SSAB 第13章 實驗設計與變異數分析 第498頁 兩因素因子實驗實例 • 表 13.12 為此次實驗之資料蒐集及相關的平方和。利用式 (13.27) 至式 (13.31),可得 GMAT 兩因素因子實驗之平方和 如下: 步驟 1. SST=(500-515)2+(580-515)2+(540-515)2+ ··· +(410- 515)2 = 82,450 步驟 2. SSA=(3)(2)[(493.33-515)2 +(513.33-515)2 +(538.33- 515)2] = 6100 步驟 3. SSB=(3)(2)[(540-515)2+(560-515)2+(445-515)2 ]= 45,300 步驟 4. SSAB=2[(540-493.33-540+515)2+(500-493.33-560+ 515)2+ ··· +(445-538.33-445+515)2 ]=11,200 步驟 5. SSE=82,540-6100-45,300-11,200=19,850 • 上述平方和除以對應之自由度可得檢定兩個主效果 ( 準備 課程與學院別 ) 及交互作用之均方值。 第13章 實驗設計與變異數分析 第498、500頁 兩因素因子實驗實例 • 由於計算過程中,可能涵蓋一般甚至大型的因子實驗問 題,我們必須使用電腦來進行上述之變異數分析及用來 做假設檢定決策的 p 值計算。 第13章 實驗設計與變異數分析 第500頁 兩因素因子實驗資料 第13章 實驗設計與變異數分析 第499頁 電腦輸出結果 97 兩因素因子實驗結論 • 表 13.13 為 GMAT 兩因素因子實驗變異數的輸出結果。檢 定 3 個準備課程 ( 因素 A) 是否有顯著差異的 p 值為 0.299, 由於 p 值=0.299 大於 α=0.05,可知 3 個準備課程的 GMAT 平均測驗成績沒有顯著的差異。 • 然而,就學院效果 ( 因素 B) 而言,p 值=0.005 小於 α= 0.05,意即 3 個不同學院的 GMAT 平均測驗成績存有顯著 的差異。最後,交互效果的 p 值為 0.350,大於 α=0.05, 亦即沒有顯著的交互作用效果。因此,我們沒有理由相 信 3 個準備課程對來自 3 個不同學院的學生準備 GMAT 考試的效果會有不同的差異。 第13章 實驗設計與變異數分析 第500頁 98 End of Chapter 13
0
You can add this document to your study collection(s)
Sign in Available only to authorized usersYou can add this document to your saved list
Sign in Available only to authorized users(For complaints, use another form )