TUGAS 2 STATISTIK LANJUT Kelompok 7 : Akmal Fatah Fainusa Annisa Nuria R. Fajri Satria H. Maria Magdalena Friska 1806152911 1806242756 1806153220 1806153416 PROGRAM STUDI S2 TEKNIK INDUSTRI UNIVERSITAS INDONESIA 2019 ANOVA (Analysis of Variance) Dalam sebuah penelitian untuk membandingkan hasil perlakuan (treatment) pada suatu populasi dengan populasi yang lainnya dapat memggunakan metode uji hipotesis yang ada (Distribusi Z, Chi Kuadrat, atau Distribusi-T). Membandingkan satu rata-rata populasi dengan satu rata-rata populasi yang lain dapat memakan waktu dan resiko kesalahan yang besar. Untuk mengatasi hal tersebut dapat menggunakan metode ANOVA. Anova merupakan metode yang dapat digunakan untuk melihat perbandingan rata-rata beberapa kelompok biasanya lebih dari dua kelompok. 1. One-way ANOVA Analysis of variance (ANOVA) merupakan suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Metode ini merupakan teknik analisis multivariate yang berfungsi untuk membedakan rerata lebih dari dua kelompok data dengan cara membandingkan variansinya. Secara umum, ANOVA menguji dua varians berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antar contoh (between samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Penetapan H0 dan H1 dalam ANOVA dirumuskan sebagai berikut: ο· H0 : Semua perlakuan (kolom, baris, interaksi) memiliki rata-rata yang sama. Secara matematis dituliskan sebagai berikut: ο· μ1 = μ2 = … = μk H1 : Ada perlakuan (kolom, baris, interaksi) yang memiliki rata-rata yang bernilai tidak sama (berbeda) atau paling tidak ada satu kelompok yang memiliki rata-rata berbeda dari yang lain. Secara matematis dituliskan sebagai berikut: μ1 ≠ μ2 ≠ … ≠ μk Pada metode ANOVA, terdapat asumsi analisis varian yang harus dipenuhi sebagai berikut: a. Populasi yang digunakan terdistribusi normal. b. Pengambilan sampel secara acak dan setiap sampel independen. c. Setiap populasi mempunyai varians yang sama. Tabel berikut ini akan memberikan sebuah gambaran secara umum penelitian dengan faktor tunggal: Perlakuan 1 2 … α Observasi π¦11 π¦21 … π¦π1 π¦12 π¦22 … π¦π2 … … … … π¦1π π¦2π … π¦ππ Total Rata-rata π¦1. π¦2. … π¦π. π¦.. π¦Μ 1. π¦Μ 2. … π¦Μ π. π¦Μ .. ANOVA terdiri dari proses partisi total variabilitas menjadi beberapa komponen bagian. Total variasi terbagi dalam dua bagian: πππ = πππ΅ + πππ Keterangan: SST (Total) = Total Sum of Squares SSB (Between) = Sum of Squares Between SSW (Within) = Sum of Squares Within ο· SST merupakan jumlah kuadrat selisih antara skor individual dengan rata-rata totalnya. π π π¦.. 2 πππ = ∑ ∑(π¦ππ ) − π 2 π=1 π=1 ο· SSB adalah variansi rata-rata kelompok sampel terhadap rata-rata keseluruhannya. π 1 π¦. .2 πππ΅ = ∑ π¦π.2 − π π ο· π=1 SSW adalah variansi yang ada dalam masing-masing kelompok. πππ = πππ − πππ΅ Keterangan: a = Jumlah perlakuan n = Jumlah sampel yi. = Jumlah sampel data pada perlakuan i yij = Pengukuran ke j dari populasi i y.. = Total keseluruhan data N = Jumlah populasi Derajat kebebasan (Degree of Freedom) pada ANOVA Derajat kebebasan atau degree of freedom (dilambangkan dengan v, dof, atau df) pada ANOVA akan sebanyak variabilitas. Terdapat tiga macam derajat kebebasan yang perlu untuk dihitung: 1. Derajat kebebasan untuk SST, vSST, dengan rumus: π£πππ = π − 1 2. Derajat kebebasan untuk SSB, vSSB, dengan rumus: π£πππ΅ = π − 1 3. Derajat kebebasan untuk SSW, vSSw, dengan rumus: π£πππ = π − π Menghitung variance antar kelompok dan dalam kelompok Variance dalam ANOVA, baik untuk antar kelompok maupun dalam kelompok sering disebut dengan deviasi rata-rata kuadrat (mean squared deviation) dan dilambangkan dengan MS. Deviasi rata-rata kuadrat masing-masing dapat dihitung dengan rumus sebagai berikut: πππ΅ π−1 πππ πππ = π−π πππ΅ = Menghitung distribusi-F Ftabel dihitung dengan melihat nilai α, vSSb adalah pembilang (kolom atas dari kiri ke kanan), sedangkan vSSw adalah penyebut (kolom kiri atas ke bawah). Perpotongan antara vSSb dan vSSw merupakan nilai Ftabel. Ftabel mengacu pada tabel distribusi F. Sedangkan Fhitung didapatkan dengan rumus di bawah ini πΉβππ‘π’ππ = πππ΅ πππ Langkah dalam ANOVA dapat dirangkum dalam tabel seperti berikut: Sumber Variasi Sum of Squares Degrees of Freedom Between πππ΅ π−1 πππ΅ = Within πππ π−π πππ = Total πππ = πππ΅ + πππ π−1 Mean Square πππ΅ π−1 πππ π−π πΉβππ‘π’ππ πΉβππ‘π’ππ = πππ΅ πππ Pernyataan aturan keputusan Tolak H0 dan terima H1 jika Ftest> Ftabel. Jika tidak demikian, terima H0. Contoh Soal: 1. Terdapat suatu penelitian yang bertujuan untuk mengetahui nilai situational awareness laki-laki saat mengenadari mobil pada kondisi tanpa musik, dengan musik klasik volume rendah (intensitas volume 55-60 dBA), musik rock volume rendah (intensitas volume 55-60 dBA), musik rock volume tinggi (intensitas volume 75-80 dBA), dan dengan musik klasik volume tinggi (intensitas volume 75-80 dBA). Penelitian tersebut dilakukan terhadap 8 responden dengan hasil sebagai berikut: Male Situational Awareness No Musik Klasik Low Klasik High Rock Low Rock High 1 2 3 4 5 6 7 8 0,79 0,83 0,64 0,85 0,66 0,81 0,85 0,78 0,75 0,71 0,65 0,71 0,72 0,62 0,61 0,64 0,71 0,57 0,70 0,66 0,77 0,80 0,74 0,64 0,77 0,62 0,67 0,66 0,57 0,57 0,66 0,87 0,72 0,65 0,69 0,71 0,81 0,81 0,55 0,51 Peneliti tersebut melakukan ANOVA dengan tingkat kepercayaan yang digunakan adalah 95% atau α = 0.05, untuk menguji hipotesis berikut : H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ6 = µ7 = µ8 H1 : terdapat perbedaan rata-rata nilai situational awareness Jawab: H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ6 = µ7 = µ8 H1 : terdapat perbedaan rata-rata nilai situational awareness Situational Awareness No Musik Klasik Low Klasik High Rock Low Rock High 1 2 3 4 5 6 7 8 Total Rata-rata 0,79 0,83 0,64 0,85 0,66 0,81 0,85 0,78 0,75 0,71 0,65 0,71 0,72 0,62 0,61 0,64 0,71 0,57 0,70 0,66 0,77 0,80 0,74 0,64 0,77 0,62 0,67 0,66 0,57 0,57 0,66 0,87 0,72 0,65 0,69 0,71 0,81 0,81 0,55 0,51 5,65 6,25 5,64 5,33 5,18 0,71 0,78 0,71 0,67 0,65 Y.. = 28,05 πΜ .. = 0,70 5 8 πΊπΊπ» = ∑ ∑ πππ 2 π=1 π=1 π. .2 − π SST = (0,79)2 + (0,81)2 + (0,65)2 + ………… + (0,51)2 – (28,05)2 40 SST = 0,6241 + 0,6561+ 0,4225 + ………… + 0,2601 – 19,67681 SST = 0,320048016 5 1 π . .2 πΊπΊπ© = ∑ ππ 2 − 8 π π=1 SSB = 1 8 (31,9225 + 39,0625 + 31,8096 + ……… + 26,8324) - 19,67006 SSB = 0,084425 SSW = SST – SSB SSW = 0,320048016 - 0,084425 SSW = 0,235623016 πππ΅ π−1 0,084425 π΄πΊπ© = 4 π΄πΊπ© = MSB = 0,021 π΄πΊπΎ = π΄πΊπΎ = πππ π−π 0,235623016 35 MSW = 0,00674 πππππππ = πππ΅ πππ πππππππ = π, πππ π, πππππ F hitung = 3,11 F table = πΉ∝,π−1,π−π F table = F0,05, 4, 35 F table = 2,64 Hasil penghitungan dengan Ms. Excel. ANOVA Source of Variation Between Groups Within Groups SS 0,084425 0,235623016 df 4 35 Total 0,320048016 39 MS F P-value F crit 0,021023 3,11833777 0,026999 2,641465 0,006742 Kesimpulan F hitung > F table , maka kita menolak H0 dan menerima H1 yang berarti terdapat perbedaan rata-rata nilai situational awareness pada responden tersebut. 2. Suatu penelitian ingin meneliti pengaruh jenis musik terhadap kecepatan saat berkendara. Penelitian ini menggunakan enam responden. Ada pun perlakuan yang diberikan yaitu mengenadari mobil pada kondisi tanpa musik, dengan musik klasik volume rendah (intensitas volume 55-60 dBA), musik rock volume rendah (intensitas volume 55-60 dBA), musik rock volume tinggi (intensitas volume 75-80 dBA), dan dengan musik klasik volume tinggi (intensitas volume 75-80 dBA). Peneliti tersebut melakukan ANOVA dengan tingkat kepercayaan yang digunakan adalah 95% atau α = 0.05, untuk menguji hipotesis berikut : H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ6 H1 : terdapat perbedaan rata-rata nilai kecepatan mengendarai mobil Rata-rata kecepatan P1 P2 P3 P4 P5 P6 (Km/h) No Musik 36,01 41,26 36,45 41,47 31,96 31,93 Klasik Low 39,17 35,03 36,34 39,91 33,94 36,55 Rock Low 47,92 35,06 36,06 46,18 32,91 38,50 Klasik High 37,96 32,51 39,03 44,31 33,61 43,96 Rock High 41,95 37,23 35,90 44,50 38,33 45,75 Jawab: H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ6 H1 : terdapat perbedaan rata-rata nilai kecepatan mengendarai mobil Rata-rata kecepatan P1 P2 P3 P4 P5 P6 Total (Km/h) No Musik 36,01 41,26 36,45 41,47 31,96 31,93 219,08 Klasik Low 39,17 35,03 36,34 39,91 33,94 36,55 220,94 Rock Low 47,92 35,06 36,06 46,18 32,91 38,50 236,63 Klasik High 37,96 32,51 39,03 44,31 33,61 43,96 231,38 Rock High 41,95 37,23 35,90 44,50 38,33 45,75 243,66 Y.. = 1151,69 5 6 πΊπΊπ» = ∑ ∑ πππ 2 − π=1 π=1 Rata-rata 36,51 36,82 39,44 38,56 40,61 πΜ .. = 38,39 π. .2 π SST = (36,01)2 + (41,26)2 + (36,45)2 + ………… + (45,75)2 – (1151,69)2 30 SST = 1296,7201 + 1702,3876 + 1328,6025 + ……………. + 2093,0625 44212,99520 SST = 585,70530 5 1 π . .2 πΊπΊπ© = ∑ ππ 2 − 6 π π=1 SSB = 1 6 (47996,0464 + 48814,4836 + 55993,7569 + 53536,7044 + 59370,1956) – 44212,99520 SSB = 72,20261 SSW = SST – SSB SSW = 585,70530 – 72,20261 SSW = 513,50268 πππ΅ π−1 72,20261 π΄πΊπ© = 4 π΄πΊπ© = MSB = 18,05065333 π΄πΊπΎ = π΄πΊπΎ = πππ π−π 513,50268 25 MSW = 20,54010733 πππππππ = πππ΅ πππ πππππππ = 18,05065333 20,54010733 F hitung = 0,878800341 F table = πΉ∝,π−1,π−π F table = F0,05, 4, 25 F table = 2,76 Hasil penghitungan dengan Ms. Excel ANOVA Source of Variation Between Groups Within Groups Total SS 72,20261333 df MS F P-value F crit 4 18,05065333 0,878800341 0,490668074 2,75871 513,5026833 25 20,54010733 585,7052967 29 Kesimpulan F hitung < F table , maka kita menerima H0, yang berarti tidak terdapat perbedaan anata jenis musik dengan kecepatan mengendarai mobil. 2. Anova - Blocking Technique Dalam melakukan Design of Experiment (DOE), variabilitas kerap kali muncul dari nuisance factor yang ditimbulkan dari pengaruh lingkungan/kondisi tempat dilakukannya experiment. Secara garis besar, nuisance factor adalah faktor penggangu yang mungkin berdampak terhadap penelitian. Faktor – faktor tersebut dapat dikelompokkan menjadi 3 (Montgomery, 2013) : 1. Faktor pengganggu yang bersifat unknown dan uncontrollable, dapat diatasi dengan menggunakan teknik randomization. 2. Faktor pengganggu yang bersifat known dan uncontrollable, dapat diatasi dengan menggunakan analysis of covariance. 3. Faktor pengganggu yang bersifat known dan controllable, dapat diatasi dengan menggunakan blocking atau randomized complete block design. Blocking bertujuan untuk menghilangkan dampak nuisance factor pada saat melakukan experiment, dengan cara membagi kelompok percobaan secara merata ke dalam blok-blok, serta dengan replikasi, kemudian menghitung faktor pengganggu (SSBlocks) dalam perhitungan uji hipotesis (ANOVA), sehingga diharapkan hasil experiment sesuai dengan kondisi tempat dilakukannya experiment. Rumus perhitungan analisis varians menggunakan F-test untuk RCBD adalah sebagai berikut (Montgomery, 2013) : Sumber: Design and Analysis of Experiments 8th Edition, halaman 144. Apabila tidak dapat ditemukan dalam excel ataupun software, maka dapat dihitung manual dengan rumus sebagai berikut untuk perhitungan menggunakan Kuadrat : π π πππ = ∑ ∑ π¦ 2 ππ − π=1 π=1 π¦2. . π π πππππππ‘ππππ‘π 1 π¦2. . = ∑ π¦ 2 π. − π π π=1 π πππ΅πππππ 1 π¦2. . = ∑ π¦2. π − π π π=1 Atau dapat juga menggunakan rumus perhitungan Rata-rata sebagai berikut : πππ = ∑ππ=1 ∑ππ=1(π¦ππ − π¦Μ )2 πππππππ‘ππππ‘π = π ∑ππ=1(π¦Μ π − π¦Μ .. )2 πππ΅πππππ = π ∑ππ=1(π₯Μ π − π₯ΜΏ )2 Dimana i = perlakukan, j = urutan replikasi. Perhitungan error of sum square dapat dihitung dengan rumus sebagai berikut : πππΈ = πππ − πππ‘ππππ‘ππππ‘π − πππ΅πππππ Source of Sum of Squares Degrees of Variation Mean Square Fo Freedom Treatments SSTreatments a-1 Blocks SSBlocks b-1 Error SSE (a-1)(b-1) Total SST N-1 πππ‘ππππ‘ππππ‘π π−1 πππ‘ππππ‘ππππ‘π πππΈ ππππππππ π−1 πππΈ (π − 1)(π − 1) Contoh Soal Berikut adalah contoh yang dapat menggambarkan aplikasi teknik blocking/RCBD : 1. Pada kantor cabang bank ABC, terdapat 3 Customer Service sekaligus yang dapat melakukan pembukaan rekening tabungan bagi nasabah baru. Pimpinan cabang melakukan uji kecepatan waktu pembukaan rekening (dalam satuan menit) terhadap ketiga Customer Service tersebut, dimana prosessor computer yang digunakan berbeda antara 1 customer service dengan yang lainnya. Maka, pemimpin cabang memetakan jenis prosessor komputer yang ada menjadi 5 blok dan membagi rata penggunaannya untuk semua Customer Service, dengan tingkatan sebagai berikut : Blok 1 Blok 2 Blok 3 Blok 4 Blok 5 Computer Computer Computer Computer Computer Core 2 Duo Core i-2 Core i-3 Core i-5 Core i-7 CS 1 x menit … … … … CS 2 … … … … … CS 3 … … … … … CS 1 … … … … … CS 2 … … … … … CS 3 … … … … … Proses pembukaan rekening tersebut dilakukan secara acak (tidak berurutan) dan pemimpin cabang ingin melihat 2 orang saja yang dapat melakukan pekerjaan paling cepat. (πΌ = 0.05) Data dianggap memenuhi asumsi one-way ANOVA Test (distribusi normal, varians homogen, variabel independen dan random) Jawab H0: µ1 = µ2 = µ3 = µ4 H1: terdapat perbedaan signifikan waktu pembukaan rekening baru diantara 3 orang Customer Service. Variance Treatments Blocks Error Total Sum of Square 54.7 141.1 13.8 209.6 Df 2 4 8 14 Mean Square 27.35 35.28 1.73 Fo 15.86 F (0.05,2,8) 4.46 F0 Λ F(0.05,2,8); maka tolak H0; terdapat perbedaan signifikan kecepatan pembukaan rekening diantara 3 Customer Service. Post Hoc one-way ANOVA menggunakan LSD Fisher test; α = 0,05 H0: µ1 = µ2 H1: µ1 ≠ µ2 2(1,73)⁄ 2πππΈ⁄ π = 2,3√ 5 = 1,96 πΏππ· = π‘0.025,8 √ π¦Μ 1. − π¦Μ 2. = 19,7 − 18,8 = −0,10 ≡ ππππππ‘ π»0 π¦Μ 1. − π¦Μ 3. = 19,7 − 23,8 = −4,1 ≡ ππππππ‘ π»0 π¦Μ 2. − π¦Μ 3. = 19,8 − 23,8 = −4 ≡ ππππππ‘ π»0 Dari hasil tersebut terdapat 1 pasangan yang berbeda signifikan (CS 1 dan CS 2), berdasarkan hasil perhitungan LSD Fischer Test maka direkomendasikan untuk memilih CS 1dan CS 2. 2. Pada sebuah latihan rescue pemadaman kebakaran, Dinas Pemadam Kebakaran, ingin melakukan percobaan apakah ada beda signifikan kecepatan pemadaman api menggunakan APAR yang berbeda, dalam 1 kejadian yang sama (latihan pemadaman kebakaran). Maka, koordinator pelatih memetakan jenis APAR yang ada menjadi 5 blok dan membagi rata penggunaannya untuk semua petugas pemadam, dengan tingkatan sebagai berikut : CS 1 CS 2 CS 3 CS 1 CS 2 CS 3 core 2 duo 25 30 29 24 22 23 core i2 22 21 22 21 22 28 core i3 20 21 29 19 20 21 core i5 17 18 22 18 16 24 core i7 15 14 20 16 14 20 Avg. 25.5 22.7 21.7 19.2 16.5 Total APAR APAR Chemical Foam Powder 19.8 20.8 24.4 19.6 18.8 23.2 633 21.1 Average CS 1 CS 2 CS 3 Average APAR Water Petugas 4 6 7 5 6 9 8 9 10 19 17 16 18 Petugas 1 9 10 7 8 17 Petugas 3 99 104 122 98 94 116 APAR Clean Agent 11 9 7 8 Petugas 2 Avg. Apar CO2 10 8 9 8 Petugas 1 Total Ptgs 1 Ptgs 2 Ptgs 3 Ptgs 4 10.6 10.7 9.8 10.1 19.7 19.8 23.8 Petugas 2 Petugas 3 Petugas 4 11 10 9 12 9 8 6 5 6 11 9 8 18 19 20 Total Variance Sum of Square Df Mean Square Treatement Block Error 2.7 326.7 7.8 3 4 12 0.90 81.68 0.65 Total 337.2 14 Fo F (0.005,3,12) 1.38 3.49 F0 < F(0.05,2,8); maka H0 diterima, sehingga dapat ditarik kesimpulan, tidak terdapat perbedaan signifikan kecepatan proses pemadaman kebakaran menggunakan APAR yang berbeda. 3. Analysis Covariance Analysis Covariance atau yang biasa disebut Ancova merupakan teknik statistik yang digunakan untuk menguji perbedaan, gabungan dari analisis varian dan analisis regresi,membandingkan varian residu dalam dan antar kelompok, dan seringkali digunakan padapenelitian experimental. Tujuan dari Ancova adalah untuk mendapatkan kemurnian pengaruh variabel independen terhadap variabel dependen, mengontrol kondisi awalsebelum penelitian dengan, dan mengontrol variabel luar yang secara teoritis akan mempengaruhi hasil penelitian. Perbedaan antara Anova dan Ancova adalah: ο· Anova lebih tepat digunakan ketika perbedaan kondisi awal antara kelompokperlakuan dan kontrolnya adalah signifikan, sedangkan Ancova lebih tepatdigunakan ketika menggunakan randomized design, kondisi awal antara kelompokkontrol dan eksperimen adalah setara, dan banyak subjek yang bisa mencapaiskor maksimal pengukuran sehingga varian skor mengalami penurunan. ο· Anova dan Ancova memfokuskan pada hal yang berbeda. Ancova memusatkan pada perbedaan efek perlakuan sedangkan Anova pada perubahanskor. Pada desain randomized Anova dan Ancova akan memberikan hasil yang mirip, namun berbeda dalam hal ukuran efek dan kekuatannya, akan tetapi, penggunaan Ancova mensyaratkan pengukuran yang memiliki “error” pengukuran sangat kecil. Langkah-langkah Pengujian: 1. Derajat kebebasan: dk total = N – 2 dk dalam = N – k – 1 dk antara = k – 1 2. Aturan pengambilan keputusan: F hitung < F table, Ho diterima F hitung > F table, Ho ditolak, H1 diterima 3. Asumsi dalam ANCOVA: Masing-masing populasi untuk setiap level faktor memiliki variansi yang sama, dimana data observasi, (Y) independent, sementara (X) bersifat tetap dan tidak berkorelasi (bebas) dengan perlakuan yang dicobakan. Hubungan antara (X) dan (Y) bersifat linear dan bebas dari perlakuan atau kelompok percobaan. Prosedur dasar untuk analysis of covariance dideskripsikan dan diilustrasikan untuk eksperimen single faktor dengan satu covariate. Diasumsikan bahwa terdapat sebuah hubungan linier antara respon dan covariate, yang dapat dihitung dengan model statistik sebagai berikut: yij = µ’ + τi + βxij + εij, i = 1,2,…., a j = 1,2,…., n dimana: yij : nilai variabel respon pada perlakuan ke-i observasi ke-j xij : nilai covariate pada observasi yang bersesuaian dengan yij τi : pengaruh perlakuan ke-i β : koefisien regresi linier εij : random error a : banyaknya kategori pada perlakuan n : banyaknya observasi pada kategori ke-i Untuk mendeskripsikan analisanya, dapat mengikuti beberapa persamaan berikut: 2 Syy= ∑ππ=1 ∑nj=1(π¦ππ − π¦Μ .. )2 = ∑ππ=1 ∑nj=1 π¦ππ − 2 Sxx= ∑ππ=1 ∑nj=1(π₯ππ − π₯Μ .. )2 = ∑ππ=1 ∑nj=1 π₯ππ − π¦..2 ππ π₯..2 ππ Sxy=∑ππ=1 ∑nj=1(π₯ππ − π₯Μ .. )(π¦ππ − π¦Μ .. ) = ∑ππ=1 ∑nj=1 π₯ππ π¦ππ − 1 ππ π₯..2 1 Txx=n∑ππ=1(π₯ Μ Μ Μ π. − π₯Μ .. )2 = π ∑ππ=1 π₯π.2 − ππ 1 Txy=n∑ππ=1(π₯ Μ Μ Μ π. − π₯Μ .. )(π¦Μ π. − π¦Μ .. ) = π ∑ππ=1 π₯π. π¦π. − Eyy= ππ π¦..2 Tyy=n∑ππ=1(π¦Μ π. − π¦Μ .. )2 = π ∑ππ=1 π¦π.2 − ∑ππ=1 ∑nj=1(π¦ππ π₯..π¦.. π₯.. π¦.. ππ 2 − π¦Μ π. ) = Syy - Tyy Exx= ∑ππ=1 ∑nj=1(π₯ππ − Μ Μ Μ π₯π. )2 = Sxx – Txx Exy= ∑ππ=1 ∑nj=1(π₯ππ − Μ Μ Μ π₯π. )(π¦ππ − π¦Μ π. ) = Sxy – Txy Dengan catatan bahwa secara umum, S = T + E, dimana symbol S, T dan E digunakan untuk menunjukan sums of square dan cross products untuk total, treatment dan error masingmasing. SS untuk x dan y harus non-negatif, dan bagaimanapun jumlah silang (xy) bias saja negatif. Dapat dilihat bagaimana analysis of covariance menyesuaikan variabel respon untuk efek covariate. π½Μ = πΈπ₯π¦ πΈπ₯π₯ Sum Square Error pada model ini adalah : SSE = Eyy – (Exy)2/Exx Dengan derajat kebebasan π(π − 1) − 1, eksperimen error variance dihitung dengan rumus : ππ πΈ MSE = π(π−1)−1 SS’E = Syy – (Sxy)2/Sxx Dengan derajat kebebasan ππ − 2, pada persamaan (Sxy)2/Sxx adalah pengurangan pada sum of square dari y yang diperoleh melalui regresi linier dari y terhadap x. Selanjutnya, dicatat bahwa SSE lebih kecil dari SSE’ dikarenakan terdapat parameter tambahan τi dan quantity SSE’- SSE adalah pengurangan sum of square yang dikarenakan τi.. Dengan Df π − 1, hipotesis test sehingga: H0 : τi = 0 F0 = (πππΈ′ −πππΈ )/(π−1) πππΈ /[π(π−1)−1] Dimana, jika hipotesa null adalah benar, berdistribusi πΉπΌ,π−1,π(π−1)−1. Sehingga tolak H0 : τi = 0 jika F0 > πΉπ−1,π(π−1)−1. Tabel dibawah ini adalah rangkuman persamaan untuk “adjusted” analysis of variance. Source of Variation SS Df Regression (Sxy)2/Sxx Treatment SS’E - SSE = Syy – (Sxy) /Sxx – [Eyy – (Exy)2/Exx] π−1 Error SSE = Eyy – (Exy)2/Exx π(π − 1) − 1 Total Syy ππ − 1 MS Fo ππ′πΈ − πππΈ π−1 πππΈ πππΈ = π(π − 1) − 1 (πππΈ′ − πππΈ )/(π − 1) πππΈ 1 2 Selain menguji hipotesis dimana tidak ada perbedaan pada treatment effect, kita sering penggunaanya untuk menginterpretasikan data yang disajikan sebagai adjusted treatment. Dimana adjusted mean dan standard deviasi dapat dihitung dengan rumus : Adjusted π¦Μ π. = π¦Μ π. - π½Μ (π₯ Μ Μ Μ π. − π₯Μ .. ) 1 SAdjπ¦Μ π. = [πππΈ (π + i= 1,2,. . . ., a 2 Μ Μ Μ π.Μ −π₯ Μ Μ Μ ) (π₯ .. )]1/2 πΈπ₯π₯ Dan dapat ditambahkan koefisien π½ pada persamaan. Yang dapat dihipotesiskan sebagai H0 : π½ = 0, dengan perhitungan: F0 = (πΈπ₯π¦ )2 /πΈπ₯π₯ πππΈ dimana tolak H0 : π½ = 0 jika F0 > πΉπΌ,1,π(π−1)−1 Contoh Soal Berikut ini adalah contoh soal yang dapat menggambarkan penggunaan Ancova : 1. Sebuah Industri yang melakukan pengolahan aluminium coil ingin mengetahui apakah terdapat pengaruh antara Mesin 1, Mesin 2 dan Mesin 3 terhadap produktifitas yang dihasilkan. Dimana produktifitas juga dipengaruhi oleh besarnya lebar aluminium coil tersebut. Dari scatter diagram dapat diketahui bahwa adanya korelasi antara produktifitas dengan lebar aluminium coil tersebut. Untuk itu dalam percobaan ini digunakan concomitant variable (X) yaitu lebar aluminium yang dihasilkan ( dalam 1000 mm) dan Y dalam ton, dengan taraf signifikansi α = 0,05. Tabel 1. Data produksi (y= produktivitas ton/hr dan x=lebar material dalam 1000 mm.) Total Mesin 1 Y X 217 10.5 211 12.1 197 11.3 234 13.3 182 11.5 1041 58.7 Mesin 2 Y X 182 18.3 202 11.7 226 12.4 229 12.5 254 15.3 1075 60.2 yij = µ’ + τi + βxij + εij, Mesin 3 Y X 188 8.3 211 11.2 204 12.9 187 10.1 177 11.4 967 53.9 i = 1,2,3 j = 1,2,3,4,5 Jawab ο· Langkah pertama, menentukan hipotesis: Ho: µ1 = µ2 = µ3, tidak ada pengaruh perlakuan jenis mesin yang dicobakan terhadap produktifitas yang dihasilkan. Ha: µ1 ≠ µ2 ≠ µ3, ada pengaruh perlakuan jenis mesin yang dicobakan terhadap produktifitas yang dihasilkan ο· Langkah kedua, memulai perhitungan uji statistik: Analisis untuk variabel X: 2 Sxx= ∑ππ=1 ∑nj=1 π₯ππ − 1 Txx= π ∑ππ=1 π₯π.2 − π₯..2 ππ π₯..2 ππ = (10.5)2 + (12.1)2 + . . . + (11.4)2 – ( 1 = 5 [(58.7)2 + (60.2)2 + (53.9)2 ] − (172.8)2 3π₯5 (172.8)2 3π₯5 ) = 25.04 = 4.33 Exx= Sxx – Txx = 25.04 – 4.33 = 20.69 Analisis untuk variabel Y: 2 Syy= ∑ππ=1 ∑nj=1 π¦ππ − 1 Tyy= π ∑ππ=1 π¦π.2 − π¦..2 π¦..2 ππ = (217)2 + (211)2 + . . . + (177)2 – ( 1 = 5 [(1041)2 + (1075)2 + (967)2 ] − ππ Eyy= Syy - Tyy = 5551.73 – 1219.73 = 4332 Analisis untuk variabel XY: Sxy = ∑ππ=1 ∑nj=1 π₯ππ π¦ππ − π₯..π¦.. ππ (3083)2 3π₯5 ) = 5551.73 (3083)2 3π₯5 = 1219.73 = (10.5)(217) + (12.1)(211) + . . . +(11.4)(177) – ( 1 Txy = π ∑ππ=1 π₯π. π¦π. − (172.8)(3083) 3π₯5 ) = 343.94 π₯.. π¦.. ππ 1 (172.8)(3083) = 5 [(58.7)(1041) + (60.2)(1075) + (53.9)(967)] − = 72.44 3π₯5 Exy= Sxy – Txy = 343.94 – 72.44 = 271.50 ο§ SS’E = Syy – (Sxy)2/Sxx = 5551.73 – (343.94)2/25.04 = 824.48 Dengan Df = ππ − 2 = 3(5) - 2 = 13 ο§ SSE = Eyy – (Exy)2/Exx = 4332 – (271.5)2/20.69 = 769.65 Dengan Df = π(π − 1) − 1 = 3(5-1) -1 = 11 ο§ MSE = = πππΈ π(π−1)−1 769.65 3(5−1)−1 = 59.20 Dari hal ini dapat kita ambil dasar penarikan suatu kesimpulan, dimana ; Untuk hypothesis H0 : τi = τ2 = τ3 = 0 dimana ; πππΈ′ − πππΈ = 824.48 – 769.65 = 54.84 dan Df = (a-1) ππ = (πππΈ′ − πππΈ )/(π − 1) = 54.84 / (3-1) = 27.42 F0 = (πππΈ′ −πππΈ )/(π−1) πππΈ /[π(π−1)−1] = 27.42 59/20 = 0.46 Tabel Ringkasan Perhitungan Analysis Covariance Source of Variation Df Machine Error Total Adjusted 2 12 14 Sum of Squares and Product X Xy y 4.33 72.44 1219.73 20.69 271.50 4332 25.04 343.94 5551.73 Adjusted for regression Y Df MS 769.65 11 824.48 13 54.84 2 Fo 59.20 27.42 0.46 Jika dibandingkan dengan jika ππ.ππ,π,ππ = 3.98, dapat di simpulkan H0 diterima karena F0 < Ftabel. Yang berarti tidak ada perbedaan perlakuan secara signifikan antara mesin – mesin yang ada. ο· Jika koefisien regresi perhitungkan berdasarkan persamaan : πΈπ₯π¦ π½Μ = πΈπ₯π₯ = 271.5 20.69 = 13.12 Kita akan menguji dengan H0 : π½ = 0 F0 = (πΈπ₯π¦ )2 /πΈπ₯π₯ πππΈ = (271.5)2 /20.69 59.20 = 60.17 Jika kita melihat ke tabel πΉ0.05,1,11 = 4.84, karena F0>Ftabel , dapat di simpulkan H0 ditolak. Yang berarti terdapat hubungan secara signifikan antara produktifitas pengolahan dan dengan unit lebar aluminium coil. ο· Jika treatment mean diadjust menjadi : Adjusted Μ Μ Μ π¦1 = Μ π¦Μ Μ 1.Μ - π½Μ (π₯ Μ Μ Μ Μ .. ) 1. − π₯ = 208.2 – 13.12 (11.74-11.52) = 205.31 Adjusted Μ Μ Μ π¦2 Μ Μ Μ Μ 2.Μ − π₯Μ .. ) = Μ Μ π¦Μ Μ 2. - π½ (π₯ = 215 – 13.12 (12.04-11.52) = 208.18 Adjusted Μ Μ Μ π¦3 Μ Μ Μ Μ 3.Μ − π₯Μ .. ) = Μ Μ π¦Μ Μ 3. - π½ (π₯ = 193.4 – 13.12 (10.78-11.52) =203.11 Jika dibandingkan adjusted mean dengan unadjusted mean dapat dilihat nilainya hampir sama, sehingga menjadi salah satu indikasi bahwa dibutuhkan Analisa covariance. Asumsi awal Analysis of covariance adalah bahwa percobaan tidak dipengaruhi oleh covariate (x) karena secara teknis menghilangkan efek dari variasi π₯Μ π . Bagaimanapun juga jika variasi pada x adalah dikarenakan oleh treatment yang kemudian analysis of covariance akan menghilangkan bagian dari efek treatment. Terdapat kemungkinan lebar aluminium dipengaruhi oleh mesin kerja, kita juga dapat menguji nya dengan hipotesa: H0 = tidak ada perbedaan lebar alumium coil antar mesin kerja. ππ₯π₯/(π−1) (4.33)/2 F0 = πΈπ₯π₯/(π(π−1) = 20.69/12 = 1.25 Jika dibandingkan dengan πΉ0.05,2,11 = 3.89, dapat di simpulkan H0 diterima karena F0 < Ftabel. Yang berarti tidak terdapat pebedaan secara signifikan antara lebar aluminium coil pada mesin 1, 2 dan 3. 2. Seorang koki ingin meneliti terkait kecepatan food processor dalam menghaluskan makanan yang ingin ia dihaluskan, pertimbangkan studi yang dilakukan untuk menentukan apakah ada perbedaan dalam kekuatan pisau yang dihasilkan oleh tiga food processor yang berbeda. Data dari percobaan ini ditunjukkan pada table diatas. menyajikan diagram sebaran kekuatan (y) versus ketebalan pisau (x). Jelas, kekuatan pisau juga dipengaruhi oleh ketebalannya; akibatnya, pisau yang lebih tebal umumnya akan lebih kuat daripada yang lebih tipis. Analisis kovarians dapat digunakan untuk menghilangkan efek ketebalan (x) pada kekuatan (y) saat menguji perbedaan kekuatan antara food processor. Data Breaking Strength (y= kekuatan dalam pounds dan x= diameter dalam 10-3in. Food Procesor 1 Total Food Procesor 2 Food Procesor 3 y x y x y x 35 19 40 20 33 20 40 25 47 27 37 22 40 23 38 22 40 27 42 25 45 30 34 21 48 30 44 27 32 15 205 22 214 126 176 105 Jawab ο· Langkah pertama, menentukan hipotesis: Ho: µ1 = µ2 = µ3, tidak ada perbedaan dalam kekuatan pisau yang dihasilkan oleh tiga food processor. Ha: µ1 ≠ µ2 ≠ µ3, ada perbedaan dalam kekuatan pisau yang dihasilkan oleh tiga food processor ο· Langkah kedua, memulai perhitungan uji statistik: Analisis untuk variabel X : 2 Sxx= ∑ππ=1 ∑nj=1 π₯ππ − 1 Txx= π ∑ππ=1 π₯π.2 − π₯..2 ππ π₯..2 ππ = (19)2 + (25)2 + … + (15)2 - (353)2 (3)(5) 1 = 5 [(122)2 + (126)2 + (105)2 ] − = 253,7333 (353)2 3π₯5 = 49.73 Exx= Sxx – Txx = 253,7333 - 49,7333 = 204 Analisis untuk variabel Y : 2 Syy= ∑ππ=1 ∑nj=1 π¦ππ − 1 Tyy= π ∑ππ=1 π¦π.2 − π¦..2 π¦..2 ππ = (35)2 + (40)2 + . . . + (32)2 – ( 1 (595)2 = 5 [(205)2 + (214)2 + (176)2 ] − ππ 3π₯5 ) = 343.3 (595)2 3π₯5 = 157,7 Eyy= Syy - Tyy = 343,3333 - 157,7333 = 1185,6 Analisis untuk variabel XY: Sxy = ∑ππ=1 ∑nj=1 π₯ππ π¦ππ − π₯..π¦.. ππ = 19)(35) + (25)(40) + . . . + (15)(32) – ( 1 Txy = π ∑ππ=1 π₯π. π¦π. − (353)(595) (3)(5) ) = 263,7 π₯.. π¦.. ππ 1 5 = [(205)(122) + (214)(126) + (176)(105)] − Exy= Sxy – Txy = 263,7 – 88,5 = 175,2 ο§ SS’E = Syy – (Sxy)2/Sxx = 343,3 – (263,7)2/253,7 = 69,3 Dengan Df = ππ − 2 = 3(5) - 2 = 13 (353)(595) (3)(5) = 88,5 ο§ SSE = Eyy – (Exy)2/Exx = 185,6 – (175,2)2/204 = 35,1 Dengan Df = π(π − 1) − 1 = 3(5-1) -1 = 11 ο§ MST = = ππ′πΈ − πππΈ π−1 69,3−35,1 3−1 = 17,1 ο§ MSE = = πππΈ π(π−1)−1 35,13412 11 = 3,2 Sum of square untuk H0 : τi = τ2 = τ3 = 0 πππΈ′ − πππΈ = 69,34432 - 35,13412 = 34,2102 dan Df = a-1 = 3-1 = 2 Untuk menguji hipotesis bahwa setiap food processor berbeda dalam hasil menghaluskan makanan hasil prosesnya, dimana H0 : τ1 = τ2 = τ3 = 0, kami menghitung uji t sebagai : F0 = (πππΈ′ −πππΈ )/(π−1) πππΈ /[π(π−1)−1] = 17,1 3,1 = 5,35 Tabel Ringkasan Perhitungan Analysis Covariance Source of Variation Machine Error Total Adjusted Sum of Squares and Product Df X Xy y 2 49,73 88,5 157,7 12 204 175,2 185,6 14 253,7 263,7 343,3 Adjusted for regression Y Df MS 17,1 35,1 11 3,2 69,3 13 54.84 2 Fo 5,35 Membandingkan dengan F0,01,2,11 = 2.86, kami menemukan bahwa F0 > Ftabel sehingga hipotesis null (H0) ditolak yang berarti terdapat perbedaan antara food processor satu dengan lainnya.