Bahan Kuliah Statistika Terapan STATISTIKA TERAPAN Bagian 1 ANALISIS REGRESI LINIER Hubungan variabel I. 1 INTRODUCTION Upaya untuk menjelaskan sebuah variabel melalui beberapa variabel sekaligus. Contoh Pertumbuhan udang; seperti berat (Y), berkaitan dengan keadaan temperatur (X1) dan salinitas (X2) air tempat pemeliharaan. Tampilan grafis hubungan Harga X1 Quality X2 Iklan X3 Y Vol. Penjualan •Dependen •Response •Independen •Explanatory Model Hubungan • Simetris •A simetris X1 Y • Regresi X1 Y • Korelasi Representasi model Hubungan •Statistis •Matematis •Y Random •Y Fix •X Fix atau random •X Fix •Probabilistik •Deterministik Model hubungan matematis y 2 slope intercept 1 0 x Δ= 1 x y 0 1+2×0 =1 1 1+2×1 =3 2 1+2×2 =5 3 1+2×3 =7 Model hubungan statistis y 1. 2. 3. 0 x Titik tidak tpt pada garis Garis merupakan ringkasan pola (sistematik) sebaran titik Untuk x yang sama, y bisa berbeda (error) Analisis Regresi dan Korelasi •Y Random •X Fix atau random Sistematis • Bagaimana bentuknya ? • Apa saja variabelnya ? Error Model Regresi •Linear Y = 0 + 1 X1 + …+ p Xp + • p = 1, Regresi linier sederhana • p 2, Regresi linier multipel •Nonlinear Y = /(1 + e X ) + Contoh plot fungsi nonlinier dalam β (koefisien regresi Derivatif juga tidak konstan (fungsi dari x). Tetapi transformasi dari x menghasilkan sebuah fungsi linier. p = 1, Regresi linier sederhana (populasi) y 0 x Assumsi Y = 0 + 1 X + 1. Xi nonrandom 2. i normal dengan rata - rata 0 dan varians konstan 2 E (Y | X =xi ) = 0 + 1 xi SAMPEL I. 2 REGRESI LINIER SEDERHANA Penaksiran Koefisien Regresi Data y y1 y2 x x1 x2 . . . . . . yn xn 0 = ?, 1 = ? Least squares estimates bˆ0 dan bˆ1 yi y ei yˆ bˆ0 bˆ1 x xi x Prinsip Least Squares Koefisien regresi sampel ditetapkan dengan Meminimumkan jumlah kuadrat residu (JKE) terhadap garis regresi sampel. Persamaan penaksiran Tabel perhitungan No 1 2 i n Jumlah y x yx x2 Solusi software (statistica) 1. 2. 3. Statistics Multiple Regression Ikuti tab selanjutnya Latihan 1 In a study conducted to examine the quality of fish after 7 days in ice storage, ten raw fish of the same kind and approximately the same size were caught and prepared for ice storage. Two of the fish were placed in storage immediately after being caught, two were placed in storage 3 hours after being caught, and two each were placed in storage at 6, 9, and 12 hours after being caught. Let y denote a measurement of fish quality (on a 10-point scale) after the 7 days of storage, and let x denote the time after being caught That the fish were placed in ice packing. The sample data appear here: a. Plot the sample data in a scatter diagram. b. Use the method of least squares to obtain estimates of the parameters in the model y 0 1x . c. Interpret the value of ˆ 1 in the context of this problem. Pengujian Koeffisien Regresi Masalah : 1. Apakah X; variabel regresi, menjelaskan Y; variabel respons ? 2. Bagaimana kesesuaian data terhadap model, memadai ? 3. Apakah prediksi melalui model memadai ? Masalah No. 1 H0 : 1 = 0 vs. H0 : 1 0 Statistik uji t atau F Keputusan : tolak H0 jika |t| t/2 Latar belakang pengujian Jika H0 benar, model regresi bentuknya: Jika H1 benar, model regresi bentuknya: y total error regresi x Jika penambahan variabel X kedalam model dapat menjelaskan Y, maka “total” error dalam Y besarnya berkurang oleh bagian yang dapat dijelaskan oleh X; yaitu =bagian “regresi”, sisanya yang masih ada merupakan bagian yang tidak dapat dijelaskan; yaitu “error”. Total = Regresi + Error Table 1 ANOVA Sumber variasi Regresi Error Total df JK (Jumlah kuadrat) P n-p-1 n-1 JKreg JKE JKT MS (RJK) MSreg =JKreg/p MSE=JKE/(n-p-1) F MSreg/MSE Contoh: Untuk menyusun kebutuhan tenaga, ditelaah hubungan antara jumlah pekerjaan yang terselesaikan dengan jam kerja/bln. yang dibutuhkannya. Dari pengamatan di sejumlah kantor cabang diperoleh data berikut. Periksa apakah pengetahuan mengenai jumlah pekerjaan terselesaikan ada hubungnannya dengan jam kerja/bln. Masalah No. 2 (kualitas Fit) •Sebuah indeks yang mencerminkan baik tidaknya model mendeskripsi data adalah Koeffisien Determinasi R2 2 R 1 SS Re s SS Total Masalah No. 3 (Kualitas Prediksi) s 1 1 n ( x0 x ) S xx 2 Analisis Residu 1 e ( y yˆ ) •Mendeteksi assumsi - assumsi mengenai error I •Rata - rata 0 •Varians konstan ei Plot residu dengan Kondisi ideal 0 x Model misspect Non constant variance e 0 0 x e Normal error •Ukuran sampel •Non constant variance •Model misspecification •Outliers x