Plagiarism

advertisement
Bahan Kuliah Statistika Terapan
STATISTIKA TERAPAN
Bagian 1
ANALISIS REGRESI LINIER
Hubungan variabel
I. 1 INTRODUCTION
Upaya untuk menjelaskan sebuah variabel
melalui beberapa variabel sekaligus.
Contoh
Pertumbuhan udang; seperti
berat (Y), berkaitan dengan
keadaan temperatur (X1) dan
salinitas (X2) air tempat
pemeliharaan.
Tampilan grafis hubungan
Harga
X1
Quality
X2
Iklan
X3
Y
Vol. Penjualan
•Dependen
•Response
•Independen
•Explanatory
Model Hubungan
• Simetris
•A simetris
X1
Y
• Regresi
X1
Y
• Korelasi
Representasi model Hubungan
•Statistis
•Matematis
•Y Random
•Y Fix
•X Fix atau random
•X Fix
•Probabilistik
•Deterministik
Model hubungan
matematis
y
2 slope
intercept 1
0
x
Δ= 1
x
y
0
1+2×0 =1
1
1+2×1 =3
2
1+2×2 =5
3
1+2×3 =7
Model hubungan
statistis
y
1.
2.
3.
0
x
Titik tidak tpt pada garis
Garis merupakan
ringkasan
pola
(sistematik) sebaran titik
Untuk x yang sama, y
bisa berbeda (error)
Analisis Regresi dan Korelasi
•Y Random
•X Fix atau random
Sistematis
• Bagaimana bentuknya ?
• Apa saja variabelnya ?
Error
Model Regresi
•Linear
Y =  0 + 1 X1 + …+ p Xp + 
• p = 1, Regresi linier sederhana
• p  2, Regresi linier multipel
•Nonlinear
Y =  /(1 + e X ) + 
Contoh plot fungsi nonlinier
dalam β (koefisien regresi
Derivatif juga tidak konstan (fungsi dari
x).
Tetapi transformasi dari x menghasilkan
sebuah fungsi linier.
p = 1, Regresi linier sederhana
(populasi)
y
0
x
Assumsi
Y =  0 + 1 X + 
1. Xi nonrandom
2.  i normal dengan rata - rata 0 dan varians konstan 2
E (Y | X =xi ) =  0 + 1 xi
SAMPEL
I. 2 REGRESI LINIER SEDERHANA
Penaksiran Koefisien Regresi
Data
y
y1
y2
x
x1
x2
.
.
.
.
.
.
yn
xn
0 = ?, 1 = ?
Least squares estimates bˆ0 dan bˆ1
yi
y
ei
yˆ  bˆ0  bˆ1 x
xi
x
Prinsip Least Squares
Koefisien regresi sampel ditetapkan dengan
Meminimumkan jumlah kuadrat residu (JKE) terhadap
garis regresi sampel.
Persamaan penaksiran
Tabel perhitungan
No
1
2
i
n
Jumlah
y
x
yx
x2
Solusi software (statistica)
1.
2.
3.
Statistics
Multiple Regression
Ikuti tab selanjutnya
Latihan 1
In a study conducted to examine the quality of fish after 7 days in ice
storage, ten raw fish of the same kind and approximately the same size
were caught and prepared for ice storage. Two of the fish were placed in
storage immediately after being caught, two were placed in storage 3
hours after being caught, and two each were placed in storage at 6, 9,
and 12 hours after being caught. Let y denote a measurement of fish
quality (on a 10-point scale) after the 7 days of storage, and let x denote
the time after being caught That the fish were placed in ice packing. The
sample data appear here:
a. Plot the sample data in a scatter diagram.
b. Use the method of least squares to obtain estimates of the parameters
in the model y 0 1x .
c. Interpret the value of ˆ 1 in the context of this problem.
Pengujian Koeffisien Regresi
Masalah :
1. Apakah X; variabel regresi, menjelaskan Y; variabel respons ?
2. Bagaimana kesesuaian data terhadap model, memadai ?
3. Apakah prediksi melalui model memadai ?
Masalah No. 1
H0 :  1 = 0
vs. H0 :  1  0
Statistik uji t atau F
Keputusan : tolak H0 jika |t|  t/2
Latar belakang pengujian
Jika H0 benar, model regresi bentuknya:
Jika H1 benar, model regresi bentuknya:
y
total
error
regresi
x
Jika penambahan variabel X kedalam model dapat menjelaskan Y, maka
“total” error dalam Y besarnya berkurang oleh bagian yang dapat dijelaskan
oleh X; yaitu =bagian “regresi”, sisanya yang masih ada merupakan bagian
yang tidak dapat dijelaskan; yaitu “error”.
Total = Regresi + Error
Table 1 ANOVA
Sumber
variasi
Regresi
Error
Total
df
JK
(Jumlah
kuadrat)
P
n-p-1
n-1
JKreg
JKE
JKT
MS
(RJK)
MSreg =JKreg/p
MSE=JKE/(n-p-1)
F
MSreg/MSE
Contoh: Untuk menyusun kebutuhan tenaga, ditelaah hubungan antara jumlah
pekerjaan yang terselesaikan dengan jam kerja/bln. yang dibutuhkannya. Dari
pengamatan di sejumlah kantor cabang diperoleh data berikut. Periksa apakah
pengetahuan mengenai jumlah pekerjaan terselesaikan ada hubungnannya dengan
jam kerja/bln.
Masalah No. 2 (kualitas Fit)
•Sebuah indeks yang mencerminkan baik tidaknya model mendeskripsi data
adalah Koeffisien Determinasi R2
2
R  1
SS Re s
SS Total
Masalah No. 3 (Kualitas Prediksi)
s
1
1
n

( x0  x )
S
xx
2
Analisis Residu 1
e  ( y  yˆ )
•Mendeteksi assumsi - assumsi mengenai error I
•Rata - rata 0
•Varians konstan
ei
Plot residu dengan Kondisi ideal
0
x
Model misspect
Non constant variance
e
0
0
x
e
Normal error
•Ukuran sampel
•Non constant variance
•Model misspecification
•Outliers
x
Download