REGRESI LINIER SEDERHANA (SIMPLE LINEAR REGRESSION) Matakuliah

advertisement
REGRESI LINIER
SEDERHANA (SIMPLE
LINEAR REGRESSION)
Matakuliah
Tahun
Versi
: KodeJ0204/Statistik Ekonomi
: Tahun 2007
: Revisi
REGRESI LINIER SEDERHANA
(SIMPLE LINEAR REGRESSION)
CAKUPAN MATERI:

Model Regresi Linier Sederhana

Metode Kuadrat Terkecil (Least Squares Method)

Koefisien Determinasi

Asumsi Model

Uji Keberartian (Testing for Significance)

Estimasi dengan Persamaan Regresi

Analisis Residual: Pemeriksaan Asumsi Model
REGRESI LINIER SEDERHANA
(SIMPLE LINEAR REGRESSION)



Model Regresi Linier Sederhana
y = 0 + 1x + 
Persamaan Regresi Linier Sederhana
E(y) = 0 + 1x
Estimasi Persamaan Regresi Linier Sederhana
^
y = b0 + b1x
dimana
y = variabel tak bebas (response/dependent variable)
x = variabel bebas (predictor/independent variable)
 = suku sisaan (error/residual)
0 = intercept (titik potong garis regresi dengan sumbu y)
1 = slope/kemiringan garis regresi
METODE KUADRAT TERKECIL

Kriteria Kuadrat Terkecil
Prinsip: Meminimalkan jumlah kuadrat jarak/selisih
antara nilai variabel tak bebas sebenarnya dengan
nilai estimasi variabel tak bebas (error)
min  ( yi  ŷi )2
dimana:
yi = nilai observasi ke-i dari variable tak bebas
^
yi = nilai estimasi ke-i dari variabel tak bebas
METODE KUADRAT TERKECIL

Kemiringan (Slope) Persamaan Regresi Estimasi
xi yi  ( xi  yi ) / n

b1 
2
2
x

(
x
)
 i  i /n

Intercept Persamaan Regresi Estimasi
b0  y  b1x
dimana:
xi = nilai variabel bebas untuk observasi ke-i
yi = nilai variabel tak bebas untuk observasi ke-i
x = rata-rata nilai variabel bebas
y = rata-rata nilai variabel tak bebas
n = total observasi
CONTOH: REED AUTO SALES
Sebagai bagian dari kampanyenya, Reed Auto
menggunakan media televisi untuk iklan selama akhir
pekan yang lalu. Berikut adalah data dari 5 sampel
penjualan.
Banyaknya iklan TV
1
3
2
1
3
Jumlah Mobil Terjual
14
24
18
17
27
CONTOH: REED AUTO SALES



Kemiringan Persamaan Regresi Estimasi
b1 = 220 - (10)(100)/5 = 5
24 - (10)2/5
Intercept Persamaan Regresi Estimasi
b0 = 20 - 5(2) = 10
Estimasi Persamaan Regresi
^
y = 10 + 5x
Interpretasi: Jika banyaknya iklan bertambah 1 kali,
maka dapat meningkatkan banyak penjualan mobil
sebanyak 5.
CONTOH: REED AUTO SALES
Scatter Diagram
30
Jumlah Mobil Terjual

25
20
y = 5x + 10
15
10
5
0
0
1 Banyaknya2Iklan TV
3
4
KOEFISIEN DETERMINASI

Hubungan antara SST, SSR, SSE
SST = SSR + SSE
2
2
2
(
y

y
)

(
ŷ

y
)

(
y

ŷ
)
 i
 i
 i i

Koefisien Determinasi (Coefficient of Determination)
r2 = SSR/SST
dimana:
SST = total sum of squares
SSR = regression sum of squares
SSE = error sum of squares
KOEFISIEN KORELASI SAMPEL
rxy  (tanda dari b1 ) Coefficient of Determinat ion
rxy  (tanda dari b1 ) r 2
dimana:
b1 = slope persamaan regresi estimasi
ŷ  b0  b1x
CONTOH: REED AUTO SALES

KOEFISIEN DETERMINASI
r2 = SSR/SST = 100/114 = 0,8772
Artinya:
Hubungan regresi sangat kuat karena 88% variasi
mobil yang terjual dapat dijelaskan oleh banyaknya
iklan TV.

KOEFISIEN KORELASI
rxy   0,8772  0,9366
ASUMSI MODEL

Asumsi tentang suku sisaan (error), 
 Error  merupakan suatu random variabel dengan
rata-rata nol (E()=0).
 Varian error , dinotasikan dengan 2, adalah sama
untuk semua nilai variabel bebas (homoscedastic).
 Nilai  saling bebas (non autocorrelation).
 Sisaan  terdistribusi normal.
UJI SIGNIFIKANSI




Untuk menguji keberartian hubungan regresi, maka
harus dilakukan uji hipotesis apakah b1 sama dg nol.
Dua pengujian yang umum digunakan adalah Uji t dan
Uji F
Kedua pengujian di atas memerlukan estimasi varian
dari  dalam model regresi, s2.
Mean square error (MSE) menghasilkan estimasi untuk
varian .
s2 = MSE = SSE/(n-2)
dimana:
SSE   (yi  ŷi )2   ( yi  b0  b1xi )2
UJI SIGNIFIKANSI: Uji t

Hipotesis
H0: 1 = 0
Ha: 1  0

Statistik Uji
b
t 1
sb1

dimana s
2
b1
s2

2
2
x

n
x
 i
Aturan Penolakan
Tolak H0 jika t < -t/2 atau t > t /2
dimana t/2 didasarkan pada distribusi t dengan derajat
bebas n - 2.
CONTOH: REED AUTO SALES

Uji t
 Hipotesis



H0: 1 = 0
Ha: 1  0
Aturan Penolakan
Untuk  = 0,05 dan derajat bebas = 3, t0,025 = 3,182
Tolak H0 jika t > 3,182
Statistik Uji
t = 5/1,08 = 4,63
Kesimpulan
Tolak H0, banyaknya iklan melalui TV signifikan
mempengaruhi jumlah mobil yang terjual (pada
=0,05).
CONFIDENCE INTERVAL UNTUK 1



Kita dapat menggunakan interval keyakinan/
confidence interval (1-)100% 1 untuk menguji
hipotesis seperti halnya yang digunakan pada uji t.
H0 ditolak jika nilai hipotesis 1 tidak masuk dalam
confidence interval untuk 1.
Confidence interval untuk 1 adalah:
b1  t  / 2 sb1
dimana
b1 = estimasi titik dari 1
t  / 2sb1 = batas kesalahan
t/2 = nilai t tabel (didasarkan pada distribusi
t dengan derajat bebas n-2)
CONTOH: REED AUTO SALES



Aturan Penolakan
Tolak H0 jika 0 tidak masuk dalam confidence interval
untuk 1.
Confidence Interval 95% untuk 1
b1  t  / 2 sb1 = 5  3,182(1,08) = 5  3,44
atau 1,56 sampai 8,44
Kesimpulan
Tolak H0, banyaknya iklan melalui TV signifikan
mempengaruhi jumlah mobil yang terjual (pada
=0,05).
UJI SIGNIFIKANSI: Uji F



Hipotesis
H0: 1 = 0
Ha: 1 = 0
Statistik Uji
F = MSR/MSE
Aturan Penolakan
Tolak H0 jika F > F
dimana F didasarkan pada distribusi F dengan derajat
bebas 1 dan n - 2.
CONTOH: REED AUTO SALES

Uji F
 Hipotesis H0: 1 = 0
Ha: 1 = 0
 Aturan Penolakan
Untuk  = 0,05 & derajat bebas = 1, 3: F0,05 = 10,13
Tolak H0 jika F > 10,13
 Statistik Uji
F = MSR/MSE = 100/4,667 = 21,43
 Kesimpulan
H0 ditolak.
EXERCISE

A medical laboratory at Duke University estimates the amount of protein in
liver samples using regression analysis. A spectrometer emitting light shines
through a substance containing the sample, and the amount of light
absorbed is used to estimate the amount of protein in the sample. A new
estimated regression equation is developed daily because of differing
amounts of dye in the solution. On one day, six samples with known protein
concentrations gave the absorbence readings shown below.
Absorbence Reading (xi)
0.509
0.756
1.020
1.400
1.570
1.790

Milligrams of Protein (yi)
0
20
40
80
100
127
Use these data to develop an estimated regression equation relating the
light absorbence reading to milligrams of protein present in the sample.
 Compute r2. Would you feel comfortable using this estimated regression
equation to estimate the amount of protein in a sample?
 In a sample just received, the light absorbence reading was .941.
Estimate the amount of protein in the sample.
SEKIAN &
SEE YOU NEXT SESSION
Download