Uploaded by Lawrence Ch

005 026 029 055 TugasKelompokSimul

advertisement
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta
dalam Ketepatan Mendeteksi Linearitas Data
Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4
1,2,3,4
Affiliasi; alamat
1,2,3,4
Departemen Aktuaria ITS Surabaya Indonesia
lahfanda.205006@mhs.its.ac.id 1, lawrence.205006@mhs.its.ac.id 2, yosafat.205006@mhs.its.ac.id 3,
teddysaputra.205006@mhs.its.ac.id 4
Abstrak
Uji deteksi linearitas merupakan uji untuk menentukan apakah suatu data dikatakan linear atau nonlinear. Terdapat tiga metode dalam uji deteksi linearitas yaitu uji Ramsey’s RESET, uji White, dan uji
Terasvirta. Penulis ingin membandingkan keefektifan ketiga metode tersebut dengan melihat hasil yang
menyatakan bahwa model tersebut dikatakan model linear dengan cara mereplikasi data simulasi sebanyak
10.000 kali dengan banyak sampel data simulasi yang berbeda-beda pada tiap model. Diperoleh uji yang
menghasilkan ketepatan terbaik pada model linear baik menggunakan 1 outlier maupun tidak adalah uji
Ramsey’s RESET. Selanjutnya pada model non-linear 1 tanpa outlier uji yang terbaik adalah uji Terasvirta,
sedangkan pada model yang sama dengan 1 outlier uji yang terbaik adalah uji White pada sampel berukuran
kecil dan uji Terasvirta pada sampel berukuran besar. Pada model non-linear 2, uji Ramsey RESET
memberikan hasil terbaik untuk semua ukuran sampel. Berdasarkan hasil yang diperoleh bisa dikatakan
bahwa penambahan outlier pada data tidak mempengaruhi ketepatan deteksi linearitas secara signifikan.
Secara keseluruhan, persentase ketepatan untuk model linear cukup tinggi sedangkan pada model nonlinear tergolong masih rendah.
Kata Kunci: Linearitas, Uji Ramsey’s RESET, Uji White, Uji Terasvirta
Abstract
The linearity detection test is a test to determine whether a data is said to be linear or non-linear.
There are three methods in the linearity detection test, namely the Ramsey's RESET test, the White test, and
the Terasvirta test. The author wants to compare the effectiveness of the three methods by looking at the
results which state that the model is said to be a linear model by replicating the simulation data 10,000
times with many different simulation data samples in each model. The test that produces the best accuracy
in the linear model using either 1 outlier or not is the Ramsey's RESET test. Furthermore, for the nonlinear model 1 without outliers, the best test is the Terasvirta test, while for the same model with 1 outlier,
the best test is the White test on small samples and the Terasvirta test on large samples. In the non-linear
model 2, the Ramsey RESET test gives the best results for all sample sizes. Based on the results obtained,
it can be said that adding outliers to the data does not significantly affect the accuracy of linearity detection.
Overall, the percentage of accuracy for the linear model is quite high, while the non-linear model is still
relatively low.
Keywords: Linearity, Ramsey’s RESET Test, White Test, Terasvirta Test
1
Pendahuluan
Model statistika dapat berupa model linear, maupun model non-linear (Baty, et al., 2015).
Kedua model tersebut menggunakan dua metode yang berbeda untuk menganalisis data. Model
linear menggunakan regresi linear untuk menganalisisnya, sedangkan model non-linear
menggunakan regresi non-linear untuk menganalisisnya (Sofita, 2015). Oleh karena itu, analisis
data harus didahului oleh uji deteksi linearitas.
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data
Masalah yang terjadi dalam uji deteksi linearitas adalah keefektifan uji deteksi linearitas.
Model yang berbentuk non-linear bisa dianggap linear oleh uji deteksi linearitas. Hal tersebut bisa
menyebabkan metode yang digunakan untuk menganalisis data salah sehingga hasil analisisnya
tidak valid. Oleh karena itu, penulis ingin mengetahui pengujian yang efektif untuk mendeteksi
kelinearitasan data. Pada penelitian akan dilakukan pengujian untuk beberapa metode pengujian
linearitas, yaitu uji Ramsey’s RESET, uji White, dan uji Terasvirta. Ketiga metode tersebut akan
digunakan untuk menguji linearitas suatu data yang telah ditentukan. Kemudian, persentase
keefektifannya akan dikomparasi.
2
Metode Penelitian
2.1
Sumber Data dan Variabel Penelitian
Pada penelitian ini akan dilakukan studi simulasi, sehingga data yang digunakan dalam
melakukan penelitian ini berupa data simulasi. Data simulasi ini direplikasi sebanyak 10.000 kali
menggunakan software RStudio. Data simulasi terdiri dari 3 model, 1 model linear dan 2 model
non-linear dengan persamaan sebagai berikut.
Tabel 1. Model yang digunakan dalam simulasi
Model
Model 1 (Linear)
Persamaan
𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒
Model 2 (Non-Linear)
𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒
Model 3 (Non-Linear)
𝑦 = −0.8 + 0.4𝑥1 2 − 0.3𝑒 𝑥2 + 0.5𝑥3 + 0.17𝑒
Data simulasi dibangkitkan dari distribusi uniform 𝑋𝑖 ~𝑈(0,1) dengan error yang
dibangkitkan dari distribusi normal 𝑒~𝑁(0,1). Data yang disimulasikan terdiri dari:
1. Model linear dengan 𝑛 = 50, 100, 200
2. Model non-linear 1 dengan 𝑛 = 50, 100, 200
3. Model non-linear 2 dengan 𝑛 = 50, 100, 200
4. Model linear dengan 𝑛 = 50, 100, 200 yang mengandung 1 outlier
5. Model non-linear dengan 𝑛 = 50, 100, 200 yang mengandung 1 outlier
2.2
Langkah Analisis
Langkah-langkah yang dilakukan pada penelitian ini adalah sebagai berikut:
1. Membangkitkan data sebanyak 50, 100, dan 200 data untuk random data linear dan nonlinear, serta data untuk variabel prediktor.
2. Melakukan uji linearitas data dengan Ramsey’s RESET Test, White Test, dan Terasvirta
Test. Pada uji Ramsey’s RESET akan digunakan 3 tipe prediktor yang akan digunakan
Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4
yaitu regressor, fitted dan princomp. Selain itu, pada masing-masing tipe tersebut juga
akan digunakan 3 tipe power yaitu kuadratik (2), kubik (3), dan kuadratik dan kubik (2:3).
3. Melakukan pembangkitan data dan pengujian linearitas sebanyak 10.000 kali.
4. Menghitung persentase hasil benar dari 10.000 kali pengujian tersebut.
5. Melakukan perbandingan hasil kebenaran Ramsey’s RESET Test, White Test, dan
Terasvirta Test untuk menentukan metode terbaik dari ketiga metode uji linearitas
tersebut.
6. Menarik kesimpulan dan saran dari hasil yang didapatkan.
3
Hasil dan Pembahasan
Berikut merupakan hasil simulasi dari masing-masing skenario yang telah dibuat.
1)
Model linear
Pertama, dilakukan simulasi uji linearitas pada model linear dengan persamaan sebagai
berikut:
𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒
Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan
dalam tabel sebagai berikut:
Tabel 2. Hasil ketepatan model linear pada beberapa uji statistik
Uji Statistik
Persentase Benar
n = 50
n = 100
n = 200
regressor2
95.15%
95.02%
95.31%
3
95.14%
95.25%
95.36%
regressor23
95.3%
95.43%
95.36%
fitted2
95.42%
95.27%
94.68%
3
95.11%
95.07%
94.82%
95.29%
95.17%
94.7%
princomp2
95.11%
95.02%
94.78%
princomp
3
94.97%
94.85%
94.69%
princomp
23
95.13%
95.03%
94.97%
white
94.7%
95.18%
94.96%
terasvirta
94.2%
94.74%
94.75%
regressor
fitted
fitted23
Tabel 2 menunjukkan bahwa semua uji statistik sudah baik dalam melakukan deteksi linearitas pada
model linear yang diberikan. Hal ini terlihat pada persentase ketepatan tiap pengujian yang
cenderung tinggi. Uji Ramsey’s RESET tipe fitted2 menghasilkan ketepatan terbaik untuk ukuran
sampel 𝑛 = 50 yaitu sebesar 95.42%. Pada 𝑛 = 100, uji Ramsey’s RESET tipe regressor23
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data
menghasilkan ketepatan model tertinggi sebesar 95.43%. Kemudian untuk 𝑛 = 200, uji Ramsey
tipe regressor3 dan regressor23 menghasilkan ketepatan model tertinggi yaitu sebesar 95.36%.
Adapun ketepatan terburuk dihasilkan oleh uji Terasvirta untuk 𝑛 = 50 (94.2%) dan 𝑛 = 100
(94.74%), dan uji Ramsey’s RESET tipe fitted2 untuk 𝑛 = 200 (94.68%). Ukuran sampel pada
pengujian model linier tidak begitu mempengaruhi ketepatan klasifikasi, Dapat dilihat bahwa pada
uji Ramsey’s RESET tipe fitted2, ketepatan klasifikasi semakin menurun ketika ukuran sampel
diperbesar, sedangkan pada uji Terasvirta menghasilkan ketepatan klasifikasi yang semakin baik
ketika ukuran sampel diperbesar. Informasi pada tabel 2 dapat juga dibandingkan dalam grafik
sebagai berikut:
95.60%
95.40%
95.20%
95.00%
94.80%
94.60%
94.40%
94.20%
94.00%
93.80%
93.60%
93.40%
n=50
n=100
n=200
Gambar 1 Perbandingan ketepatan model linear pada beberapa uji statistik
2) Model non-linear 1
Selanjutnya dilakukan simulasi uji linearitas pada model non-linear dengan persamaan
sebagai berikut:
𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒
Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan
dalam tabel sebagai berikut:
Tabel 3. Hasil ketepatan model non-linear 1 pada beberapa uji statistik
Uji Statistik
Persentase Benar
n = 50
n = 100
n = 200
regressor2
5.09%
4.76%
4.95%
3
5.23%
4.98%
4.96%
regressor
Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4
regressor23
5.11%
5.16%
5.13%
fitted2
4.39%
4.81%
4.84%
fitted3
5.52%
4.74%
5.03%
fitted
23
4.75%
4.61%
5.28%
2
5.05%
5.01%
4.90%
princomp3
5.14%
4.81%
5.07%
5.28%
4.92%
5.01%
white
5.10%
5.34%
5.17%
terasvirta
6.34%
5.61%
5.52%
princomp
princomp
23
Tabel 3 menunjukkan bahwa semua uji statistik belum baik dalam melakukan deteksi linearitas pada
model non-linear yang mengandung fungsi logaritma. Hal ini terlihat pada persentase ketepatan tiap
pengujian yang cenderung rendah. Secara keseluruhan, uji Terasvirta untuk 𝑛 = 50 menghasilkan
ketepatan terbaik dari semua ukuran sampel yaitu sebesar 6,34%. Pada 𝑛 = 100, uji Terasvirta
menghasilkan ketepatan model tertinggi sebesar 5.61%. Kemudian untuk 𝑛 = 200, uji Terasvirta
menghasilkan ketepatan model tertinggi yaitu sebesar 5.52%. Adapun ketepatan terburuk dihasilkan
oleh uji Ramsey’s RESET tipe fitted2 untuk 𝑛 = 50 (4.39%), uji Ramsey’s RESET tipe fitted23
untuk 𝑛 = 100 (4.61%), dan uji Ramsey’s RESET tipe princomp23 untuk 𝑛 = 200 (4.84%).
Ukuran sampel pada pengujian model non-linier 1 tidak begitu mempengaruhi ketepatan klasifikasi,
Dapat dilihat bahwa pada uji Terasvirta dan Ramsey’s RESET tipe fitted3, ketepatan klasifikasi
semakin menurun ketika ukuran sampel diperbesar. Informasi pada tabel 3 dapat juga dibandingkan
dalam grafik sebagai berikut:
Gambar 2 Perbandingan ketepatan model non-linear 1 pada beberapa uji statistik
3) Model non-linear 2
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data
Selanjutnya dilakukan simulasi dengan model non-linear lainnya dengan persamaan sebagai
berikut:
𝑦 = −0.8 + 0.4𝑥1 2 − 0.3𝑒 𝑥2 + 0.5𝑥3 + 0.17𝑒
Hasil pengujian terhadap model menggunakan beberapa metode uji deteksi linearitas dapat
dilihat melalui tabel berikut:
Tabel 4. Hasil ketepatan model non-linear 2 pada beberapa uji statistik
Uji Statistik
Persentase Benar
n = 50
n = 100
n = 200
regressor2
17.43%
35.14%
66.50%
regressor
3
16.97%
34.56%
65.54%
regressor
23
12.56%
26.34%
53.51%
fitted2
5.09%
5.19%
4.89%
fitted
3
5.19%
5.16%
5.41%
fitted
23
5.27%
5.27%
4.91%
princomp2
7.02%
8.71%
11.69%
princomp3
6.74%
8.03%
11.14%
6.63%
7.58%
10.00%
white
6.52%
7.73%
11.37%
terasvirta
9.64%
16.32%
34.36%
princomp
23
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
n = 50
n = 100
n=200
Gambar 3 Perbandingan ketepatan model non-linear 2 pada beberapa uji statistik
Melalui tabel 4, diketahui bahwa ketepatan uji deteksi linearitas pada model linear 2 tidak
baik karena persentase benarnya tergolong rendah. Berdasarkan gambar 3, terlihat adanya
kenaikan persentase benar saat sampel bertambah pada metode yang sama, sehingga dapat
disimpulkan bahwa penambahan jumlah sampel dapat meningkatkan ketepatan klasifikasi.
Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4
Berdasarkan tabel 4, metode terbaik untuk mendeteksi uji deteksi linearitas pada model
linear 2 adalah metode Ramsey’s RESET dengan tipe regressor dan power 2 dengan
ketepatan uji deteksi linearitas pada model mencapai 66.50% pada jumlah sampel 200.
Adapun metode dengan hasil ketepatan terburuk yaitu metode Ramsey’s RESET dengan tipe
fitted dan power 2 dengan persentase benar sebesar 4.89% pada jumlah sampel 200.
4) Model linear dengan 1 outlier
Selanjutnya dilakukan simulasi pada model linear dengan 1 outlier. Persamaan dari model
linear yang diuji adalah sebagai berikut:
𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒
Hasil pengujian terhadap model menggunakan beberapa metode dapat dilihat melalui tabel
berikut:
Tabel 5. Hasil ketepatan model linear dengan outlier pada beberapa uji statistik
Uji Statistik
Persentase Benar
n = 50
n = 100
n = 200
regressor2
94.93%
95.13%
94.92%
3
95.07%
95.35%
94.99%
regressor23
95.13%
95.2%
94.42%
fitted2
94.97%
95.06%
95.13%
fitted
3
94.79%
95.07%
95.02%
fitted
23
94.8%
94.96%
95.09%
princomp2
94.87%
95.01%
95.16%
princomp
3
94.76%
95%
95.11%
princomp
23
95.01%
95.01%
94.72%
white
94.77%
94.77%
94.99%
terasvirta
94.66%
94.66%
94.64%
regressor
Melalui tabel 5, diketahui bahwa ketepatan uji deteksi linear pada model linear dengan
outlier bisa dikatakan cukup baik karena persentase benarnya cukup tinggi yaitu di atas 90%
pada jenis tes dan nilai n yang berbeda-beda. Metode uji deteksi yang menghasilkan
persentase benar tertinggi ada pada metode regressor3 yaitu sebesar 95.35% dengan n sebesar
100. Sedangkan metode uji deteksi yang menghasilkan persentase benar terendah ada pada
metode regressor23 yaitu sebesar 94.42% dengan n sebesar 200. Adanya outlier dalam data
juga tidak mempengaruhi ketepatan deteksi linearitas secara signifikan karena hasil yang
didapatkan tidak jauh berbeda dengan hasil ketepatan pada model linear yang sama tanpa
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data
memasukkan outlier. Informasi pada tabel 5 dapat juga dibandingkan dalam grafik sebagai
berikut:
Gambar 4 Perbandingan ketepatan model linear dengan outlier pada beberapa uji statistik
5) Model non-linear 1 dengan 1 outlier
Selanjutnya dilakukan simulasi uji linearitas pada model non-linear dengan 1 outlier.
Adapun persamaan dari model non-linear yang diuji adalah sebagai berikut:
𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒
Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan
dalam tabel sebagai berikut:
Tabel 6. Hasil ketepatan model non-linear 1 dengan outlier pada beberapa uji statistik
Uji Statistik
Persentase Benar
n = 50
n = 100
n = 200
regressor2
5.57%
4.97%
4.90%
regressor3
5.35%
4.83%
4.64%
5.14%
5.01%
5.28%
fitted2
6.15%
4.75%
5.06%
fitted3
6.11%
4.86%
5.20%
5.65%
4.77%
5.11%
princomp2
6.21%
5.05%
4.82%
princomp3
6.20%
4.85%
4.66%
5.38%
5.18%
5.08%
white
6.37%
4.98%
5.08%
terasvirta
6.36%
5.59%
5.41%
regressor
fitted
23
23
princomp
23
Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4
Tabel 6 menunjukkan bahwa semua uji statistik belum baik dalam melakukan deteksi linearitas pada
model non-linear yang mengandung fungsi logaritma dan outlier. Hal ini terlihat pada persentase
ketepatan tiap pengujian yang cenderung rendah. Secara keseluruhan, uji White untuk 𝑛 =
50 menghasilkan ketepatan terbaik dari semua ukuran sampel yaitu sebesar 6,37%. Pada 𝑛 = 100,
uji Terasvirta menghasilkan ketepatan model tertinggi sebesar 5.59%. Kemudian untuk 𝑛 = 200,
uji Terasvirta menghasilkan ketepatan model tertinggi yaitu sebesar 5.41%. Adapun ketepatan
terburuk dihasilkan oleh uji Ramsey’s RESET tipe regressor23 untuk 𝑛 = 50 (5.14%), uji
Ramsey’s RESET tipe fitted2 untuk 𝑛 = 100 (4.75%), dan uji Ramsey’s RESET tipe regressor3
untuk 𝑛 = 200 (4.64%). Ukuran sampel pada pengujian model non-linier 1 tidak begitu
mempengaruhi ketepatan klasifikasi, Dapat dilihat bahwa pada uji Terasvirta, uji Ramsey’s RESET
tipe regressor3, dan tipe princomp2 ketepatan klasifikasi semakin menurun ketika ukuran sampel
diperbesar. Adanya outlier dalam data juga tidak mempengaruhi ketepatan deteksi linearitas secara
signifikan karena hasil yang didapatkan tidak jauh berbeda dengan hasil ketepatan pada model nonlinear 1 tanpa outlier. Informasi pada tabel 6 dapat juga dibandingkan dalam grafik sebagai berikut:
Gambar 5 Perbandingan ketepatan model non-linear 1 dengan outlier pada beberapa uji statistik
4
Simpulan
Berdasarkan hasil simulasi uji Ramsey’s RESET, uji White, dan uji Terasvirta pada model,
didapatkan simpulan sebagai berikut:
•
Uji dengan ketepatan terbaik dalam mendeteksi model linear, baik yang mengandung 1 outlier
ataupun tidak, adalah uji Ramsey’s RESET dengan type dan power yang berbeda dan
kondisional terhadap jumlah sampel.
Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data
•
Uji dengan ketepatan terbaik dalam mendeteksi model non-linear 1 tanpa outlier adalah uji
Terasvirta. Sedangkan untuk model non-linear 1 dengan 1 outlier, uji White memberikan hasil
yang terbaik untuk ukuran sampel yang kecil (𝑛 = 50) dan uji Terasvirta memberikan hasil
yang lebih baik untuk ukuran sampel yang besar (𝑛 = 100 & 𝑛 = 200).
•
Uji dengan ketepatan terbaik dalam mendeteksi model non-linear 2 adalah uji Ramsey’s
RESET dengan tipe regressor dan power 2 untuk setiap ukuran sampel.
•
Persentase ketepatan untuk mendeteksi model non-linear 1 masih tergolong rendah sehingga
ketiga uji masih belum ideal untuk mendeteksi model non-linear yang mengandung fungsi
logaritma.
•
Penambahan jumlah sampel pada model non-linear 2 signifikan dalam meningkatkan
ketepatan deteksi linearitas.
•
5
Outlier dalam data tidak mempengaruhi ketepatan deteksi linearitas secara signifikan.
Ucapan Terima Kasih
Segala puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena berkat dan
rahmat-Nya sehingga penulis dapat menyelesaikan laporan dengan judul “Simulasi Uji Ramsey’s
RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data”. Penulis juga
mengucapkan terima kasih kepada dosen pengampu mata kuliah Simulasi Aktuaria kelas B, Bu
Ulil Azmi, S.Si, M.Si, M.Sc yang telah memberikan kesempatan bagi penulis dalam melaksanakan
penelitian ini.
6
Daftar Pustaka
Baty, F., Ritz, C., Charles, S., Brutsche, M., Flandrois, J.-P., & Delignette-Muller, M.-L. (2015).
A Toolbox for Nonlinear Regression in R: The. Journal of Statistical Software, 1-21.
Sofita, D. (2015). Analisis Regresi Eksponensial (Studi Kasus: Data Jumlah Penduduk dan
Kelahiran di Kalimantan Timur pada Tahun 1992-2013). Jurnal Eksponensial, 57-63.
Download