Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4 1,2,3,4 Affiliasi; alamat 1,2,3,4 Departemen Aktuaria ITS Surabaya Indonesia lahfanda.205006@mhs.its.ac.id 1, lawrence.205006@mhs.its.ac.id 2, yosafat.205006@mhs.its.ac.id 3, teddysaputra.205006@mhs.its.ac.id 4 Abstrak Uji deteksi linearitas merupakan uji untuk menentukan apakah suatu data dikatakan linear atau nonlinear. Terdapat tiga metode dalam uji deteksi linearitas yaitu uji Ramsey’s RESET, uji White, dan uji Terasvirta. Penulis ingin membandingkan keefektifan ketiga metode tersebut dengan melihat hasil yang menyatakan bahwa model tersebut dikatakan model linear dengan cara mereplikasi data simulasi sebanyak 10.000 kali dengan banyak sampel data simulasi yang berbeda-beda pada tiap model. Diperoleh uji yang menghasilkan ketepatan terbaik pada model linear baik menggunakan 1 outlier maupun tidak adalah uji Ramsey’s RESET. Selanjutnya pada model non-linear 1 tanpa outlier uji yang terbaik adalah uji Terasvirta, sedangkan pada model yang sama dengan 1 outlier uji yang terbaik adalah uji White pada sampel berukuran kecil dan uji Terasvirta pada sampel berukuran besar. Pada model non-linear 2, uji Ramsey RESET memberikan hasil terbaik untuk semua ukuran sampel. Berdasarkan hasil yang diperoleh bisa dikatakan bahwa penambahan outlier pada data tidak mempengaruhi ketepatan deteksi linearitas secara signifikan. Secara keseluruhan, persentase ketepatan untuk model linear cukup tinggi sedangkan pada model nonlinear tergolong masih rendah. Kata Kunci: Linearitas, Uji Ramsey’s RESET, Uji White, Uji Terasvirta Abstract The linearity detection test is a test to determine whether a data is said to be linear or non-linear. There are three methods in the linearity detection test, namely the Ramsey's RESET test, the White test, and the Terasvirta test. The author wants to compare the effectiveness of the three methods by looking at the results which state that the model is said to be a linear model by replicating the simulation data 10,000 times with many different simulation data samples in each model. The test that produces the best accuracy in the linear model using either 1 outlier or not is the Ramsey's RESET test. Furthermore, for the nonlinear model 1 without outliers, the best test is the Terasvirta test, while for the same model with 1 outlier, the best test is the White test on small samples and the Terasvirta test on large samples. In the non-linear model 2, the Ramsey RESET test gives the best results for all sample sizes. Based on the results obtained, it can be said that adding outliers to the data does not significantly affect the accuracy of linearity detection. Overall, the percentage of accuracy for the linear model is quite high, while the non-linear model is still relatively low. Keywords: Linearity, Ramsey’s RESET Test, White Test, Terasvirta Test 1 Pendahuluan Model statistika dapat berupa model linear, maupun model non-linear (Baty, et al., 2015). Kedua model tersebut menggunakan dua metode yang berbeda untuk menganalisis data. Model linear menggunakan regresi linear untuk menganalisisnya, sedangkan model non-linear menggunakan regresi non-linear untuk menganalisisnya (Sofita, 2015). Oleh karena itu, analisis data harus didahului oleh uji deteksi linearitas. Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data Masalah yang terjadi dalam uji deteksi linearitas adalah keefektifan uji deteksi linearitas. Model yang berbentuk non-linear bisa dianggap linear oleh uji deteksi linearitas. Hal tersebut bisa menyebabkan metode yang digunakan untuk menganalisis data salah sehingga hasil analisisnya tidak valid. Oleh karena itu, penulis ingin mengetahui pengujian yang efektif untuk mendeteksi kelinearitasan data. Pada penelitian akan dilakukan pengujian untuk beberapa metode pengujian linearitas, yaitu uji Ramsey’s RESET, uji White, dan uji Terasvirta. Ketiga metode tersebut akan digunakan untuk menguji linearitas suatu data yang telah ditentukan. Kemudian, persentase keefektifannya akan dikomparasi. 2 Metode Penelitian 2.1 Sumber Data dan Variabel Penelitian Pada penelitian ini akan dilakukan studi simulasi, sehingga data yang digunakan dalam melakukan penelitian ini berupa data simulasi. Data simulasi ini direplikasi sebanyak 10.000 kali menggunakan software RStudio. Data simulasi terdiri dari 3 model, 1 model linear dan 2 model non-linear dengan persamaan sebagai berikut. Tabel 1. Model yang digunakan dalam simulasi Model Model 1 (Linear) Persamaan 𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒 Model 2 (Non-Linear) 𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒 Model 3 (Non-Linear) 𝑦 = −0.8 + 0.4𝑥1 2 − 0.3𝑒 𝑥2 + 0.5𝑥3 + 0.17𝑒 Data simulasi dibangkitkan dari distribusi uniform 𝑋𝑖 ~𝑈(0,1) dengan error yang dibangkitkan dari distribusi normal 𝑒~𝑁(0,1). Data yang disimulasikan terdiri dari: 1. Model linear dengan 𝑛 = 50, 100, 200 2. Model non-linear 1 dengan 𝑛 = 50, 100, 200 3. Model non-linear 2 dengan 𝑛 = 50, 100, 200 4. Model linear dengan 𝑛 = 50, 100, 200 yang mengandung 1 outlier 5. Model non-linear dengan 𝑛 = 50, 100, 200 yang mengandung 1 outlier 2.2 Langkah Analisis Langkah-langkah yang dilakukan pada penelitian ini adalah sebagai berikut: 1. Membangkitkan data sebanyak 50, 100, dan 200 data untuk random data linear dan nonlinear, serta data untuk variabel prediktor. 2. Melakukan uji linearitas data dengan Ramsey’s RESET Test, White Test, dan Terasvirta Test. Pada uji Ramsey’s RESET akan digunakan 3 tipe prediktor yang akan digunakan Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4 yaitu regressor, fitted dan princomp. Selain itu, pada masing-masing tipe tersebut juga akan digunakan 3 tipe power yaitu kuadratik (2), kubik (3), dan kuadratik dan kubik (2:3). 3. Melakukan pembangkitan data dan pengujian linearitas sebanyak 10.000 kali. 4. Menghitung persentase hasil benar dari 10.000 kali pengujian tersebut. 5. Melakukan perbandingan hasil kebenaran Ramsey’s RESET Test, White Test, dan Terasvirta Test untuk menentukan metode terbaik dari ketiga metode uji linearitas tersebut. 6. Menarik kesimpulan dan saran dari hasil yang didapatkan. 3 Hasil dan Pembahasan Berikut merupakan hasil simulasi dari masing-masing skenario yang telah dibuat. 1) Model linear Pertama, dilakukan simulasi uji linearitas pada model linear dengan persamaan sebagai berikut: 𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒 Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan dalam tabel sebagai berikut: Tabel 2. Hasil ketepatan model linear pada beberapa uji statistik Uji Statistik Persentase Benar n = 50 n = 100 n = 200 regressor2 95.15% 95.02% 95.31% 3 95.14% 95.25% 95.36% regressor23 95.3% 95.43% 95.36% fitted2 95.42% 95.27% 94.68% 3 95.11% 95.07% 94.82% 95.29% 95.17% 94.7% princomp2 95.11% 95.02% 94.78% princomp 3 94.97% 94.85% 94.69% princomp 23 95.13% 95.03% 94.97% white 94.7% 95.18% 94.96% terasvirta 94.2% 94.74% 94.75% regressor fitted fitted23 Tabel 2 menunjukkan bahwa semua uji statistik sudah baik dalam melakukan deteksi linearitas pada model linear yang diberikan. Hal ini terlihat pada persentase ketepatan tiap pengujian yang cenderung tinggi. Uji Ramsey’s RESET tipe fitted2 menghasilkan ketepatan terbaik untuk ukuran sampel 𝑛 = 50 yaitu sebesar 95.42%. Pada 𝑛 = 100, uji Ramsey’s RESET tipe regressor23 Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data menghasilkan ketepatan model tertinggi sebesar 95.43%. Kemudian untuk 𝑛 = 200, uji Ramsey tipe regressor3 dan regressor23 menghasilkan ketepatan model tertinggi yaitu sebesar 95.36%. Adapun ketepatan terburuk dihasilkan oleh uji Terasvirta untuk 𝑛 = 50 (94.2%) dan 𝑛 = 100 (94.74%), dan uji Ramsey’s RESET tipe fitted2 untuk 𝑛 = 200 (94.68%). Ukuran sampel pada pengujian model linier tidak begitu mempengaruhi ketepatan klasifikasi, Dapat dilihat bahwa pada uji Ramsey’s RESET tipe fitted2, ketepatan klasifikasi semakin menurun ketika ukuran sampel diperbesar, sedangkan pada uji Terasvirta menghasilkan ketepatan klasifikasi yang semakin baik ketika ukuran sampel diperbesar. Informasi pada tabel 2 dapat juga dibandingkan dalam grafik sebagai berikut: 95.60% 95.40% 95.20% 95.00% 94.80% 94.60% 94.40% 94.20% 94.00% 93.80% 93.60% 93.40% n=50 n=100 n=200 Gambar 1 Perbandingan ketepatan model linear pada beberapa uji statistik 2) Model non-linear 1 Selanjutnya dilakukan simulasi uji linearitas pada model non-linear dengan persamaan sebagai berikut: 𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒 Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan dalam tabel sebagai berikut: Tabel 3. Hasil ketepatan model non-linear 1 pada beberapa uji statistik Uji Statistik Persentase Benar n = 50 n = 100 n = 200 regressor2 5.09% 4.76% 4.95% 3 5.23% 4.98% 4.96% regressor Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4 regressor23 5.11% 5.16% 5.13% fitted2 4.39% 4.81% 4.84% fitted3 5.52% 4.74% 5.03% fitted 23 4.75% 4.61% 5.28% 2 5.05% 5.01% 4.90% princomp3 5.14% 4.81% 5.07% 5.28% 4.92% 5.01% white 5.10% 5.34% 5.17% terasvirta 6.34% 5.61% 5.52% princomp princomp 23 Tabel 3 menunjukkan bahwa semua uji statistik belum baik dalam melakukan deteksi linearitas pada model non-linear yang mengandung fungsi logaritma. Hal ini terlihat pada persentase ketepatan tiap pengujian yang cenderung rendah. Secara keseluruhan, uji Terasvirta untuk 𝑛 = 50 menghasilkan ketepatan terbaik dari semua ukuran sampel yaitu sebesar 6,34%. Pada 𝑛 = 100, uji Terasvirta menghasilkan ketepatan model tertinggi sebesar 5.61%. Kemudian untuk 𝑛 = 200, uji Terasvirta menghasilkan ketepatan model tertinggi yaitu sebesar 5.52%. Adapun ketepatan terburuk dihasilkan oleh uji Ramsey’s RESET tipe fitted2 untuk 𝑛 = 50 (4.39%), uji Ramsey’s RESET tipe fitted23 untuk 𝑛 = 100 (4.61%), dan uji Ramsey’s RESET tipe princomp23 untuk 𝑛 = 200 (4.84%). Ukuran sampel pada pengujian model non-linier 1 tidak begitu mempengaruhi ketepatan klasifikasi, Dapat dilihat bahwa pada uji Terasvirta dan Ramsey’s RESET tipe fitted3, ketepatan klasifikasi semakin menurun ketika ukuran sampel diperbesar. Informasi pada tabel 3 dapat juga dibandingkan dalam grafik sebagai berikut: Gambar 2 Perbandingan ketepatan model non-linear 1 pada beberapa uji statistik 3) Model non-linear 2 Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data Selanjutnya dilakukan simulasi dengan model non-linear lainnya dengan persamaan sebagai berikut: 𝑦 = −0.8 + 0.4𝑥1 2 − 0.3𝑒 𝑥2 + 0.5𝑥3 + 0.17𝑒 Hasil pengujian terhadap model menggunakan beberapa metode uji deteksi linearitas dapat dilihat melalui tabel berikut: Tabel 4. Hasil ketepatan model non-linear 2 pada beberapa uji statistik Uji Statistik Persentase Benar n = 50 n = 100 n = 200 regressor2 17.43% 35.14% 66.50% regressor 3 16.97% 34.56% 65.54% regressor 23 12.56% 26.34% 53.51% fitted2 5.09% 5.19% 4.89% fitted 3 5.19% 5.16% 5.41% fitted 23 5.27% 5.27% 4.91% princomp2 7.02% 8.71% 11.69% princomp3 6.74% 8.03% 11.14% 6.63% 7.58% 10.00% white 6.52% 7.73% 11.37% terasvirta 9.64% 16.32% 34.36% princomp 23 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% n = 50 n = 100 n=200 Gambar 3 Perbandingan ketepatan model non-linear 2 pada beberapa uji statistik Melalui tabel 4, diketahui bahwa ketepatan uji deteksi linearitas pada model linear 2 tidak baik karena persentase benarnya tergolong rendah. Berdasarkan gambar 3, terlihat adanya kenaikan persentase benar saat sampel bertambah pada metode yang sama, sehingga dapat disimpulkan bahwa penambahan jumlah sampel dapat meningkatkan ketepatan klasifikasi. Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4 Berdasarkan tabel 4, metode terbaik untuk mendeteksi uji deteksi linearitas pada model linear 2 adalah metode Ramsey’s RESET dengan tipe regressor dan power 2 dengan ketepatan uji deteksi linearitas pada model mencapai 66.50% pada jumlah sampel 200. Adapun metode dengan hasil ketepatan terburuk yaitu metode Ramsey’s RESET dengan tipe fitted dan power 2 dengan persentase benar sebesar 4.89% pada jumlah sampel 200. 4) Model linear dengan 1 outlier Selanjutnya dilakukan simulasi pada model linear dengan 1 outlier. Persamaan dari model linear yang diuji adalah sebagai berikut: 𝑦 = 1 + 0.7𝑥1 − 0.3𝑥2 + 0.2𝑥3 + 0.15𝑒 Hasil pengujian terhadap model menggunakan beberapa metode dapat dilihat melalui tabel berikut: Tabel 5. Hasil ketepatan model linear dengan outlier pada beberapa uji statistik Uji Statistik Persentase Benar n = 50 n = 100 n = 200 regressor2 94.93% 95.13% 94.92% 3 95.07% 95.35% 94.99% regressor23 95.13% 95.2% 94.42% fitted2 94.97% 95.06% 95.13% fitted 3 94.79% 95.07% 95.02% fitted 23 94.8% 94.96% 95.09% princomp2 94.87% 95.01% 95.16% princomp 3 94.76% 95% 95.11% princomp 23 95.01% 95.01% 94.72% white 94.77% 94.77% 94.99% terasvirta 94.66% 94.66% 94.64% regressor Melalui tabel 5, diketahui bahwa ketepatan uji deteksi linear pada model linear dengan outlier bisa dikatakan cukup baik karena persentase benarnya cukup tinggi yaitu di atas 90% pada jenis tes dan nilai n yang berbeda-beda. Metode uji deteksi yang menghasilkan persentase benar tertinggi ada pada metode regressor3 yaitu sebesar 95.35% dengan n sebesar 100. Sedangkan metode uji deteksi yang menghasilkan persentase benar terendah ada pada metode regressor23 yaitu sebesar 94.42% dengan n sebesar 200. Adanya outlier dalam data juga tidak mempengaruhi ketepatan deteksi linearitas secara signifikan karena hasil yang didapatkan tidak jauh berbeda dengan hasil ketepatan pada model linear yang sama tanpa Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data memasukkan outlier. Informasi pada tabel 5 dapat juga dibandingkan dalam grafik sebagai berikut: Gambar 4 Perbandingan ketepatan model linear dengan outlier pada beberapa uji statistik 5) Model non-linear 1 dengan 1 outlier Selanjutnya dilakukan simulasi uji linearitas pada model non-linear dengan 1 outlier. Adapun persamaan dari model non-linear yang diuji adalah sebagai berikut: 𝑦 = log(𝑥1 + 6) + √𝑥2 + 6 + 0.5𝑥3 + 0.12𝑒 Persentase ketepatan uji linearitas dari beberapa uji statistik pada model tersebut ditampilkan dalam tabel sebagai berikut: Tabel 6. Hasil ketepatan model non-linear 1 dengan outlier pada beberapa uji statistik Uji Statistik Persentase Benar n = 50 n = 100 n = 200 regressor2 5.57% 4.97% 4.90% regressor3 5.35% 4.83% 4.64% 5.14% 5.01% 5.28% fitted2 6.15% 4.75% 5.06% fitted3 6.11% 4.86% 5.20% 5.65% 4.77% 5.11% princomp2 6.21% 5.05% 4.82% princomp3 6.20% 4.85% 4.66% 5.38% 5.18% 5.08% white 6.37% 4.98% 5.08% terasvirta 6.36% 5.59% 5.41% regressor fitted 23 23 princomp 23 Lahfanda Dista Permata Putri 1, Lawrence 2, Yosafat Respati 3, Teddy Hari Saputra 4 Tabel 6 menunjukkan bahwa semua uji statistik belum baik dalam melakukan deteksi linearitas pada model non-linear yang mengandung fungsi logaritma dan outlier. Hal ini terlihat pada persentase ketepatan tiap pengujian yang cenderung rendah. Secara keseluruhan, uji White untuk 𝑛 = 50 menghasilkan ketepatan terbaik dari semua ukuran sampel yaitu sebesar 6,37%. Pada 𝑛 = 100, uji Terasvirta menghasilkan ketepatan model tertinggi sebesar 5.59%. Kemudian untuk 𝑛 = 200, uji Terasvirta menghasilkan ketepatan model tertinggi yaitu sebesar 5.41%. Adapun ketepatan terburuk dihasilkan oleh uji Ramsey’s RESET tipe regressor23 untuk 𝑛 = 50 (5.14%), uji Ramsey’s RESET tipe fitted2 untuk 𝑛 = 100 (4.75%), dan uji Ramsey’s RESET tipe regressor3 untuk 𝑛 = 200 (4.64%). Ukuran sampel pada pengujian model non-linier 1 tidak begitu mempengaruhi ketepatan klasifikasi, Dapat dilihat bahwa pada uji Terasvirta, uji Ramsey’s RESET tipe regressor3, dan tipe princomp2 ketepatan klasifikasi semakin menurun ketika ukuran sampel diperbesar. Adanya outlier dalam data juga tidak mempengaruhi ketepatan deteksi linearitas secara signifikan karena hasil yang didapatkan tidak jauh berbeda dengan hasil ketepatan pada model nonlinear 1 tanpa outlier. Informasi pada tabel 6 dapat juga dibandingkan dalam grafik sebagai berikut: Gambar 5 Perbandingan ketepatan model non-linear 1 dengan outlier pada beberapa uji statistik 4 Simpulan Berdasarkan hasil simulasi uji Ramsey’s RESET, uji White, dan uji Terasvirta pada model, didapatkan simpulan sebagai berikut: • Uji dengan ketepatan terbaik dalam mendeteksi model linear, baik yang mengandung 1 outlier ataupun tidak, adalah uji Ramsey’s RESET dengan type dan power yang berbeda dan kondisional terhadap jumlah sampel. Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data • Uji dengan ketepatan terbaik dalam mendeteksi model non-linear 1 tanpa outlier adalah uji Terasvirta. Sedangkan untuk model non-linear 1 dengan 1 outlier, uji White memberikan hasil yang terbaik untuk ukuran sampel yang kecil (𝑛 = 50) dan uji Terasvirta memberikan hasil yang lebih baik untuk ukuran sampel yang besar (𝑛 = 100 & 𝑛 = 200). • Uji dengan ketepatan terbaik dalam mendeteksi model non-linear 2 adalah uji Ramsey’s RESET dengan tipe regressor dan power 2 untuk setiap ukuran sampel. • Persentase ketepatan untuk mendeteksi model non-linear 1 masih tergolong rendah sehingga ketiga uji masih belum ideal untuk mendeteksi model non-linear yang mengandung fungsi logaritma. • Penambahan jumlah sampel pada model non-linear 2 signifikan dalam meningkatkan ketepatan deteksi linearitas. • 5 Outlier dalam data tidak mempengaruhi ketepatan deteksi linearitas secara signifikan. Ucapan Terima Kasih Segala puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena berkat dan rahmat-Nya sehingga penulis dapat menyelesaikan laporan dengan judul “Simulasi Uji Ramsey’s RESET, Uji White, dan Uji Terasvirta dalam Ketepatan Mendeteksi Linearitas Data”. Penulis juga mengucapkan terima kasih kepada dosen pengampu mata kuliah Simulasi Aktuaria kelas B, Bu Ulil Azmi, S.Si, M.Si, M.Sc yang telah memberikan kesempatan bagi penulis dalam melaksanakan penelitian ini. 6 Daftar Pustaka Baty, F., Ritz, C., Charles, S., Brutsche, M., Flandrois, J.-P., & Delignette-Muller, M.-L. (2015). A Toolbox for Nonlinear Regression in R: The. Journal of Statistical Software, 1-21. Sofita, D. (2015). Analisis Regresi Eksponensial (Studi Kasus: Data Jumlah Penduduk dan Kelahiran di Kalimantan Timur pada Tahun 1992-2013). Jurnal Eksponensial, 57-63.