Model Panel Data Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 1 Tipe-tipe data yang umumnya digunakan dalam studi-studi empirik: Data time series. Dalam data time series kita mengobservasi nilai dari satu atau beberapa variable sepanjang periode waktu tertentu Data cross section. Dalam data cross section nilai dari satu atau beberapa variable dikumpulkan untuk beberapa unit sample atau entitas pada suatu titik waktu yang sama. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 2 Data Panel Data yang terdiri atas a group of cross-sectional units (people, households, firms, states, countries) who are observed over time Dalam data panel, unit cross sectional yang sama (mis.: perusahaan, orang, rumah tangga, negara) disurvei sepanjang waktu tertentu. Pendeknya, data panel mempunyai dimensi waktu dan ruang. – Denote the number of cross-sectional units (individuals) by N – Denote the number of time periods in which we observe them as T Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 3 Jika setiap unit cross sectional memiliki jumlah observasi time series yang sama, maka panel data seperti itu disebut sebagai balanced panel. Jika tidak, maka disebut unbalanced panel. Contoh suatu studi yang dilakukan untuk menganalisis faktor-faktor yang berpengaruh terhadap tingkat upah (wage). Dihipotesiskan bahwa wage=f(x1, x2, x3, …, x6). Sampel yang digunakan dalam penelitian ini adalah perempuan pekerja sebanyak N=716 yang diinterview pada tahun 1982, 1983, 1984, 1985, dan 1986. Data panel dalam penelitian ini merupakan contoh balanced panel. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 4 15.1 A Microeconomic Panel Table 15.1 Representative Observations from NLS Panel Data Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 5 Bagaimana mengestimasi persamaan regresi untuk wage function (wage=f(x1, x2, x3, x4, x5, x6) dengan menggunakan data panel ini? Ada beberapa pendekatan, 3 diantaranya: - Pooled Model - Fixed Effect Model - Random Effect Model Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 6 15.2 Pooled Model Pooled model merupakan model dimana data dari berbagai individu dalam unit cross section digabungkan bersama-sama jadi satu dengan tidak mempertimbangkan kemungkinan perbedaan karakteristik antar individu yang akan mengarahkan pada perbedaan koefisien. Dalam kondisi demikian pooled model dituliskan sbb.: Eq. 15.1 y it 1 2 x 2 it 3 x 3 it eit – Perhatikan bahwa koefisien (β1, β2, β3) tidak memiliki subscripts i atau t. – Ini menunjukkan bahwa pengaruh x2 dan x3 terhadap y (wage) adalah sama untuk semua individu dalam unit cross section. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 7 15.2 Pooled Model The least squares estimator, when applied to a pooled model, is referred to as pooled least squares – The data for different individuals are pooled together, and the equation is estimated using least squares Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 8 15.2 Pooled Model 15.2.1 Cluster-Robust Standard Errors Menerapkan pooled least squares dengan mengabaikan sifat panel data, dalam beberapa hal mengandung kelemahan. – dalam hal asumsi yang dianggap tidak realistik yaitu ketiadaan korelasi antar error untuk pengamatan pada individu yang sama. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 9 15.3 The Fixed Effects Model Eq. 15.2 Fixed Effect Model Kita dapat memperluas model dalam in Eq. 15.1 dengan melonggarkan asumsi bahwa semua individu memiliki koefisien yang sama. Modifikasi modelnya menjadi: y it 1i 2 i x 2 it 3 i x 3 it e it – subscript i yang ditambahkan pada setiap koefisien menunjukkan bahwa koefisien (β1, β2, β3) dapat berbeda antar individu. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 10 15.3 The Fixed Effects Model Untuk menghindari terlalu banyaknya parameter yang harus ditaksir, kita dapat membuat simplifikasi atas persamaan 15.2 Simplifikasi yang umum dilakukan adalah dengan membangun model dimana intersep β1i berbeda antar individu tetapi slope koefisien β2 and β3 diasumsikan konstan untuk semua individu. Persamaan 15.2, kemudian menjadi: Eq. 15.3 Principles of Econometrics, 4th Edition y it 1i 2 x 2 it 3 x 3 it eit Chapter 15: Panel Data Models Page 11 15.3 The Fixed Effects Model Persamaan tersebut menunjukkan bahwa semua perbedaan perilaku antar individu, yang disebut sebagai individual heterogeneity, diasumsikan ditangkap oleh unsur intersep. – A model with these features is called a fixed effects model • The intercepts are called fixed effects Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 12 15.3 The Fixed Effects Model Bagaimana mengestimasi persamaan 15.3? 1. The least squares dummy variable (LSDV) estimator 2. The fixed effects estimator Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 13 15.3 The Fixed Effects Model 15.3.1 The Least Square Dummy Variable Estimator for Small N One way to estimate the model in Eq. 15.3 is to include an intercept dummy variable (indicator variable) for each individual 1 i 1 D1 i 0 otherw ise D2i 1 i 2 0 otherw ise D3i 1 i 3 0 otherw ise – If we have 10 individuals, we define 10 such dummies Now we can write: Eq. 15.4 y it 1 1 D1 i 1 2 D 2 i Principles of Econometrics, 4th Edition 1,1 0 D1 0 i 2V 2 it 3 K 3 it e it Chapter 15: Panel Data Models Page 14 15.3 The Fixed Effects Model 15.3.1 The Least Square Dummy Variable Estimator for Small N – In a panel data context, it is called the least squares dummy variable (LSDV) estimator Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 15 15.3 The Fixed Effects Model Table 15.3 Dummy Variable Estimation of Wage Equation for N = 10 15.3.1 The Least Square Dummy Variable Estimator for Small N Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 16 15.3 The Fixed Effects Model Table 15.4 Pooled Least Squares Estimates of Wage Equation for N = 10 15.3.1 The Least Square Dummy Variable Estimator for Small N Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 17 15.3 The Fixed Effects Model 15.3.1 The Least Square Dummy Variable Estimator for Small N • We can test the estimates of the intercepts: H 0 : 11 12 1,1 0 H 1 : th e 1 i are n o t all eq u al Hipotesis di atas digunakan untuk menguji apakah pendekatan pooled least squares tepat digunakan? Dituliskan dengan cara lain: H0: Pooled Least Squares H1: Fixed Effect Model Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 18 15.3 The Fixed Effects Model 15.3.1 The Least Square Dummy Variable Estimator for Small N Hipotesis dapat diuji menggunakan prosedur uji-F (Wald Test). Membandingkan F stat dengan F tabel. The F-statistic is: F SSE R SSE U SSE U NT K J 5.502466 2.667190 2.667190 50 15 9 4.134 Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 19 15.3 The Fixed Effects Model 15.3.1 The Least Square Dummy Variable Estimator for Small N Jika F stat lebih besar dari F tabel – We reject the null hypothesis that the intercept parameters for all individuals are equal. – We conclude that there are differences in individual intercepts, and that the data should not be pooled into a single model with a common intercept parameter Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 20 15.3 The Fixed Effects Model 15.3.2 The Fixed Effects Estimator Using the dummy variable approach is not feasible when N is large – Another approach is necessary yaitu fixed effect estimator. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 21 15.4 The Random Effects Model Random Effect Model (REM) Seperti pada FEM, dalam random effects model, kita mengasumsikan bahwa semua perbedaan individu ditangkap oleh intersep. Namun demikian jika pada FEM setiap unit cross section memiliki nilai intersep tersendiri yang fixed, maka dalam REM nilai intersep untuk setiap individu bersifat random. Dalam arti, semua individu dalam unit cross section memiliki rata-rata intersep yang sama dan perbedaan individu dalam nilai intersep direfleksikan dalan error term ui . Nilai intersep untuk setiap individu adalah nilai intersep ratarata dari seluruh intersep cross sectional ditambah komponen error yang merepresentasikan deviasi random intersep individu dari nilai intersep rata-rata. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 22 15.4 The Random Effects Model Dengan demikian nilai intersep untuk individu dapat dinyatakan dengan: 1i 1 u i Persamaan di atas menunjukkan bahwa intersep individu terdiri atas intersep rata-rata seluruh unit cross section ditambah perbedaan individual yang bersifat random. – The random individual differences ui are called random effects. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 23 15.4 The Random Effects Model Substituting, we get: y it 1 i 2 x 2 it 3 x 3 it e it Eq. 15.18 1 u i 2 x 2 it 3 x 3 it e it – Rearranging: y it 1 2 x 2 it 3 x 3 it e it u i Eq. 15.19 1 2 x 2 it 3 x 3 it v it Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 24 Gabungan error term vt pada persamaan 15.19 terdiri dari dua komponen, ui yang merupakan komponen error cross section dan eit yang merupakan kombinasi error term time series dan cross section. Oleh karena itu, random effect model sering juga disebut sebagai error component model, merupakan gabungan yang terdiri atas dua atau lebih komponen error. Estimasi atas parameter dalam persamaan 15.19 dilakukan dengan menerapkan generalized least squares. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 25 15.5 Comparing Fixed and Random Effects Estimators Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 26 15.5 Comparing Fixed and Random Effects Estimators Kita mempunyai dua alternatif dari estimasi pooled least squares yaitu FEM dan REM. Kelebihan REM dibanding FEM adalah: 1. Random effects estimator memungkinkan kita untuk mengestimasi efek variabel yang bersifat individually time-invariant (lihat contoh variable BLACK dan EDUC yang harus hilang dari estimasi FEM) 2. Estimasi parameter dalam REM menggunakan prosedur estimasi GLS, sementara FEM menggunakan prosedur least squares. Dalam sampel besar estimator GLS memiliki varians yang lebih kecil dibanding estimator least squares. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 27 Namun demikian, terdapat potensi masalah yang mungkin muncul jika kita menggunakan REM, yaitu kemungkinan korelasi antara error dengan explanatory variable (x) → disebut masalah endogenitas. Oleh karena itu kita dapat melakukan pengujian untuk menentukan apakah REM atau FEM yang lebih tepat? Pengujian dilakukan atas hipotesis berikut: H0 : Random Effect Model (Tidak ada korelasi antara error dengan x → cov(vit, xit) = 0) H1 : Fixed Effect Model Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 28 Pengujian dilakukan dengan prosedur uji Hausman, membandingkan χ2 hitung dengan χtabel. χtabel = χ((1-α), df), dengan df = jumlah koefisien variabel bersama yang diestimasi. Tolak H0 jika χ2 hitung > χtabel. Principles of Econometrics, 4th Edition Chapter 15: Panel Data Models Page 29