SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT Khoa TOÁN KINH TẾ Chương 5. DỮ LIỆU CHUỖI THỜI GIAN GVC. TS. Lê Thanh Hoa 1 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan Nội dung 1 SỐ LIỆU CHUỖI THỜI GIAN 2 TỰ TƯƠNG QUAN 2 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 1. Một số khái niệm Các biến số theo thời gian, được gọi đơn giản là chuỗi thời gian Khái niệm chuỗi thời gian: chuỗi các quan sát được thu thập trên cùng một đối tượng, tại các mốc thời gian cách đều nhau, được gọi là chuỗi thời gian. Các mốc thời gian: theo năm, theo quý, theo nửa năm, theo tháng, theo tuần, theo ngày... Phân biệt với số liệu chéo: các đối tượng khác nhau tại cùng một thời điểm. 3 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 1. Một số khái niệm Trong kinh tế xã hội, chúng ta thường làm việc với các số liệu quan sát theo thời gian: GDP hàng năm Lạm phát hàng tháng Chỉ số VN-Index hàng ngày... 4 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 1. Một số khái niệm Hiện tượng tự tương quan Chuỗi {Xt , t = 0, 1, · · · } được gọi là tự tương quan bậc p nếu: corr (Xt , Xt−p ) ̸= 0, với p ̸= 0 Tự tương quan với số liệu chuỗi thời gian được gọi là tương quan chuỗi 5 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 1. Một số khái niệm Một số đặc trưng của số liệu chuỗi thời gian Số liệu chuỗi thời gian và tính tự tương quan Corr (Yt , Yt−s ) ̸= 0 Số liệu chuỗi thời gian và yếu tố mùa vụ: vé máy bay nhiều khách vào dịp hè và lễ tết, giá thực phẩm tăng cao vào tết, lượng điện tiêu thụ thường cao vào mùa đông và mùa hè... 6 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 1. Một số khái niệm Một số đặc trưng của số liệu chuỗi thời gian Số liệu chuỗi thời gian và yếu tố xu thế: GDP thường có xu thế tăng, lương có xu hướng tăng, giá bất động sản có xu hướng tăng... Số liệu chuỗi thời gian và yếu tố ngẫu nhiên: điểm của bài thi TOEIC, IELTS... khi càng giành nhiều thời gian học càng tăng, tuy nhiên cũng bị ảnh hưởng bởi các yếu tố như tâm lý, sức khỏe... của hôm làm bài thi. 7 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Xu thế là sự vận động tăng hay giảm của dữ liệu trong một thời gian dài. Xu thế tuyến tính dưới dạng một đường thẳng hoặc xu thế phi tuyến dưới dạng một đường cong. Mô hình hóa xu thế bằng mô hình hồi quy giữa biến cần dự báo (biến Y) và thời gian (biến t). Ý nghĩa của mô hình xu thế dạng biến động của dữ liệu trong quá khứ sẽ còn tiếp tục trong tương lai. 8 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Lựa chọn dạng hàm xu thế dựa vào sự biến đổi của biến phụ thuộc theo thời gian. Để tăng độ chính xác khi lựa chọn dạng hàm xu thế cần kết hợp thêm nhiều yếu tố đánh giá như: dựa vào hệ số tương quan, sai phân, tốc độ phát triển... 9 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Một số dạng hàm xu thế điển hình Tuyến tính Yt = β0 + β1 t + ϵt Bậc hai Yt = β0 + β1 t + β2 t 2 + ϵt Bậc ba Yt = β0 + β1 t + β2 t 2 + β3 t 3 + ϵt Tuyến tính-log Yt = β0 + β1 ln(t) + ϵt Nghịch đảo Yt = β0 + β1 1t + ϵt Tăng trưởng mũ Yt = e β0 +β1 t+ϵt Log-tuyến tính ln(Yt ) = β0 + β1 t + ϵt 10 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Kiểm tra các giả định của mô hình hồi quy tổng thể Sai số dự báo tuân theo phân phối chuẩn Phương sai của sai số không đổi Không xảy ra hiện tượng tự tương quan 11 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Một số lệnh ước lượng các hàm xu thế trong Eviews Phương trình hồi quy tổng thể Các lệnh trên Eviews Yt = β0 + β1 t + ϵt ls y c t 2 Yt = β0 + β1 t + β2 t + ϵt ls y c t tˆ 2 2 3 Yt = β0 + β1 t + β2 t + β3 t + ϵt ls y c t tˆ 2 tˆ 3 Yt = β0 + β1 ln(t) + ϵt ls y c log(t) 1 Yt = β0 + β1 t + ϵt ls y c 1/t β0 +β1 t+ϵt Yt = e ls log(y) c t ln(Yt ) = β0 + β1 t + ϵt ln log(y) c t 12 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Ví dụ minh họa Năm 1995 1997 1999 2001 2003 2005 Lượng khách quốc tế 1351.3 1715.6 1781.8 2330.8 2429.6 3477.5 Năm 1996 1998 2000 2002 2004 2006 Lượng khách quốc tế 1607.2 1520.1 2140.1 2628.2 2927.9 3583.7 13 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian Cài đặt chuỗi thời gian và đồ thị đường: 14 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian 15 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 2. Mô hình xu thế của chuỗi thời gian 16 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 3. Mô hình có yếu tố mùa vụ của chuỗi thời gian Mô hình chuỗi thời gian và yếu tố mùa vụ 17 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 3. Mô hình có yếu tố mùa vụ của chuỗi thời gian Ví dụ minh họa Giả sử GDP (theo quý) phụ thuộc vào vốn và lao động tùy thuộc vào các quý (Q1, Q2, Q3, Q4) GDP = β1 + β2 K + β3 L + α1 Q1 + α2 Q2 + α3 Q3 + ϵt Sử dụng sự khác nhau giữa các quý thông qua biến giả. Tại sao không có biến Q4? Có phải thiếu biến? 18 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 4. Mô hình cấu trúc của chuỗi thời gian Mô hình SEM là sự mở rộng của mô hình tuyến tính tổng quát (GLM) cho phép nhà nghiên cứu kiểm định một tập hợp phương trình hồi quy cùng một lúc. SEM có thể cho một mô hình phức hợp phù hợp với dữ liệu như các bộ dữ liệu khảo sát trong dài hạn (longitudinal), phân tích nhân tố khám phá (EFA), phân tích nhân tố khẳng định (CFA), các mô hình không chuẩn hoá,cơ sở dữ liệu có cấu trúc sai số tự tương quan, dữ liệu với các biến số không chuẩn(Non-Normality) , hay dữ liệu bị thiếu (missing data). 19 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 5. Các giả thiết về chuỗi thời gian tương đương OLS Định nghĩa Một chuỗi Xt với E (Xt2 ) hữu hạn, được gọi là chuỗi dừng nếu thỏa mãn các điều kiện sau: Kỳ vọng không đổi E (Xt ) = µ. Phương sai không đổi Var (Xt ) = σ 2 Hiệp phương sai không phụ thuộc vào thời điểm tính toán Cov (Xt , Xt−s ) = ρs , ∀t. 20 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan I. SỐ LIỆU CHUỖI THỜI GIAN 5. Các giả thiết về chuỗi thời gian tương đương OLS Chuỗi không dừng nếu không thỏa mãn ít nhất 1 trong các điều kiện trên. 21 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 1. Nguyên nhân Hiện tượng tự tương quan Tự tương quan bậc 1 ϵt = ρ1 ϵt−1 + wt , trong đó wt là nhiễu trắng. Tự tương quan bậc p ϵt = ρ1 ϵt−1 + · · · + ρp ϵt−p + wt , trong đó wt là nhiễu trắng. 22 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 1. Nguyên nhân Trong hồi quy cổ điển luôn có giả thiết rằng không có sự tương quan giữa các nhiễu ϵi , nghĩa là Cov (ϵi , ϵj ) = 0. Khi giả thiết này bị vi phạm, gọi là hiện tượng tự tương quan Cov (ϵi , ϵj ) ̸= 0. Tức là, khi đó các nhiễu có mối quan hệ phụ thuộc lẫn nhau. 23 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan 24 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 1. Nguyên nhân Nguyên nhân khách quan Quán tính: trong hồi quy của chuỗi thời gian, các quan sất kế tiếp có nhiều khả năng phụ thuộc lẫn nhau Hiện tượng mạng nhện: cần có một khoảng thời gian nhất định để phản ứng lại với sự thay đổi Trễ: số liệu thời kỳ sau phụ thuộc vào thời kỳ ngay trước nó Nguyên nhân chủ quan Xử lý số liệu: việc làm trơn số liệu dẫn đến sai số hệ thống trong các nhiễu ngẫu nhiên. Sai lệch do lập mô hình: thiếu biến, dạng hàm sai 25 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 2. Hậu quả Ước lượng bình phương nhỏ nhất thông thường vẫn là ước lượng tuyến tính không chệch, nhưng chúng không phải là ước lượng nhỏ nhất nữa. Phương sai ước lượng được của các ước lượng bình phương không còn đạt giá trị bé nhất. Các kiểm định t, F không đáng tin cậy Ước lượng không chính xác σ 2 26 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Xem xét đồ thị phần dư: xem xét các phần dư có mối quan hệ phụ thuộc lẫn nhau hay không, tất nhiên, có nhiều trường hợp không phát hiện được hiện tượng tự tương quan nếu chỉ dựa vào phần dư. Kiểm định hiện tượng tự tương quan bậc 1: ϵt = ρ1 ϵt−1 + wt , thông qua bài toán H0 : ρ1 = 0 H1 : ρ1 ̸= 0. 27 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Sử dụng giá trị Durbin - Watson P 2 i=1,n (ei − ei−1 ) P d= 2 i=1,n ei Trong đó d ≈ 2 − 2ρ1 28 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Các kết luận dựa vào hệ số Durbin - Watson Nếu d = 0 có dấu hiệu tự tương quan dương rất cao giữa ϵt và ϵt−1 Nếu d = 4 có dấu hiệu tự tương quan âm rất cao giữa ϵt và ϵt−1 Nếu d = 2 không có dấu hiệu tự tương quan giữa ϵt và ϵt−1 29 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan Sử dụng giá trị kiểm định DW-stat 30 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Trong nhiều tài liệu, quy ước trong xem xét tự tương quan như sau: Nếu 1 ≤ d ≤ 3 thì kết luận mô hình không xảy ra hiện tượng tự tương quan Nếu 0 ≤ d ≤ 1 hoặc 3 ≤ d ≤ 4 thì kết luận mô hình xảy ra hiện tượng tự tương quan Sử dụng một số bài toán kiểm định H0 : Không xảy ra hiện tượng tự tương quan H1 : Có xảy ra hiện tượng tự tương quan 31 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Mô hình tự tương quan bậc p: ϵt = ρ1 ϵt−1 + · · · + ρp ϵt−p + wt . Bài toán kiểm định tự tương quan H 0 : ρ1 = ρ2 = · · · = ρ p = 0 H1 : ρ21 + ρ22 + · · · + ρ2p ̸= 0 được thực hiện thông qua kiểm định F hoặc kiểm định Breusch Godfrey (BG, LM) 32 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 3. Cách phát hiện tự tương quan Bài toán kiểm định BG - LM Ước lượng phần dư et của mô hình Yt = β1 + β2 Xt2 + · · · + βK XtK + ϵt . Ước lượng mô hình hồi quy phụ et = α1 + α2 Xt2 + · · · + αK XtK + ρ1 et−1 + · · · + ρp et−p + wt . Tính được giá trị Re2 Kết quả: Khi H0 thỏa mãn và n đủ lớn thì LM = (n − p)Re2 ∼ χ2 (p) 33 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan Kiểm định BG-LM: Bài toán có xảy ra hiện tượng tự tương quan 34 / 35 SỐ LIỆU CHUỖI THỜI GIAN Tự tương quan II. TỰ TƯƠNG QUAN 4. Cách biện pháp khắc phục Sử dụng phương pháp bình phương cực tiểu tổng quát GLS Sử dụng phương pháp lấy sai phân ∆Y = β1 + β2 ∆X + ϵ. Sử dụng phương sai hiệu chỉnh Các biện pháp khắc phục Khi cấu trúc của tự tương quan là đã biết Khi cấu trúc của tự tương quan là chưa biết 35 / 35