Chương 6 Chẩn đoán hồi quy: Tự tương quan (Gujarati: Econometrics by example, 2011) 1. Người dịch và diễn giải: Phùng Thanh Bình http://vnp.edu.vn/ C Một vấn đề phổ biến trong phân tích hồi quy liên quan đến chuỗi thời gian là hiện tượng tự tương quan. Nhớ lại rằng một trong những giả định của mô hình hồi quy tuyến tính cổ điển là các hạng nhiễu, ut, không tương quan – nghĩa là, hạng nhiễu tại thời điểm t không tương quan với hạng nhiễu tại thời điểm (t - 1) hoặc bất kỳ hạng nhiễu nào trong quá khứ. Nếu các hạng nhiễu tương quan sẽ dẫn đến các hậu quả sau đây2: 1. Các ước lượng OLS vẫn không chệch và vẫn nhất quán. 2. Chúng (tức các ước lượng OLS) vẫn theo phân phối chuẩn trong các mẫu lớn. 3. Nhưng chúng không còn hiệu quả nữa. Nghĩa là, chúng không còn BLUE nữa (ước lượng tuyến tính không chệch tốt nhất). Trong hầu hết các trường hợp, các sai số chuẩn OLS bị ước lượng thấp (underestimated), nghĩa là các giá trị t ước ượng bị thổi phồng (tức cao hơn bình thường), điều này nhìn bề ngoài có vẽ như một hệ số có ý nghĩa thống kê hơn là nó thực sự có thể. [Diễn giải: Dễ bác bỏ giả thuyết H0, mặc dù H0 có thể là giả thuyết đúng]. 4. Kết quả là, như trong trường hợp phương sai thay đổi, thủ tục kiểm định giả thuyết trở nên đáng nghi, vì các sai số chuẩn ước lượng có thể không tin cậy, thậm chí tiệm cận (tức là trong các mẫu lớn). Vì vậy, các kiểm định t và F có thể không có hiệu lực. Như trong trường hợp phương sai thay đổi, chúng ta cần tìm hiểu xem liệu tự tương quan có tồn tại trong một trường hợp cụ thể nào đó hay không và có hành động chỉnh sửa hoặc tìm kiếm các thủ tục ước lượng thay thế khác sao cho có được các ước lượng tuyến tính không chệch tốt nhất. Trước khi thực hiện điều này, chúng ta hãy xem xét một ví dụ cụ thể. 6.1 Hàm tiêu dùng của Mỹ, 1947 – 2000 Table 6.1 là tệp dữ liệu về chi tiêu cho tiêu dùng thực (C), thu nhập cá nhân khả dụng thực (DPI), tài sản thực (W), và lãi suất thực (R) của Mỹ giai đoạn 1947 – 2000; thuật 1 Hiện nay đã có ấn bản mới (lần 2, năm 2015). Dữ liệu của phiên bản 2011: https://www.macmillanihe.com/companion/Gujarati-Econometrics-By-Example/student-zone/ 2 Để biết chi tiết, xem Gujarati/Porter, Chương 12. 1 ngữ ‘thực’ nghĩa là đã được điều chỉnh lạm phát3. Table 6.1 có thể được tìm thấy trên trang web của cuốn sách. Bây giờ hãy xem xét mô hình hồi quy sau đây: Lưu ý rằng chúng ta dùng chỉ số dưới là t (thay vì i) để chỉ ra rằng chúng ta đang xử lý dữ liệu chuỗi thời gian. Cũng lưu ý rằng ln là logarít tự nhiên. Để đơn giản hóa việc giải thích, chúng ta sẽ gọi phương trình (6.1) là hàm tiêu dùng. Các biến giải thích trong phương trình này là các biến được sử dụng phổ biến trong hàm tiêu dùng, mặc dù có thể có các biến đổi trong lựa chọn các biến DPI, tài sản, và lãi suất. Tham khảo bất kỳ giáo trình kinh tế vĩ mô nào để tìm hiểu lý thuyết kinh tế nền tảng của hàm tiêu dùng. Lưu ý rằng chúng ta cho các biến C, DPI, và W ở dạng log, nhưng R ở dạng tuyến tính bởi vì một số lãi suất thực có giá trị âm. Các hệ số B2 và B3 lần lượt là các hệ số co giãn của chi tiêu cho tiêu dùng theo thu nhập khả dụng và tài sản, và B4 là hệ số bán co giãn theo lãi suất thực (nhớ lại là thảo luận của chúng ta về các dạng hàm của mô hình hồi quy ở chương 3)4. Theo tiên nghiệm, chúng ta kỳ vọng các hệ số co giãn theo thu nhập và tài sản có dấu dương và hệ số bán co giãn theo lãi suất mang dấu âm. Kết quả hồi quy Kết quả ước lượng mô hình hồi quy được trình bày trong Bảng 6.2. 3 Dữ liệu được thu thập từ nhiều nguồn khác nhau của chính phủ, như Phòng công thương, Ngân hàng dự trữ liên bang và Báo cáo kinh tế cho tổng thống. 4 Trong phân tích hàm tiêu dùng, chúng ta thường sử dụng các dạng log hoặc bán log, vì các hệ số có thể được giải thích như các hệ số co giãn hoặc hệ số bán con giãn. 2 Đánh giá kết quả Các hệ số độ dốc có dấu đúng như kỳ vọng. Nếu thỏa mãn các giả định của mô hình hồi quy tuyến tính cổ điển, thì các hệ số ước lượng có ý nghĩa thống kê “cao”, vì các giá trị xác suất p rất thấp. Hệ số co giãn theo thu nhập là 0.8 cho chúng ta biết rằng, khi giữ nguyên các biến khác không đổi, nếu thu nhập khả dụng thực cá nhân tăng thêm 1%, thì chi tiêu cho tiêu dùng trung bình tăng thêm khoảng 0.8%. Hệ số của tài sản khoảng 0.20 cho chúng ta biết bằng nếu tài sản thực tăng thêm 10%, thìchi tiêu cho tiêu dùng trung bình tăng thêm khoảng 0.2%, khi giữ nguyên các biến khác không đổi. Hệ số bán co giãn theo lãi suất cho chúng ta biết rằng nếu lãi suất tăng thêm một điểm phần trăm (không phải 1%), thì chi tiêu cho tiêu dùng trung bình giảm xuống khoảng 0.25%, khi giữ nguyên các biến khác không đổi. R2 cao và các thống kê khác trong bảng kết quả trên có thể cho thấy rằng mô hình hồi quy rất phù hợp, mặc dù chúng ta nên thận trọng với một giá trị R2 gần như bằng 1. Điều này bởi vì khả năng hồi quy giả mạo (spurious regression) xảy ra khi cả biến phụ thuộc và các biến giải thích tăng qua thời gian. [Diễn giải: Khi các biến trong mô hình là các chuỗi không dừng thì hồi quy có thể cho kết quả R2 cao, t cao, nhưng R2 > DW]. Nhưng chúng ta sẽ thảo luận chủ đề này chi tiết hơn ở chương về kinh tế lượng chuỗi thời gian (chương 13 của cuốn sách này). Vì chúng ta đang xử lý dữ liệu chuỗi thời gian, có ta phải dè chừng hiện tượng tự tương quan (hoặc tương quan chuỗi). Nếu có tự tương quan trong hạng nhiễu, thì các sai số chuẩn ước lượng, và tự bản thân nó, các giá trị t ước lượng sẽ bị nghi ngờ. Vì thế, trước khi chúng ta chấp nhận các kết quả được trình bày trong bảng trên, chúng ta cần kiểm tra xem có sự hiện diện của hiện tượng tự tương quan hay không. 6.2 Các kiểm định tự tương quan Mặc dù có nhiều kiểm định tự tương quan, nhưng ở đây chúng ta sẽ chỉ thảo luận một vài cách, cụ thể là phương pháp đồ thị (graphical method), kiểm định Durbin-Watson, và kiểm định Breusch-Godfrey (BG)5. Phương pháp đồ thị Khi đánh giá các kết quả hồi quy thì một cách thực hành tốt là luôn luôn phải vẽ đồ thị phần dư từ mô hình được ước lượng để nhận diện ra các manh mối về sự khả năng vi phạm một hoặc nhiều hơn một trong số các giả định OLS. Như một tác giả lưu ý: “Bất kỳ ai cố gắng phân tích một chuỗi thời gian mà không vẽ đồ thị là đang tìm đến rắc rối”6. Ví dụ, trong thảo luận của chúng ta về phương sai thay đổi, chúng ta vẽ đồ thị phần dư bình phương theo giá trị ước lượng của biến phụ thuộc để tìm ra một dạng nào đó trong các phần dư này, điều này có thể gợi ý loại chuyển hóa mà bạn có thể thực hiện đối với mô hình gốc để trong mô hình được chuyển hóa chúng ta không gặp vấn đề phương sai thay đổi. 5 6 Để tìm hiểu các phương pháp khác dùng để phát hiện tự tương, xem Gujarati/Porter, Chương 12, trang 429-40. Chris Chatfield, The Analysis of Time Series: An Introduction, 6th edn, Chapman and Hall, 2004, p.6. 3 Vì tự tương quan là sự tương quan giữa các hạng nhiễu, ut, nên một phương pháp đơn giản tình thế để kiểm định tự tương quan đơn giản là vẽ các giá trị của ut theo thời gian. Không may, chúng ta không thể quan sát các ut một cách trực tiếp. Thứ mà chúng ta có thể quan sát là các đại diện của chúng, tức các et, tức phần dư mà chúng ta có thể quan sát sau khi ước lượng mô hình hồi quy. Mặc dù các et không hoàn toàn giống các ut, nhưng các et là các ước lượng nhất quán của các ut, theo nghĩa là khi cỡ mẫu tăng, thì các et hội tụ về các giá trị thực, tức các ut, của chúng. Mẫu của chúng ta với 54 quan sát thì về mặt kỹ thuật không phải là lớn, nhưng chúng bao quát dữ liệu cả giai đoạn sau chiến tranh thế giới lần thư hai. Thậm chí nếu chúng ta mở rộng cỡ mẫu đến cuối năm 2009, thì chúng ta sẽ chỉ có thêm có 9 quan sát. Vì thế, chúng ta không thể làm nhiều về cỡ mẫu của chúng ta. Bằng cách vẽ dữ liệu các et theo thời gian, chúng ta có thể có một ấn tượng trực giác về khả năng tồi tại vấn đề tự tương quan. Thực hiện như thế, chúng ta có được Hình 6.1. Hình 6.1: Phần dư (nhân với 100) và phần dư chuẩn hóa. Hình này cho thấy rằng phần dư S1 thu được từ hồi quy (6.1) và phần dư chuẩn hóa, S2, tức đơn giản là lấy S1 chia cho sai số chuẩn của hồi quy [Diễn giải: Tức là căn bậc hai của RSS / bậc tự do]. Để tương đồng về quy mô, chúng ta nhân S1 với 100. [Diễn giải: Cách tạo S1 và S2 trên Eviews:] ls lnconsump c lndpi lnwealth interest scalar se_reg=0.011934 genr S2=resid/se_reg genr S1=resid*100 plot s1 s2 4 Các đồ thị S1 và S2 cho thấy một dạng chuyển động lên – xuống, điều này cho chúng ta biết rằng các phần dư có tương quan với nhau. Điều này có thể được thấy rõ hơn nếu chúng ta vẽ đồ thị phần dư tại thời điểm t the phần phần dư tại thời điểm (t - 1), như trong Hình 6.2. Hình 6.2: Phần dư hiện hành và phần dư trễ một giai đoạn. [Diễn giải: Để vẽ được Hình 6.2 trên Eviews, chúng ta thực hiện như sau: Chọn Quick\Graph …, nhập tên biến, ví dụ resid và resid(-1), và chọn tiếp như bảng dưới đây:] 5 Đường hồi quy trong Hình 6.2 cho thấy rõ ràng rằng các phần dư có mối tương quan dương với nhau. [Diễn giải: Cách vẽ Hình 6.1 trên Stata]: Ngay sau khi hồi quy với Stata -2 -1 0 1 2 3 predict s1, resid gen s1_100=100*s1 label var s1_100 "Residuals" predict s2, rstandard twoway (line s1_100 time) (line s2 time) 0 20 40 Time Residuals Standardized residuals [Diễn giải: Dạng đồ thị phần dư và nhận dạng loại tự tương quan] Tự tương quan dương: 6 60 Tự tương quan âm: 7 Không có tự tương quan: Kiểm định d Durbin-Watson7 Kiểm định nổi tiếng nhất và thường được sử dụng nhất để phát hiện tương quan chuỗi được phát triển bởi hai nhà thống kê Durbin và Watson, và được biết rộng rãi với tên gọi là thống kê d Durbin-Watson. Thống kê d Durbin-Watson được định nghĩa như sau: Đây là tỷ số của tổng bình phương khác biệt giữa hai phần dư liền kề nhau so với tổng bình phương phần dư. Lưu ý rằng bậc tự do trên tử số là (n - 1), vì chúng ta mất một quan sát để tạo ra các chênh lệch liền kề của phần dư. Cũng lưu ý rằng giá trị d luôn nằm giữa 0 và 48. [Diễn giải: Công thức (6.2) có thể được triễn khai như sau: d= 2 𝑡=𝑛 2 𝑡=𝑛 ∑𝑡=𝑛 𝑡=2 𝑒𝑡 + ∑𝑡=2 𝑒𝑡−1 −2 ∑𝑡=2 𝑒𝑡 𝑒𝑡−1 2 ∑𝑡=𝑛 𝑡=1 𝑒𝑡 (a) 𝑡=𝑛 2 2 Do ∑𝑡=𝑛 𝑡=2 𝑒𝑡 và ∑𝑡=2 𝑒𝑡−1 chỉ khác nhau một quan sát, nên chúng được xem là xấp xỉ bằng nhau, vậy công thức (a) có thể được viết gọn lại như sau: d = 2 (1 − 7 8 ∑𝑡=𝑛 𝑡=2 𝑒𝑡 𝑒𝑡−1 2 ∑𝑡=𝑛 𝑡=1 𝑒𝑡 ) (b) Để biết thêm chi tiết, xem Gujarati/Porter, Chương 12. Để biết chi tiết, xem Gujarati/Porter, Chương 12, trang 435 – 6. 8 Nếu đặt 𝜌 ̂ = ∑𝑡=𝑛 𝑡=2 𝑒𝑡 𝑒𝑡−1 2 ∑𝑡=𝑛 𝑡=1 𝑒𝑡 , ta có: d = 2(1 − 𝜌̂) (c) Qua công thức (c) chúng ta thấy 0 < d < 4, vì -1 < 𝜌̂ < 1; 𝜌̂ = 1, d = 0, và 𝜌̂ = -1, d = 4]. Giá trị d Durbin-Watson cho ví dụ của chúng ta là 1.2829 1.28. Chúng ta làm gì với giá trị này? Trước khi chúng ta tìm hiểu thống kê d được sử dụng như thế nào, điều quan trọng cần nhớ là các giả định cơ bản của thống kê d. Các giả định này là: 1. Mô hình hồi quy có hệ số cắt9. 2. Các biến giải thích là cố định trong lấy mẫu lặp đi lặp lại. 3. Các hạng nhiễu, ut, theo cơ chế tự hồi quy bậc một [AR(1), first-order autoregressive scheme]: Trong đó, (rho) là hệ số tự tương quan (coefficient of autocorrelation) [Diễn giải: Ước lượng của hệ số này chính là AC bậc 1 trong giản đồ tự tương quan của Eviews], nằm trong khoảng -1 < < 1. Nó được gọi là AR bậc một bởi vì chỉ liên quan đến hạng nhiễu hiện tại và hạng nhiễu trễ một giai đoạn. vt là hạng nhiễu ngẫu nhiên. 4. Hạng nhiễu ut theo phân phối chuẩn. 5. Các biến giải thích không bao gồm các giá trị trễ của biến phụ thuộc, Yt, nghĩa là, các biến giải thích không bao gồm các biến Yt-1, Yt-2, Yt-3, và các số hạng trễ khác của Y. Như bạn có thể thấy, các giả định này có thể khá hạn chế trong thực tế. Phân phối xác suất chính xác của d thì khó để suy ra bởi vì nó phụ thuộc vào một cách phức tạp về các giá trị được nhận của các biến giải thích. Và vì các giá trị mà các biến giải thích nhận được có tính đặc thì của mẫu, nên không có cách duy nhất để suy ra phân phối mẫu của d. Tuy nhiên, dựa trên cỡ mẫu và số lượng các biến giải thích, Durbin và Watson có thể thiết lập hai giá trị tới hạn (critical values) của thống kê d, gọi là dL và dU, gọi là giới hạn dưới và giới hạn trên. Vì thế, nếu giá trị d tính toán nằm dưới giới hạn dưới, hoặc trên giới hạn trên, hoặc nằm giữa hai giá trị giới hạn, thì một quyết định có thể được thực hiện về sự tồn tại hiện tượng tự tương quan hay không. Quy tắc quyết định như sau: 1. Nếu d < dL, có thể có bằng chứng về tự tương quan dương. 2. Nếu d > dU, có thể có bằng chứng tự tương quan âm. 3. Nếu dL < d < dU, không có kết luận xác định về tự tương quan dương. 9 Nếu không có hệ số cắt, Farebrother đã điều chỉnh kiểm định d để tính đến trường hợp này. Để biết thêm chi tiết, xem Gujarati/Porter, trang 434. 9 4. Nếu dU < d < 4 – dL, không có bằng chứng về tự tương quan dương hoặc âm. 5. Nếu 4 – dU < d < 4 – dL, không có kết luận xác định về tự tương quan âm. 6. Nếu 4 - dL < d < 4, có thể có bằng chứng về tự tương quan âm. Như đã lưu ý, giá trị d nằm giữa 0 và 4. Càng gần về 0, càng có bằng chứng về tự tương quan dương; và càng gần về 4, càng có bằng chứng về tự tương quan âm. Nếu d khoảng bằng 2, không có bằng chứng về tự tương quan âm hoặc dương bậc một. [Diễn giải: Chúng ta có thể minh họa bằng sơ đồ sau đây:] Durbin và Watson chuẩn bị các bảng về các giới hạn dưới và giới hạn trên của thống kê d cho một số quan sát được chọn (tối đa đến 200) và số biến giải thích (tối đa đến 10) và cho các mức ý nghĩa 5% và 1%. Trở lại với hàm tiêu dùng của chúng ta, chúng ta có n = 54, X (số biến giải thích) = 3. Các giá trị phê phán ở mức ý nghĩa 5% cho kết hợp này (sử dụng n = 55): (1,4552, 1.681). Vì giá trị d Durbin-Watson tính toán là khoảng 1.28, giá trị này nằm dưới giới hạn dưới, nên chúng ta kết luận rằng có thể có tự tương quan dương trong hạng nhiễu. Giá trị d phê phán ở mức ý nghĩa 1% là (1.284, 1.506). Giá trị tính toán d hơi thấp hơn giới hạn dưới, một lần nữa cho thấy rằng hồi quy của chúng ta có thể bị hiện tượng tự tương quan dương bậc một. [Diễn giải: Cách kiểm định d Durbin-Watson trên Stata, … dùng giá trị xác suất, khỏi cần tra bảng]: 10 [ Lưu ý: burbinalt chính là thống kê Durbin h, sẽ được thảo luận ở phần sau. Kiểm định Breusch – Godfrey (BG) về tự tương quan10 Để tránh vài tính chất hạn chế của kiểm định d, Breusch và Godfrey đã phát triển một kiểm định tự tương quan mang tính tổng quát hơn, kiểm định này cho phép: (1) Các giá trị trễ của biến phụ thuộc được đưa vào mô hình như các biến giải thích, (2) Cơ chế tự tương quan bậc cao hơn, chẳng hạn AR(2) và AR(3), và (3) Các số hạng trung bình di động (MA) của hạng nhiễu, như ut-1, ut-2, …11 Để minh họa kiểm định BG, giả sử trong phương trình (6.1), hạng nhiễu theo cấu trúc như sau: Trong đó, vt là hạng nhiễu theo các giả định cổ điển thông thường. Phương trình (6.4) là một cấu trúc tự hồi quy AR(p) trong đó hạng nhiễu hiện tại phụ thuộc vào các hạng nhiễu trước đó cho tới độ trễ p. Giá trị chính xác của p thường là một quá trì thử và sai [Diễn giải: Thường dựa vào các tiêu chí AIC hoặc SIC để xác định độ trễ tối ưu, hoặc dựa vào giản đồ tự tương quan (xem bài giảng về chuỗi dừng)], mặc dù trong hầu hết các chuỗi thời gian kinh tế bạn không phải chọn một giá trị p cao. Giả thuyết H0 như sau: Nghĩa là, không có tương quan chuỗi ở bất kỳ độ trễ nào. 10 Để biết chi tiết, xem Gujarati/Porter, trang 438 – 40. Ví dụ, một cơ chế AR(2) nghĩa là hồi quy giá trị hạng nhiễu hiện tại của một biến theo các độ trễ một và hai giai đoạn của nó. Trong khi, một cơ chế MA(1) là hồi quy theo hạng nhiễu hiện tại và giá trị giai đoạn trước đó của hạng nhiễu. Cơ chế MA được thảo luận chi tiết hơn ở Chương 16. 11 11 Trong thực tế, chúng ta chỉ quan sát các phần dư et, đó là các ước lượng của ut. Vì thế, kiểm định BG được thực hiện theo các bước sau đây: 1. Ước lượng phương trình (6.1) theo OLS và thu phần dư et. 2. Hồi quy et theo các biến giải thích trong mô hình (6.1) và p hạng nhiễu tự hồi quy như trong phương trình (6.4), nghĩa là chạy hồi quy sau đây: và thu được R2 từ hồi quy phụ này. 3. Nếu cỡ mẫu lớn (về mặt kỹ thuật, là vô cùng), thì BG cho thấy rằng: Nghĩa là, trong mẫu lớn, (n - p) nhân với R2 theo phân phối Chi bình phương với p bậc tự do. 4. Một cách khác, chúng ta có thể sử dụng giá trị F thu được từ hồi quy (6.6) để kiểm định giả thuyết H0 trong (6.5). Giá trị F này lần lượt có (p, n – k - p) bậc tự do trên tử và dưới mẫu, trong đó k thể hiện số tham số trong phương trình (6.1) (bao gồm cả hệ số cắt). Vì thế, nếu trong một ứng dụng, giá trị Chi bình phương tính toán lớn hơn giá trị Chi bình phương phê phán tại một mức ý nghĩa được chọn, chúng ta có thể bác bỏ giả thuyết H0 cho rằng không có tự tương quan, trong trường hợp đó ít nhất có một giá trị p trong (6.6) khác 0 một cách có ý nghĩa thống kê. Nói cách khác, chúng ta có một hình thức tự tương quan nào đó. Hầu hết các phần mềm thống kê hiện nay đều có trình bày giá trị xác suất p của giá trị Chi bình phương ước lượng, nên chúng ta không cần chọn mức ý nghĩa một cách tùy tiện. Tương tự, nếu giá trị F tính toán lớn hơn giá trị F phê phán tại một mức ý nghĩa cho trước, chúng ta cũng có thể bác bỏ giả thuyết H0 cho rằng không có tự tương quan. Thay vì chọn mức ý nghĩa, chúng ta có thể dựa vào giá trị xác suất p của thống kê F ước lượng và bác bỏ giả thuyết H0 nếu giá trị p này thấp. Hai kiểm định này cho các kết quả tương tự, điều này không có gì ngạc nhiên vì chúng ta biết rằng có mối quan hệ giữa thống kê F và Chi bình phương12. Trước khi minh họa kiểm định, các tính chất sau đây của kiểm định BG mà ta cần phải lưu ý: 1. Kiểm định đòi hỏi rằng phương sai của hạng nhiễu ut, khi cho trước các giá trị của các biến giải thích và các số hạng trễ của hạng nhiễu, là đồng nhất. Nếu điều này không xảy ra, chúng ta sẽ phải sử dụng phương sai điều chỉnh phương sai thay đổi, chẳng hạn như sai số chuẩn mạnh theo thủ tục của White. 12 Mối quan hệ này như sau: Đối với bậc tự do ở mẫu số lớn, thì bậc tự do ở tử số nhân với giá trị F xấp xỉ bằng giá trị Chi bình phương với số bậc tự do của tử số, trong đó m và n lần lượt là các bậc tự do của mẫu và tử số. 12 2. Một vấn đề thực tế khi áp dụng kiểm định BG là việc lựa chọn số số hạng trễ của hạng nhiễu, p, trong phương trình (6.4). Giá trị p có thể phụ thuộc vào loại chuỗi thời gian. Đối với dữ liệu theo tháng, chúng ta có thể đưa vào 11 biến trễ của hạng nhiễu, đối với dữ liệu theo quý, chúng ta có thể đưa vào 3 biến trễ của hạng nhiễu, và đối với dữ liệu theo năm, một độ trễ của hạng nhiễu có thể đủ. Dĩ nhiên, chúng ta có thể chọn số độ trễ theo cách thử và sai và chọ giá trị p dựa vào các tiêu chi AIC và SIC (xem chương 2). Giá trị các tiêu chí này càng nhỏ, thì mô hình càng tốt. Quay lại ví dụ về hàm tiêu dùng của chúng ta, các kết quả hồi quy (6.6) như sau: Để minh họa, chúng ta chỉ đưa vào một biến trễ của phần dư trong hồi quy này bởi vì chúng ta có dữ liệu theo năm. Kết quả được trình bày trong Bảng 6.3. Như các kết quả này cho thấy, có bằng chứng mạnh về tự tương quan bậc một, vì cả các giá trị F và Chi bình phương đều có ý nghĩa cao bởi vì các giá trị xác suất p rất thấp. Bảng 6.3: Kiểm định BG về tự tương quan của hàm tiêu dùng. Chúng ta cũng ước lượng mô hình bao gồm 2 và 3 độ trễ của hạng nhiễu. Tiêu chí AIC cho các giá trị lần lượt là -6.01, -6.0, -5.96 cho một, hai và 3 độ trễ của hạng nhiễu trong phương trình (6.6). Mặc dù không có khác biệt đáng kể trong các giá trị này, trên cơ sở thông tin AIC, nhưng chúng ta chọn mô hình với giá trị âm lớn nhất, ở đây là -6.01, vì thế chúng ta có thể biện minh cho việc sử dụng một biến trễ của hạng nhiễu trong phương trình (6.6) là phù hợp13. Cũng vậy, các hệ số của các hạng trễ thứ hai và thứ 3 cũng không có ý nghĩa thống kê. 13 Lưu ý rằng -5.96 lớn hơn -6.00, và số này lớn hơn -6.01. 13 [Diễn giải: Kểm điện BG trên Eviews và Stata:] 6.3 Các biến pháp khắc phục Nếu chúng ta thấy có tự tương quan trong một áp dụng thực tế, chúng ta cần để ý điều này, vì tùy vào mức độ nghiêm trọng của nó mà chúng ta có rút ra những kết luận sai lầm bởi vì các sai số chuẩn OLS thông thường có thể bị chệch nghiêm trọng. Bây giờ, vấn đề mà chúng ta đối mặt là chúng ta không biết cấu trúc tương quan của các hạng nhiễu ut như thế nào, vì chúng không thể quan sát một cách trực tiếp. 14 Tuy nhiên, như trong trường hợp của phương sai thay đổi, chúng ta cần sử dụng đến ước đoán dựa trên cơ sở kinh nghiệm (educated guess) hoặc một loại chuyển hóa nào đó về mô hình hồi quy gốc để trong mô hình đã được chuyển hóa chúng ta không còn gặp phải vấn đề tương quan chuỗi nữa. Có nhiều cách chúng ta có thể thử áp dụng. Chuyển hóa sai phân bậc 1 Giả sử tự tương quan là loại AR(1), như trong phương trình (6.3), chúng ta có thể viết như sau: Nếu chúng ta biết giá trị của , chúng ta có thể lấy giá trị hiện tại của hạng nhiễu trừ cho nhân với giá trị hạng nhiễu trước đó một giai đoạn. Hạng nhiễu thu được, vt, sẽ thỏa mãn các giả định chuẩn của OLS. Vì thế, chúng ta có thể chuyển hóa hồi quy gốc như sau: Số hạng cuối cùng trong phương trình này đơn giản là vt, bây giờ không còn tương quan chuỗi nữa. Mô hình được chuyển hóa vì thế có thể được ước lượng theo OLS. Tất tả điều mà chúng ta phải làm là chuyển hóa mỗi biến trong mô hình gốc bằng cách lấy giá trị ở hiện tại trừ cho nhân với giá trị trước đó và chạy hồi quy. Các hệ số ước lượng thu được từ mô hình đã được chuyển hóa là các ước lượng tuyến tính không chệch tốt nhất (BLUE). Nhưng lưu ý rằng trong chuyển hóa này, chúng ta mất một quan sát, bởi vì đối với mỗi quan sát đầu tiên không có quan sát trước đó. Nếu mẫu tương đối lớn, mất một quan sát có thể không phải là vấn đề. Nhưng nếu cỡ mẫu nhỏ, thì việc mất một quan sát đầu tiên có nghĩa là các ước lượng sẽ không còn BLUE. Tuy nhiên, có một thủ tục, gọi là chuyển hóa Prais-Winsten, vẫn tính đến quan sát đầu tiên14. Bây giờ câu hỏi đặt ra là: chúng ta ước lượng như thế nào? Chúng ta biết rằng -1 < < 1. Vì thế, bất kỳ giá trị nào trong khoảng này có thể được sử dụng để chuyển hóa mô hình gốc, như trong phương trình (6.9). Nhưng chúng ta nên chọn một giá trị nào, vì có vô số các giá trị trong khoảng này? Nhiều chuỗi thời gian kinh tế có tự tương quan với nhau rất cao, gợi ý rằng một giá trị = 1 có thể là thích hợp để chuyển hóa mô hình gốc. Nếu thực sự điều này đúng, thì phương trình (6.9) có thể được viết như sau: 14 Chúng ta sẽ không theo đuổi thủ tục này ở đây, vì nó đã được xây dựng sẵn trong các phần mềm. Để biết thêm chi tiết, xem Gujarati/Porter, trang 442-3. 15 Ở đây, là toán tử sai phân bậc một. Ví dụ, lnCt = (lnCt – lnCt-1). Phương trình (6.10) được gọi là chuyển hóa sai phân bậc 1. Ngược lại, phương trình (6.1) được gọi là hồi quy dạng gốc (level form regression). Khi ước lượng phương trình (6.10), lưu ý rằng không có hệ số cắt. Vì thế, khi ước lượng mô hình này bạn phải bỏ hệ số cắt ra. Hầu hết các phần mềm có thể thực hiện một cách dễ dàng. Sử dụng Eviews, một kết quả thực nghiệm của phương trình (6.10) được trình bày trong Bảng 6.4. Bảng 6.4: Chuyển hóa sai phân bậc 1 của hàm tiêu dùng. [Diễn giải: Trên Eviews, chúng ta không cần tạo ra các biến sai phân, vì chúng ta có thể sử dụng trực tiếp các lệnh hàm log hoặc sai phân, ví dụ LS D(LOG(CONSUMPTION)) D(LOG(PDI)) D(LOG(WEALTH)) D(INTEREST). Trong Stata, ta phải tạo ra các biến log trước, sau đó dùng lệnh như sau: reg d.lnconsump d.lndpi d.lnwealth d.interest, nocon]. Nếu chúng ta kiểm định tự tương quan của hồi quy này bằng kiểm định BG, chúng ta thấy rằng không bằng chứng về tự tương quan, cho dù chúng ta sử dụng 1, 2, hoặc nhiều độ trễ của hạng nhiễu trong phương trình (6.4). Nếu chúng ta so sánh các kết quả hồi quy của hồi quy gốc được cho trong Bảng 6.2 và các kết quả thu được từ chuyển hóa sai phân bậc 1 trong Bảng 6.4, chúng ta thấy rằng hệ số co giãn của theo thu nhập gần như giống nhau, nhưng hệ số co giãn theo tài sản, mặc dù vẫn có ý nghĩa thống kê, nhưng hầu như chỉ bằng một phần hai và hệ số bán con giãn theo lãi suất thực tế là bằng 0 và sai dấu. Kết quả này có thể là do chọn sai giá trị để chuyển hóa. Nhưng cơ bản hơn là nó có thể phải thực hiện với tính dừng của một hoặc nhiều biến, một chủ đề chúng ta sẽ khám phá chi tiết ở chương về kinh tế lượng chuỗi thời gian (Chương 13 của cuốn sách này). 16 Chúng ta nên nhấn mạnh rằng các giá trị R2 trong hồi quy dạng gốc (Bảng 6.2) và trong dạng sai phân bậc 1 (Bảng 6.4) không thể so sánh trực tiếp bởi vì biến phụ thuộc trong hai mô hình là khác nhau. Như được lưu ý trước đây, để so sánh hai hoặc nhiều giá trị R2, biến phụ thuộc phải giống nhau. Chuyển hóa tổng hóa Vì sẽ lãng phí thời gian để thử nhiều giá trị để chuyển hóa mô hình gốc, chúng ta có thể tiến hành theo kiểu hơi phân tích. Ví dụ, nếu giả định ut theo cơ chế AR(1) là phù hợp, chúng ta có thể hồi quy et theo et-1, sử dụng et làm biến đại diện cho ut, một giả định có thể phù hợp trong các mẫu lớn, bởi vì trong các mẫu lớn 𝜌̂ là ước lượng nhất quán của [Lưu ý: Trong sách ghi et là không đúng]. Đó nghĩa là chúng ta ước lượng: Ở đây 𝜌̂ là ước lượng của được cho trong phương trình (6.8). Một khi chúng ta có được một giá trị ước lượng của từ phương trình (6.11), chúng ta có thể sử dụng giá trị này để chuyển hóa mô hình như trong phương trình (6.9) và ước lượng mô hình được chuyển hóa. Các giá trị ước lượng của các tham số thu được vì thế được biết với tên gọi là các ước lượng bình phương bé nhất tổng quát khả thi (FGLS, feasible generalized least squares estimators). Sử dụng dữ liệu của chúng ta, giá trị 𝜌̂ thu được là 0.3246. Một cách khác để có một ước lượng của , đặc biệt trong các mẫu lớn, là sử dụng mối quan hệ sau đây giữa và d Durbin-Watson: Ở đây d là DW d thu được từ hồi quy gốc. Trong ví dụ của chúng ta, d bằng 1.2892. Vì thế chúng ta có: Chúng ta có thể sử dụng giá ước lượng này của để chuyển hóa mô hình gốc. Các giá trị ước lượng từ phương trình (6.11) và (6.12) là gần giống nhau. Nên lưu ý rằng 𝜌̂ được ước lượng từ (6.11) và (6.12) cung cấp một giá trị ước lượng nhất quán của giá trị thực. Để minh họa chúng ta sử dụng 𝜌̂ = 0.3246 và thu được các kết quả như được trình bày trong Bảng 6.5. Bây giờ, chúng ta phần tích phần dư từ hồi quy này để xem có tương quan chuỗi hay không, ví dụ sử dụng kiểm định BG. Sử dụng 1 và 2 độ trễ trong phương trình (6.6), chúng ta thấy rằng thống kê BG ước lượng không có ý nghĩa thống kê, điều này chỉ ra rằng các phần dư trong cách chuyển hóa AR(1) không có tự tương quan: giá trị Chi bình 17 phương của kiểm định BG cho một độ trễ của phần dư là 0.0094, với xác suất khoảng 92%. Bảng 6.5: Hàm tiêu dùng được chuyển hóa với 𝜌̂ = 0.3246. Nếu bạn so sánh các kết quả trong bảng này với các kết quả trong Bảng 6.2, bạn sẽ thấy các sai số chuẩn của các hệ số trong hai bảng khác nhau một cách đáng kể, nhưng nhớ rằng Bảng 6.2 chưa có điều chỉnh tự tương quan, trong khi Bảng 6.5 có điều chỉnh tự tương quan. Độ lớn của các hệ số co giãn theo thu nhập và tài sản gần như giống nhau trong hai bảng, mặc dù các sai số chuẩn, và vì thế các giá trị t, là khác nhau. Các giá trị tuyệt đối của t thấp hơn trong Bảng 6.5 cho chúng ta thấy rằng các sai số chuẩn OLS ban đầu được ước lượng thấp, đúng như thảo luận của chúng ta về các hậu quả của ước lượng OLS khi có hiện diện tự tương quan. Hệ số của biến lãi suất trong mô hình chuyển hóa có dấu đúng, nhưng nó vẫn không có ý nghĩa thống kê. Một lần nữa, điều này có thể là vì các lý do vừa được thảo luận ở trên. Các giá trị R2 trong hai bảng gần giống nhau, nhưng chúng ta không thể so sánh chúng một cách trực tiếp vì các lý do đã được thảo luận trước đây. Trước khi tiếp tục phân tích sâu hơn, chúng ta cần lưu ý rằng chuyển hóa dạng AR(1) là một trường hợp cụ thể của một dạng chuyển hóa tổng quát hơn, như dạng AR(p) đã được trình bày ở phương trình (6.4). Ví dụ, nếu hạng nhiễu theo cơ chế AR(2). thì Ở đây vt theo các giả định chuẩn của OLS. Trong trường hợp này, chúng ta sẽ chuyển hóa biến phụ thuộc và các biến giải thích bằng cách lấy giá trị hiện tại của mỗi biến trừ 18 cho hai giá trị trước đó của chúng, mỗi giá trị đó lần lượt được nhân với các hệ số tự tương quan 1, và 2. Trong thức tế, dĩ nhiên chúng ta thay thế các ut không thể quan sát được bằng các ước lượng của chúng, tức là các et. Nhưng chúng ta không cần phải thực hiện bằng tay. Ví dụ, trong eviews, nếu bạn đưa thêm các số hạng AR(1) và AR(2) khi chạy hồi quy PLS, vì mỗi số hạng AR được đưa vào mô hình sẽ tiêu hao một bậc tự do. Phương pháp Newey-West để điều chỉnh các số chuẩn của OLS. Tất cả các phương pháp tìm kiếm các hệ số tự tương quan đã được thảo luận về cơ bản là các phương pháp thử và sai. Các phương này sẽ thành công như thế nào trong một ứng dụng thực tế sẽ tùy thuộc vào bản chất của vấn đề và cở mẫu. Nhưng nếu cỡ mẫu lớn, thì bạn có thể ước lượng hồi quy OLS theo cách thông thường, nhưng điều chỉnh các sai số chuẩn của các hệ số hồi quy, theo một phương pháp được đề xuất bời Newey và West. Các sai số chuẩn được điều chỉnh theo thủ tục của họ cũng được biết với tên gọi các sai số chuẩn HAC (heteroscedasticity and autocorrelation consistent)15. Nói chung, nếu có tự tương quan, các sai số theo phương pháp HAC được tìm thấy lớn hơn các sai số chuẩn theo phương pháp OLS thông thường. Thủ tục HAC bây giờ được đưa vào trong nhiều phần mềm. Chúng ta minh họa thủ tục này cho hàm tiêu dùng. Sử dụng Eviews, chúng ta thu được kết quả như trong Bảng 6.6. Nếu bạn so sánh các sai số chuẩn HAC với các sai số chuẩn OLS trong Bảng 6.2, bạn sẽ thấy rằng chúng không khác nhau đáng kể. Điều này cho thấy rằng mặc dù có bằng chứng tự tương quan dựa trên nhiều kiểm định tự tương quan, nhưng vấn đề tự tương quan dường như không quá nghiêm trọng. Điều này có thể do sự thật rằng sự tương quan được phát hiện trong hạn nhiễu, khoảng 0.32 và 0.35, có thể là không quá cao. Dĩ nhiên, câu trả lời này là riêng biệt cho trường hợp dữ liệu của chúng ta và không có sự đảm bảo rằng điều này sẽ xảy ra trong mọi trường hợp. Bảng 6.6: Các sai số chuẩn HAC của hàm tiêu dùng. 15 Công thức toán học đằng sau phương pháp này khá phức tạp. Nếu bạn biết đại số ma trận, bạn có thể tham khảo William H. Greene, Econometric Analysis, 6th edn, Pearson/Prentice Hall, New Jersey, 2008. 19 [Diễn giải: Để hiểu công thức toán, chúng ta có thể xem Giáo trình kinh tế lượng UEH: Chapter 12, pp. 431 – 34]. Tình cờ, quan sát thấy rằng các giá trị hệ số ước lượng trong hai bảng là giống nhau, cũng như các thống kê tóm tắt khác. Nói cách khác, thủ tục HAC chỉ thay đổi các sai số chuẩn, và vì thế các thống kê t và các giá trị xác suất p. Điều này tương tự như các sai số chuẩn điềi chỉnh phương sai thay đổi theo thủ tục của White, nghĩa là, cũng không ảnh hưởng đến các hệ số hồi quy gốc và các thống kê tóm tắt khác. Nhưng hãy nhớ rằng thủ tục HAC chỉ có hiệu lực trong các mẫu lớn16. [Diễn giải: Phương pháp Newey-West trên Eviews và Stata] 16 Về các hạn chế của thủ tục HAC, xem Jeffrey M. Wooldridge, Introductory Econometrics, 4 th edn, SouthWestern, Ohio, 2009, pp. 428-31. 20 [Diễn giải: Mở rộng phương pháp FGLS bằng thủ tục lặp Cochrane-Orcutt và thủ tục lặp Prais-Winsten] Cochrane và Orcutt (1949) phát triển một thủ tục lặp vốn trở nên khá phổ biến trong giới nghiên cứu kinh tế lượng. Thủ tục Cochrane-Orcutt được thực hiện theo các bước sau đây: Bước 1: Ước lượng phương trình sau đây theo OLS và lưu phần dư et. Yt = b1 + b2Xt + et (*) Bước 2: Ước lượng hệ số tương quan chuỗi bậc một, ̂ , theo OLS từ phương trình sau đây: et = ̂ et-1 + vt Bước 3: Chuyển hóa các biến gốc theo cách sau đây: Yt* = Yt − ˆ Yt −1 , b*1 = b1(1 - ̂ ), và X*t = Xt - ̂ Xt-1 cho các quan sát từ t = 2 trở đi; và Y1* = Y1 1 − ˆ 2 và X *i1 = X i1 1 − ˆ 2 cho quan sát t = 1. Bước 4: Hồi quy lại phương trình (*) với các biến chuyển hóa và lưu phần dư của mô hình vừa được chuyển hóa này. Do chúng ta không biết có phải ̂ từ Bước 2 là giá trị ước lượng “tốt nhất” của chưa, nên chúng ta quay trở lại như Bước 2, tiếp tục thực hiện quy trình này từ Bước 2 đến Bước 4 (bước lặp) một số lần cho đến khi nào giá trị ước lượng của ở hai lần lặp liền kề khác nhau rất ít (ví dụ 0.001). Tuy nhiên, nếu chúng ta thực hiện thủ tục lặp này một cách thủ công (ước lượng, tính toán, rồi ước lượng lại, v.v.) sẽ tốn kém rất nhiều thời gian. Chính vì thế, các thủ tục lặp này luôn được lập trình trong hầu hết các phần mềm kinh tế lượng. Trên thực tế, thủ tục này trở nên rất đơn giản với Eviews. Giả sử lúc đầu ta có phương trình: ls lnconsump c lndpi lnwealth interest [như Bảng 6.2] Thì thủ tục lặp của Cochrane-Orcutt trên Eviews chỉ đơn giản là ước lượng phương trình sau đây: ls lnconsump c lndpi lnwealth interest AR(1) 21 Trong kết quả hồi quy, hệ số ứng với AR(1) chính là giá trị ̂ tối ưu sau một số bước lặp. Lưu ý rằng, nếu mô hình hồi quy có hiện tượng tự tương quan bậc 2, thì thủ tục lặp của Cochrane – Orcutt trên Eviews sẽ như sau: ls lnconsump c lndpi lnwealth interest AR(1) AR(2) Như vậy, giá trị ̂ tối ưu theo thủ tục lặp Cochrane-Orcutt là 0.61. Bây giờ, thống kê d Durbin-Watson gần bằng 2, chứng tỏ không còn tự tương quan với FGLS với giá trị ̂ = 0.61. Trên Stata: 22 Thủ tục lặp Prais-Winsten cũng tương tự, nhưng khác ở cách xử lý quan sát đầu tiên như sau: Y*t = √(1 − ρ̂2 )Yt và X*t = √(1 − ρ̂2 )X t Trong Eviews không có sẵn thủ tục này, nhưng Stata thì ta sử dụng lệnh sau: 23 6.4 Đánh giá mô hình Một giả định quan trọng của mô hình hồi quy tuyến tính cổ điển là mô hình được sử dụng trong phân tích là mô hình được xác định đúng (correctly specified model). Đây là một yêu cầu cao, vì tìm một mô hình đúng giống như tìm Holy Grail (tức Chén Thánh). Trong thực tế, chúng ta sử dụng các nghiên cứu thực nghiệm trước đây đã được công bố trong cùng lĩnh vực nghiên cứu như một hướng dẫn, thu thập dữ liệu có sẵn tốt nhất, và sử dụng phương pháp ước lượng tốt nhất có thể. Mặc dù thế, việc xây dựng mô hình là một nghệ thuật. Trong ngữ cảnh của chương này, tự tương quan có thể xảy ra vì nhiều lý do, chẳng hạn như tính trì trệ, lỗi dạng mô hình, và hiện tượng Cobweb (mạng nhện), thao tác dữ liệu, và tính không dừng17. Để minh họa, chúng ta sẽ xem xét trường hợp lỗi dạng mô hình. Bây giờ, xem xét một xác định lại của mô hình (6.1): Mô hình này khác mô hình (6.1) ở chổ chúng ta đưa thêm biến log của chi tiêu cho tiêu dùng trễ một giai đoạn như một biến giải thích và thay ký hiệu hệ số từ B sang A để xem liệu có bất kỳ khác biệt nào giữa chúng. Mô hình (6.15) được gọi là mô hình tự hồi quy (autoregressive model) bởi vì một trong số biến giải thích là giá trị trễ của biến phụ thuộc. Lý do đưa thêm giá trị trễ của biến tiêu dùng vào mô hình là để xem liệu chi tiêu cho tiêu dùng trong quá khứ có ảnh hưởng chi tiêu cho tiêu dùng ở hiện tại. Nếu có, thì đó sẽ là yếu tố trì trệ (hoặc quán tính) được đề cập ở trên. Từ bảng này chúng ta thấy rõ ràng rằng độ trễ của tiêu dùng có ảnh hưởng chi tiêu cho tiêu dùng hiện tại, khi giữ nguyên các biến khác không đổi. Điều này có thể do tính trì trệ. Các hệ số trong Bảng 6.2 và 6.7 thoạt nhìn thì khác nhau, nhưng thực sự không phải 17 Một thảo luận vắn tắt về vấn đề này, xem Gujarati/Porter, trang 414-18. 24 thế, vì nếu bạn chia cả hai vế cho (1 – 0.2765) = 0.7235, thì bạn sẽ có các giá trị của hệ số gần như giống với Bảng 6.218. Bảng 6.7: Hàm tiêu dùng tự hồi quy. Liệu chúng ta có gặp vấn đề tự tương quan trong mô hình được chỉnh sửa lại này hay không? Ở đây, chúng ta không thể sử dụng kiểm định d Durbin-Watson bởi vì, như đã được lưu ý trước đây, kiểm định này không thể áp dụng nếu mô hình có các giá trị trễ của biến phụ thuộc, tức như trường hợp ở đây. Giả định có tự tương quan bậc một, Durbin đã phát triển một kiểm định khác thay thế cho các mô hình như thế, gọi là thống kê h Durbin19. 18 Trong dài hạn, khi chi tiêu cho tiêu dùng ổn định, LCt = LCt-1. Vì thế, nếu bạn chuyển 0.2765LCt sang vế trái, bạn sẽ có 0.7235LCt. Sau khi chia cả hai vế cho 0.7235 bạn sẽ có các kết quả có thể so sánh với Bảng 6.2. 19 Để biết một thảo luận về kiểm định này, xem Gujarati/Porter, trang 465. 25 Dưới giả thuyết H0 rằng = 0, trong các mẫu lớn, thống kê h theo phân phối chuẩn chuẩn hóa, nghĩa là, h ~ N(0,1). Bây giờ, từ các tính chất của phân phối chuẩn chúng ta biết rằng xác suất để |h| > 1.96 là khoảng 5%, trong đó |h| có nghĩa là giá trị tuyệt đối của h. Đối với ví dụ của chúng ta, giá trị h khoảng 5.43, lớn hơn giá trị h phê phán ở mức ý nghĩa 5%, nên chúng ta có kết luận rằng mô hình (6.15) cũng gặp vấn đề tự tương quan bậc một. [Diễn giải: Kết quả trên Stata sử dụng thống kê Chi bình phương chứ không phải phân phối chuẩn chuẩn hóa, và kết luận vẫn không thay đổi]. Thay vì sử dụng kiểm định này, chúng ta sẽ sử dụng kiểm định BG, vì nó cho phép các giá trị trễ của biến phụ thuộc như các biến giải thích. Sử dụng kiểm định BG, và sử dụng hai giá trị trễ của phần dư, vẫn có bằng chứng về tự tương quan; các giá trị xác suất p là 0.09 (kiểm định F) và 0.07 (kiểm định Chi bình phương) (Bảng 6.8). Bảng 6.8: Kiểm định BG về tự hồi quy của hàm tiêu dùng tự hồi quy. 26 Dù sử dụng mô hình nào, (6.1) hay (6.15), thì dường như chúng ta đều gặp vấn đề tương quan chuỗi trong dữ liệu của chúng ta. Một lưu ý kỹ thuật: Vì chúng ta có một biến trễ của biến phụ thuộc như một trong những biến giải thích và tương quan chuỗi, các hệ số hồi quy ước lượng trong phương trình (6.15) có thể bị chệch cũng như không nhất quán. Một giải pháp của vấn đề này là sử dụng một biến công cụ (IV, instrumental variable hoặc instrument), cho biến trễ của biến phụ thuộc theo một cách mà biến công cụ được chọn có tương quan (có thể là cao) với biến phụ thuộc nhưng không tương quan với hạng nhiễu. Chủ đề này tương đối phức tạp và chúng ta sẽ dành một chương cho ước lượng biến công cụ (Chương 19). Mộ giải pháp được đề nghị là sử dụng giá trị trễ của biến thu nhập như một biến công cụ thay vì giá trị trễ của biến chi tiêu cho tiêu dùng. Nhưng chúng ta sẽ nói nhiều hơn về vấn đề này ở chương 19. Để giải quyết vấn đề tự tương quan trong hạng nhiễu, chúng ta có thể sử dụng một hoặc nhiều phương pháp khắc phục đã được đề cập ở trên, hoặc có thể sử dụng phương pháp Newey – West và thu được các sai số chuẩn HAC hoặc các sai số chuẩn mạnh. Kết quả này được trình bày trong Bảng 6.9. Bảng 6.9: Các sai số chuẩn HAC của hàm tiêu dùng tự hồi quy. So sánh các kết quả trong Bảng 6.6 và 6.9, rõ ràng rằng các sai số chuẩn của các hệ số trong Bảng 6.6 bị ước lượng thấp. Một lần nữa hãy nhớ rằng thủ tục điều chỉnh HAC chỉ có hiệu lực trong các mẫu lớn. Mô hình (6.15) không phải là cách duy nhất trong đó mô hình gốc có thể được xác định lại. Thay vì đưa giá trị trễ của biến phụ thuộc giữa các biến giải thích, chúng ta có thể đưa các giá trị trễ của các biến giải thích, ví dụ LDPI. Hoặc chúng ta có thể đưa cả hai20. 20 Để biết chi tiết, xem Gujarati/Porter, Chương 17. 27 6.5 Tóm tắt và kết luận Trong chương này, chúng ta đã khảo sát hơi sâu chủ đề tự tương quan. Dữ liệu chuỗi thời gian thường gặp phải vấn đề tự tương quan. Trước hết chúng ta thảo luận bản chất và các hậu quả của tự tương quan, sau đó chúng ta thảo luận các phương pháp phát hiện tự tương quan, và rồi chúng ta xem xét các cách trong đó vấn đề tự tương quan có thể được giải quyết. Vì nói chung chúng ta không biết các hạng nhiễu thực trong một mô hình hồi quy, trong thực tế chúng ta phải suy đoán bản chất của tự tương quan trong một ứng dụng cụ thể bằng cách phân tích phần dư, đó là các đại diện tốt của hạng nhiễu thực nếu cỡ mẫu là tương đối lớn. Chúng ta có thể vẽ đồ thị phần dư, hoặc sử dụng các kiểm định DurbinWatson, hoặc Breusch-Godfrey. Nếu các kiểm định tự tương quan cho thấy rằng tự tương quan tồn tại trong một trường hợp cụ thể, chúng ta có thể chuyển hóa mô hình gốc sao cho trong mô hình được chuyển hóa chúng ta không còn gặp vấn đề tự tương quan. Nhưng nói dễ hơn làm, vì chúng ta không biết cấu trúc thực của tự tương quan trong tổng thể của một mẫu được rút ra. Vì thế chúng ta cố gắng thử nhiều cách chuyển hóa, chẳng hạn như chuyển hóa dạng sai phân bậc một và sai phân tổng quát. Thông thường thì đây là một quá trình thử và sai. Nếu cỡ mẫu tương đối lớn, chúng ta có thể sử dụng các sai số chuẩn mạnh hoặc các sai số chuẩn theo phương pháp HAC, cách này không đòi hỏi bất kỳ kiến thức đặc biệt nào về bản chất của tự tương quan. Thủ tục HAC đơn giản là điều chỉnh các sai số chuẩn của OLS, mà không làm thay đổi các giá trị của các hệ số hồi quy. Vì các ước lượng OLS vẫn nhất quán mặc dù có tự tương quan, nên sự đột phá của các phương pháp điều chỉnh được thảo luận trong chương này là ước lượng các sai số chuẩn của các hệ số hồi quy càng hiệu quả càng tốt sao cho chúng ta không rút ra các kết luận sai lầm về ý nghĩa thống kê của một hoặc nhiều hệ số hồi quy./. 28