TRƢỜNG ĐẠI HỌC KINH TẾ TPHCM HƢỚNG DẪN THỰC HÀNH STATA 12 PHẦN CƠ BẢN TRẦN THỊ TUẤN ANH 14 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 TRẦN THỊ TUẤN ANH - UEH 2 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 LỜI MỞ ĐẦU Stata là phần mềm xử lý số liệu rất mạnh, được sử dụng phổ biến trong đào tạo và nghiên cứu về Kinh tế lượng. Tài liệu Hướng dẫn thực hành Stata 12 được soạn ra để phục vụ cho sinh viên, học viên cao học, nghiên cứu sinh, các nhà nghiên cứu muốn tìm hiểu thực hành các kiến thức Kinh tế lượng trên phần mềm Stata Số liệu thực hành được sử dụng trong tài liệu này có thể được tìm thấy tại trang web http://sites.google.com/site/anhttt - mục số liệu thực hành. Đây là tài liệu được soạn thảo lần đầu tiên nên còn rất nhiều thiếu sót. Mọi góp ý giúp cải thiện tài liệu xin gửi về địa chỉ mail anhttt@gmail.com. Tác giả xin trân trọng mọi ý kiến đóng góp. Trần Thị Tuấn Anh TRẦN THỊ TUẤN ANH - UEH 3 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 TRẦN THỊ TUẤN ANH - UEH 4 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 MỤC LỤC CHƢƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12 .................................................. 8 1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12....................................................... 8 1.1.1. Khởi động phần mềm Stata ........................................................................... 8 1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA ................................ 9 1.2.1. Nhập liệu trực tiếp từ bàn phím ..................................................................... 9 1.2.4. Mở một tập tin số liệu có sẵn của Stata ....................................................... 13 1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA ................................................ 14 1.3.1. Lƣu dữ liệu .................................................................................................. 14 1.3.2. Lƣu kết quả xử lý số liệu ............................................................................. 14 1.4. a. Sao chép và cắt dán ..................................................................................... 14 b. Sử dụng file log ........................................................................................... 15 TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA .......................... 17 1.4.1. Xóa biến trong Stata .................................................................................... 17 1.4.2. Đổi tên biến trong Stata ............................................................................... 18 1.4.3. Tạo biến mới từ những biến đã có ............................................................... 19 1.5. THOÁT KHỎI PHẦN MỀM STATA ............................................................... 21 CHƢƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA ............................................... 22 2.1. MÔ TẢ SỐ LIỆU ............................................................................................... 22 2.1.1. Mô tả tập tin số liệu ..................................................................................... 22 2.1.2. Thực hiện mô tả tóm tắt số liệu ................................................................... 22 2.1.3. Vẽ đồ thị phân tán ........................................................................................ 24 2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS ...................... 25 2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS ................ 26 2.2.2. Hệ số xác định và kiểm định hệ số xác định ............................................... 27 2.2.3. Khoảng tin cậy của hệ số hồi quy ................................................................ 28 TRẦN THỊ TUẤN ANH - UEH 5 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 2.2.4. Kiểm định giả thuyết về hệ số hồi quy ........................................................ 29 a. Kiểm định giả thuyết hai phía...................................................................... 29 b. Kiểm định giả thuyết phía phải.................................................................... 30 c. Kiểm định giả thuyết phía trái ..................................................................... 31 d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số hồi quy .................................................................................................................. 31 2.3. PHẦN DƢ CỦA MÔ HÌNH HỒI QUY ......................................................... 32 2.3.1. Vẽ biểu đồ histogram của phần dƣ .............................................................. 33 2.3.2. Kiểm định tính chuẩn của phần dƣ .............................................................. 33 2.4. XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG ........................... 34 CHƢƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH ................................................. 36 3.1. HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ ............................................... 36 3.2. DẠNG HÀM LOG –LOG; DẠNG HÀM LOG –LIN; DẠNG HÀM LIN – LOG ............................................................................................................................ 36 3.2.1. Dạng hàm log – log ..................................................................................... 36 3.2.2. Dạng hàm log – lin ...................................................................................... 37 3.2.3. Dạng hàm lin – log ...................................................................................... 38 3.3. DẠNG HÀM BẬC HAI (QUADRATIC MODEL) .......................................... 39 CHƢƠNG 4 : HỒI QUY VỚI BIẾN GIẢ ................................................................... 40 4.1. GIỚI THIỆU BIẾN GIẢ .................................................................................... 40 4.2. HỒI QUY VỚI BIẾN GIẢ ................................................................................. 40 4.3. HỒI QUY VỚI BIẾN TƢƠNG TÁC ................................................................ 41 4.4. Tạo biến giả từ biến định tính ............................................................................ 43 4.4.1. Tạo bằng lệnh tabulate ................................................................................. 43 4.4.2. Dùng biến factor .......................................................................................... 44 4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE IN DIFFERENCE ......................................................................................................... 45 4.6. ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM................................... 45 TRẦN THỊ TUẤN ANH - UEH 6 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƢƠNG 5 : ĐA CỘNG TUYẾN .............................................................................. 48 5.1. PHÁT HIỆN ĐA CỘNG TUYẾN ..................................................................... 48 5.1.1. Hệ số tƣơng quan ......................................................................................... 48 5.1.2. Nhân tử phóng đại phƣơng sai (vif) ............................................................ 49 5.2 PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN .............................................49 CHƢƠNG 6 : PHƢƠNG SAI THAY ĐỔI .................................................................. 51 6.1. PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI ......................................................... 52 6.1.1. Đồ thị phần dƣ ............................................................................................. 52 6.1.2. Kiểm định Breusch – Pagan ........................................................................ 52 6.1.3. Kiểm định White ......................................................................................... 53 6.2. XỬ LÝ PHƢƠNG SAI THAY ĐỔI .................................................................. 55 6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai ............................................ 55 6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS) ............................... 56 CHƢƠNG 7 : TỰ TƢƠNG QUAN ............................................................................. 58 7.1. KIỂM ĐỊNH TỰ TƢƠNG QUAN .................................................................... 59 7.1.1. Đồ thị phần dƣ ............................................................................................. 59 7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function) ......................... 60 7.1.3. Kiểm định Durbin – Watson ........................................................................ 60 7.1.4. Kiểm định Breusch – Godfrey ..................................................................... 61 7.2. XỬ LÝ TỰ TƢƠNG QUAN ............................................................................. 62 7.2.1. Ma trận ƣớc lƣợng hiệp phƣơng sai Newey - West..................................... 62 7.2.2. Khắc phục tự tƣơng quan bằng GLS – thủ tục Prais - Winsten .................. 63 TÀI LIỆU THAM KHẢO ............................................................................................ 65 TRẦN THỊ TUẤN ANH - UEH 7 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12 1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12 1.1.1. Khởi động phần mềm Stata Tên gọi Stata đƣợc viết tắt từ Statistics và data. Việc khởi động Stata có thể đƣợc thực hiện bằng nhiều cách: Cách 1 : Khởi động bằng cách nhấp chuột kép (double - click) vào biểu tƣợng phần mềm trên màn hình chính (Desktop) của hệ điều hành. - Cách 2 : Khởi động bằng cách nhấp chuột kép vài những tập tin số liệu có phần mở rộng là dta. Đây là những tập tin số liệu củ Stata. Khi nhấp chuột kép vào những tập tin này, hệ điều hành sẽ tự động khởi động phần mềm Stata để đọc tập tin loại này. Lưu ý : trong một vài trƣờng hợp, hệ điều hành chƣa nhận dạng đƣợc tập tin *.dta là tập tin của Stata, để mở tập tin cần nhấp chuột phải trên tập tin .dta cần mở, chọn “Open with” và chọn “Choose default program”. Sau đó nhất nút lệnh “Browse” trên cửa sổ hiện ra và chỉ đƣờng dẫn đến nơi cài đặt Stata hoặc chỉ đƣờng dẫn đến màn hình chính có biểu tƣợng Stata . Giao diện của phần mềm Stata 12 sau khi khởi động sẽ gồm có 4 cửa sổ chính Command : cửa sổ lệnh, là nơi để nhập các câu lệnh cần thực hiện Results : cửa sổ kết quả, để hiển thị kết quả thực thi các câu lệnh Review : cửa sổ xem lại, nơi liệt kê tất cả các câu lệnh đã sử dụng từ khi Stata đƣợc khởi động Variables : cửa sổ tên biến, liệt kê danh sách các biến đang đƣợc sử dụng TRẦN THỊ TUẤN ANH - UEH 8 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Phía trên bên trái của màn hình Stata là hệ thống thực đơn chính (main menus) Phía dƣới hệ thống thực đơn chính là thanh công cụ hiển thị các nút lệnh ứng với các chức năng thƣờng đƣợc sử dụng của Stata 1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA 1.2.1. Nhập liệu trực tiếp từ bàn phím Nếu muốn nhập liệu trực tiếp vào Stata, ngƣời dùng cần sử dụng màn hình nhập liệu (Data editor window) của Stata bằng cách nhấp chuột vào nút lệnh edit trên thanh công cụ Hoặc dùng lệnh TRẦN THỊ TUẤN ANH - UEH 9 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Khi đó, cửa sổ nhập liệu sẽ hiển thị. 1.2.2. Sao chép và cắt dán từ Excel Thay vì gõ số liệu trực tiếp, ta có thể sao chép số liệu từ Excel và dán vào Stata. Đầu tiên, mở tập tin Excel có chứa dữ liệu, đánh dấu khối những dữ liệu cần sao chép (kể cả dòng tên biến trên cùng); sau đó nhấn Ctrl+C để thực hiện sao chép. Sau đó, chuyển qua cửa sổ nhập liệu của Stata, nhấn Ctrl + V để dán số liệu. Vì dòng đầu tiên là tên biến nên chú ý chọn mục “Treat first row as variable name” trong hộp hội thoại hiện ra sau khi dán dữ liệu. Số liệu sau khi dán sẽ có dạng sau: TRẦN THỊ TUẤN ANH - UEH 10 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Dữ liệu sau khi chuyển sang Stata nhƣ trên đã sẵn sàng cho việc xử lý. 1.2.3. Nhúng một file số liệu từ Excel Để việc nhập liệu đƣợc thuận tiện, Stata còn cho phép nhúng (import) một tập tin dữ liệu có sẵn ở những định dạng khác (nhƣ txt, csv, xls, SAS…). Tuy nhiên, định dạng thƣờng gặp nhất là xls hoặc xlsx của Excel. Chức năng này đƣợc thực hiện bằng cách chọn mục import trong thực đơn File của hệ thống thực đơn chính hoặc dùng lệnh import của Stata. Lệnh import đƣợc nhập theo ví dụ sau. Hoặc dùng hệ thống thực đơn của Stata : File/Import/Excel spreadsheet TRẦN THỊ TUẤN ANH - UEH 11 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Sau khi chọn chức năng từ hệ thống thực đơn, cửa sổ nhúng tập tin sẽ hiện ra. Ta phải chỉ đƣờng dẫn đến tập tin, chọn sheet có số liệu, chọn vùng có số liệu trên sheet đã chọn. Nếu dòng đầu tiên của tập tin là tên biến thì chọn vào ô import first row as variable name và sau đó nhấn OK Các biến sau khi đƣợc nhập trực tiếp hoặc nhúng vào Stata sẽ hiển thị ra trong cửa sổ TRẦN THỊ TUẤN ANH - UEH 12 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 biến số bên phải của màn hình Stata 1.2.4. Mở một tập tin số liệu có sẵn của Stata Nếu đã có sẵn tập tin số liệu của Stata trên máy tính, có thể mở trực tiếp tập tin này bằng lệnh use Hoặc chọn từ hệ thống thực đơn File/Open và chỉ rõ đƣờng dẫn đến tập tin cần mở trong cửa sổ hiện ra Hoặc sử dụng nút lệnh Open trên thanh công cụ TRẦN THỊ TUẤN ANH - UEH 13 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA 1.3.1. Lƣu dữ liệu Muốn lƣu dữ liệu đã nhập vào Stata, sử dụng lệnh save Hoặc dùng thực đơn File/Save hoặc File/Save as Hoặc sử dụng nút lệnh save từ thanh công cụ 1.3.2. Lƣu kết quả xử lý số liệu Sau khi xử lý số liệu, kết quả xử lý số liệu đƣợc lƣu bằng nhiều cách. a. Sao chép và cắt dán Nếu muốn sao chép và xuất kết quả xử lý số liệu ra Word hoặc Excel, có thể dùng các chức năng copy đƣợc Stata hỗ trợ. Trƣớc hết, chọn mảng kết quả cần sao chép trên cửa số Result, nhấp chuột phải và chọn một trong số các chức năng copy trên thực đơn hiện ra. TRẦN THỊ TUẤN ANH - UEH 14 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Mỗi chức năng copy của Stata có một định dạng khác nhau. Do đó, nên lựa chọn chức năng phù hợp nhất với yêu cầu. Tuy nhiên, lựa chọn thông dụng nhất là copy table để sao chép số liệu vì định dạng này giữ nguyên hàng – cột của kết quả cần sao chép, đồng thời cho phép kẻ khung hoặc trang trí lại cách trình bày. Lựa chọn copy as picture sẽ xuất kết quả dạng ảnh nên không thể trang trí lại theo yêu cầu. b. Sử dụng file log Những kết quả thực hiện lệnh đƣợc hiển thị ra trên cửa sổ kết quả results không thể lƣu đƣợc bằng lệnh save. Nếu muốn lƣu những kết quả này, cần sử dụng tập tin log. Tập tin log của Stata có hai định dạng : dạng tập tin .txt và dạng tập tim .smcl . Tuy nhiên, dạng .smcl thƣờng đƣợc sử dụng vì nó giữ nguyên định dạng kết quả mà Stata xuất ra. Để tạo một tập tin .smcl, dùng lệnh. Phía sau từ khóa using là đƣờng dẫn và tên của tập tin log sẽ đƣợc tạo Hoặc có thể dùng hệ thống thực đơn File/Log/Begin TRẦN THỊ TUẤN ANH - UEH 15 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Sau các thao tác trên, ở cửa sổ kết quả sẽ hiển thị các thông tin cho biết tập tin log đã đƣợc tạo Và thanh trạng thái ở cuối cửa sổ kết quả sẽ có dòng chữ Kể từ lúc này trở đi, các câu lệnh cũng nhƣ kết quả thực hiện câu lệnh đó sẽ đƣợc Stata lƣu lại trong tập tin log. Sau khi kết thúc các thao tác, nếu muốn dừng lƣu và đóng tập tin log thì dùng lệnh Hoặc chọn từ thực đơn chính File /Log/ Close TRẦN THỊ TUẤN ANH - UEH 16 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Lưu ý : những kết quả thực hiện chỉ đƣợc lƣu khi tập tin log đã đƣợc tạo, có dấu hiệu log on ở cuối cửa sổ lệnh. Những kết quả thực hiện lệnh trƣớc khi tạo tập tin log hoặc sau khi tập tin log đã đƣợc đóng đều không đƣợc lƣu lại. 1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA 1.4.1. Xóa biến trong Stata Để xóa bớt một hay nhiều biến trong số các biến đã tạo có thể dùng lệnh drop. Phía sau tên lệnh là danh sách các biến cần xóa, mỗi tên biến cách nhau một khoảng trắng. Nếu muốn xóa tất cả các biến trong tập tin số liệu, dùng lệnh Nếu muốn xóa những biến có cùng những ký tự đầu trong tên giống nhau, ví vụ nhƣ var01, var02, var03; dùng lệnh Thay vì dùng lệnh drop, ta chọn một hoặc nhiều biến cần xóa ở cửa sổ tên biến, nhấp TRẦN THỊ TUẤN ANH - UEH 17 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 chuộc phải và chọn mục Drop Selected Variables từ thực đơn hiện ra. 1.4.2. Đổi tên biến trong Stata Tên biến đƣợc đổi bằng lệnh rename Ví dụ, đổi tên biến DT thành tên biến doanhthu Nếu không dùng lệnh, có thể dùng chức năng của Stata. Trƣớc hết , cần hiển thị lại số liệu của các biến đã có bằng lệnh Hoặc có thể chọn nút lệnh “browse” trên thanh công cụ Sau khi thực hiện lệnh Browse, cửa sổ số liệu sẽ hiện ra TRẦN THỊ TUẤN ANH - UEH 18 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Góc trên bên phải của cửa sổ này là danh sách biến, góc dƣới là các tính chất tƣơng ứng của biến đƣợc chọn trên danh sách biến nhƣ tên, kiểu số liệu… Do vậy, để đổi tên biến, cần chọn biến cần đổi tên ở danh sách biến và gõ tên mới vào ô Name ở phần properties bên dƣới. Lưu ý : Vì Stata phân biệt chữ hoa và chữ thƣờng rất rõ ràng nên phải cẩn thận vấn đề chữ hoa – chữ thƣờng trong tên biến. Đồng thời tên biến không đƣợc có khoảng trắng hoặc các ký tự đặc biệt nhƣ -, *, {, +, %.% # @ ^ …. 1.4.3. Tạo biến mới từ những biến đã có Dùng lệnh generate hoặc viết gọn là gen Ví dụ tạo biến lnDoanhThu bằng logarit cơ số tự nhiên của biến DoanhThu đã có TRẦN THỊ TUẤN ANH - UEH 19 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Tên của biến mới sau khi đƣợc tạo sẽ đƣợc thêm vào cửa sổ danh sách biến ở góc phải màn hình chính Hoặc tạo biến DoanhThu2 bằng bình phƣơng của biến DoanhThu Lưu ý : Một số toán tử và hàm số thƣờng dùng trong Stata khi tạo biến hoặc xử lý số liệu Dấu cộng + Phủ định ~ Dấu trừ - Nhỏ hơn < Dấu nhân * Nhỏ hơn hoặc bằng <= Dấu chia / Lớn hơn > Dấu lũy thừa ^ Lớn hơn hoặc bằng >= Toán tử “và” & Hàm ex : Toán tử hoặc | Hàm log nepe : ln() So sánh bằng == So sánh khác != hoặc ~= TRẦN THỊ TUẤN ANH - UEH exp() 20 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 1.5. THOÁT KHỎI PHẦN MỀM STATA Để kết thúc sử dụng phần mềm Stata, có thể thoát khỏi phần mềm bằng cách gõ lệnh exit vào cửa sổ lệnh và nhấn phím “Enter”. Hoặc chọn mục “Exit” trong thực đơn con của mục File trong thực đơn chính TRẦN THỊ TUẤN ANH - UEH 21 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA 2.1. MÔ TẢ SỐ LIỆU Trƣớc khi tiến hành hồi quy, số liệu có thể đƣợc mô tả để kiểm tra xem liệu số liệu có phù hợp với yêu cầu nghiên cứu. 2.1.1. Mô tả tập tin số liệu Dùng lệnh describe để mô tả các thông tin chung nhất về tập tin số liệu nhƣ số quan sát, số biến, kích thƣớc tập tin, tên các biến, kiểu số liệu của từng biến, và nhãn của biến (nếu có) Kết quả mô tả tập tin nhƣ sau 2.1.2. Thực hiện mô tả tóm tắt số liệu Dùng lệnh summarize với cú pháp cơ bản nhƣ sau TRẦN THỊ TUẤN ANH - UEH 22 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 summarize [varlist] [if] [, options] Ví dụ Lưu ý : Nếu sau lệnh summarize mà không liệt kê tên biến, phần mềm sẽ hiển thị thông tin của tất cả các biến hiện có trong tập tin số liệu. Nếu muốn mô tả chi tiết, có thể tùy chọn detail vào cuối lệnh summarize sau khi đã thêm dấu phẩy TRẦN THỊ TUẤN ANH - UEH 23 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 2.1.3. Vẽ đồ thị phân tán Stata vẽ đƣợc rất nhiều loại đồ thị nhƣng đồ thị phân tán là dạng đồ thị thƣờng dùng nhất khi phân tích hồ quy. Ngƣởi dùng vẽ đồ thị phân tán của hai biến bằng lệnh scatter scatter [varlist] [if] [, options] scatter thƣờng đƣợc dùng để vẽ đồ thị giữa hai biến.Trong varlist, biến đầu tiên đƣợc liệt kê là biến ở trục tung, biến tiếp theo sẽ là biến ở trục hoành. Kết quả thực hiện câu lệnh : Để vẽ đồ thị từ gốc tọa độ hoặc thêm tiêu đề, cần thêm các tùy chọn nhƣ trong câu lệnh sau: TRẦN THỊ TUẤN ANH - UEH 24 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Kết quả thực hiện lệnh : Để lƣu đồ thị, dùng lệnh Hoặc có thể nhấn nút lƣu trên thanh công cụ của cửa sổ đồ thị. Sau đó chọn đƣờng dẫn và đặt tên cho đồ thị cần lƣu. Phần mở rộng trong tên đồ thị của Stata là .gph 2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS Trong Stata, ngoài việc ƣớc lƣợng mô hình, phần mềm còn hỗ trợ rất nhiều các kiểm định để đánh giá và lựa chọn mô hình TRẦN THỊ TUẤN ANH - UEH 25 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS Hàm hồi quy tuyến tính k biến có dạng nhƣ sau Y 1 2 X 2 3 X 3 ... k X k U Hàm hồi quy mẫu tƣơng ứng Y ˆ1 ˆ2 X 2 ˆ3 X 3 ... ˆk X k e Việc ƣớc lƣợng mô hình hồi quy tuyến tính mẫu bằng phƣơng pháp OLS trên Stata đƣợc thực hiện bằng lệnh regress với cú pháp nhƣ sau: regress depvar [indepvars] [if] [, options] Biến đƣợc nhập sau tên lệnh regress là biến phụ thuộc. Tất cả các tên biến đƣợc liệt kê sau biến phụ thuộc là biến độc lập. Tùy chọn [if] đƣợc dùng để giới hạn số liệu cần đƣa vào hồi quy. Ví dụ sau sử dụng số liệu của tập tin doanhthu.dta để hồi quy tuyến tính theo hàm hồi quy DoanhThu 1 2ChaoHang 3QuangCao U Trong đó : DoanhThu thể hiện doanh thu của doanh nghiệp, đơn vị tính là triệu đồng/tháng. ChaoHang là biến thể hiện chi phí chào hàng (triệu đồng/tháng) QuangCao là chi phí quảng cáo của doanh nghiệp (triệu đồng/tháng) Để hồi quy theo ví dụ trên, trƣớc hết, mở tập tin doanhthu.dta bằng Stata. Sau đó, hồi quy bằng lệnh: Hoặc có thể gọi chức năng hồi quy này từ hệ thống thực đơn chính Statistics/Linear models and related/ Linear regression TRẦN THỊ TUẤN ANH - UEH 26 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Khi nhập hàm hồi quy, ta không cần nhập hệ số tự do vì Stata đã mặc định thêm hệ số tự do vào hàm hồi quy. Kết quả hồi quy thu đƣợc nhƣ sau : Từ kết quả trên, hàm hồi quy ƣớc lƣợng đƣợc từ mẫu số liệu bằng phƣơng pháp OLS là DoanhThu 78,915 4, 472ChaoHang 2, 298QuangCao e 2.2.2. Hệ số xác định và kiểm định hệ số xác định Hệ số xác định R2 giúp đánh giá sự phù hợp của mô hình với mẫu nghiên cứu. Nó cho biết mức độ giải thích của các biến độc lập với sự biến động (quanh giá trị trung bình) của biến phụ thuộc. Ngoài R2, Stata cũng tính hệ số xác định hiệu chỉnh (Adjusted R2) và hiển thị cả hai trên bảng kết quả hồi quy. TRẦN THỊ TUẤN ANH - UEH 27 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 2.2.3. Khoảng tin cậy của hệ số hồi quy Y 1 2 X 2 3 X 3 ... k X k U Xét hàm hồi quy tổng thể Và hàm hồi quy mẫu tƣơng ứng Y ˆ1 ˆ2 X 2 ˆ3 X 3 ... ˆk X k e Khoảng tin cậy của j ,( j 1, k ) với độ tin cậy (1 ) đƣợc tính bằng công thức ˆ t j 2 se(ˆ j ), ˆ j t se(ˆ j ) 2 Trong đó : t là giá trị có đƣợc khi tra bảng t-Student, mức ý nghĩa 2 , bậc tự do n – k 2 Giá trị này có thể tra đƣợc bằng hàm TINV của Excel hoặc hàm invtail của Stata se(ˆ j ) là sai số chuẩn của ˆ j , đƣợc phần mềm Stata tính sẵn Tuy nhiên, Stata luôn tính sẵn khoảng tin cậy của hệ số hồi quy với độ tin cậy 95%. TRẦN THỊ TUẤN ANH - UEH 28 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Nếu muốn thay đổi độ tin cậy, ví dụ 99%, dùng tùy chọn level(99) sau lệnh regress 2.2.4. Kiểm định giả thuyết về hệ số hồi quy a. Kiểm định giả thuyết hai phía Giả sử cần kiểm định giả thuyết hai phía H0 : j 0 H1 : j 0 với độ tin cậy (1 ) Có 3 cách kiểm định Dùng khoảng tin cậy Dùng thống kê t Dùng p-value Kết quả hiển thị trên Stata hỗ trợ cả ba cách kiểm định này TRẦN THỊ TUẤN ANH - UEH 29 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Giả sử cần kiểm định giả thuyết hai phía H 0 : j 0 H1 : j 0 với độ tin cậy (1 ) và 0 là một số thực bất kỳ. Ví dụ cần kiểm định H 0 : ChaoHang 7 H1 : ChaoHang 7 với độ tin cậy 95% Dùng lệnh test của Stata Kết quả kiểm định nhƣ sau b. Kiểm định giả thuyết phía phải Giả sử cần kiểm định giả thuyết phía phải H0 : j 0 H1 : j 0 với độ tin cậy (1 ) Dùng thống kê t của kiểm định hai phía mà Stata đã tính sẵn, so sánh với giá trị t có đƣợc khi tra bảng t-Student với mức ý nghĩa bậc tự do n – k Giả sử cần kiểm định giả thuyết phía phải Ví dụ, để kiểm định H 0 : ChaoHang 7 H1 : ChaoHang 7 H 0 : j 0 H1 : j 0 với độ tin cậy (1 ) với độ tin cậy (1 ) , sử dụng lệnh lincom nhƣ sau : Kết quả sau khi thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 30 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Dùng t có đƣợc từ kết quả trên để so sánh với giá trị t có đƣợc khi tra bảng t-Student với mức ý nghĩa bậc tự do n – k Để tính p-value của kiểm định này, sau khi chạy lệnh lincom, có thể lần lƣợt thực hiện các lệnh sau Lệnh ttail() để tính p-value của kiểm định một phía dùng phân phối t-Student Kết quả thực thi cáclệnh trên nhƣ sau c. Kiểm định giả thuyết phía trái Tƣơng tự nhƣ kiểm định phía phải nhƣng so sánh với giá trị t d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số hồi quy Giả sử cần kiểm định giả thuyết H 0 : ChaoHang QuangCao H1 : ChaoHang QuangCao với độ tin cậy (1 ) Dùng lệnh test của Stata Kết quả thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 31 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Giả sử cần kiểm định giả thuyết H 0 : ChaoHang 2QuangCao H1 : ChaoHang 2QuangCao với độ tin cậy (1 ) Dùng lệnh test của Stata Kết quả kiểm định Giả sử cần kiểm định giả thuyết H 0 : ChaoHang QuangCao 10 H1 : ChaoHang QuangCao 10 với độ tin cậy (1 ) Dùng lệnh test của Stata Kết quả 2.3. PHẦN DƢ CỦA MÔ HÌNH HỒI QUY TRẦN THỊ TUẤN ANH - UEH 32 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Phần dƣ của mô hình hồi quy đƣợc lấy bằng lệnh 2.3.1. Vẽ biểu đồ histogram của phần dƣ Dùng lệnh histogram để vẽ biểu đồ histogram của phần dƣ Kết quả thực hiện lệnh 2.3.2. Kiểm định tính chuẩn của phần dƣ Dùng lệnh sktest để kiểm định tính chuẩn của sai số. Lệnh này đòi hỏi phải có ít nhất 8 TRẦN THỊ TUẤN ANH - UEH 33 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 quan sát trong mẫu số liệu. Kết quả hiển thị 2.4. XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG Để xuất nhiều kết quả hồi quy ra trên cùng một bảng với mỗi phƣơng trình là một cộng trong bảng, ngƣời dùng có thể dùng lệnh esttab với ví dụ minh họa nhƣ sau Kết quả xuất ra dạng bảng nhƣ sau TRẦN THỊ TUẤN ANH - UEH 34 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Lưu ý : nếu lệnh esttab chƣa có sẵn trong Stata, có thể cài đặt bằng cách dùng : TRẦN THỊ TUẤN ANH - UEH 35 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH 3.1. HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ Hàm hồi quy tuyến tính đi qua gốc tọa độ khi hệ số tự do bằng 0. Khi đó, hồi quy tổng thể có dạng Y 2 X 2 3 X 3 ... k X k U Ƣớc lƣợng hàm hồi quy qua gốc tọa độ bằng lệnh regress với tùy chọn noconstant Kết quả hồi quy 3.2. DẠNG HÀM LOG –LOG; DẠNG HÀM LOG –LIN; DẠNG HÀM LIN – LOG 3.2.1. Dạng hàm log – log Dạng hàm log –log có dạng ln(Y ) 1 2 ln( X ) U Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu ) 1 2 ln(ChaoHang ) U . TRẦN THỊ TUẤN ANH - UEH 36 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Các bƣớc cần thực hiện nhƣ sau : Kết quả 3.2.2. Dạng hàm log – lin Dạng hàm log –lin có dạng ln(Y ) 1 2 X U Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu ) 1 2ChaoHang U . Các bƣớc cần thực hiện nhƣ sau : Kết quả TRẦN THỊ TUẤN ANH - UEH 37 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Lưu ý : Nếu biến lnDoanhThu đã có sẵn thì không cần tạo lại bằng lệnh generate 3.2.3. Dạng hàm lin – log Dạng hàm log –lin có dạng Y 1 2 ln( X ) U Ví dụ : cần ƣớc lƣợng dạng hàm DoanhThu 1 2 ln(ChaoHang ) U . Kết quả Lưu ý : Nếu biến lnChaoHang đã có sẵn thì không cần tạo lại bằng lệnh generate TRẦN THỊ TUẤN ANH - UEH 38 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 3.3. DẠNG HÀM BẬC HAI (QUADRATIC MODEL) Hàm hồi quy dạng bậc hai có phƣơng trình Y 1 2 X 3 X 2 U Giả sử cần ƣớc lƣợng hàm hồi quy DoanhThu 1 2ChaoHang 3ChaoHang 2 U Các bƣớc thực hiện Kết quả thực hiện TRẦN THỊ TUẤN ANH - UEH 39 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 4 : HỒI QUY VỚI BIẾN GIẢ 4.1. GIỚI THIỆU BIẾN GIẢ Biến định tính là những biến số kinh tế mà giá trị không thể hiện bằng những con số mà bằng các tính chất mà bằng các lựa chọn. Để đƣa biến định tính vào hồi quy, ngƣời ta sử dụng biến giả (Dummy variable). Biến Dummy là những biến chỉ nhận giá trị 0 và 1. Biến này còn đƣợc gọi là biến nhị phân (Binary variable) hay là biến chỉ mục (indicator variable) 4.2. HỒI QUY VỚI BIẾN GIẢ Sử dụng tập tin số liệu ThuNhapTPHCM.dta, tiến hành mô tả số liệu Trong tập tin này có các biến giả NgoaiNgu, DNNN, HoKhau, GioiTinh. Việc hồi quy với các biến giả này không có gì khác với hồi quy các biến định lƣợng thông thƣờng. Tuy nhiên, việc giải thích hệ số hồi quy của biến giả rất khác với biến định lƣợng. TRẦN THỊ TUẤN ANH - UEH 40 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Giả sử cần hồi quy hàm tiền lƣơng có dạng lnThuNhap 1 2 KinhNghiem 4GioiTinh 5 NgoaiNgu 6 HoKhau U Việc hồi quy đƣợc thực hiện bằng câu lệnh sau Kết quả hồi quy 4.3. HỒI QUY VỚI BIẾN TƢƠNG TÁC Giả sử cần tƣơng tác giữa biến KinhNghiem và GioiTinh để xem biến GioiTinh có làm thay đổi tác động biên của KinhNghiem đến biến lnThuNhap hay không. Dạng hàm hồi quy với biến tƣơng tác nhƣ sau : lnThuNhap 1 2 KinhNghiem 3 KinhNghiem GioiTinh 4 NgoaiNgu 5 HoKhau U Tạo biến tƣơng tác TRẦN THỊ TUẤN ANH - UEH 41 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Thực hiện hồi quy Kết quả hồi quy Lưu ý : thay vì dùng hai lệnh để tạo ra biến tƣơng tác rồi hồi quy nhƣ trên, kết quả tƣơng đƣơng có thể đƣợc tạo ra bằng cách dùng một lệnh duy nhất Kết quả thực hiện lệnh TRẦN THỊ TUẤN ANH - UEH 42 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 4.4. Tạo biến giả từ biến định tính 4.4.1. Tạo bằng lệnh tabulate Trong số liệu của tập tin ThuNhap_TPHCM có biến BangCap là biến định tính với các lựa chọn PTCS(Phồ thông cơ sở), PTTH (phổ thông trung học), CD (Cao đẳng), DH (Đại học), THS (Thạc sỹ) và KH(Khác) Để tạo các biến giả ứng với các lựa chọn của biến bằng cấp, dùng lệnh : Kết quả, Stata sẽ tạo ra 6 biến giả từ BangCap1 đến BangCap6 ứng với 6 lựa chọn, đƣợc mô tả nhƣ sau TRẦN THỊ TUẤN ANH - UEH 43 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 4.4.2. Dùng biến factor Những biến định tính đƣợc nhập vào theo kiểu số liệu numeric, thay vì tạo biến giả bằng lệnh tabulate, có thể dùng biến factor để đƣa vào mô hình Stata sẽ tự động thêm biến giả vào hàm hồi quy. Số biến giả thêm vào sẽ bằng số lựa chọn của biến BangCap trừ đi 1 TRẦN THỊ TUẤN ANH - UEH 44 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE IN DIFFERENCE Tƣơng tác giữa hai biến giả đƣợc gọi là phƣơng pháp D-I-D trong kinh tế lƣợng. Ví dụ sau tƣơng tác giữa hai biến giả GioiTinh và HoKhau Kết quả thực hiện lệnh 4.6. ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM Giả sử muốn ƣớc lƣợng một hồi quy thu nhập cho Nam giới và Nữ giới riêng biệt. Câu lệnh có thể dùng trong trƣờng hợp này nhƣ sau TRẦN THỊ TUẤN ANH - UEH 45 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Kết quả là sẽ có hai hàm hồi quy đƣợc ƣớc lƣợng Lưu ý : thay vì dùng tùy chọn by hoặc bysort, ta có thể dùng điều kiện if sau lệnh regress TRẦN THỊ TUẤN ANH - UEH 46 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Kết quả hồi quy cho nữ giới Kết quả hồi quy cho nam giới Kết quả cũng vẫn giống với dùng lệnh bysort ở trên. TRẦN THỊ TUẤN ANH - UEH 47 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 5 : ĐA CỘNG TUYẾN 5.1. PHÁT HIỆN ĐA CỘNG TUYẾN Đa cộng tuyến là hiện tƣợng các biến độc lập trong mô hình có mối quan hệ với nhau. Đa cộng tuyến hoàn hảo làm cho mô hình không ƣớc lƣợng đƣợc. Đa cộng tuyến không hoàn hảo có thể làm cho các biến độc lập cộng tuyến mất đi ý nghĩa trong mô hình hoặc có thể bị sai dấu của hệ số hồi quy. Tiếp tục sử dụng tập tin số liệu ThuNhapTPHCM.dta để hồi quy hàm thu nhập nhƣ sau lnThuNhap 1 2 KinhNghiem 3GioiTinh 4 NgoaiNgu 5 HoKhau U Mô hình ƣớc lƣợng đƣợc 5.1.1. Hệ số tƣơng quan Hệ số tƣơng quan giữa các biến độc lập trong mô hình đƣợc tính bằng lệnh correlate TRẦN THỊ TUẤN ANH - UEH 48 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Ma trận hệ số tƣơng quan giữa các biến độc lập nhƣ sau 5.1.2. Nhân tử phóng đại phƣơng sai (vif) Mỗi biến độc lập trong mô hình sẽ có một hệ số phóng đại phƣơng sai. Để tìm vif, phải đảm bảo hàm hồi quy vừa chạy gần nhất trƣớc đó là hàm hồi quy cần kiểm định đa cộng tuyến. Sau đó dùng lệnh vif. Kết quả 5.2. PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN Việc phát hiện sai dấu do đa cộng tuyến có thể thực hiện bằng các so sánh dấu của hệ số tương quan giữa biến phụ thuộc và các biến độc lập với dấu của hệ số hồi quy thu được bằng lệnh regress. Nếu hai dấu này khác nhau, đó là thể hiện của sai dấu cho các biến TRẦN THỊ TUẤN ANH - UEH 49 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 độc lập có tƣơng quan với nhau. TRẦN THỊ TUẤN ANH - UEH 50 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 6 : PHƯƠNG SAI THAY ĐỔI Giả sử xét hàm hồi quy tuyến tính Y 2 X 2 3 X 3 ... k X k U Mô hình hồi quy tuyến tính cổ điển giả định rằng : E (U i ) 0 Var (Ui ) 2 const , i 1, n Cov(Ui ,U j ) 0, i j Khi giả thiết về sự không đổi của phƣơng sai sai số bị vi phạm sẽ dẫn đến hiện tƣợng phƣơng sai thay đổi. Khi đó, E (U i ) 0 Var (Ui ) i2 , i 1, n Cov(Ui ,U j ) 0, i j Vậy làm sao để phát hiện mô hình hồi quy bị phƣơng sai thay đổi ? Xử lý phƣơng sai thay đổi nhƣ thế nào? Phần thực hành chƣơng 6 sẽ sử dụng tập tin số liệu Heteroskesdaticity.dta để thực hiện các kiểm định và xử lý khi có phƣơng sai thay đổi. Giả sử hàm hồi quy cần ƣớc lƣợng : Y 1 2 X 2 3 X 3 4 X 4 5 X 5 U Kết quả hồi quy TRẦN THỊ TUẤN ANH - UEH 51 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 6.1. PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI 6.1.1. Đồ thị phần dƣ Một trong những dấu hiện ban đầu cho thấy có sự hiện diện của phƣơng sai thay đổi là sai số phân bố không đồng đều xung quanh giá trị trung bình của nó. Đồ thị thu đƣợc nhƣ sau: Tùy chọn yline(0) để vẽ trục tung của đồ thị. Qua đồ thị cho thấy phần dƣ của mô hình có phân bố không đều quanh giá trị trung bình của nó. Đây là dấu hiệu của phƣơng sai thay đổi. 6.1.2. Kiểm định Breusch – Pagan TRẦN THỊ TUẤN ANH - UEH 52 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Giả thuyết H0 của kiểm định Breusch – Pagan là mô hình có phƣơng sai thuần nhất, giả thuyết đối H1 là phƣơng sai của sai số phụ thuộc vào các yếu tố z2i ,..., zki : H 0 : i2 2 H1 : i2 2 h( 2 z2i ... m zmi ) Sau khi hồi quy bằng OLS, Stata hỗ trợ thực hiện kiểm định Breusch – Pagan bằng lệnh: Kết quả kiểm định của mô hình trong ví dụ trên là Một cách dùng khác của kiểm định Breusch – Pagan Kết quả 6.1.3. Kiểm định White Giả thuyết H0 của kiểm định White TRẦN THỊ TUẤN ANH - UEH H 0 : i2 2 H1 : i, j : i2 2j 53 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Kiểm định phƣơng sai thay đổi bằng kiểm định White trên Stata đƣợc thực hiện bằng lệnh : Kết quả thực hiện lệnh Lưu ý : Trong một số trƣờng hợp, nếu phần mềm không hỗ trợ kiểm định phƣơng sai thay đổi bằng gói các câu lệnh đƣợc xây dựng sẵn, ta có thể hồi quy phần dƣ để kiểm tra phƣơng sai thay đổi của sai số. Kết quả nhƣ sau : TRẦN THỊ TUẤN ANH - UEH 54 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 6.2. XỬ LÝ PHƢƠNG SAI THAY ĐỔI Khi bị phƣơng sai thay đổi, ƣớc lƣợng tính đƣợc bằng phƣơng pháp OLS không còn là ƣớc lƣợng hiệu quả nữa. Đồng thời các kiểm định về hệ số hồi quy đƣợc tính toán dựa trên giả định var(U i ) 2 không còn đáng tin cậy. Việc xử lý hiện tƣợng phƣơng sai thay đổi có thể tính lại giá trị các kiểm định để kiểm định đáng tin cậy hơn (bằng cách dùng ma trận ƣớc lƣợng vững của hiệp phƣơng sai) hoặc tìm ƣớc lƣợng hiệu quả hơn bằng GLS. 6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai Sử dụng ƣớc lƣợng vững của ma trận hiệp phƣơng sai sai số do White(1980) đề xuất để tính toán lại các giá trị kiểm định khi có phƣơng sai thay đổi. Trên Stata, việc này đƣợc thực hiện bằng cách thêm tùy chọn robust hoặc vce(robust) sau câu lệnh regress Kết quả TRẦN THỊ TUẤN ANH - UEH 55 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Lƣu ý rằng sau khi dùng tùy chọn robust, giá trị các hệ số hồi quy không hề thay đổi. Chỉ có các sai số chuẩn thay đổi dẫn đến thống kê t và p-value của kiểm định các hệ số hồi quy thay đổi. 6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS) Phƣơng pháp GLS để tìm ƣớc lƣợng hiệu quả trong trƣờng hợp phƣơng sai thay đổi đƣợc thực hiện bằng cách tìm trọng số cho sai số; để sau khi hồi quy với trọng số, phƣơng sai của mô hình trở nên không đổi. Do vậy , GLS trong trƣờng hợp phƣơng sai thay đổi còn đƣợc gọi là WLS (Weighted Least Squares – Bình phương nhỏ nhất có trọng số) Trong ví dụ trên, trọng số có thể tìm đƣợc nhƣ sau : TRẦN THỊ TUẤN ANH - UEH 56 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Kết quả sau khi hồi quy với trọng số Ngoài ra, một số câu lệnh đƣợc viết bởi các nhà nghiên cứu cũng cho phép thực hiện WLS trên Stata nhƣ wls0, vwls TRẦN THỊ TUẤN ANH - UEH 57 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 CHƯƠNG 7 : TỰ TƯƠNG QUAN Hiện tƣợng tự tƣơng quan thƣờng đƣợc xét đối với số liệu theo thời gian, khi giả thiết về sự không tƣơng quan giữa các sai số bị vi phạm. Giả sử xét hàm hồi quy Yt 1 2 X t U t Chƣơng 7 sử dụng số liệu của tập tin GiaXangDau.dta để thực hiện các kiểm định và xử lý tự tƣơng quan. Mô tả tập tin số liệu nhƣ sau: Giả sử hàm hồi quy cần thực hiện: giaxangvietnamt 1 2 giaxangthegioit U t Để Stata nhận dạng số liệu theo thời gian, cần dùng lệnh tsset Biến quarter là biến dùng để chỉ định thời gian trong tập tin số liệu này. Hồi quy m6 hình TRẦN THỊ TUẤN ANH - UEH 58 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 với phƣơng pháp OLS, kết quả ƣớc lƣợng ban đầu nhƣ sau : 7.1. KIỂM ĐỊNH TỰ TƢƠNG QUAN 7.1.1. Đồ thị phần dƣ Các câu lệnh thực hiện để vẽ đồ thị phần dƣ : Đồ thị biểu diễn phần dƣ thu đƣợc nhƣ sau: TRẦN THỊ TUẤN ANH - UEH 59 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function) Biểu đồ tự tƣơng quan biểu diễn hệ số tự tƣơng quan từ bậc 1 đến bậc k của một đại lƣợng ngẫu nhiên lên cùng một đồ thị. Để biểu diễn biểu đồ tự tƣơng quan từ bậc 1 đến bậc 12 của biến phandu, câu lệnh đƣợc sử dụng nhƣ sau Biểu đồ hiện ra nhƣ sau 7.1.3. Kiểm định Durbin – Watson Sau khi ƣớc lƣợng hàm hồi quy, để tính giá trị thống kê d theo kiểm định Durbin – Watson, cần thực thi câu lệnh: Kết quả TRẦN THỊ TUẤN ANH - UEH 60 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Với giá trị thống kê d tính đƣợc, ta tra bảng Durbin-Watson, tìm ra giá trị dL và dU, kẻ thang kiểm định Durbin Watson và kết luận vê tự tƣơng quan bậc nhất. Ngoài ra, Stata hỗ trợ việc kiểm định tự tƣơng quan bậc nhất bằng Durbin – Watson thông qua việc tính sẵn giá trị p-value cho kiểm định này. Kết quả p-value đƣợc hiển thị ra nhƣ sau : 7.1.4. Kiểm định Breusch – Godfrey Kiểm định BG trên Stata đƣợc hỗ trợ bằng câu lệnh estat bgodfrey. Khi kiểm định BG trên Stata cần chỉ rõ bậc tự tƣơng quan cần kiểm định. Nếu không chỉ rõ bậc tự tƣơng quan, phần mềm sẽ mặc định kiểm định tự tƣơng quan bậc 1. Ví dụ, để kiểm định tự tƣơng quan từ bậc 1 đến bậc 4 Kết quả kiểm định tƣơng ứng TRẦN THỊ TUẤN ANH - UEH 61 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Nếu chỉ cần kiểm định tự tƣơng quan bậc 1 và bậc 4 (nghĩa là không kiểm định tự tƣơng quan bậc 2 và 3), câu lệnh đƣợc dùng sẽ là: Kết quả thực hiện lệnh 7.2. XỬ LÝ TỰ TƢƠNG QUAN Cũng giống nhƣ trƣờng hợp phƣơng sai thay đổi, hiện tƣợng tự tƣơng quan cũng làm cho ƣớc lƣợng OLS không còn là ƣớc lƣợng hiệu quả nhất và các kiểm định về hệ số hồi quy cũng không còn đáng tin cậy. Do đó, việc khắc phục có thể theo hai hƣớng. Một là, làm cho kiểm định hệ số hồi quy đáng tin cậy hơn bằng ma trận ƣớc lƣợng hiệp phƣơng sai của Newey – West. Hai là, tìm ƣớc lƣợng hiệu quả bằng GLS. 7.2.1. Ma trận ước lượng hiệp phương sai Newey - West Để sử dụng ma trận ƣớc lƣợng hiệp phƣơng sai, cần chỉ định rõ bandwidth đƣợc sử dụng TRẦN THỊ TUẤN ANH - UEH 62 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 để tính toán ma trận ƣớc lƣợng hiệp phƣơng sai. Bandwidth có thể đƣợc tính toán bằng công thức B 0.75T 1 3 hoặc B 4 T 100 2 9 . Stata không dùng bandwidth mặc định nhƣ một số phần mềm khác nên ngƣời dùng thƣờng phải chỉ định con số này. Để tính toán bandwidth, ta \có thể dùng các câu lệnh sau Kết quả bandwidth đƣợc chọn sẽ là Với bandwidth = 3, mô hình hồi quy đƣợc thực hiện với ma trận ƣớc lƣợng hiệp phƣơng sai của Newey – West nhƣ sau : Kết quả thực hiện câu lệnh trên 7.2.2. Khắc phục tự tương quan bằng GLS – thủ tục Prais - Winsten TRẦN THỊ TUẤN ANH - UEH 63 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 Một thủ tục phổ biến của GLS để xử lý trong trƣờng hợp tự tƣơng quan bậc nhất đƣợc đề xuất bởi Prais – Winsten(1954). Stata thực hiện thủ tục này bằng lệnh prais. Cú pháp lệnh này rất giống lệnh regress Kết quả thực hiện Lệnh prais có các tùy chọn để tính hệ số tự tƣơng quan rho khác nhau (gõ help prais để xem trợ giúp của Stata về các tùy chọn này). TRẦN THỊ TUẤN ANH - UEH 64 HƯỚNG DẪN THỰC HÀNH STATA 12 2014 TÀI LIỆU THAM KHẢO Lee C. Adkins & R. Carter Hill (2011), Using Stata for Principles of Econometrics, 4th edition, Wiley Publisher. White, H. (1980), A Heteroscedasticity-Consistent Covariance Matrix Es timator and a Direct Test for Heteroscedasticity. Econometrica 48, 817-838. Prais, S. J. and Winsten D. B., (1954), Trend Estimators and Serial Correlation Cowles Commission, Discussion Paper No. 383, University of Chicago. TRẦN THỊ TUẤN ANH - UEH 65