Uploaded by ngocdu nong

HuongDanSuDungStata2014 TuanAnhUEH (1)

advertisement
TRƢỜNG ĐẠI HỌC KINH TẾ TPHCM
HƢỚNG DẪN THỰC HÀNH
STATA 12
PHẦN CƠ BẢN
TRẦN THỊ TUẤN ANH
14
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
TRẦN THỊ TUẤN ANH - UEH
2
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
LỜI MỞ ĐẦU
Stata là phần mềm xử lý số liệu rất mạnh, được sử dụng phổ biến trong
đào tạo và nghiên cứu về Kinh tế lượng.
Tài liệu Hướng dẫn thực hành Stata 12 được soạn ra để phục vụ cho
sinh viên, học viên cao học, nghiên cứu sinh, các nhà nghiên cứu muốn
tìm hiểu thực hành các kiến thức Kinh tế lượng trên phần mềm Stata
Số liệu thực hành được sử dụng trong tài liệu này có thể được tìm thấy
tại trang web http://sites.google.com/site/anhttt
- mục số liệu thực
hành.
Đây là tài liệu được soạn thảo lần đầu tiên nên còn rất nhiều thiếu sót.
Mọi góp ý giúp cải thiện tài liệu xin gửi về địa chỉ mail
anhttt@gmail.com. Tác giả xin trân trọng mọi ý kiến đóng góp.
Trần Thị Tuấn Anh
TRẦN THỊ TUẤN ANH - UEH
3
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
TRẦN THỊ TUẤN ANH - UEH
4
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
MỤC LỤC
CHƢƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12 .................................................. 8
1.1.
GIỚI THIỆU GIAO DIỆN CỦA STATA 12....................................................... 8
1.1.1. Khởi động phần mềm Stata ........................................................................... 8
1.2.
THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA ................................ 9
1.2.1. Nhập liệu trực tiếp từ bàn phím ..................................................................... 9
1.2.4. Mở một tập tin số liệu có sẵn của Stata ....................................................... 13
1.3.
LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA ................................................ 14
1.3.1. Lƣu dữ liệu .................................................................................................. 14
1.3.2. Lƣu kết quả xử lý số liệu ............................................................................. 14
1.4.
a.
Sao chép và cắt dán ..................................................................................... 14
b.
Sử dụng file log ........................................................................................... 15
TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA .......................... 17
1.4.1. Xóa biến trong Stata .................................................................................... 17
1.4.2. Đổi tên biến trong Stata ............................................................................... 18
1.4.3. Tạo biến mới từ những biến đã có ............................................................... 19
1.5.
THOÁT KHỎI PHẦN MỀM STATA ............................................................... 21
CHƢƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA ............................................... 22
2.1.
MÔ TẢ SỐ LIỆU ............................................................................................... 22
2.1.1. Mô tả tập tin số liệu ..................................................................................... 22
2.1.2. Thực hiện mô tả tóm tắt số liệu ................................................................... 22
2.1.3. Vẽ đồ thị phân tán ........................................................................................ 24
2.2.
MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS ...................... 25
2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS ................ 26
2.2.2. Hệ số xác định và kiểm định hệ số xác định ............................................... 27
2.2.3. Khoảng tin cậy của hệ số hồi quy ................................................................ 28
TRẦN THỊ TUẤN ANH - UEH
5
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
2.2.4. Kiểm định giả thuyết về hệ số hồi quy ........................................................ 29
a.
Kiểm định giả thuyết hai phía...................................................................... 29
b.
Kiểm định giả thuyết phía phải.................................................................... 30
c.
Kiểm định giả thuyết phía trái ..................................................................... 31
d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số
hồi quy .................................................................................................................. 31
2.3. PHẦN DƢ CỦA MÔ HÌNH HỒI QUY ......................................................... 32
2.3.1. Vẽ biểu đồ histogram của phần dƣ .............................................................. 33
2.3.2. Kiểm định tính chuẩn của phần dƣ .............................................................. 33
2.4.
XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG ........................... 34
CHƢƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH ................................................. 36
3.1.
HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ ............................................... 36
3.2. DẠNG HÀM LOG –LOG; DẠNG HÀM LOG –LIN; DẠNG HÀM LIN –
LOG ............................................................................................................................ 36
3.2.1. Dạng hàm log – log ..................................................................................... 36
3.2.2. Dạng hàm log – lin ...................................................................................... 37
3.2.3. Dạng hàm lin – log ...................................................................................... 38
3.3.
DẠNG HÀM BẬC HAI (QUADRATIC MODEL) .......................................... 39
CHƢƠNG 4 : HỒI QUY VỚI BIẾN GIẢ ................................................................... 40
4.1.
GIỚI THIỆU BIẾN GIẢ .................................................................................... 40
4.2.
HỒI QUY VỚI BIẾN GIẢ ................................................................................. 40
4.3.
HỒI QUY VỚI BIẾN TƢƠNG TÁC ................................................................ 41
4.4.
Tạo biến giả từ biến định tính ............................................................................ 43
4.4.1. Tạo bằng lệnh tabulate ................................................................................. 43
4.4.2. Dùng biến factor .......................................................................................... 44
4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE
IN DIFFERENCE ......................................................................................................... 45
4.6.
ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM................................... 45
TRẦN THỊ TUẤN ANH - UEH
6
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƢƠNG 5 : ĐA CỘNG TUYẾN .............................................................................. 48
5.1.
PHÁT HIỆN ĐA CỘNG TUYẾN ..................................................................... 48
5.1.1. Hệ số tƣơng quan ......................................................................................... 48
5.1.2. Nhân tử phóng đại phƣơng sai (vif) ............................................................ 49
5.2 PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN .............................................49
CHƢƠNG 6 : PHƢƠNG SAI THAY ĐỔI .................................................................. 51
6.1.
PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI ......................................................... 52
6.1.1. Đồ thị phần dƣ ............................................................................................. 52
6.1.2. Kiểm định Breusch – Pagan ........................................................................ 52
6.1.3. Kiểm định White ......................................................................................... 53
6.2.
XỬ LÝ PHƢƠNG SAI THAY ĐỔI .................................................................. 55
6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai ............................................ 55
6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS) ............................... 56
CHƢƠNG 7 : TỰ TƢƠNG QUAN ............................................................................. 58
7.1.
KIỂM ĐỊNH TỰ TƢƠNG QUAN .................................................................... 59
7.1.1. Đồ thị phần dƣ ............................................................................................. 59
7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function) ......................... 60
7.1.3. Kiểm định Durbin – Watson ........................................................................ 60
7.1.4. Kiểm định Breusch – Godfrey ..................................................................... 61
7.2.
XỬ LÝ TỰ TƢƠNG QUAN ............................................................................. 62
7.2.1. Ma trận ƣớc lƣợng hiệp phƣơng sai Newey - West..................................... 62
7.2.2. Khắc phục tự tƣơng quan bằng GLS – thủ tục Prais - Winsten .................. 63
TÀI LIỆU THAM KHẢO ............................................................................................ 65
TRẦN THỊ TUẤN ANH - UEH
7
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 1 : GIỚI THIỆU PHẦN MỀM STATA 12
1.1. GIỚI THIỆU GIAO DIỆN CỦA STATA 12
1.1.1. Khởi động phần mềm Stata
Tên gọi Stata đƣợc viết tắt từ Statistics và data. Việc khởi động Stata có thể đƣợc thực
hiện bằng nhiều cách:
Cách 1 : Khởi động bằng cách nhấp chuột kép (double - click) vào biểu
tƣợng phần mềm trên màn hình chính (Desktop) của hệ điều hành.
-
Cách 2 : Khởi động bằng cách nhấp chuột kép vài những tập tin số liệu
có phần mở rộng là dta. Đây là những tập tin số liệu củ Stata. Khi nhấp chuột kép
vào những tập tin này, hệ điều hành sẽ tự động khởi động phần mềm Stata để đọc
tập tin loại này.
Lưu ý : trong một vài trƣờng hợp, hệ điều hành chƣa nhận dạng đƣợc tập tin *.dta là
tập tin của Stata, để mở tập tin cần nhấp chuột phải trên tập tin .dta cần mở,
chọn
“Open with” và chọn “Choose default program”. Sau đó nhất nút lệnh “Browse” trên
cửa sổ hiện ra và chỉ đƣờng dẫn đến nơi cài đặt Stata hoặc chỉ đƣờng dẫn đến màn
hình chính có biểu tƣợng Stata .
Giao diện của phần mềm Stata 12 sau khi khởi động sẽ gồm có 4 cửa sổ chính
Command
: cửa sổ lệnh, là nơi để nhập các câu lệnh cần thực hiện
Results
: cửa sổ kết quả, để hiển thị kết quả thực thi các câu lệnh
Review
: cửa sổ xem lại, nơi liệt kê tất cả các câu lệnh đã sử dụng từ
khi Stata đƣợc khởi động
Variables
: cửa sổ tên biến, liệt kê danh sách các biến đang đƣợc sử
dụng
TRẦN THỊ TUẤN ANH - UEH
8
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Phía trên bên trái của màn hình Stata là hệ thống thực đơn chính (main menus)
Phía dƣới hệ thống thực đơn chính là thanh công cụ hiển thị các nút lệnh ứng với các
chức năng thƣờng đƣợc sử dụng của Stata
1.2. THAO TÁC NHẬP SỐ LIỆU VÀO PHẦN MỀM STATA
1.2.1. Nhập liệu trực tiếp từ bàn phím
Nếu muốn nhập liệu trực tiếp vào Stata, ngƣời dùng cần sử dụng màn hình nhập liệu
(Data editor window) của Stata bằng cách nhấp chuột vào nút lệnh edit trên thanh
công cụ
Hoặc dùng lệnh
TRẦN THỊ TUẤN ANH - UEH
9
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Khi đó, cửa sổ nhập liệu sẽ hiển thị.
1.2.2. Sao chép và cắt dán từ Excel
Thay vì gõ số liệu trực tiếp, ta có thể sao chép số liệu từ Excel và dán vào Stata. Đầu
tiên, mở tập tin Excel có chứa dữ liệu, đánh dấu khối những dữ liệu cần sao chép (kể
cả dòng tên biến trên cùng); sau đó nhấn Ctrl+C để thực hiện sao chép. Sau đó,
chuyển qua cửa sổ nhập liệu của Stata, nhấn Ctrl + V để dán số liệu. Vì dòng đầu tiên
là tên biến nên chú ý chọn mục “Treat first row as variable name” trong hộp hội thoại
hiện ra sau khi dán dữ liệu.
Số liệu sau khi dán sẽ có dạng sau:
TRẦN THỊ TUẤN ANH - UEH
10
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Dữ liệu sau khi chuyển sang Stata nhƣ trên đã sẵn sàng cho việc xử lý.
1.2.3. Nhúng một file số liệu từ Excel
Để việc nhập liệu đƣợc thuận tiện, Stata còn cho phép nhúng (import) một tập tin dữ
liệu có sẵn ở những định dạng khác (nhƣ txt, csv, xls, SAS…). Tuy nhiên, định dạng
thƣờng gặp nhất là xls hoặc xlsx của Excel.
Chức năng này đƣợc thực hiện bằng cách chọn mục import trong thực đơn File của
hệ thống thực đơn chính hoặc dùng lệnh import của Stata.
Lệnh import đƣợc nhập theo ví dụ sau.
Hoặc dùng hệ thống thực đơn của Stata : File/Import/Excel spreadsheet
TRẦN THỊ TUẤN ANH - UEH
11
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Sau khi chọn chức năng từ hệ thống thực đơn, cửa sổ nhúng tập tin sẽ hiện ra. Ta phải
chỉ đƣờng dẫn đến tập tin, chọn sheet có số liệu, chọn vùng có số liệu trên sheet đã
chọn. Nếu dòng đầu tiên của tập tin là tên biến thì chọn vào ô import first row as
variable name và sau đó nhấn OK
Các biến sau khi đƣợc nhập trực tiếp hoặc nhúng vào Stata sẽ hiển thị ra trong cửa sổ
TRẦN THỊ TUẤN ANH - UEH
12
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
biến số bên phải của màn hình Stata
1.2.4. Mở một tập tin số liệu có sẵn của Stata
Nếu đã có sẵn tập tin số liệu của Stata trên máy tính, có thể mở trực tiếp tập tin này
bằng lệnh use
Hoặc chọn từ hệ thống thực đơn File/Open và chỉ rõ đƣờng dẫn đến tập tin cần mở
trong cửa sổ hiện ra
Hoặc sử dụng nút lệnh Open trên thanh công cụ
TRẦN THỊ TUẤN ANH - UEH
13
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
1.3. LƢU DỮ LIỆU VÀ KẾT QUẢ TRÊN STATA
1.3.1. Lƣu dữ liệu
Muốn lƣu dữ liệu đã nhập vào Stata, sử dụng lệnh save
Hoặc dùng thực đơn File/Save hoặc File/Save as
Hoặc sử dụng nút lệnh save từ thanh công cụ
1.3.2. Lƣu kết quả xử lý số liệu
Sau khi xử lý số liệu, kết quả xử lý số liệu đƣợc lƣu bằng nhiều cách.
a. Sao chép và cắt dán
Nếu muốn sao chép và xuất kết quả xử lý số liệu ra Word hoặc Excel, có thể dùng các
chức năng copy đƣợc Stata hỗ trợ. Trƣớc hết, chọn mảng kết quả cần sao chép trên
cửa số Result, nhấp chuột phải và chọn một trong số các chức năng copy trên thực
đơn hiện ra.
TRẦN THỊ TUẤN ANH - UEH
14
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Mỗi chức năng copy của Stata có một định dạng khác nhau. Do đó, nên lựa chọn
chức năng phù hợp nhất với yêu cầu. Tuy nhiên, lựa chọn thông dụng nhất là copy
table để sao chép số liệu vì định dạng này giữ nguyên hàng – cột của kết quả cần sao
chép, đồng thời cho phép kẻ khung hoặc trang trí lại cách trình bày. Lựa chọn copy as
picture sẽ xuất kết quả dạng ảnh nên không thể trang trí lại theo yêu cầu.
b. Sử dụng file log
Những kết quả thực hiện lệnh đƣợc hiển thị ra trên cửa sổ kết quả results không thể
lƣu đƣợc bằng lệnh save. Nếu muốn lƣu những kết quả này, cần sử dụng tập tin log.
Tập tin log của Stata có hai định dạng : dạng tập tin .txt và dạng tập tim .smcl . Tuy
nhiên, dạng .smcl thƣờng đƣợc sử dụng vì nó giữ nguyên định dạng kết quả mà Stata
xuất ra.
Để tạo một tập tin .smcl, dùng lệnh. Phía sau từ khóa using là đƣờng dẫn và tên của
tập tin log sẽ đƣợc tạo
Hoặc có thể dùng hệ thống thực đơn File/Log/Begin
TRẦN THỊ TUẤN ANH - UEH
15
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Sau các thao tác trên, ở cửa sổ kết quả sẽ hiển thị các thông tin cho biết tập tin log đã
đƣợc tạo
Và thanh trạng thái ở cuối cửa sổ kết quả sẽ có dòng chữ
Kể từ lúc này trở đi, các câu lệnh cũng nhƣ kết quả thực hiện câu lệnh đó sẽ đƣợc
Stata lƣu lại trong tập tin log. Sau khi kết thúc các thao tác, nếu muốn dừng lƣu và
đóng tập tin log thì dùng lệnh
Hoặc chọn từ thực đơn chính File /Log/ Close
TRẦN THỊ TUẤN ANH - UEH
16
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Lưu ý : những kết quả thực hiện chỉ đƣợc lƣu khi tập tin log đã đƣợc tạo, có dấu hiệu
log on ở cuối cửa sổ lệnh. Những kết quả thực hiện lệnh trƣớc khi tạo tập tin log hoặc
sau khi tập tin log đã đƣợc đóng đều không đƣợc lƣu lại.
1.4. TẠO VÀ QUẢN LÝ BIẾN (VARIABLE ) TRONG STATA
1.4.1. Xóa biến trong Stata
Để xóa bớt một hay nhiều biến trong số các biến đã tạo có thể dùng lệnh drop. Phía
sau tên lệnh là danh sách các biến cần xóa, mỗi tên biến cách nhau một khoảng trắng.
Nếu muốn xóa tất cả các biến trong tập tin số liệu, dùng lệnh
Nếu muốn xóa những biến có cùng những ký tự đầu trong tên giống nhau, ví vụ nhƣ
var01, var02, var03; dùng lệnh
Thay vì dùng lệnh drop, ta chọn một hoặc nhiều biến cần xóa ở cửa sổ tên biến, nhấp
TRẦN THỊ TUẤN ANH - UEH
17
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
chuộc phải và chọn mục Drop Selected Variables từ thực đơn hiện ra.
1.4.2. Đổi tên biến trong Stata
Tên biến đƣợc đổi bằng lệnh rename
Ví dụ, đổi tên biến DT thành tên biến doanhthu
Nếu không dùng lệnh, có thể dùng chức năng của Stata. Trƣớc hết , cần hiển thị lại số
liệu của các biến đã có bằng lệnh
Hoặc có thể chọn nút lệnh “browse” trên thanh công cụ
Sau khi thực hiện lệnh Browse, cửa sổ số liệu sẽ hiện ra
TRẦN THỊ TUẤN ANH - UEH
18
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Góc trên bên phải của cửa sổ này là danh sách biến, góc dƣới là các tính chất tƣơng
ứng của biến đƣợc chọn trên danh sách biến nhƣ tên, kiểu số liệu… Do vậy, để đổi tên
biến, cần chọn biến cần đổi tên ở danh sách biến và gõ tên mới vào ô Name ở phần
properties bên dƣới.
Lưu ý : Vì Stata phân biệt chữ hoa và chữ thƣờng rất rõ ràng nên phải cẩn thận vấn đề
chữ hoa – chữ thƣờng trong tên biến. Đồng thời tên biến không đƣợc có khoảng trắng
hoặc các ký tự đặc biệt nhƣ -, *, {, +, %.% # @ ^ ….
1.4.3. Tạo biến mới từ những biến đã có
Dùng lệnh generate hoặc viết gọn là gen
Ví dụ tạo biến lnDoanhThu bằng logarit cơ số tự nhiên của biến DoanhThu đã có
TRẦN THỊ TUẤN ANH - UEH
19
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Tên của biến mới sau khi đƣợc tạo sẽ đƣợc thêm vào cửa sổ danh sách biến ở góc phải
màn hình chính
Hoặc tạo biến DoanhThu2 bằng bình phƣơng của biến DoanhThu
Lưu ý : Một số toán tử và hàm số thƣờng dùng trong Stata khi tạo biến hoặc xử lý số
liệu
Dấu cộng
+
Phủ định
~
Dấu trừ
-
Nhỏ hơn
<
Dấu nhân
*
Nhỏ hơn hoặc bằng
<=
Dấu chia
/
Lớn hơn
>
Dấu lũy thừa
^
Lớn hơn hoặc bằng
>=
Toán tử “và”
&
Hàm ex
:
Toán tử hoặc
|
Hàm log nepe
: ln()
So sánh bằng
==
So sánh khác
!= hoặc ~=
TRẦN THỊ TUẤN ANH - UEH
exp()
20
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
1.5. THOÁT KHỎI PHẦN MỀM STATA
Để kết thúc sử dụng phần mềm Stata, có thể thoát khỏi phần mềm bằng cách gõ lệnh exit
vào cửa sổ lệnh và nhấn phím “Enter”.
Hoặc chọn mục “Exit” trong thực đơn con của mục File trong thực đơn chính
TRẦN THỊ TUẤN ANH - UEH
21
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 2 : HỒI QUY TUYẾN TÍNH VỚI STATA
2.1. MÔ TẢ SỐ LIỆU
Trƣớc khi tiến hành hồi quy, số liệu có thể đƣợc mô tả để kiểm tra xem liệu số liệu có
phù hợp với yêu cầu nghiên cứu.
2.1.1. Mô tả tập tin số liệu
Dùng lệnh describe để mô tả các thông tin chung nhất về tập tin số liệu nhƣ số quan sát,
số biến, kích thƣớc tập tin, tên các biến, kiểu số liệu của từng biến, và nhãn của biến (nếu
có)
Kết quả mô tả tập tin nhƣ sau
2.1.2. Thực hiện mô tả tóm tắt số liệu
Dùng lệnh summarize với cú pháp cơ bản nhƣ sau
TRẦN THỊ TUẤN ANH - UEH
22
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
summarize [varlist]
[if]
[, options]
Ví dụ
Lưu ý :
 Nếu sau lệnh summarize mà không liệt kê tên biến, phần mềm sẽ hiển thị thông
tin của tất cả các biến hiện có trong tập tin số liệu.
 Nếu muốn mô tả chi tiết, có thể tùy chọn detail vào cuối lệnh summarize sau khi
đã thêm dấu phẩy
TRẦN THỊ TUẤN ANH - UEH
23
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
2.1.3. Vẽ đồ thị phân tán
Stata vẽ đƣợc rất nhiều loại đồ thị nhƣng đồ thị phân tán là dạng đồ thị thƣờng dùng nhất
khi phân tích hồ quy. Ngƣởi dùng vẽ đồ thị phân tán của hai biến bằng lệnh scatter
scatter [varlist]
[if]
[, options]
scatter thƣờng đƣợc dùng để vẽ đồ thị giữa hai biến.Trong varlist, biến đầu tiên đƣợc
liệt kê là biến ở trục tung, biến tiếp theo sẽ là biến ở trục hoành.
Kết quả thực hiện câu lệnh :
Để vẽ đồ thị từ gốc tọa độ hoặc thêm tiêu đề, cần thêm các tùy chọn nhƣ trong câu lệnh
sau:
TRẦN THỊ TUẤN ANH - UEH
24
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Kết quả thực hiện lệnh :
Để lƣu đồ thị, dùng lệnh
Hoặc có thể nhấn nút lƣu trên thanh công cụ của cửa sổ đồ thị. Sau đó chọn đƣờng dẫn và
đặt tên cho đồ thị cần lƣu. Phần mở rộng trong tên đồ thị của Stata là .gph
2.2. MÔ HÌNH HỒI QUY TUYẾN TÍNH - PHƢƠNG PHÁP OLS
Trong Stata, ngoài việc ƣớc lƣợng mô hình, phần mềm còn hỗ trợ rất nhiều các kiểm định
để đánh giá và lựa chọn mô hình
TRẦN THỊ TUẤN ANH - UEH
25
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
2.2.1. Ƣớc lƣợng mô hình hồi quy tuyến tính bằng phƣơng pháp OLS
Hàm hồi quy tuyến tính k biến có dạng nhƣ sau
Y  1   2 X 2  3 X 3  ...   k X k  U
Hàm hồi quy mẫu tƣơng ứng Y  ˆ1  ˆ2 X 2  ˆ3 X 3  ...  ˆk X k  e
Việc ƣớc lƣợng mô hình hồi quy tuyến tính mẫu bằng phƣơng pháp OLS trên Stata đƣợc
thực hiện bằng lệnh regress với cú pháp nhƣ sau:
regress depvar [indepvars] [if] [, options]
Biến đƣợc nhập sau tên lệnh regress là biến phụ thuộc. Tất cả các tên biến đƣợc liệt kê
sau biến phụ thuộc là biến độc lập. Tùy chọn [if] đƣợc dùng để giới hạn số liệu cần đƣa
vào hồi quy.
Ví dụ sau sử dụng số liệu của tập tin doanhthu.dta để hồi quy tuyến tính theo hàm hồi
quy
DoanhThu  1   2ChaoHang  3QuangCao  U
Trong đó :
 DoanhThu thể hiện doanh thu của doanh nghiệp, đơn vị tính là triệu đồng/tháng.
 ChaoHang là biến thể hiện chi phí chào hàng (triệu đồng/tháng)
 QuangCao là chi phí quảng cáo của doanh nghiệp (triệu đồng/tháng)
Để hồi quy theo ví dụ trên, trƣớc hết, mở tập tin doanhthu.dta bằng Stata. Sau đó, hồi
quy bằng lệnh:
Hoặc có thể gọi chức năng hồi quy này từ hệ thống thực đơn chính Statistics/Linear
models and related/ Linear regression
TRẦN THỊ TUẤN ANH - UEH
26
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Khi nhập hàm hồi quy, ta không cần nhập hệ số tự do vì Stata đã mặc định thêm hệ số tự
do vào hàm hồi quy. Kết quả hồi quy thu đƣợc nhƣ sau :
Từ kết quả trên, hàm hồi quy ƣớc lƣợng đƣợc từ mẫu số liệu bằng phƣơng pháp OLS là
DoanhThu  78,915  4, 472ChaoHang  2, 298QuangCao  e
2.2.2. Hệ số xác định và kiểm định hệ số xác định
Hệ số xác định R2 giúp đánh giá sự phù hợp của mô hình với mẫu nghiên cứu. Nó cho
biết mức độ giải thích của các biến độc lập với sự biến động (quanh giá trị trung bình)
của biến phụ thuộc. Ngoài R2, Stata cũng tính hệ số xác định hiệu chỉnh (Adjusted R2) và
hiển thị cả hai trên bảng kết quả hồi quy.
TRẦN THỊ TUẤN ANH - UEH
27
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
2.2.3. Khoảng tin cậy của hệ số hồi quy
Y  1   2 X 2  3 X 3  ...   k X k  U
Xét hàm hồi quy tổng thể
Và hàm hồi quy mẫu tƣơng ứng Y  ˆ1  ˆ2 X 2  ˆ3 X 3  ...  ˆk X k  e
Khoảng tin cậy của  j ,( j  1, k ) với độ tin cậy (1   ) đƣợc tính bằng công thức
 ˆ  t
j

2
 se(ˆ j ), ˆ j  t  se(ˆ j )
2

Trong đó :
 t là giá trị có đƣợc khi tra bảng t-Student, mức ý nghĩa  2 , bậc tự do n – k
2
Giá trị này có thể tra đƣợc bằng hàm TINV của Excel hoặc hàm invtail của Stata
 se(ˆ j ) là sai số chuẩn của ˆ j , đƣợc phần mềm Stata tính sẵn
Tuy nhiên, Stata luôn tính sẵn khoảng tin cậy của hệ số hồi quy với độ tin cậy 95%.
TRẦN THỊ TUẤN ANH - UEH
28
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Nếu muốn thay đổi độ tin cậy, ví dụ 99%, dùng tùy chọn level(99) sau lệnh regress
2.2.4. Kiểm định giả thuyết về hệ số hồi quy
a. Kiểm định giả thuyết hai phía
 Giả sử cần kiểm định giả thuyết hai phía
H0 :  j  0
H1 :  j  0
với độ tin cậy (1   )
Có 3 cách kiểm định
 Dùng khoảng tin cậy
 Dùng thống kê t
 Dùng p-value
Kết quả hiển thị trên Stata hỗ trợ cả ba cách kiểm định này
TRẦN THỊ TUẤN ANH - UEH
29
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
 Giả sử cần kiểm định giả thuyết hai phía
H 0 :  j  0
H1 :  j  0
với độ tin cậy (1   ) và  0 là
một số thực bất kỳ.
Ví dụ cần kiểm định
H 0 : ChaoHang  7
H1 : ChaoHang  7
với độ tin cậy 95%
Dùng lệnh test của Stata
Kết quả kiểm định nhƣ sau
b. Kiểm định giả thuyết phía phải
 Giả sử cần kiểm định giả thuyết phía phải
H0 :  j  0
H1 :  j  0
với độ tin cậy (1   )
Dùng thống kê t của kiểm định hai phía mà Stata đã tính sẵn, so sánh với
giá trị t có đƣợc khi tra bảng t-Student với mức ý nghĩa  bậc tự do n – k
 Giả sử cần kiểm định giả thuyết phía phải
Ví dụ, để kiểm định
H 0 : ChaoHang  7
H1 : ChaoHang  7
H 0 :  j  0
H1 :  j  0
với độ tin cậy (1   )
với độ tin cậy (1   ) , sử dụng lệnh lincom nhƣ sau :
Kết quả sau khi thực hiện lệnh
TRẦN THỊ TUẤN ANH - UEH
30
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Dùng t có đƣợc từ kết quả trên để so sánh với giá trị t có đƣợc khi tra bảng t-Student
với mức ý nghĩa  bậc tự do n – k
Để tính p-value của kiểm định này, sau khi chạy lệnh lincom, có thể lần lƣợt thực hiện
các lệnh sau
Lệnh ttail() để tính p-value của kiểm định một phía dùng phân phối t-Student
Kết quả thực thi cáclệnh trên nhƣ sau
c. Kiểm định giả thuyết phía trái
Tƣơng tự nhƣ kiểm định phía phải nhƣng so sánh với giá trị t
d. Kiểm định giả thuyết đồng thời liên quan đến tổ hợp tuyến tính các hệ số hồi quy
 Giả sử cần kiểm định giả thuyết
H 0 : ChaoHang  QuangCao
H1 : ChaoHang  QuangCao
với độ tin cậy (1   )
Dùng lệnh test của Stata
Kết quả thực hiện lệnh
TRẦN THỊ TUẤN ANH - UEH
31
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
 Giả sử cần kiểm định giả thuyết
H 0 : ChaoHang  2QuangCao
H1 : ChaoHang  2QuangCao
với độ tin cậy (1   )
Dùng lệnh test của Stata
Kết quả kiểm định
 Giả sử cần kiểm định giả thuyết
H 0 : ChaoHang  QuangCao  10
H1 : ChaoHang  QuangCao  10
với độ tin cậy (1   )
Dùng lệnh test của Stata
Kết quả
2.3.
PHẦN DƢ CỦA MÔ HÌNH HỒI QUY
TRẦN THỊ TUẤN ANH - UEH
32
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Phần dƣ của mô hình hồi quy đƣợc lấy bằng lệnh
2.3.1. Vẽ biểu đồ histogram của phần dƣ
Dùng lệnh histogram để vẽ biểu đồ histogram của phần dƣ
Kết quả thực hiện lệnh
2.3.2. Kiểm định tính chuẩn của phần dƣ
Dùng lệnh sktest để kiểm định tính chuẩn của sai số. Lệnh này đòi hỏi phải có ít nhất 8
TRẦN THỊ TUẤN ANH - UEH
33
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
quan sát trong mẫu số liệu.
Kết quả hiển thị
2.4.
XUẤT NHIỀU KẾT QUẢ HỒI QUY DƢỚI DẠNG BẢNG
Để xuất nhiều kết quả hồi quy ra trên cùng một bảng với mỗi phƣơng trình là một cộng
trong bảng, ngƣời dùng có thể dùng lệnh esttab với ví dụ minh họa nhƣ sau
Kết quả xuất ra dạng bảng nhƣ sau
TRẦN THỊ TUẤN ANH - UEH
34
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Lưu ý : nếu lệnh esttab chƣa có sẵn trong Stata, có thể cài đặt bằng cách dùng :
TRẦN THỊ TUẤN ANH - UEH
35
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 3 : MỞ RỘNG HỒI QUY TUYẾN TÍNH
3.1. HỒI QUY TUYẾN TÍNH QUA GỐC TỌA ĐỘ
Hàm hồi quy tuyến tính đi qua gốc tọa độ khi hệ số tự do bằng 0. Khi đó, hồi quy tổng
thể có dạng
Y   2 X 2  3 X 3  ...   k X k  U
Ƣớc lƣợng hàm hồi quy qua gốc tọa độ bằng lệnh regress với tùy chọn noconstant
Kết quả hồi quy
3.2. DẠNG HÀM LOG –LOG; DẠNG HÀM LOG –LIN; DẠNG HÀM LIN – LOG
3.2.1. Dạng hàm log – log
Dạng hàm log –log có dạng
ln(Y )  1   2 ln( X )  U
Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu )  1   2 ln(ChaoHang )  U .
TRẦN THỊ TUẤN ANH - UEH
36
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Các bƣớc cần thực hiện nhƣ sau :
Kết quả
3.2.2. Dạng hàm log – lin
Dạng hàm log –lin có dạng
ln(Y )  1   2 X  U
Ví dụ : cần ƣớc lƣợng dạng hàm ln( DoanhThu )  1   2ChaoHang  U .
Các bƣớc cần thực hiện nhƣ sau :
Kết quả
TRẦN THỊ TUẤN ANH - UEH
37
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Lưu ý : Nếu biến lnDoanhThu đã có sẵn thì không cần tạo lại bằng lệnh generate
3.2.3. Dạng hàm lin – log
Dạng hàm log –lin có dạng
Y  1   2 ln( X )  U
Ví dụ : cần ƣớc lƣợng dạng hàm DoanhThu  1   2 ln(ChaoHang )  U .
Kết quả
Lưu ý : Nếu biến lnChaoHang đã có sẵn thì không cần tạo lại bằng lệnh generate
TRẦN THỊ TUẤN ANH - UEH
38
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
3.3.
DẠNG HÀM BẬC HAI (QUADRATIC MODEL)
Hàm hồi quy dạng bậc hai có phƣơng trình Y  1  2 X  3 X 2  U
Giả sử cần ƣớc lƣợng hàm hồi quy DoanhThu  1  2ChaoHang  3ChaoHang 2  U
Các bƣớc thực hiện
Kết quả thực hiện
TRẦN THỊ TUẤN ANH - UEH
39
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 4 : HỒI QUY VỚI BIẾN GIẢ
4.1. GIỚI THIỆU BIẾN GIẢ
Biến định tính là những biến số kinh tế mà giá trị không thể hiện bằng những con số mà
bằng các tính chất mà bằng các lựa chọn. Để đƣa biến định tính vào hồi quy, ngƣời ta sử
dụng biến giả (Dummy variable). Biến Dummy là những biến chỉ nhận giá trị 0 và 1. Biến
này còn đƣợc gọi là biến nhị phân (Binary variable) hay là biến chỉ mục (indicator
variable)
4.2. HỒI QUY VỚI BIẾN GIẢ
Sử dụng tập tin số liệu ThuNhapTPHCM.dta, tiến hành mô tả số liệu
Trong tập tin này có các biến giả NgoaiNgu, DNNN, HoKhau, GioiTinh. Việc hồi quy với
các biến giả này không có gì khác với hồi quy các biến định lƣợng thông thƣờng. Tuy
nhiên, việc giải thích hệ số hồi quy của biến giả rất khác với biến định lƣợng.
TRẦN THỊ TUẤN ANH - UEH
40
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Giả sử cần hồi quy hàm tiền lƣơng có dạng
lnThuNhap  1   2 KinhNghiem   4GioiTinh  5 NgoaiNgu   6 HoKhau  U
Việc hồi quy đƣợc thực hiện bằng câu lệnh sau
Kết quả hồi quy
4.3. HỒI QUY VỚI BIẾN TƢƠNG TÁC
Giả sử cần tƣơng tác giữa biến KinhNghiem và GioiTinh để xem biến GioiTinh có làm
thay đổi tác động biên của KinhNghiem đến biến lnThuNhap hay không. Dạng hàm hồi
quy với biến tƣơng tác nhƣ sau :
lnThuNhap  1   2 KinhNghiem  3 KinhNghiem  GioiTinh   4 NgoaiNgu  5 HoKhau  U
Tạo biến tƣơng tác
TRẦN THỊ TUẤN ANH - UEH
41
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Thực hiện hồi quy
Kết quả hồi quy
Lưu ý : thay vì dùng hai lệnh để tạo ra biến tƣơng tác rồi hồi quy nhƣ trên, kết quả tƣơng
đƣơng có thể đƣợc tạo ra bằng cách dùng một lệnh duy nhất
Kết quả thực hiện lệnh
TRẦN THỊ TUẤN ANH - UEH
42
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
4.4. Tạo biến giả từ biến định tính
4.4.1. Tạo bằng lệnh tabulate
Trong số liệu của tập tin ThuNhap_TPHCM có biến BangCap là biến định tính với các
lựa chọn PTCS(Phồ thông cơ sở), PTTH (phổ thông trung học), CD (Cao đẳng), DH (Đại
học), THS (Thạc sỹ) và KH(Khác)
Để tạo các biến giả ứng với các lựa chọn của biến bằng cấp, dùng lệnh :
Kết quả, Stata sẽ tạo ra 6 biến giả từ BangCap1 đến BangCap6 ứng với 6 lựa chọn,
đƣợc mô tả nhƣ sau
TRẦN THỊ TUẤN ANH - UEH
43
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
4.4.2. Dùng biến factor
Những biến định tính đƣợc nhập vào theo kiểu số liệu numeric, thay vì tạo biến giả bằng
lệnh tabulate, có thể dùng biến factor để đƣa vào mô hình
Stata sẽ tự động thêm biến giả vào hàm hồi quy. Số biến giả thêm vào sẽ bằng số lựa
chọn của biến BangCap trừ đi 1
TRẦN THỊ TUẤN ANH - UEH
44
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
4.5. TƢƠNG TÁC GIỮA 2 BIẾN ĐỊNH GIẢ - PHƢƠNG PHÁP DIFFERENCE IN
DIFFERENCE
Tƣơng tác giữa hai biến giả đƣợc gọi là phƣơng pháp D-I-D trong kinh tế lƣợng. Ví dụ
sau tƣơng tác giữa hai biến giả GioiTinh và HoKhau
Kết quả thực hiện lệnh
4.6. ƢỚC LƢỢNG HÀM HỒI QUY THEO TỪNG NHÓM
Giả sử muốn ƣớc lƣợng một hồi quy thu nhập cho Nam giới và Nữ giới riêng biệt. Câu lệnh có
thể dùng trong trƣờng hợp này nhƣ sau
TRẦN THỊ TUẤN ANH - UEH
45
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Kết quả là sẽ có hai hàm hồi quy đƣợc ƣớc lƣợng
Lưu ý : thay vì dùng tùy chọn by hoặc bysort, ta có thể dùng điều kiện if sau lệnh
regress
TRẦN THỊ TUẤN ANH - UEH
46
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Kết quả hồi quy cho nữ giới
Kết quả hồi quy cho nam giới
Kết quả cũng vẫn giống với dùng lệnh bysort ở trên.
TRẦN THỊ TUẤN ANH - UEH
47
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 5 : ĐA CỘNG TUYẾN
5.1.
PHÁT HIỆN ĐA CỘNG TUYẾN
Đa cộng tuyến là hiện tƣợng các biến độc lập trong mô hình có mối quan hệ với nhau. Đa
cộng tuyến hoàn hảo làm cho mô hình không ƣớc lƣợng đƣợc. Đa cộng tuyến không hoàn
hảo có thể làm cho các biến độc lập cộng tuyến mất đi ý nghĩa trong mô hình hoặc có thể
bị sai dấu của hệ số hồi quy.
Tiếp tục sử dụng tập tin số liệu ThuNhapTPHCM.dta để hồi quy hàm thu nhập nhƣ sau
lnThuNhap  1   2 KinhNghiem  3GioiTinh   4 NgoaiNgu  5 HoKhau  U
Mô hình ƣớc lƣợng đƣợc
5.1.1. Hệ số tƣơng quan
Hệ số tƣơng quan giữa các biến độc lập trong mô hình đƣợc tính bằng lệnh correlate
TRẦN THỊ TUẤN ANH - UEH
48
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Ma trận hệ số tƣơng quan giữa các biến độc lập nhƣ sau
5.1.2. Nhân tử phóng đại phƣơng sai (vif)
Mỗi biến độc lập trong mô hình sẽ có một hệ số phóng đại phƣơng sai. Để tìm vif, phải
đảm bảo hàm hồi quy vừa chạy gần nhất trƣớc đó là hàm hồi quy cần kiểm định đa cộng
tuyến. Sau đó dùng lệnh vif.
Kết quả
5.2.
PHÁT HIỆN ĐỔI DẤU DO ĐA CỘNG TUYẾN
Việc phát hiện sai dấu do đa cộng tuyến có thể thực hiện bằng các so sánh dấu của hệ số
tương quan giữa biến phụ thuộc và các biến độc lập với dấu của hệ số hồi quy thu được
bằng lệnh regress. Nếu hai dấu này khác nhau, đó là thể hiện của sai dấu cho các biến
TRẦN THỊ TUẤN ANH - UEH
49
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
độc lập có tƣơng quan với nhau.
TRẦN THỊ TUẤN ANH - UEH
50
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 6 : PHƯƠNG SAI THAY ĐỔI
Giả sử xét hàm hồi quy tuyến tính Y   2 X 2  3 X 3  ...   k X k  U
Mô hình hồi quy tuyến tính cổ điển giả định rằng :
E (U i )  0
Var (Ui )   2  const , i  1, n
Cov(Ui ,U j )  0, i  j
Khi giả thiết về sự không đổi của phƣơng sai sai số bị vi phạm sẽ dẫn đến hiện tƣợng
phƣơng sai thay đổi. Khi đó,
E (U i )  0
Var (Ui )   i2 , i  1, n
Cov(Ui ,U j )  0, i  j
Vậy làm sao để phát hiện mô hình hồi quy bị phƣơng sai thay đổi ? Xử lý phƣơng sai
thay đổi nhƣ thế nào? Phần thực hành chƣơng 6 sẽ sử dụng tập tin số liệu
Heteroskesdaticity.dta để thực hiện các kiểm định và xử lý khi có phƣơng sai thay đổi.
Giả sử hàm hồi quy cần ƣớc lƣợng :
Y  1   2 X 2  3 X 3   4 X 4  5 X 5  U
Kết quả hồi quy
TRẦN THỊ TUẤN ANH - UEH
51
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
6.1.
PHÁT HIỆN PHƢƠNG SAI THAY ĐỔI
6.1.1. Đồ thị phần dƣ
Một trong những dấu hiện ban đầu cho thấy có sự hiện diện của phƣơng sai thay đổi là
sai số phân bố không đồng đều xung quanh giá trị trung bình của nó.
Đồ thị thu đƣợc nhƣ sau:
Tùy chọn yline(0) để vẽ trục tung của đồ thị. Qua đồ thị cho thấy phần dƣ của mô hình có
phân bố không đều quanh giá trị trung bình của nó. Đây là dấu hiệu của phƣơng sai thay
đổi.
6.1.2. Kiểm định Breusch – Pagan
TRẦN THỊ TUẤN ANH - UEH
52
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Giả thuyết H0 của kiểm định Breusch – Pagan là mô hình có phƣơng sai thuần nhất, giả
thuyết đối H1 là phƣơng sai của sai số phụ thuộc vào các yếu tố z2i ,..., zki :
H 0 :  i2   2
H1 :  i2   2 h( 2 z2i  ... m zmi )
Sau khi hồi quy bằng OLS, Stata hỗ trợ thực hiện kiểm định Breusch – Pagan bằng lệnh:
Kết quả kiểm định của mô hình trong ví dụ trên là
Một cách dùng khác của kiểm định Breusch – Pagan
Kết quả
6.1.3. Kiểm định White
Giả thuyết H0 của kiểm định White
TRẦN THỊ TUẤN ANH - UEH
H 0 :  i2   2
H1 : i, j :  i2   2j
53
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Kiểm định phƣơng sai thay đổi bằng kiểm định White trên Stata đƣợc thực hiện bằng
lệnh :
Kết quả thực hiện lệnh
Lưu ý : Trong một số trƣờng hợp, nếu phần mềm không hỗ trợ kiểm định phƣơng sai thay
đổi bằng gói các câu lệnh đƣợc xây dựng sẵn, ta có thể hồi quy phần dƣ để kiểm tra
phƣơng sai thay đổi của sai số.
Kết quả nhƣ sau :
TRẦN THỊ TUẤN ANH - UEH
54
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
6.2.
XỬ LÝ PHƢƠNG SAI THAY ĐỔI
Khi bị phƣơng sai thay đổi, ƣớc lƣợng tính đƣợc bằng phƣơng pháp OLS không còn là
ƣớc lƣợng hiệu quả nữa. Đồng thời các kiểm định về hệ số hồi quy đƣợc tính toán dựa
trên giả định var(U i )   2 không còn đáng tin cậy. Việc xử lý hiện tƣợng phƣơng sai
thay đổi có thể tính lại giá trị các kiểm định để kiểm định đáng tin cậy hơn (bằng cách
dùng ma trận ƣớc lƣợng vững của hiệp phƣơng sai) hoặc tìm ƣớc lƣợng hiệu quả hơn
bằng GLS.
6.2.1. Ƣớc lƣợng vững của ma trận hiệp phƣơng sai
Sử dụng ƣớc lƣợng vững của ma trận hiệp phƣơng sai sai số do White(1980) đề xuất để
tính toán lại các giá trị kiểm định khi có phƣơng sai thay đổi. Trên Stata, việc này đƣợc
thực hiện bằng cách thêm tùy chọn robust hoặc vce(robust) sau câu lệnh regress
Kết quả
TRẦN THỊ TUẤN ANH - UEH
55
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Lƣu ý rằng sau khi dùng tùy chọn robust, giá trị các hệ số hồi quy không hề thay đổi. Chỉ
có các sai số chuẩn thay đổi dẫn đến thống kê t và p-value của kiểm định các hệ số hồi
quy thay đổi.
6.2.2. Phƣơng pháp bình phƣơng nhỏ nhất tổng quát (GLS)
Phƣơng pháp GLS để tìm ƣớc lƣợng hiệu quả trong trƣờng hợp phƣơng sai thay đổi
đƣợc thực hiện bằng cách tìm trọng số cho sai số; để sau khi hồi quy với trọng số,
phƣơng sai của mô hình trở nên không đổi. Do vậy , GLS trong trƣờng hợp phƣơng sai
thay đổi còn đƣợc gọi là WLS (Weighted Least Squares – Bình phương nhỏ nhất có trọng
số)
Trong ví dụ trên, trọng số có thể tìm đƣợc nhƣ sau :
TRẦN THỊ TUẤN ANH - UEH
56
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Kết quả sau khi hồi quy với trọng số
Ngoài ra, một số câu lệnh đƣợc viết bởi các nhà nghiên cứu cũng cho phép thực hiện
WLS trên Stata nhƣ wls0, vwls
TRẦN THỊ TUẤN ANH - UEH
57
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
CHƯƠNG 7 : TỰ TƯƠNG QUAN
Hiện tƣợng tự tƣơng quan thƣờng đƣợc xét đối với số liệu theo thời gian, khi giả thiết về
sự không tƣơng quan giữa các sai số bị vi phạm.
Giả sử xét hàm hồi quy Yt  1   2 X t  U t
Chƣơng 7 sử dụng số liệu của tập tin GiaXangDau.dta để thực hiện các kiểm định và xử
lý tự tƣơng quan. Mô tả tập tin số liệu nhƣ sau:
Giả sử hàm hồi quy cần thực hiện:
giaxangvietnamt  1   2 giaxangthegioit  U t
Để Stata nhận dạng số liệu theo thời gian, cần dùng lệnh tsset
Biến quarter là biến dùng để chỉ định thời gian trong tập tin số liệu này. Hồi quy m6 hình
TRẦN THỊ TUẤN ANH - UEH
58
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
với phƣơng pháp OLS, kết quả ƣớc lƣợng ban đầu nhƣ sau :
7.1. KIỂM ĐỊNH TỰ TƢƠNG QUAN
7.1.1. Đồ thị phần dƣ
Các câu lệnh thực hiện để vẽ đồ thị phần dƣ :
Đồ thị biểu diễn phần dƣ thu đƣợc nhƣ sau:
TRẦN THỊ TUẤN ANH - UEH
59
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
7.1.2. Biểu đồ tự tƣơng quan ( ACF - Autocorrelation Function)
Biểu đồ tự tƣơng quan biểu diễn hệ số tự tƣơng quan từ bậc 1 đến bậc k của một đại
lƣợng ngẫu nhiên lên cùng một đồ thị. Để biểu diễn biểu đồ tự tƣơng quan từ bậc 1 đến
bậc 12 của biến phandu, câu lệnh đƣợc sử dụng nhƣ sau
Biểu đồ hiện ra nhƣ sau
7.1.3. Kiểm định Durbin – Watson
Sau khi ƣớc lƣợng hàm hồi quy, để tính giá trị thống kê d theo kiểm định Durbin –
Watson, cần thực thi câu lệnh:
Kết quả
TRẦN THỊ TUẤN ANH - UEH
60
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Với giá trị thống kê d tính đƣợc, ta tra bảng Durbin-Watson, tìm ra giá trị dL và dU, kẻ
thang kiểm định Durbin Watson và kết luận vê tự tƣơng quan bậc nhất. Ngoài ra, Stata hỗ
trợ việc kiểm định tự tƣơng quan bậc nhất bằng Durbin – Watson thông qua việc tính sẵn
giá trị p-value cho kiểm định này.
Kết quả p-value đƣợc hiển thị ra nhƣ sau :
7.1.4. Kiểm định Breusch – Godfrey
Kiểm định BG trên Stata đƣợc hỗ trợ bằng câu lệnh estat bgodfrey. Khi kiểm định
BG trên Stata cần chỉ rõ bậc tự tƣơng quan cần kiểm định. Nếu không chỉ rõ bậc tự
tƣơng quan, phần mềm sẽ mặc định kiểm định tự tƣơng quan bậc 1.
Ví dụ, để kiểm định tự tƣơng quan từ bậc 1 đến bậc 4
Kết quả kiểm định tƣơng ứng
TRẦN THỊ TUẤN ANH - UEH
61
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Nếu chỉ cần kiểm định tự tƣơng quan bậc 1 và bậc 4 (nghĩa là không kiểm định tự
tƣơng quan bậc 2 và 3), câu lệnh đƣợc dùng sẽ là:
Kết quả thực hiện lệnh
7.2. XỬ LÝ TỰ TƢƠNG QUAN
Cũng giống nhƣ trƣờng hợp phƣơng sai thay đổi, hiện tƣợng tự tƣơng quan cũng làm cho
ƣớc lƣợng OLS không còn là ƣớc lƣợng hiệu quả nhất và các kiểm định về hệ số hồi quy
cũng không còn đáng tin cậy. Do đó, việc khắc phục có thể theo hai hƣớng. Một là, làm
cho kiểm định hệ số hồi quy đáng tin cậy hơn bằng ma trận ƣớc lƣợng hiệp phƣơng sai
của Newey – West. Hai là, tìm ƣớc lƣợng hiệu quả bằng GLS.
7.2.1. Ma trận ước lượng hiệp phương sai Newey - West
Để sử dụng ma trận ƣớc lƣợng hiệp phƣơng sai, cần chỉ định rõ bandwidth đƣợc sử dụng
TRẦN THỊ TUẤN ANH - UEH
62
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
để tính toán ma trận ƣớc lƣợng hiệp phƣơng sai. Bandwidth có thể đƣợc tính toán bằng
công thức B  0.75T
1
3

hoặc B  4 T 100

2
9
. Stata không dùng bandwidth mặc định nhƣ
một số phần mềm khác nên ngƣời dùng thƣờng phải chỉ định con số này.
Để tính toán bandwidth, ta \có thể dùng các câu lệnh sau
Kết quả bandwidth đƣợc chọn sẽ là
Với bandwidth = 3, mô hình hồi quy đƣợc thực hiện với ma trận ƣớc lƣợng hiệp phƣơng
sai của Newey – West nhƣ sau :
Kết quả thực hiện câu lệnh trên
7.2.2. Khắc phục tự tương quan bằng GLS – thủ tục Prais - Winsten
TRẦN THỊ TUẤN ANH - UEH
63
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
Một thủ tục phổ biến của GLS để xử lý trong trƣờng hợp tự tƣơng quan bậc nhất đƣợc đề
xuất bởi Prais – Winsten(1954). Stata thực hiện thủ tục này bằng lệnh prais. Cú pháp
lệnh này rất giống lệnh regress
Kết quả thực hiện
Lệnh prais có các tùy chọn để tính hệ số tự tƣơng quan rho khác nhau (gõ help prais để
xem trợ giúp của Stata về các tùy chọn này).
TRẦN THỊ TUẤN ANH - UEH
64
HƯỚNG DẪN THỰC HÀNH STATA 12 2014
TÀI LIỆU THAM KHẢO
Lee C. Adkins & R. Carter Hill (2011), Using Stata for Principles of Econometrics, 4th
edition, Wiley Publisher.
White, H. (1980), A Heteroscedasticity-Consistent Covariance Matrix Es timator and a
Direct Test for Heteroscedasticity. Econometrica 48, 817-838.
Prais, S. J. and Winsten D. B., (1954),
Trend Estimators and Serial Correlation
Cowles Commission, Discussion Paper No. 383, University of Chicago.
TRẦN THỊ TUẤN ANH - UEH
65
Download