Uploaded by hanh nguyen

Econome

advertisement
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh Tế Lượng
và Dữ liệu kinh tế
Chương 1
Wooldridge: Giới thiệu Kinh tế lượng :
Một phương pháp tiếp cận hiện đại, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
1.1 Kinh tế lượng là gì?
Kinh tế lượng = sử dụng các phương pháp thống kê để phân tích dữ liệu kinh tế
Các nhà Kinh tế lượng thường phân tích dữ liệu phi thí nghiệm (quan sát)
Các mục tiêu đặc trưng của phân tích kinh tế lượng
Ước lượng các mối quan hệ giữa các biến kinh tế
Kiểm định các lý thuyết và các giả thuyết kinh tế
Dự báo các biến kinh tế
Đánh giá và bổ sung chính sách của chính phủ và doanh nghiệp
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
1
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
1.2 Các bước trong việc phân tích kinh tế lượng
1) Mô hình kinh tế (bước này thường bị bỏ qua)
2) Mô hình kinh tế lượng
Các mô hình kinh tế
Có thể là các mô hình vi mô hoặc vĩ mô
Thường sử dụng hành vi tối ưu, mô hình cân bằng, …
Thiết lập mối quan hệ giữa các biến kinh tế
Ví dụ: các hàm cầu, phương trình giá, …
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.1 Mô hình kinh tế về tội phạm (Becker - 1968)
Thiết lập phương trình đối với hoạt động phạm tội dựa trên nguyên tắc tối đa
hoá lợi ích
1.1
Số giờ tiêu tốn cho
hoạt động phạm tội
“Số tiền nhận được“
của hoạt động phạm
tội *
Tuổi
Tiền lương cho
việc làm hợp
pháp
Thu nhập
khác
Khả năng
bị bắt #
Khả năng bị
kết án nếu
bị bắt #
Mức án dự kiến
nếu bị kết án #
Dạng hàm của mối liên hệ không được nêu rõ
Phương trình có thể thừa nhận mà không dựa trên mô hình kinh tế
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
2
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.1 (tt) Mô hình kinh tế lượng về hoạt động phạm tội
Dạng hàm phải được định rõ
Các biến có thể phải xấp xỉ bởi các đại lượng khác
Đo lường mức độ
hoạt động phạm tội
Tiền lương cho
việc làm hợp
pháp
Thu nhập
khác
Số lần bị bắt
giữ trước đây #
Các yếu tố tác động đến
hoạt động phạm tội nhưng
không quan sát được
1.3
Số lần bị kết án #
Độ dài bản án trung
bình nếu bị kết tội #
Tuổi
Ví dụ: Tính cách, số
tiền thu được từ hoạt
động phạm tội, nền
tảng gia đình…
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.2 Mô hình kinh tế về đào tạo nghề và năng suất người lao động
Việc đào tạo nghề tác động đến năng suất người lao động như thế nào?
Lý thuyết kinh tế chính thức không thực sự cần thiết để xây dựng phương trình
1.2
Lương theo giờ
Số năm đi học
chính thức
Số năm kinh nghiệm
Số tuần tham gia vào
đào tạo nghề
Còn có nhiều yếu tố khác có thể liên quan đến phương trình trên nhưng
đây là các yếu tố quan trọng nhất
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
3
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.2 (tt) Mô hình kinh tế lượng về đào tạo nghề và năng suất
người lao động
Các yếu tố tác động đến
tiền lương nhưng
không quan sát được
1.4
Tiền lương
theo giờ
Số năm đi học
chính thức
Số năm kinh
nghiệm
Số tuần tham gia vào
đào tạo nghề
Ví dụ: Năng lực bẩm sinh,
chất lượng giáo dục,
nền tảng gia đình …
Phần lớn nội dung kinh tế lượng là xử lý vấn đề định dạng sai số u
Các mô hình kinh tế lượng có thể được dùng để kiểm định giả thuyết
Ví dụ, tham số β3 cho biết tác động của việc đào tạo lên tiền lương
Tác động này lớn ra sao? Tác động này có khác 0 hay không?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
7
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
1.3 Phân tích kinh tế lượng đòi hỏi cần có dữ liệu
Các loại dữ liệu kinh tế
Dữ liệu chéo
Dữ liệu chuỗi thời gian
Dữ liệu chéo gộp
Dữ liệu bảng/dữ liệu dọc (longitudinal data)
Phương pháp kinh tế lượng phụ thuộc vào bản chất của dữ liệu được
sử dụng
Sử dụng các phương pháp không thích hợp có thể dẫn đến kết quả sai lầm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
4
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chéo
Mẫu gồm các cá nhân, các hộ gia đình, các doanh nghiệp, các tỉnh thành, các
quốc gia, hay các đơn vị quan tâm khác tại một thời điểm hoặc trong một
khoảng thời gian đã cho
Các quan sát chéo có thể ít nhiều độc lập với nhau
Ví dụ, lấy mẫu ngẫu nhiên từ một tổng thể
Đôi khi việc lấy mẫu ngẫu nhiên bị vi phạm, ví dụ: các đơn vị từ chối trả lời
trong các cuộc khảo sát, hay nếu việc lấy mẫu được phân theo cụm
Dữ liệu chéo thường gặp trong kinh tế vi mô ứng dụng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chéo về tiền lương và các biến về đặc điểm nhân khẩu
Biến chỉ báo
(1= đúng, 0= sai)
Số quan sát
Tiền lương theo giờ
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
5
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chéo về tốc độ tăng trưởng và các đặc điểm của quốc gia
Tỷ lệ tăng của
GDP thực bình
quân đầu người
Phần trăm của
chi tiêu chính
phủ trên GDP
Tỷ lệ người lớn
hoàn thành trung
học cơ sở
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
11
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chuỗi thời gian
Các quan sát của một hay nhiều biến theo thời gian
Ví dụ, giá chứng khoán, cung tiền, chỉ số giá tiêu dùng, tổng sản phẩm trong
nước, doanh số bán xe hơi, …
Các quan sát chuỗi thời gian thường gặp vấn đề tương quan chuỗi
Thứ tự của các quan sát cũng truyền tải những thông tin quan trọng
Tần suất dữ liệu: hàng ngày, hàng tuần, hàng tháng, hàng quý, hàng năm, …
Đặc điểm tiêu biểu của chuỗi thời gian: xu thế và thời vụ
Các ứng dụng thường gặp: Kinh tế vĩ mô và tài chính ứng dụng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
6
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu thời gian về tiền lương tối thiểu và các biến liên quan
Tiền lương tối thiểu
trung bình trong
một năm cho trước
Tỷ lệ bảo hộ trung bình
(bởi luật lương tối thiểu)
Tỷ lệ thất nghiệp
Tổng sản phẩm
quốc gia
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
13
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chéo gộp
Hai hay nhiều bộ dữ liệu chéo được kết hợp thành một tập dữ liệu
Các dữ liệu chéo được rút ra độc lập với nhau
Dữ liệu chéo gộp thường được dùng để đánh giá các thay đổi chính sách
Ví dụ:
• Đánh giá tác động của thay đổi thuế tài sản lên giá nhà
• Mẫu ngẫu nhiên về giá nhà trong năm 1993
• Mẫu ngẫu nhiên khác của giá nhà trong năm 1995
• So sánh trước/sau (1993: trước thay đổi, 1995: sau thay đổi)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
14
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
7
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu chéo gộp về giá nhà
Thuế tài sản
Số phòng ngủ
Kích thước của
ngôi nhà tính
bằng feet vuông
Số phòng tắm
Trước thay đổi
Sau thay đổi
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
15
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu bảng (hay dữ liệu dọc)
Cùng các đơn vị chéo được quan sát theo thời gian
Dữ liệu bảng có chiều thời gian và chiều dữ liệu chéo
Dữ liệu bảng có thể được dùng để kiểm soát những yếu tố không
quan sát được nhưng không đổi theo thời gian
Dữ liệu bảng có thể được dùng để lập mô hình các trường hợp có
biến trễ của biến phụ thuộc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
16
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
8
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Ví dụ:
• Thống kê tội phạm trong thành phố; mỗi thành phố được quan
sát trong hai năm
• Các đặc điểm không quan sát được nhưng không thay đổi theo
thời gian của thành phố có thể được kiểm soát trong mô hình
• Tác động của cảnh sát đến tỷ lệ tội phạm có thể có tính trễ
theo thời gian
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
17
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
Dữ liệu bảng hai năm về thống kê tội phạm trong thành phố
Mỗi thành phố có hai
quan sát theo thời gian
Số cảnh sát trong
năm 1986
Số cảnh sát trong
năm 1990
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
9
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
1.4 Quan hệ nhân quả và khái niệm về “phân tích trong điều kiện
các yếu tố khác không đổi“
Định nghĩa về tác động nhân quả của
đến
Cách thức biến
thay đổi khi biến
kiện các yếu tố khác không đổi“
thay đổi “trong điều
Đa số các câu hỏi kinh tế là câu hỏi phân tích trong điều kiện các
yếu tố khác không đổi
Điều quan trọng là xác định tác động nhân quả nào mà người ta
quan tâm
Cần thiết phải mô tả cách thiết kế một thí nghiệm để có thể suy
diễn được về quan hệ nhân quả mà câu hỏi nghiên cứu đặt ra
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.3: Tác động nhân quả của phân bón lên năng suất cây trồng
“Sản lượng đậu nành sẽ tăng lên bao nhiêu nếu tăng lượng phân bón cho đất?“
Giả thiết ngầm: tất cả các yếu tố khác tác động đến năng suất cây trồng như chất
lượng đất, lượng mưa, sự hiện diện của ký sinh trùng, vv ... được giữ cố định
Thí nghiệm:
Chọn các thửa đất có diện tích một mẫu; gán ngẫu nhiên số lượng phân bón khác
nhau cho các thửa khác nhau; so sánh sản lượng
Cách thí nghiệm này áp dụng được lượng phân bón sử dụng không liên quan đến
các yếu tố khác tác động đến năng suất cây trồng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
10
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.4: Đo lường suất sinh lợi giáo dục
“Nếu một người được chọn từ tổng thể và số năm đi học của người này
tăng thêm một, tiền lương của họ sẽ tăng bao nhiêu?“
Giả thiết ngầm: tất cả các yếu tố khác tác động đến tiền lương như kinh
nghiệm, nền tảng gia đình, sự thông minh, vv... được giữ cố định
Thí nghiệm:
Chọn một nhóm người; gán ngẫu nhiên số năm học khác nhau cho họ
(không khả thi!); so sánh kết quả tiền lương
Vấn đề khi không thể gán ngẫu nhiên: số năm đi học của một người có
liên hệ với các yếu tố khác mà tác động tiền lương (Ví dụ: sự thông minh)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
21
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.5: Tác động của việc thực thi pháp luật đến mức tội phạm của thành phố
“Nếu chọn ngẫu nhiên một thành phố và tăng thêm 10 cảnh sát cho thành phố này,
tỉ lệ phạm tội của nó sẽ giảm khoảng bao nhiêu?“
Nói cách khác: “Nếu hai thành phố giống nhau ở mọi khía cạnh, ngoại trừ thành
phố A có nhiều hơn 10 cảnh sát, tỉ lệ phạm tội của hai thành phố sẽ khác biệt nhau
khoảng bao nhiêu?“
Cách thí nghiệm:
Gán ngẫu nhiên số cảnh sát cho một số lớn các thành phố
Thực tế, số cảnh sát sẽ được quyết định bởi tỷ lệ tội phạm (có sự đồng thời trong
vấn đề xác định tỷ lệ tội phạm và số cảnh sát)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
22
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
11
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.6: Tác động của lương tối thiểu đến thất nghiệp
“Số người thất nghiệp sẽ tăng bao nhiêu nếu tiền lương tối thiểu
được tăng lên một lượng nào đó“? (các yếu tố khác không đổi)
Cách thí nghiệm:
Chính phủ chọn ngẫu nhiên lương tối thiểu mỗi năm và quan sát kết
quả thất nghiệp
Thí nghiệm sẽ có hiệu lực vì mức lương tối thiểu không liên hệ với
các yếu tố khác tác động đến sự thất nghiệp
Thực tế, mức lương tối thiểu sẽ phụ thuộc vào các yếu tố kinh tế và
chính trị mà những yếu tố này cũng tác động đến thất nghiệp
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
23
Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế
VD 1.7: Kiểm định các dự đoán của lý thuyết kinh tế
Các lý thuyết kinh tế không phải lúc nào cũng được phát biểu dưới dạng tác
động nhân quả
Ví dụ, giả thuyết kỳ vọng nói rằng lãi suất dài hạn bằng kỳ vọng của lãi kép
ngắn hạn
Hàm ý là lãi suất của một trái phiếu kỳ hạn ba tháng nên bằng với lãi suất kỳ
vọng trong ba tháng đầu tiên của một trái phiếu kỳ hạn sáu tháng; điều này
có thể được kiểm định bằng cách sử dụng các phương pháp kinh tế lượng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
24
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
12
Chương 1 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03/08/2021
Môøi gheù thaêm trang web:
25
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
25
https://sites.google.com/a/ueh.edu.vn/
phamtricao/
13
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Chương 2
Wooldridge: Kinh tế lượng nhập môn:
Cách tiếp cận hiện đại, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Mô hình hồi quy đơn
2.1 Định nghĩa về mô hình hồi quy tuyến tính đơn
Giải thích biến y theo biến x
Hệ số chặn
Hệ số góc
2.1
Biến phụ thuộc,
Biến được giải thích,
Biến được hồi quy,…
Thành phần sai số ngẫu nhiên,
Biến độc lập,
Biến giải thích,
Biến hồi quy,…
nhiễu (đại diện các yếu tố
không quan sát được)
Nhiễu u luôn luôn tồn tại
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
β0: hệ số chặn (hệ số tự do, tung độ gốc)
β1: hệ số góc (độ dốc)
3
3
Mô hình hồi quy đơn
Cách diễn giải mô hình hồi quy tuyến tính đơn
“Nghiên cứu sự thay đổi của
tương ứng với sự thay đổi trong
:“
2.2
với điều kiện
Biến phụ thuộc thay đổi bao nhiêu đơn vị
nếu biến độc lập tăng lên một đơn vị?
Việc giải thích chỉ đúng khi tất cả các yếu
tố khác giữ nguyên, khi biến độc lập tăng
một đơn vị
 1 > 0: Biến phụ thuộc tăng bao nhiêu đơn vị
nếu biến độc lập tăng lên một đơn vị?
Mô hình hồi quy tuyến tính đơn hiếm khi áp dụng trong thực tế
nhưng cần thiết thảo luận về mô hình này vì lý do sư phạm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
VD 2.1: Sản lượng đậu nành và phân bón
2.3
Lượng mưa, chất lượng đất,
sự hiện diện của vật ký sinh, …
Đo lường tác động của phân bón lên sản lượng,
trong điều kiện các yếu tố khác không đổi
VD 2.2: Một phương trình tiền lương dạng đơn giản
2.4
Kinh nghiệm tham gia lực lượng lao động,
thâm niên chức vụ, đạo đức công việc,
sự thông minh …
Đo sự thay đổi trong tiền lương theo giờ
khi thêm 1 năm đi học, giữ các yếu tố khác cố định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
Mô hình hồi quy đơn
Khi nào có thể diễn giải dưới dạng quan hệ nhân quả?
Một hàm bất kỳ của biến
x không tương quan với u
2.5 & 2.6
Biến giải thích phải không hàm chứa
thông tin về trung bình của các
yếu tố không quan sát được
Giả thiết 2.5 & 2.6 có thể đúng/sai trong thực tế
VD 2.2 tt: phương trình tiền lương
Ví dụ: Sự thông minh, tuổi …
Giả thiết sự độc lập về trung bình có điều kiện ít khi được thoả mãn vì xét trung
bình, những người có học vấn cao hơn cũng thường thông minh hơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Hàm hồi quy tổng thể (PRF)
Giả thiết sự độc lập của trung bình có điều kiện hàm ý rằng
2.8
Điều này có nghĩa là giá trị trung bình của biến phụ thuộc có thể
được biểu diễn như một hàm tuyến tính của biến giải thích
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
7
Mô hình hồi quy đơn
Hàm hồi quy tổng thể PRF
Đối với cá nhân có
giá trị trung bình của y là
,
E ( y / x2 )   0  1 x2
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
2.2 Tìm các ước lượng bình phương nhỏ nhất (OLS)
Để ước lượng mô hình hồi quy, ta cần dữ liệu
Một mẫu ngẫu nhiên gồm
quan sát
Quan sát thứ nhất
Quan sát thứ hai
Quan sát thứ ba
Giá trị của
Giá trị của
biến độc lập
biến phụ thuộc
ở quan sát thứ i
ở quan sát thứ i
Quan sát thứ n
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
MÔ HÌNH HỒI QUY ĐƠN
known already-> no
need for numbers
NOT measurement of y, cuz y known already
10
10
known already-> no uhat
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Tìm một đường hồi quy xuyên qua các điểm dữ liệu
“càng phù hợp càng tốt“:
2.9
Ví dụ, điểm dữ liệu
thứ i
Đường hồi quy ước
lượng (SRF)
2.20
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
11
Mô hình hồi quy đơn
“càng phù hợp càng tốt“ nghĩa là gì? yi^ càng gần yi , với mọi i
Các phần dư hồi quy
2.21
Cực tiểu hóa tổng bình phương các phần dư hồi quy
2.22
Ước lượng bình phương nhỏ nhất thông thường (OLS)
2.17 & 2.19
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
VD 2.3 Tiền lương CEO và tỷ số lợi nhuận trên vốn chủ sở hữu
Tiền lương (ngàn USD/năm)
Lợi nhuận trên vốn chủ sở hữu (Return on equity)
của doanh nghiệp mà CEO đang làm việc (%)
Hồi quy ước lượng được
2.26
Hệ số chặn
Diễn giải ý nghĩa nhân quả?
Nếu lợi nhuận trên vốn chủ sở hữu tăng 1 (%)
thì tiền lương tăng 18,501 ngàn USD/năm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
13
Mô hình hồi quy đơn
Đường hồi quy tổng thể có duy nhất không?
Đường hồi quy mẫu có duy nhất không?
Đường hồi quy ước lượng SRF
(phụ thuộc vào mẫu) (biết)
tons
Đường hồi quy tổng thể PRF
(không biết)
only one
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
VD 2.4 Tiền lương và học vấn
Tiền lương (USD/giờ)
Số năm đi học (năm)
Hàm hồi quy ước lượng
2.27
Hệ số chặn
Diễn giải ý nghĩa nhân quả?
Nếu số năm đi học tăng 1 năm thì
tiền lương tăng 0,54 USD/giờ
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
15
Mô hình hồi quy đơn
VD 2.5 Kết quả bỏ phiếu và chi phí tranh cử (giữa hai đảng)
Tỷ
lệ bỏ phiếu
cho ứng cử viên A (%)
Fitted
regression
Phần trăm chi phí tranh cử của ứng cử viên A (%)
2.28
Hệ số chặn
Diễn giải ý nghĩa nhân quả?
Nếu chi phí tranh cử của ứng cử viên A tăng thêm
1 % thì tỷ lệ bỏ phiếu cho ứng cử viên A tăng
thêm 0,464 % tổng số phiếu bầu
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
2.3 Các tính chất của OLS trên mẫu dữ liệu bất kỳ
Các giá trị ước lượng và các phần dư
Các giá trị ước lượng hay
giá trị dự đoán
Độ lệch so với đường hồi quy (= phần dư)
Các tính chất đại số của hồi quy OLS
2.30
Tổng các phần dư bằng 0
2.31
Tương quan giữa phần dư và biến
độc lập bằng 0
(Hiệp phương sai mẫu giữa x và
u^ bằng 0)
Trung bình mẫu của y và x nằm
trên đường hồi quy mẫu SRF
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
17
Mô hình hồi quy đơn
Ví dụ, tiền lương của CEO số 12 thấp hơn mức
tiền lương dự đoán khi sử dụng thông tin về lợi
nhuận trên vốn chủ sở hữu của doanh nghiệp nơi
CEO này làm việc là 526,0231 USD
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Mức độ phù hợp của SRF so với mẫu khảo sát
“Mức độ giải thích của biến độc lập cho biến phụ thuộc ra sao?“
;
Đo lường sự biến động
2.33
2
SSE  ˆ12  ( xi  x )
2.34
Tổng bình phương toàn phần,
cho biết toàn bộ biến thiên
trong biến phụ thuộc
Tổng bình phương hồi quy,
cho biết phần biến thiên được
giải thích bởi hàm hồi quy
2.35
Tổng bình phương phần dư,
cho biết phần biến thiên không
được giải thích bởi hàm hồi quy
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Mô hình hồi quy đơn
Phân rã tổng mức độ biến thiên
SST, SSE, SSR cố định hay biến đổi?
Nếu biến đổi thì biến đổi theo yếu tố gì?
2.36
Toàn bộ phần
biến thiên
Phần biến thiên
được giải thích
Phần biến thiên không
được giải thích
Đo lường sự phù hợp (R2) (R-squared)
2.38
R2 cho biết tỷ lệ phần biến thiên của y
được giải thích bằng hàm hồi quy
Tính chất: 0  R2  1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
VD 2.8 Tiền lương CEO và tỷ số lợi nhuận trên vốn chủ sở hữu
2.39
Hồi quy chỉ giải thích 1,32 % toàn bộ
biến thiên trong tiền lương CEO
VD 2.9 Kết quả bỏ phiếu và chi phí tranh cử (giữa 2 đảng)
2.40
Hồi quy giải thích 85,6 % toàn bộ
biến thiên trong kết quả bầu cử
Cảnh báo: R2 không nhất thiết hàm ý về mối quan hệ nhân quả
trong hàm hồi quy
VD: lượng mưa = β0 + β1 năng suất lúa + u
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
21
MÔ HÌNH HỒI QUY ĐƠN
>
>
>
>
load("I:/Bai giang 2020 hk3/Chuong 02/wage2.RData")
wage2<-data
hq1 <-lm(wage~IQ, data=wage2)
summary(hq1)
Call:
lm(formula = wage ~ IQ, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.9916
85.6415
1.366
0.172
IQ
8.3031
0.8364
9.927
<2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 384.8 on 933 degrees of freedom
Multiple R-squared: 0.09554, Adjusted R-squared: 0.09457
F-statistic: 98.55 on 1 and 933 DF, p-value: < 2.2e-16
> hq2 <-lm(IQ~wage, data=wage2)
> summary(hq2)
Call:
lm(formula = IQ ~ wage, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 90.260206
1.205063 74.901
<2e-16 ***
wage
0.011506
0.001159
9.927
<2e-16 ***
--Residual standard error: 14.32 on 933 degrees of freedom
Multiple R-squared: 0.09554, Adjusted R-squared: 0.09457
F-statistic: 98.55 on 1 and 933 DF, p-value: < 2.2e-16
22
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
2.4 Vấn đề về đơn vị tính của biến và dạng hàm
Mối liên hệ giữa đơn vị đo cũ và mới
y (tấn) y* (kg)
1
1000 = k0
x (trăm ngàn đ) x* (triệu đ)
1
0,1 = k1
y (tháng) y* (năm)
1
1/12 = k0
x (năm) x* (tháng)
1
12 = k1
y (tấn/tháng) y* (tấn/năm)
1
12 = k0
x (triệu đ/năm) x* (ngàn đ/tháng)
1
103/12 = k1
x (USD/kg) x* (ngàn đ/g)
Tỷ giá
1
20/1000 = k1 1 USD = 20 ngàn đ
y* = k0y ; x*= k1x
23
23
MÔ HÌNH HỒI QUY ĐƠN
Chương 6, sách dịch Kinh tế lượng, trang 205-207
Công thức:
Z (đơn vị cũ)  Z* (đơn vị mới)
1
k
Z* = k = k.1 = k.Z
Áp dụng:
1) 1 pound = 16 ounce
Bwght (ounce)
Bwghtlbs (pound)
Bwght (ounce)  Bwghtlbs (pound)
1
1/16
Bwghtlbs = 1/16 = (1/16).1 = (1/16) Bwght
2) 1 packs = 20 cigs (1 gói có 20 điếu)
cigs (điếu)
packs (gói)
cigs (điếu)  packs (gói)
1
1/20
packs = 1/20 = (1/20).1 = (1/20) cigs
24
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
Hàm hồi quy mẫu theo đơn vị đo cũ
ŷ  ˆ 0  ˆ1 x
Hàm hồi quy mẫu theo đơn vị đo mới
ŷ *  ˆ 0*  ˆ1* x *
k
ˆ1*  0 ˆ1
Với ˆ 0*  k 0 ˆ 0
;
k1
*
k
yˆ
x*
 ˆ 0  ˆ1
Cm: ŷ  ˆ 0  ˆ1 x 
 yˆ *  k 0 ˆ 0  0 ˆ1 x *
k0
k1
k1
VD: yˆ  2  0, 0 0 7 x ; k0= 1000 ; k1= 0,1
1 0 00
yˆ *  10 0 0 * 2 
0, 0 07 x *  2 00 0  70 x *
0,1
Câu hỏi: R2 có phụ thuộc vào đơn vị đo của biến x và y không?
25
25
MÔ HÌNH HỒI QUY ĐƠN
Khái niệm biên tế
Giả sử ta có Y = f(X).
X là lượng thay đổi tuyệt đối của biến X
Biên tế của Y theo X được tính bằng:
MYX = Y/ X
Hay:
Y = MYX .X
Ý nghĩa: Khi X tăng 1 đơn vị thì Y thay đổi MYX đơn vị.
MYX > 0: X tăng 1 đơn vị thì Y tăng MYX đơn vị.
Khi X rất nhỏ (X0), giá trị biên tế được tính x ấp xỉ là
đạo hàm của Y theo X, tức là:
MYX  dY/dX = f’(X)
26
• Biên tế phụ thuộc đơn vị đo của biến
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
Khái niệm hệ số co giãn
X/X là lượng thay đổi tương đối của biến X
Hệ số co giãn của Y theo X được tính bằng:
Y / Y
E YX 
X / X
Y
X
Hay: 100
 E Y X (10 0
)
Y
X
Ý nghĩa: Khi X tăng 1% thì Y thay đổi EYX %.
EYX > 0 : Khi X tăng 1% thì Y tăng EYX %.
Khi X rất nhỏ (X0), ta có:
dY / Y
X
EYX 
 f '( X )
dX / X
Y
• Hệ số co giãn không phụ thuộc đơn vị đo
của biến
27
27
MÔ HÌNH HỒI QUY ĐƠN
Tên
Dạng hàm
gọi
Tuyến y  0  1 x
tínhTuyến
tính
Tuyến y   0  1 log( x)
tính
-log
log( y )   0  1 x
Log
-Tuyến
tính
log( y )   0  1 log( x)
Log
-Log
Biên tế Dẫn xuất từ biên tế
β1
y  ( 1 )(x)
Hệ số
co giãn
β1 .(x/y)
β1 (1/x)
y  ( 1 / 100)(100x / x)
β1 .(1/y)
β1 (y)
100y / y  ( 1.100)( x)
β1 .(x)
β1 (y/x) 100y / y  ( 1 )(100x / x ) β1
Ý nghĩa của hệ số góc
Khi x tăng 1 % thì y
thay đổi (β1 /100) đơn
vị
Khi x tăng 1 đơn vị thì
y thay đổi (β1.100)%
Khi x tăng 1 đơn vị thì
y thay đổi β1 đơn vị
Khi x tăng 1% thì y
thay đổi β1 %
Tuyến tính – Tuyến tính (tuyến tính)
Tuyến tính – log (lin – log) ; linear
Log – Tuyến tính (log – lin)
Log – Log (tuyến tính log / log kép)
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
29
29
MÔ HÌNH HỒI QUY ĐƠN
Ví dụ:
Y: chi tiêu (triệu đ)
X : thu nhập (USD), 1 USD = 20 ngàn đ
1) yˆ  1,2  0,07 x
Khi thu nhập tăng lên 1 USD thì chi tiêu tăng lên 0,07 triệu đ,
với các yếu tố khác cố định
2) yˆ  0,9  2ln x
Khi thu nhập tăng lên 1 % thì chi tiêu tăng lên 2/100 = 0,02 triệu đ,
với các yếu tố khác cố định
y  0,4  0,06 x
3) ln
Khi thu nhập tăng lên 1 USD thì chi tiêu tăng lên 0,06*100 = 6 %,
với các yếu tố khác cố định
y  0,8  0,03ln x
4) ln
Khi thu nhập tăng lên 1 % thì chi tiêu tăng lên 0,03 %,
với các yếu tố khác cố định
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
2.4 Vấn đề về đơn vị tính của biến và dạng hàm
Kết hợp phi tuyến tính: Dạng semi-log
VD 2.10 Hồi quy log tiền lương theo số năm đi học
2.42
logarit tự nhiên của tiền lương
Điều này thay đổi sự giải thích của hệ số hồi quy:
Tỷ lệ thay đổi của tiền
lương
… nếu số năm đi học
tăng 1 năm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
31
Mô hình hồi quy đơn
2.43
Hồi quy ước lượng
2.44
Nếu số năm đi học tăng thêm 1 năm
thì tiền lương tăng thêm 8,3 %
(= suất sinh lợi giáo dục)
Ví dụ:
Mức tăng của lương là 8,3 % cho mỗi
năm đi học tăng thêm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Dạng hàm phi tuyến: Dạng Log-log (tuyến tính log, log kép)
VD 2.11 Lương CEO và doanh số bán hàng
2.45
logarit tự nhiên của
tiền lương CEO
logarit tự nhiên của doanh số bán của
công ty nơi ông ấy/ cô ấy làm việc
Điều này thay đổi sự giải thích của hệ số hồi quy:
Tỷ lệ thay đổi tiền lương
… nếu doanh số tăng 1 %
Các thay đổi Logarit luôn là
thay đổi phần trăm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
33
Mô hình hồi quy đơn
VD 2.11 (tt): Tiền lương CEO và doanh số bán hàng
2.46
VD:
Nếu doanh số tăng 1 % thì tiền lương CEO tăng 0,257 %
Dạng log-log hàm ý về mô hình hệ số co giãn không đổi trong khi
dạng semi-log cho phép giả định về mô hình với hệ số bán co giãn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
2.5 Các giá trị kỳ vọng và phương sai của các ước lượng OLS
Các hệ số hồi quy ước lượng được là các biến ngẫu nhiên vì
chúng được tính từ một mẫu ngẫu nhiên
Dữ liệu là ngẫu nhiên và phụ thuộc vào mẫu cụ thể được rút ra
Câu hỏi là trung bình các tham số ước lượng bằng bao nhiêu và
chúng biến thiên ra sao trong mẫu lặp lại
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
35
Mô hình hồi quy đơn
Các giả thiết (thông thường) cho mô hình hồi quy tuyến tính
Giả thiết SLR.1 (Sự tuyến tính theo tham số )
2.47
Trong tổng thể, mối quan hệ giữa y và x
là tuyến tính theo tham số
Giả thiết SLR.2 (Mẫu ngẫu nhiên)
Dữ liệu là một mẫu ngẫu nhiên
rút ra từ tổng thể
2.48
Mỗi điểm dữ liệu vì thế
tuân theo phương trình tổng thể
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
Hiểu chữ tuyến tính như thế nào cho đúng?
Trong các phương trình sau, phương trình
nào được gọi là pt tuyến tính, tại sao?
1) x  y 2   3
1
2)  x 
 2
y
3) x  3 y  0
4) 2 x  3 y  5
5) x  y  3
6) e x  y  7
7) x  ln y   2
8) tgx  y  6
9) x / y  4 y  5
10) 2 xy  3 x  7
37
37
MÔ HÌNH HỒI QUY ĐƠN
Trong các mô hình hồi quy sau,
mô hình nào là hồi quy tuyến tính?
 1
 U
X
1) Y     
1 2
2) ln Y     ln X  U
3) Y     X   X 2  U
1 2
3
1
4) Y    X  U

5) Y

1
U
  X
1 e 1 2
38
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Thảo luận về mẫu ngẫu nhiên: Tiền lương và học vấn
Tổng thể, ví dụ bao gồm tất cả người lao động của nước A
Trong tổng thể, mối quan hệ tuyến tính giữa tiền lương (hay log tiền
lương) và số năm đi học được thỏa mãn
Rút ngẫu nhiên một người lao động từ tổng thể
Tiền lương và số năm đi học của lao động trên là ngẫu nhiên vì người ta
không biết trước người lao động nào được rút ra
Trả người lao động lại vào tổng thể và lặp lại việc rút ngẫu nhiên
lần
Tiền lương và số năm đi học của các lao động đã rút ra sẽ được sử dụng
để ước lượng mối quan hệ tuyến tính giữa tiền lương và học vấn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
39
Mô hình hồi quy đơn
Các giá trị ứng với lao
động thứ i đã rút ra
Chênh lệch so với mối
quan hệ tổng thể ở
công nhân thứ i:
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Các giả thiết (thông thường) cho mô hình hồi quy tuyến tính (tt)
Giả thiết SLR.3 (Biến thiên trong mẫu của biến độc lập)
Giá trị của biến độc lập không giống nhau hoàn toàn
(nếu không sẽ không thể nghiên cứu các giá trị khác
nhau của biến độc lập dẫn đến các giá trị khác nhau
của biến phụ thuộc như thế nào)
Giả thiết SLR.4 (Kỳ vọng có điều kiện bằng 0)
Giá trị của biến độc lập không được chứa
thông tin về giá trị trung bình của các yếu
tố không quan sát được
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
41
Mô hình hồi quy đơn
Định lý 2.1 (Tính không chệch của OLS)
2.53
Giải thích về tính không chệch
Các hệ số ước lượng được có thể nhỏ hơn hay lớn hơn hệ số hồi quy tổng
thể (hệ số hồi quy đúng), phụ thuộc vào mẫu ngẫu nhiên được chọn
Tuy nhiên, xét trung bình, chúng sẽ bằng giá trị của hệ số hồi quy đúng
thể hiện mối quan hệ giữa y và x trong tổng thể
“Xét trung bình“ có nghĩa nếu việc lấy mẫu được lặp lại, nghĩa là lấy mẫu
ngẫu nhiên và thực hiện ước lượng lặp lại nhiều lần
Với một mẫu cho trước, các giá trị ước lượng có thể khác đáng kể với các
giá trị đúng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Phương sai của hệ số ước lượng bằng OLS
Phụ thuộc vào mẫu, các giá trị ước lượng sẽ gần hơn hay xa hơn so
với các giá trị đúng của tổng thể
Chúng ta có thể kỳ vọng các giá trị ước lượng, xét trung bình, cách
bao xa các giá trị đúng của tổng thể, (= độ biến thiên của mẫu)?
Độ biến thiên của mẫu được đo bằng phương sai của các ước lượng
Giả thiết SLR.5 (Phương sai thuần nhất)
Giá trị của biến giải thích phải không chứa
thông tin về độ biến thiên của các yếu tố
không quan sát được (nhiễu)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
43
Mô hình hồi quy đơn
Đồ thị minh họa về phương sai thuần nhất (không đổi)
Độ biến thiên của các tác động không
quan sát được không phụ thuộc vào
giá trị của biến độc lập
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
VD 2.13: Phương sai không thuần nhất (thay đổi):
Tiền lương và học vấn
Phương sai của các yếu tố không
quan sát được tác động đến tiền
lương tăng cùng với mức học vấn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
45
Mô hình hồi quy đơn
Định lý 2.2 (Phương sai của các hệ số ước lượng bằng OLS )
Dưới các giả thiết SLR.1 – SLR.5:
2.57
2.58
Kết luận:
Biến thiên mẫu của các hệ số hồi quy ước lượng được sẽ càng lớn khi
biến thiên của các yếu tố không quan sát được càng lớn
Biến thiên mẫu của các hệ số hồi quy ước lượng được sẽ càng nhỏ khi
biến thiên của biến độc lập càng lớn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Mô hình hồi quy đơn
Ước lượng phương sai của sai số
Giả định u và x độc lập  E(u/x) = E(u), Var(u/x) = Var(u)
Phương sai của u không phụ thuộc vào x, nghĩa
là bằng với phương sai không điều kiện
Người ta có thể ước lượng phương sai
của sai số bằng cách tính phương sai
của các phần dư trong mẫu; không may
là ước lượng này bị chệch
2.61
Một ước lượng không chệch của phương sai sai
số có thể tính được bằng cách lấy số quan sát
trừ đi số hệ số hồi quy
ˆ : S .E. of regression (Sai số chuẩn hồi quy) 2.62
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
47
Mô hình hồi quy đơn
Định lý 2.3 (Tính không chệch của phương sai sai số)
2.62
sd ( ˆ1 )  Var ( ˆ1 )   2 / SSTx
Tính toán sai số chuẩn cho các hệ số hồi quy
Thay
cho
không biết
Độ lệch chuẩn tính toán được (estimated standard deviation) của các hệ số hồi quy
được gọi là “các sai số chuẩn“ (standard errors). Chúng giúp đo lường độ “chính xác“
(precise) của các hệ số hồi quy ước lượng được.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
2.6 HỒI QUY QUA GỐC TỌA ĐỘ
Hàm hồi quy mẫu của hồi quy qua gốc tọa độ:
2.63
Công thức tính hệ số góc:
2.66
49
49
MÔ HÌNH HỒI QUY ĐƠN
Hệ số xác định R 2 tính theo cách thông thường
có thể âm
R2 =
2.68
50
50
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
Do đó, hệ số xác định R 2 tính theo công thức sau
R2 =
2.67
Lưu ý:
 Không thể so sánh R2 theo công thức (2.38) với R2 theo công thức
(2.68) vì hai mô hình khác số tham số. Dùng R2 hiệu chỉnh (xem
Chương 6)
 Không thể so sánh R2 theo công thức (2.38) với R2 theo công thức
51
(2.67) vì hai công thức tính khác nhau.
51
MÔ HÌNH HỒI QUY ĐƠN
Call:
lm(formula = wage ~ brthord)
Không qua gốc tọa độ
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1054.736
23.876 44.176 < 2e-16 ***
brthord
-36.822
8.589 -4.287 2.02e-05 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 399.8 on 850 degrees of freedom
(83 observations deleted due to missingness)
Multiple R-squared: 0.02117, Adjusted R-squared: 0.02001
Call:
lm(formula = wage ~ 0 + brthord)
Qua gốc tọa độ
Coefficients:
Estimate Std. Error t value Pr(>|t|)
brthord 273.960
8.939
30.65
<2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 725.4 on 851 degrees of freedom
(83 observations deleted due to missingness)
Multiple R-squared: 0.5246,
Adjusted R-squared: 0.5241
( R2 = -2.2262 và R2 hiệu chỉnh = -2.2262 )
52
52
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
26
Chương 2 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MÔ HÌNH HỒI QUY ĐƠN
Tập tin wage2.wf1
Không qua gốc tọa độ
Call:
lm(formula = wage ~ age)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 283.483
139.782
2.028
0.0428 *
age
20.389
4.207
4.846 1.47e-06 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 399.6 on 933 degrees of freedom
Multiple R-squared: 0.02456, Adjusted R-squared: 0.02351
Qua gốc tọa độ
Call:
lm(formula = wage ~ 0 + age)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
age
28.883
0.394
73.32
<2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 400.2 on 934 degrees of freedom
Multiple R-squared: 0.852,
Adjusted R-squared: 0.8518
( R2 = 0.020255 và R2 hiệu chỉnh = 0.020255 )
53
53
Môøi gheù thaêm trang web:
54
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
54
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
27
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Chương 3
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
• Hồi quy đơn (hồi quy 2 biến)
• y = β0+β1x1+u
• β0: hệ số chặn
• β1: hệ số góc
• Hồi quy bội 3 biến
• y = β0+β1x1+β2x2+u
3.3
• Hồi quy bội 4 biến
• y = β0+β1x1+β2x2+β3x3+u
• β0: hệ số chặn
• β1, β2, β3: hệ số góc
• β0, β1, β2, β3: hệ số hồi quy
• y: biến phụ thuộc
• x1, x2, x3: biến độc lập
• u: sai số ngẫu nhiên, nhiễu
2
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
3.1 Sự cần thiết nghiên cứu hồi quy bội
Định nghĩa mô hình hồi quy bội (k+1 biến)
“Giải thích biến
theo các biến
Hệ số chặn
“
Các hệ số góc
3.6
Biến phụ thuộc
Biến được giải thích,
Biến phản ứng,…
Sai số ngẫu nhiên,
Nhiễu,
Phần chưa quan sát được,…
Biến độc lập,
Biến giải thích,
Biến kiểm soát,…
3.8
Một hàm bất kỳ của biến xj không tương
quan với u, với mọi biến xj
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3
Phân tích hồi quy bội:
Vấn đề ước lượng
Sự cần thiết của hồi quy bội
Đưa thêm nhiều biến độc lập vào mô hình
Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi,
trừ các yếu tố trong
Cho phép sử dụng dạng hàm đa dạng hơn
Ví dụ 3.2: Phương trình tiền lương
Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi
Tất cả các yếu tố khác
3.1
Tiền lương (USD/giờ)
Số năm đi học
Số năm kinh nghiệm làm việc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên
3.2
Các yếu tố khác
Điểm trung bình của
bài thi chuẩn hóa
Chi phí trên mỗi sinh
viên của trường
Thu nhập trung bình
của gia đình các sinh
viên trong trường
Chi phí trên mỗi sinh viên có thể tương quan với thu nhập trung bình của
các gia đình do vấn đề tài chính
Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể
dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung
bình bị chệch.
Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số
có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: Thu nhập và chi tiêu của hộ gia đình
3.4
Các yếu tố khác
Chi tiêu của hộ
Thu nhập của hộ
Thu nhập của hộ bình phương
Mô hình có hai biến độc lập: thu nhập và thu nhập bình phương
Chi tiêu được giải thích bằng hàm bậc hai của thu nhập
Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:
Mức chi tiêu tăng thêm bao
nhiêu đơn vị nếu thu nhập
tăng thêm một đơn vị?
Phụ thuộc vào
mức chi tiêu cụ
thể đang xét
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO
3.7
Log của thu nhập CEO
Log của doanh thu
Hàm bậc hai của số năm thâm niên làm CEO
Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh
thu của doanh nghiệp là hằng số.
Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên
làm CEO có dạng hàm bậc hai
Ý nghĩa của sự “tuyến tính“ trong hồi quy
Mô hình phải tuyến tính theo tham số (không phải theo biến số)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
7
Phân tích hồi quy bội:
Vấn đề ước lượng
3.2 Cách thực hiện và diễn giải của phương pháp OLS
Ước lượng OLS của mô hình hồi quy bội:
Mẫu ngẫu nhiên
Phần dư
3.11’
Cực tiểu tổng bình phương phần dư
3.12’
Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Diễn giải ý nghĩa của mô hình hồi quy bội
Cho biết lượng thay đổi của biến phụ thuộc khi biến độc
lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc
lập khác và sai số không đổi
Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến độc lập
khác không đổi, ngay cả khi trong thực tế có thể các biến độc lập này
là có tương quan với nhau.
Cách diễn giải này được gọi là “Các yếu tố khác không đổi“
Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ
không thay đổi khi biến độc lập thay đổi.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.1: Các yếu tố tác động đến điểm GPA
3.15
Điểm GPA trung bình của
sinh viên ở đại học
Điểm GPA trung bình khi
học phổ thông trung học
Kết quả bài kiểm tra thành tích
Diễn giải
Trong điều kiện ACT không đổi, nếu GPA trung học tăng thêm 1 điểm thì GPA
đại học tăng thêm 0,453 điểm
Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP của
sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng sinh
viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B
Trong điều kiện điểm hsGPA như nhau, nếu ACT tăng thêm 10 điểm thì
colGAP tăng thêm 0,0094*10 = 0,094 điểm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
• SAT (Scholastic Assessment Test) là một trong những bài thi chuẩn hóa cho việc
đăng ký vào nhiều trường đại học tại Hoa Kỳ. SAT được quản lý bởi tổ chức phi lợi
nhuận College Board và được các trường đại học dùng để kiểm tra trình độ tiếng
Anh, đánh giá kiến thức tự nhiên, xã hội và kỹ năng phân tích, giải quyết vấn đề của
học sinh. Do vậy, những câu hỏi trong bài thi thường khá “bẫy”, yêu cầu học sinh cần
phát triển khả năng suy luận của mình. Tất cả các trường cao đẳng và đại học của
Mỹ đều chấp nhận điểm thi SAT vì đó sẽ là thước đo dự đoán sự thành công trong
việc học tập của học sinh khi lên đại học.
• Từ tháng 3 năm 2016, bài thi SAT đã được thay đổi theo format mới và được gọi là
New SAT.
• ACT (American College Testing), là một kỳ thi đầu vào được chuẩn hóa dành cho các
học sinh trung học muốn nộp đơn vào các trường cao đẳng và đại học Hoa Kỳ. Song
hành cùng với SAT, bài thi ACT bao gồm các môn English (tiếng Anh), Mathematics
(toán), Reading (đọc), Science Reasoning (khoa học luận), và Writing (viết).
• Giống như SAT, bài thi ACT được bài kiểm tra chuẩn hoá trên giấy được quản lí cấp
quốc gia nhằm giúp các trường đại học đánh giá ứng viên. Tất cả các trường đại học
hiện nay đều chấp nhận cả 2 điểm SAT và ACT. Điều này có nghĩa là bạn sẽ có cơ
hội quyết định sẽ tập trung vào bài thi nào hơn. Và trong nhiều trường hợp, nhiều học
sinh chuẩn bị để tham gia cả 2.
• (Theo Internet)
11
11
Phân tích hồi quy bội:
Vấn đề ước lượng
Cách diễn giải tác động riêng phần trong hồi quy bội:
Hệ số hồi quy của biến độc lập trong mô hình hồi quy bội có thể
được ước lượng và có thể tính toán được bằng hai bước sau:
1) Hồi quy biến độc lập này theo tất cả các biến độc lập còn lại
2) Hồi quy
theo phần dư của hàm hồi quy ở bước 1
Tại sao cách này có thể thực hiện được?
Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến
độc lập và phần còn lại này không tương quan với các biến độc lập
khác trong mô hình
Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt
của riêng biến độc lập đó đến biến phụ thuộc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
> load("I:/Bai giang 2020 hk3/Chuong 03/gpa1.RData")
> gpa1<-data
> hq<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1)
> summary(hq)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age)
Residuals:
Min
1Q
Median
-0.86321 -0.23315 -0.03006
3Q
0.24839
Max
0.80606
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206
0.65037
1.387 0.16771
hsGPA
0.43379
0.09709
4.468 1.65e-05 ***
ACT
0.01449
0.01058
1.370 0.17309
skipped
-0.08066
0.02617 -3.082 0.00249 **
age
0.01990
0.02284
0.872 0.38498
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
13
13
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
hsGPA = β0 + β1 ACT + β2 skipped + β3 age + v
> hqp<-lm(hsGPA~ACT+skipped+age, data=gpa1)
> summary(hqp)
Call:
lm(formula = hsGPA ~ ACT + skipped + age, data = gpa1)
Residuals:
Min
1Q
-0.9925 -0.1561
Median
0.0029
3Q
0.1899
Max
0.6300
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.793037
0.471721
8.041 3.74e-13 ***
ACT
0.038582
0.008705
4.432 1.90e-05 ***
skipped
-0.043514
0.022730 -1.914 0.05765 .
age
-0.061095
0.019407 -3.148 0.00202 **
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.2902 on 137 degrees of freedom
Multiple R-squared: 0.1948, Adjusted R-squared: 0.1772
F-statistic: 11.05 on 3 and 137 DF, p-value: 1.522e-06
> vmu<-resid(hqp) # hoac vmu <-hqp$residuals
14
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
> hqp1<- lm(colGPA ~ vmu, data=gpa1)
> summary(hqp1)
Call:
lm(formula = colGPA ~ vmu, data = gpa1)
Residuals:
Min
1Q
Median
-0.83002 -0.28206 -0.03992
3Q
0.26128
Max
0.86387
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.05674
0.02965 103.079 < 2e-16 ***
vmu
0.43379
0.10367
4.184 5.04e-05 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3521 on 139 degrees of freedom
Multiple R-squared: 0.1119, Adjusted R-squared: 0.1055
F-statistic: 17.51 on 1 and 139 DF, p-value: 5.041e-05
15
15
Phân tích hồi quy bội:
Vấn đề ước lượng
Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ
Giá trị ước lượng (Fitted values) và phần dư
3.21
3.20
Giá trị ước lượng/Giá trị dự đoán
Phần dư
Tính chất đại số của hồi quy OLS
Tổng phần dư bằng 0
Tương quan giữa biến độc
lập xj và phần dư bằng 0
(Hiệp phương sai mẫu
giữa xj và u^ bằng 0)
Trung bình mẫu của biến phụ
thuộc và các biến độc lập nằm
trên đường hồi quy
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Mức độ phù hợp của hàm SRF so với mẫu khảo sát
Sự phân rã của tổng mức biến động
SST  SSE  SSR
3.27
Lưu ý rằng R2 luôn tăng khi thêm
biến độc lập vào hàm hồi quy
R bình phương (R2)
3.28
R2 bằng bình phương của hệ số
tương quan giữa giá trị thực tế và
giá trị ước lượng của biến phụ thuộc
Các biểu diễn khác của R bình phương
= {r(y,y^)}2 3.29
Tính chất: 0  R2  1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
17
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ
Số lần bị bắt giữ
trong năm 1986
Tỷ lệ số lần bắt
giữ có dẫn đến bị
buộc tội trước đó
(không phải %)
Số tháng bị giam
trong năm 1986
Số quý làm việc
trong năm 1986
Diễn giải:
Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ
giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người)
Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó
giảm 0,034*12 = 0,408 lần
Số quý làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó
giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt)
Nếu thêm một biến độc lập khác avgsen vào mô hình:
Mức phạt trung bình của các lần phạm tội trước
R2 chỉ tăng nhẹ
Diễn giải:
Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?)
Vai trò của biến độc lập mới thêm vào khá hạn chế khi R2 tăng rất ít
Lưu ý chung về R2
Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân
tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Phân tích hồi quy bội:
Vấn đề ước lượng
3.3 Giá trị kỳ vọng của ước lượng OLS
Các giả thiết của mô hình hồi quy bội:
Giả thiết MLR.1 (Tuyến tính theo tham số)
3.31
Trong tổng thể, mối liên hệ giữa
biến phụ thuộc y và các biến độc
lập là tuyến tính theo tham số
Giả thiết MLR.2 (Mẫu ngẫu nhiên)
Mẫu dữ liệu được chọn
ngẫu nhiên từ tổng thể
3.32
Vì vậy, mỗi quan sát đều tuân theo hàm hồi quy tổng thể
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Khaùi nieäm ña coäng tuyeán (cách tiếp cận hình học)
Xeùt moâ hình hoài quy boäi:
y = β0 + β1x1 + β2x2 + u
y
x1
y
x2
x1
Khoâng coù ÑCT
y
x1
ÑCT thaáp
y
x2
ÑCT vöøa
x1
x2
x2
x2
x1
ÑCT cao ÑCT hoaøn haûo
21
21
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Cách tiếp cận đại số của vấn đề đa cộng tuyến:

Nếu tồn tại các số thực 1, …, k không đồng thời bằng
0 và “số thực” c sao cho:
1x1 + 2x2 + … + kxk = c
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến
tính chính xác.

Nếu tồn tại các số thực 1, ..., k không đồng thời bằng
0 và “số thực” c sao cho:
1x1 + 2x2 + … + kxk + v = c
với v là sai số ngẫu nhiên
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ
tuyến tính không chính xác.
22
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u
* Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i  0
(i= 1, 2) và c sao cho:
1x1+2x2 = c
Giả sử 2 ≠ 0 
c
x   1 x 
  x  c'
2
1
2 1 
2
* Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i  0
(i= 1, 2) và c sao cho:
1x1+2x2+v = c (v là sai số ngẫu nhiên)
Giả sử 2 ≠ 0 

x  1 x  1 v  c   x  v ' c '
2
1
2 1 2
2
23
23
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
y = β0+β1x1+ β2x2+u
Xét hệ số tương quan r = r(x1,x2), ta có: 0  |r|  1
•
•
r = 0: x1, x2 không có đa cộng tuyến
r ≠ 0: x1, x2 có đa cộng tuyến
– |r| càng gần 1 thì mức độ ĐCT càng cao
– |r| càng gần 0 thì mức độ ĐCT càng thấp
– |r|=1: ĐCT hoàn hảo
Lưu ý:
Chỉ đúng cho mô hình có 2 biến độc lập.
24
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Ví dụ:
Ta có dữ liệu giả định của các biến sau:
x1
10
15
18
24
30
x2
50
75
90
120
150
x2 *
52
75
97
129
152
v
2
0
7
9
2
x1, x2 có đa cộng tuyến hoàn hảo?
x1, x2* có đa cộng tuyến hoàn hảo?
25
25
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Ví dụ (tt):
Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo.
Ta thấy hệ số tương quan r(x1,x2) = 1.
Ta có x2*= 5x1+v, nên x1 và x2* có đa cộng tuyến không hoàn hảo.
Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2* có đa cộng tuyến cao, gần
hoàn hảo.
26
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo)
Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng
số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập
Lưu ý về giả thiết MLR.3
Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn
hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có
thể xảy ra
Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến
độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra
khỏi hàm hồi quy
Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
27
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ
Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó
không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là
như nhau
Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập
Có mối liên hệ tuyến tính chính xác giữa shareA và shareB và hệ số chặn:
shareA + shareB = 1 (hệ số chặn của mô hình)
Cách 1: shareA hoặc shareB sẽ bị loại ra khỏi
mô hình
Cách 2: không khuyến khích làm
voteA = 1shareA + 2shareB + u
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.4 (Trung bình có điều kiện bằng 0)
Một hàm bất kỳ của biến xj không tương quan với u, với mọi biến xj
3.36
Giá trị của các biến độc lập không chứa bất
kỳ thông tin nào về giá trị trung bình của
các yếu tố không quan sát được
Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0
có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào
sai số ngẫu nhiên hơn so với hồi quy đơn.
Ví dụ: Điểm kiểm tra trung bình
Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi
đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
29
Phân tích hồi quy bội:
Vấn đề ước lượng
Thảo luận về giả thiết trung bình có điều kiện bằng 0
Các biến độc lập có tương quan với sai số được gọi là biến nội sinh; Sự
nội sinh là trường hợp vi phạm giả thiết MLR.4
Các biến độc lập không tương quan với sai số được gọi là biến ngoại
sinh; MLR.4 được thỏa mãn nếu tất cả các biến độc lập là ngoại sinh
Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả
của hồi quy bội, và cho tính không chệch của ước lượng OLS
Định lý 3.1 (Tính không chệch của OLS)
3.37
Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một
mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Việc thêm biến không liên quan vào mô hình hồi quy
x3 không có tác động riêng phần tới y trong tổng thể
3.38
= 0 trong tổng thể
Không có vấn đề gì vì
Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu.
Bỏ sót biến có liên quan: trường hợp đơn giản
3.40
Mô hình đúng (chứa x1 và x2)
Mô hình ước lượng (x2 bị bỏ sót)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
31
Phân tích hồi quy bội:
Vấn đề ước lượng
Chệch do bỏ sót biến
Đây là hệ số chặn ước
lượng được khi y chỉ
hồi quy theo x1
Giả sử x1 và x2 có tương quan và mối quan
hệ giữa chúng là tuyến tính
Đây là hệ số góc của
x1 khi y chỉ hồi quy
theo x1
Phần sai số
Kết luận: Tất cả các hệ số ước lượng được đều bị chệch
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương
3.42
Cả hai đều có thể mang dấu dương
Suất sinh lợi giáo dục
sẽ bị ước lượng cao hơn thực tế do
.t
. . Kết quả hồi
quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết
quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng
cao thì nhìn chung năng lực cũng càng cao.
Khi nào bỏ sót biến không gây ra sự chệch cho ước lượng?
Khi biến bỏ sót không liên quan hoặc không tương quan với các biến
độc lập trong mô hình.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
33
Phân tích hồi quy bội:
Vấn đề ước lượng
Tính chệch do bỏ sót biến: trường hợp tổng quát hơn
Mô hình đúng (gồm x1, x2 và x3)
3.49
Mô hình ước lượng (x3 bị bỏ sót)
Không thể xác định rõ được chiều hướng của phần chệch
Phân tích như trường hợp đơn giản nếu một biến độc lập không
tương quan với các biến độc lập khác
Ví dụ: Bỏ sót biến ability trong phương trình hồi quy tiền lương
Nếu exper gần như không tương quan với educ và abil, thì chiều hướng
của phần chệch do bỏ sót biến có thể được phân tích như trong trường
hợp đơn giản chỉ có hai biến đã xét trước đó.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
3.4 Phương sai của ước lượng OLS
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.5 (Phương sai thuần nhất)
Giá trị của các biến độc lập không hàm chứa
bất kỳ thông tin nào về phương sai của các
yếu tố chưa quan sát được.
Ví dụ: phương trình tiền lương
Giả thiết này có thể sẽ khó kiểm
chứng trong nhiều trường hợp
Tất cả các biến độc lập được ký
hiệu chung dưới dạng vector
Cách ký hiệu ngắn gọn
với
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
35
Phân tích hồi quy bội:
Vấn đề ước lượng
Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS)
Dưới các giả thiết từ MLR.1 đến MLR.5:
Phương sai của sai số
Tổng biến động trong mẫu
của biến độc lập xj:
R2 có được khi hồi quy biến độc lập xj theo tất cả
các biến độc lập khác (hồi quy có hệ số chặn)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến):
1) Phương sai của sai số
Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều
“nhiễu“ hơn trong phương trình
Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác
Phương sai sai số không giảm khi kích thước mẫu tăng lên
2) Tổng biến động trong mẫu của biến giải thích
Tổng biến động trong mẫu của biến độc lập càng nhiều thì ước lượng thu được
càng chính xác (more precise)
Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng
Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
37
Phân tích hồi quy bội:
Vấn đề ước lượng
3) Mối quan hệ tuyến tính giữa các biến độc lập
Hồi quy
theo tất cả các biến độc lập khác (có hệ số chặn)
R2 của hồi quy này càng cao thì xj càng được giải
thích nhiều hơn bởi các biến độc lập khác
Phương sai mẫu của
sẽ càng lớn khi
càng được giải thích nhiều
bởi các biến độc lập khác
Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi
là vấn đề đa cộng tuyến (nghĩa là .
với một vài
nào đó)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Một ví dụ về đa cộng tuyến
Điểm trung bình bài thi
chuẩn hóa của trường
Chi phí cho
giáo viên
Các chi phí cho
nguyên vật liệu
dạy học
Các chi phí khác
Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ
chi tiêu lớn cho tất cả các khoản chi.
Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi
thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise),
chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể.
Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
39
Phân tích hồi quy bội:
Vấn đề ước lượng
Thảo luận về vấn đề đa cộng tuyến
Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào
thành một yếu tố vì không thể tách biệt tác động của từng khoản chi
Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm
đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến)
Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng
của các biến độc lập khác có thể không bị ảnh hưởng.
Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3
Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương
sai“
Kinh nghiệm: nhân tử phóng đại
phương sai không nên lớn hơn 10
VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
> hq<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1)
> summary(hq)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)
Residuals:
Min
1Q
Median
-0.86321 -0.23315 -0.03006
3Q
0.24839
Max
0.80606
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206
0.65037
1.387 0.16771
hsGPA
0.43379
0.09709
4.468 1.65e-05 ***
ACT
0.01449
0.01058
1.370 0.17309
skipped
-0.08066
0.02617 -3.082 0.00249 **
age
0.01990
0.02284
0.872 0.38498
--Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
> library(car)
> vif(hq)
hsGPA
ACT skipped
age
1.242002 1.165185 1.045578 1.084732
VIF < 10 : các biến độc lập có đa cộng tuyến thấp
41
41
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
•
•
•
•
•
• Cách phát hiện đa cộng tuyến:
Dấu của hệ số hồi quy bị sai
Hệ số xác định R2 cao nhưng tỷ số |t| thấp
Hệ số tương quan cặp giữa các biến độc lập cao
Kiểm định sử dụng hồi quy phụ
Nhân tử phóng đại phương sai VIF
• Cách khắc phục đa cộng tuyến:
•
•
•
•
•
•
Sử dụng thông tin tiên nghiệm
Thu thập thêm số liệu hoặc lấy thêm mẫu mới
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Bỏ bớt biến độc lập
Dùng sai phân cấp 1
Thay đổi dạng hàm của biến
42
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Phương sai trong mô hình bị định dạng sai
Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có
thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính
hiệu quả của ước lượng
Mô hình đúng của tổng thể
3.52
3.53
Mô hình ước lượng 1
p
Mô hình ước lượng 2
Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được
bù đắp bằng phương sai nhỏ của ước lượng thu được
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
43
Phân tích hồi quy bội:
Vấn đề ước lượng
Phương sai trong mô hình bị định dạng sai (tt.)
3.54
Xét điều kiện theo x1 và x2 ,
phương sai trong mô hình 2
luôn nhỏ hơn trong mô hình 1
3.55
Kết luận: Không thêm biến không liên quan vào mô hình
Trường hợp 1:
Trường hợp 2:
Sự đánh đổi giữa tính chệch và tính hiệu quả
Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
45
45
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Tính chất
Biến
Ước lượng
không chệch
(Phụ nữ có
sắc đẹp)
Phương sai nhỏ
(Phụ nữ có tính
tình tốt)
?
?
?
?
Thừa (dư) biến không có liên quan
Thiếu (sót) biến có liên quan (có tương
quan với các biến độc lập khác)
Chọn: cái nết hay cái đẹp ???!!!
Ngày xưa: Cái nết … cái đẹp
Ngày nay: Cái đẹp … cái nết
Giống loài “đẹp người & đẹp nết” thì đã tc!
46
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
Ước lượng phương sai của sai số
3.56
Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự
do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số.
Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với
nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài toán tìm cực tiểu.
df = n-(k+1) = số quan sát – số tham số cần ước lượng >0
3.57
Định lý 3.3 (Ước lượng không chệch của phương sai sai số)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
47
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
> # Truong hop: n=4 < so tham so=5
> data1 <- gpa1[c(1:4),]
> dim(data1)
[1] 4 29
> hq1<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=data1)
> summary(hq1)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = data1)
Residuals:
ALL 4 residuals are 0: no residual degrees of freedom!
Coefficients: (1 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.46667
NA
NA
NA
hsGPA
-2.33333
NA
NA
NA
ACT
0.26667
NA
NA
NA
skipped
-0.03333
NA
NA
NA
age
NA
NA
NA
NA
Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:
1,
Adjusted R-squared:
NaN
F-statistic:
NaN on 3 and 0 DF, p-value: NA
NA : Not Available (Không có sẵn)
NaN : Not a Number (không phải số)
48
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
> # Truong hop: n = 5 = so tham so
> data2 <- gpa1[c(1:5),]
> dim(data2)
[1] 5 29
> hq2<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=data2)
> summary(hq2)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = data2)
Residuals:
ALL 5 residuals are 0: no residual degrees of freedom!
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -18.9715
NA
NA
NA
hsGPA
-3.4286
NA
NA
NA
ACT
0.8143
NA
NA
NA
skipped
0.6786
NA
NA
NA
age
0.6571
NA
NA
NA
Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:
1,
Adjusted R-squared:
NaN
F-statistic:
NaN on 4 and 0 DF, p-value: NA
49
49
Phân tích hồi quy bội:
Vấn đề ước lượng
Ước lượng phương sai mẫu của các ước lượng OLS
Độ lệch chuẩn
đúng của ước
lượng của
Thay
Độ lệch chuẩn ước
lượng của ước lượng
của
cho phương sai chưa biết
3.58
Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1
đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
50
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề ước lượng
3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch
Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là
không chệch
Ước lượng không chệch nào có phương sai nhỏ nhất?
Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng
tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc.
3.60
Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu
của tất cả các biến độc lập; ước lượng OLS luôn có
thể đưa về dạng này
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
51
Phân tích hồi quy bội:
Vấn đề ước lượng
BLUE là viết tắt của Best Linear Unbiased Estimator
Định lý 3.4 (Định lý Gauss-Markov)
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến
tính không chệch tốt nhất (BLUE) của các hệ số hồi quy.
“Tốt nhất ” nghĩa là “có phương sai nhỏ nhất ” :
với mọi
sao cho.
OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa
mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ
có ước lượng khác tốt hơn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
52
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
26
Chương 3 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Giả thiết MLR1-5:
Phương sai nhỏ nhất trong lớp:
Tuyến tính
Không chệch
Tuyến tính
Chệch
Phi tuyến
Không chệch
Phi tuyến
Chệch
Phi tuyến  Không tuyến tính
53
53
Môøi gheù thaêm trang web:
54
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
54
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
27
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề suy diễn thống kê
Chương 4
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Phân tích hồi quy bội
Vấn đề suy diễn
Suy diễn thống kê trong mô hình hồi quy
Kiểm định giả thuyết về tham số tổng thể
Xây dựng khoảng tin cậy (đối xứng)
4.1 Phân phối mẫu của ước lượng OLS
Ước lượng OLS là các biến ngẫu nhiên
Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này
Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê
Để suy luận về phân phối, chúng ta cần thêm giả thiết
Giả thiết về phân phối của sai số: sai số có phân phối chuẩn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Giả thiết MLR.6 (Phân phối chuẩn của sai số)
và độc lập với các biến
Nếu có MLR.6 thì sẽ có MLR.4 và MLR.5
Giả sử rằng phần sai số của hồi quy tổng
thể có phân phối chuẩn.
Dạng phân phối và phương sai không
phụ thuộc vào bất kỳ biến độc lập nào.
Suy ra:
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Định lý giới hạn trung tâm (CLT)
• Có x1,..., xk là các biến ngẫu nhiên
Xét biến ngẫu nhiên tổng x = x1+…+xk
Nếu các điều kiện sau thỏa:
• Các xi là độc lập
• Các xi có cùng phân phối xác suất
• Các xi có cùng kỳ vọng và phương sai (hữu hạn)
• k lớn (thường k  30)
thì x sẽ có phân phối xấp xỉ chuẩn
4
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn
Phần sai số được xem là tổng của “nhiều“ yếu tố không quan sát được
Tổng của các yếu tố độc lập có phân phối xấp xỉ chuẩn (Định lý giới hạn
trung tâm - Central Limit Theorem - CLT)
Các vấn đề nảy sinh:
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau
• Các yếu tố này độc lập với nhau ở mức nào?
Phân phối của sai số là một vấn đề thuộc về thực nghiệm
Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn (tt)
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)
Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc
biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage)
Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất (kể
cả ước lượng phi tuyến)
Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn
có thể thay thế bằng cỡ mẫu lớn (xem Chương 5)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG
Giả thiết MLR1-6:
Phương sai nhỏ nhất trong lớp:
Tuyến tính
Không chệch
Tuyến tính
Chệch
Phi tuyến
Không chệch
Phi tuyến
Chệch
7
7
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
Tập tin gpa1.wf1
> hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1)
> summary(hoiquy1)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206
0.65037
1.387 0.16771
hsGPA
0.43379
0.09709
4.468 1.65e-05 ***
ACT
0.01449
0.01058
1.370 0.17309
skipped
-0.08066
0.02617 -3.082 0.00249 **
age
0.01990
0.02284
0.872 0.38498
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
> # Lay phan du
> phandu1=resid(hoiquy1)
8
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
> # install.packages("fBasics")
> library(fBasics)
Loading required package: timeDate
Loading required package: timeSeries
> jarqueberaTest(phandu1)
Title:
Jarque - Bera Normalality Test
Test Results:
STATISTIC:
X-squared: 1.5592
P VALUE:
Asymptotic p Value: 0.4586
H0: phần dư có phân phối chuẩn
H1: phần dư không có phân phối chuẩn
p-value = 0,4586 > 0,05 : chấp nhận H0
Vậy phần dư có phân phối chuẩn
9
9
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
> shapiro.test(phandu1)
Shapiro-Wilk normality test
data: phandu1
W = 0.9893, p-value = 0.3537
> require(nortest)
Loading required package: nortest
> # Kiem dinh Anderson-Darling
> ad.test(phandu1)
Anderson-Darling normality test
data: phandu1
A = 0.60863, p-value = 0.1116
> # Kiem dinh Kolmogorov-Smirnov
> lillie.test(phandu1)
Lilliefors (Kolmogorov-Smirnov) normality test
data: phandu1
D = 0.071506, p-value = 0.07439
10
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
> # Chay hoi quy
> hoiquy2 <- lm(log(wage) ~ educ+exper+age+married,
data=wage2)
> # Lay phan du
> phandu2=resid(hoiquy2)
> # kiem dinh Jarque-Bera
> library(fBasics)
> jarqueberaTest(phandu2)
Title:
Jarque - Bera Normalality Test
Test Results:
STATISTIC:
X-squared: 43.649
P VALUE:
Asymptotic p Value: 3.325e-10
H0: phần dư có phân phối chuẩn
H1: phần dư không có phân phối chuẩn
p-value = 3,325 10-10 < 0,05 : bác bỏ H0
Vậy phần dư không có phân phối chuẩn
11
11
Phân tích hồi quy bội
Vấn đề suy diễn
Một số thuật ngữ
“các giả thiết Gauss-Markov“
Các giả thiết của “mô hình hồi quy tuyến tính cổ
điển (CLM - classical linear model )“
Định lý 4.1 (Phân phối chuẩn trong mẫu)
Dưới các giả thiết MLR.1 – MLR.6:
4.1
Các ước lượng OLS có phân phối mẫu với
phương sai như đã thiết lập trong chương trước
Ước lượng chuẩn hóa tuân theo phân phối
chuẩn tắc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
4.2 Kiểm định giả thuyết về từng tham số tổng thể
Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa)
Dưới các giả thiết MLR.1 – MLR.6:
4.3
Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch
chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân
phối chuẩn tắc sẽ được thay thế bằng phân phối t
Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn.
Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau)
4.4
Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát
các biến độc lập khác, xj không tác động đến y
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
13
Phân tích hồi quy bội
Vấn đề suy diễn
Thống kê t (hay tỷ số t)
ˆ  0
t ˆ  j
j
se( ˆ )
j
4.5
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả
thuyết không càng ít khả năng đúng. Nhưng khi nào thì
được gọi là “xa“ giá trị 0?
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng
bao nhiêu lần độ lệch chuẩn.
Phân phối của thống kê t nếu giả thuyết không là đúng
Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì
khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội :
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải)
t0,05(28)= 1,701
Kiểm định H 0 :  j  0
với giả thuyết đối H1 :  j  0 .
4.6
Bác bỏ giả thuyết không và ủng hộ giả thuyết đối
một phía này nếu hệ số hồi quy ước lượng được là
quá lớn (cụ thể là lớn hơn giá trị tới hạn t(n-k-1)).
Xây dựng giá trị tới hạn sao cho, nếu giả thuyết
không là đúng thì khả năng giả thuyết không bị
bác bỏ, chẳng hạn, là 5% trong tổng số các trường
hợp.
t  t (n  k  1) : bac bo H 0 4.7
Trong ví dụ đã cho, đây là giá trị của phân phối t
với 28 bậc tự do mà 5% số các trường hợp sẽ lớn
hơn giá trị này.
Bác bỏ H0 nếu thống kê t lớn hơn 1,701
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
15
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.1: Phương trình tiền lương
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công
nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không
Sai số chuẩn
Kiểm định
với giả thuyết đối
.
Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ)
hoặc không tác động gì cả.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.1: Phương trình tiền lương (tt)
Thống kê t
Bậc tự do;
Ở đây, sự xấp xỉ phân
phối chuẩn tắc có thể
được áp dụng
t0,05 (522)  1,645
t0,01 (522)  2,326
Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp
xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp).
Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới
hạn t(n-k-1). texper= 2,41 > t0,05(522)= 1,645 : bác bỏ H0
“Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có
ý nghĩa thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
17
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái)
t0,05(18)= 1,734
Kiểm định H 0 :  j  0 với giả thuyết đối H1 :  j  0
4.8
Bác bỏ giả thuyết không với giả thuyết đối một
phía này nếu hệ số ước lượng được là “quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn -t(n-k-1)).
Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng thì giả thuyết này sẽ bị bác bỏ,
chẳng hạn, trong 5% tổng số các trường hợp.
Trong ví dụ đã cho, đây là điểm giá trị mà tại đó
phân phối t với 18 bậc tự do sẽ có 5% các trường
hợp nhỏ hơn giá trị này.
Bác bỏ H0 nếu thống kê t nhỏ hơn -1,734
t  t ( n  k  1) : bac bo H 0
4.9
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập
của sinh viên sẽ tốt hơn hay không
Phần trăm sinh viên vượt
qua bài kiểm tra môn Toán
Thu nhập trung bình
Tỷ lệ giáo viên trên
hàng năm của giáo viên 1000 sinh viên
Kiểm định
.
Lượng sinh viên theo học
(= quy mô trường học)
với giả thuyết đối
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học
không hề có tác động đến kết quả học tập?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Thống kê t
Bậc tự do;
Trường hợp này có thể áp
dụng xấp xỉ phân phối
chuẩn tắc
t0,05 (404)  1, 645
Bảng z:
t0,15 (404)  1, 04
Giá trị tới hạn với mức ý nghĩa 5% và 15%.
Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn
giá trị tới hạn. tenroll= -0,91 > -t0,05(404)= -1,645 : chấp nhận H0
Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động
đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Một dạng hàm có log:
R2 cao hơn một chút
Kiểm định
với giả thuyết đối
.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
21
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Thống kê t
t0,05 (404)  1, 645
Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không
Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của
sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều
tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0
Độ lớn của tác động ra sao?
Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài
kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%)
Ví dụ:
(tác động rất nhỏ)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối hai phía
t0,025(25)= 2,06
Kiểm định H 0 :  j  0 với H 0 :  j  0 .
4.10
Bác bỏ giả thuyết không với giả thiết đối hai phía
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.
Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.
Trong ví dụ đã cho, những điểm ứng với 5% các
trường hợp này nằm ở hai phía đuôi của hàm
phân phối.
Bác bỏ H0 nếu giá trị tuyệt đối của thống kê lớn hơn
2,06
| t | t / 2 ( n  k  1) : bac bo H 0 4.11
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
23
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.3: Các yếu tố tác động đến điểm GPA
Số buổi cúp học
Dùng phân phối chuẩn tắc để tìm giá trị tới hạn
| thsGPA | 4, 38  t0,005 (137)  2,576 : bac bo H 0
| t ACT | 1,36  t0,05 (137)  1, 645 : chap nhan H 0
Tác động của hsGPA và số buổi cúp học
khác 0 có ý nghĩa ở mức ý nghĩa 1%.
Tác động của ACT khác 0 không có ý
nghĩa thống kê, thậm chí ở mức ý nghĩa
10%.
| t skipped | 3,19  t0,005 (137)  2,576 : bac bo H 0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Biến độc lập “có ý nghĩa thống kê“ trong hồi quy
Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc lập
tương ứng với hệ số hồi quy đó được gọi là “có ý nghĩa thống kê“
Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối chuẩn thì quy
tắc sau đây có thể áp dụng:
“có ý nghĩa thống kê ở mức 10% “
“có ý nghĩa thống kê ở mức 5%“
“có ý nghĩa thống kê ở mức 1%“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
25
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Biến độc lập có ý nghĩa thống kê, mức ý nghĩa 5%
> hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1)
> summary(hoiquy1)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
0.90206
0.65037
1.387
0.16771
hsGPA
0.43379
0.09709
4.468 1.65e-05 ***
ACT
0.01449
0.01058
1.370
0.17309
skipped
-0.08066
0.02617
-3.082
0.00249 **
age
0.01990
0.02284
0.872
0.38498
--Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared:
0.2379,
Adjusted R-squared:
0.2154
F-statistic: 10.61 on 4 and 136 DF,
p-value: 1.635e-07
* H0:  1 = 0 ; H1:  1 ≠ 0
p-value(2p) = 1,6510-5 < = 0,05 : bác bỏ H0
Hoặc |t|= 4,468 > t/2(136) = 1,96 : bác bỏ H0
Biến hsGPA có ý nghĩa thống kê
* H0:  4 = 0 ; H1:  4 ≠ 0
p-value(2p) = 0,38498 > = 0,05 : chấp nhận H0
Hoặc |t|= 0,872 < t/2(136) = 1,96 : chấp nhận H0
Biến age không có ý nghĩa thống kê
26
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của
hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến
Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc
ý nghĩa thực tiễn!
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị “sai“ dấu,
mô hình hồi quy có thể bị định dạng sai
Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường
(10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi
quy (cẩn thận bởi vấn đề chệch do bỏ sót biến có liên quan)
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng “kém chính xác“
(imprecise) vì vậy bằng chứng để bỏ biến sẽ yếu hơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
27
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định các giả thuyết tổng quát về hệ số hồi quy
Giả thuyết không
Giá trị cần kiểm định của các hệ số hồi quy
4.12
Thống kê t
4.13
Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc
lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các
thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.4: Vấn đề tội phạm trong trường học và số sinh viên theo học
Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh
viên theo học tăng 1%
Giá trị ước lượng là khác 1
nhưng sự khác nhau có ý
nghĩa thống kê hay không?
1, 27  1
| t |
 2, 45  t0,025 (95)  1,987 : bac bo H 0
0,11
Giả thuyết bị bác bỏ ở
mức ý nghĩa 5%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
29
Phân tích hồi quy bội
Vấn đề suy diễn
Tính toán p-value cho các kiểm định t
Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết không không
thể bị bác bỏ
Lý do là, bằng cách hạ thấp mức ý nghĩa, người ta muốn tránh sai lầm bác bỏ một
giả thuyết H0 đúng
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-value của kiểm
định giả thuyết
Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì người ta sẽ bác
bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ
Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không
p-value giúp dễ dàng kết luận hơn so với các giá trị thống kê ở những mức ý nghĩa
cho trước
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Cách tính p-value (trường hợp kiểm định hai phía)
p-value = P(|T|>|t|)
Những giá trị này là
giá trị tới hạn cho
mức ý nghĩa 5%
4.15
Trong trường hợp kiểm định hai phía, p-value
là xác suất sao cho các biến ngẫu nhiên có
phân phối t sẽ nhận giá trị tuyệt đối lớn hơn
giá trị thực tế, nghĩa là:
Khi đó, giả thuyết không sẽ bị bác bỏ nếu
p-value tương ứng nhỏ hơn mức ý nghĩa.
Ví dụ, với mức ý nghĩa 5%, thống kê t sẽ
không nằm trong miền bác bỏ.
Giá trị thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
31
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Tóm tắt kiểm định t
Mô hình
Phía phải
H0: βj = aj
H1: βj > aj
y   0  1 x1  ...   k xk  u
Phía trái
H0: βj = aj
H0: βj < aj
t
ˆ j  a j
Hai phía
H0: βj = aj
H0: βj ≠ aj
se( ˆ j )
  t(n-k-1)   t(n-k-1)
  t/2(n-k-1)
t > t(n-k-1)
t < -t(n-k-1)
|t| > t/2(n-k-1)
= 5%, n= 27, k+1= 7  t(n-k-1) = t0,05(20) = 1,725
t/2(n-k-1) = t0,025(20) = 2,086
= 5%, n= 207, k+1= 7  t0,05() = 1,645
t0,025() = 1,960
p-value(1p) = P(T>|t|)
p-value(2p) = P(|T|>|t|)
p-value(1p) <  (0,05)
p-value(2p) <  (0,05)
p-value(1p) = p-value(2p)/2
Quy tắc bác bỏ H0
Tra bảng thống kê
Tính p-value
Quy tắc bác bỏ H0
32
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Trong EXCEL: Phaân phoái Student t
 Caùc phaân vò t/2, t ñöôïc xaùc ñònh theo coâng thöùc:
=TINV(xaùc suaát, baäc töï do).
Thí duï vôùi coâng thöùc =TINV(0.05,6) ta ñöôïc t0,025(6) = 2.4469
 Ñeå tính p–value cho kieåm ñònh hai phía vaø moät phía ta
söû duïng coâng thöùc sau:
=TDIST(|t|, baäc töï do, ñuoâi)
vôùi ñuoâi=1: moät phía, ñuoâi=2: hai phía.
Vôùi thí duï n= 6, t= 2.4469 thì trong EXCEL ta goõ coâng thöùc sau:
=TDIST(2.4469,6,2) keát quaû ta ñöôïc p–value(2p) = 0.05
=TDIST(2.4469,6,1) ta ñöôïc p–value(1p) = 0.025
33
33
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
load("H:/BAI GIANG KTL 2021/ /Chuong 04/gpa1.RData")
gpa1 <- data
hq <- lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1)
summary(hq)
# Kiem dinh t
t_test <- function(reg, coefnum, val){
coefnum <- coefnum+1 # he so chan o vi tri so 1
co <- coef(summary(reg))
tstat <- (co[coefnum,1]-val)/co[coefnum,2]
p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE)
result1 <- c(t_stat = round(tstat, digits=4))
result2 = c(p_value_2p = round(p_value, digits=4))
result3 = c(p_value_1p = round(p_value/2, digits=4))
return(list(result1, result2,result3))
}
# y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4
# H0: b1 = 0.8 ; H1: b1 <> 0.8
# Chay ham Kiem dinh t truoc
t_test(hq,1,0.8) # nhap so 1 cho b1
34
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> t_test(hq,1,0.8) # nhap so 1 cho b1
[[1]]
t_stat
-3.7719
[[2]]
p_value_2p
2e-04
[[3]]
p_value_1p
1e-04
# Gia tri toi han cua Kiem dinh t
t_critical <- function(alpha, df){
result1 <- c(t_alpha = round(abs(qt(alpha, df)),digits=4))
result2 <- c(t_alpha_chia2 = round(abs(qt(alpha/2, df)),digits=4))
return(list(result1, result2))
}
# Muc y nghia alpha = 0,05, bac tu do df cua hoi quy
# Chay ham gia tri toi han truoc
df <- hq$df.residual
t_critical(0.05,df)
35
35
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> t_critical(0.05,df)
[[1]]
t_alpha
1.6561
[[2]]
t_alpha_chia2
1.9776
> summary(hq)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206
0.65037
1.387 0.16771
hsGPA
0.43379
0.09709
4.468 1.65e-05 ***
ACT
0.01449
0.01058
1.370 0.17309
skipped
-0.08066
0.02617 -3.082 0.00249 **
age
0.01990
0.02284
0.872 0.38498
--Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379,
Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
36
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
1) H 0 : 1  0,8 ; H1 : 1  0,8 với mức ý nghĩa 5%
Phương pháp giá trị tới hạn:
Ta có |t| = 3,7719 > t0,025(136) = 1,9776 : bác bỏ H0
Phương pháp p-value:
Ta có p-value(2p) = 210-4 < 0,05 : bác bỏ H0
2) H 0 : 1  0,8 ; H1 : 1  0,8 với mức ý nghĩa 5%
Phương pháp giá trị tới hạn:
Ta có t = -3,7719 < -t0,05(136) = -1,6561 : bác bỏ H0
Phương pháp p-value:
Ta có p-value(1p) = 110-4 < 0,05 : bác bỏ H0
37
37
Phân tích hồi quy bội
Vấn đề suy diễn
4.3 Khoảng tin cậy (đối xứng)
Định lý 4.2 giúp rút ra kết quả hàm ý rằng
Giá trị tới hạn
của kiểm định
hai phía


P ˆ j  t / 2 ( n  k  1).se( ˆ j )   j  ˆ j  t / 2 (n  k  1).se( ˆ j )  1  
Giới hạn dưới của
khoảng tin cậy
 j  ˆ j  t /2 (n  k  1).se( ˆ j )
Giới hạn trên của
khoảng tin cậy
Độ tin cậy
Diễn giải ý nghĩa của khoảng tin cậy (1- = 0,95)
Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên
Trong trường hợp lặp lại việc lấy mẫu, khoảng tin cậy như trên sẽ chứa hệ số
hồi quy tổng thể trong 95% các trường hợp.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Các khoảng tin cậy ứng với các mức ý nghĩa thông thường

P  ˆ  t
P  ˆ  t

(n  k  1).se( ˆ )   0, 95
( n  k  1).se( ˆ )   0,90
P ˆ j  t0,005 ( n  k  1).se( ˆ j )   j  ˆ j  t0,005 (n  k  1).se( ˆ j )  0, 99
j
0,025
j
0,05
( n  k  1).se( ˆ j )   j  ˆ j  t0,025
( n  k  1).se( ˆ j )   j  ˆ j  t0,05
Quy tắc kinh nghiệm t0,005 ()
4.16
j
j
 2,576; t0,025 ()  1,96; t0,05 ()  1, 645
Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết 2 phía
Nếu aj không thuộc khoảng tin cậy  bác bỏ H0: βj = aj ; ủng hộ H1: βj ≠ aj
Nếu aj thuộc khoảng tin cậy  chấp nhận H0: βj = aj
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
39
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ 4.8: Mô hình hồi quy về chi phí R&D của doanh nghiệp
Doanh thu
hàng năm
Chi tiêu cho R&D
Phần trăm lợi nhuận trên doanh thu
n  32; R 2  0,918; df  32  2  1  29; t0,025 (29)  2, 045
  ˆ  t (df ).se( ˆ )
  ˆ  t (df ).se( ˆ )
1
1
 /2
=
1
2
2
 /2
2
=
Tác động của doanh thu đến chi phí R&D ước lượng được có
khoảng tin cậy 95% khá hẹp. Ngoài ra, tác động này khác 0
có ý nghĩa thống kê vì số 0 nằm ngoài khoảng tin cậy.
Tác động ước lượng được của profmarg có
khoảng tin cậy 95% rất rộng. Thậm chí tác
động này không có ý nghĩa thống kê vì số 0
nằm trong khoảng tin cậy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Tập tin rdchem.wf1
> hoiquy1<-lm(log(rd) ~ log(sales)+profmarg, data=rdchem)
> summary(hoiquy1)
Call:
lm(formula = log(rd) ~ log(sales) + profmarg, data = rdchem)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.37827
0.46802 -9.355 2.93e-10 ***
log(sales)
1.08422
0.06020 18.012 < 2e-16 ***
profmarg
0.02166
0.01278
1.694
0.101
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5136 on 29 degrees of freedom
> # Khoang tin cay 95%
> confint(hoiquy1,level = 0.95)
2.5 %
97.5 %
(Intercept) -5.335478450 -3.4210681
log(sales)
0.961107256 1.2073325
profmarg
-0.004487722 0.0477991
Khoảng tin cậy 95% của β1: 1.08422  2.045*0.0602
Hay (0.9611 ; 1.2073)
41
41
Phân tích hồi quy bội
Vấn đề suy diễn
4.4 Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học
(4 năm)
Số năm đi học khi
học hệ 2 năm
Số năm đi học khi
học hệ 4 năm
4.17
Kiểm định
.
với giả thuyết đối
4.18
4.19
Một thống kê kiểm định có thể dùng là :
4.20
Chênh lệch giữa các ước lượng được chuẩn hóa bằng cách chia cho
độ lệch chuẩn của khoảng chênh lệch này. Giả thuyết H0 sẽ bị bác bỏ
nếu giá trị thống kê t mang giá trị âm quá lớn để tin rằng sự khác
nhau thực sự trong tổng thể giữa hai ước lượng là bằng 0.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Không thể tính toán với các kết quả hồi quy bình thường
Cách làm khác
Tính
4.23
Không có sẵn trong kết quả hồi quy thông thường
và kiểm định
với
.
4.24
4.25
Thêm đại lượng này vào hàm
hồi quy ban đầu
Biến độc lập mới (= tổng số năm đi học ở cả
hai hệ)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
43
Phân tích hồi quy bội
Vấn đề suy diễn
Kết quả ước lượng
Tổng số năm đi học = jc+univ
4.27
Giả thuyết bị bác bỏ tại mức ý nghĩa
10%, nhưng không bị bác bỏ tại 5%
t= -1,48 < -t0,1()= - 1,282 hay p-value(1p)= 0,07 < 0,1 : bác bỏ H0
t= -1,48 > -t0,05()= - 1,645 hay p-value(1p)= 0,07 > 0,05 : chấp nhận H0
Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Tập tin twoyear.wf1
> hoiquy1<-lm(lwage ~ jc + univ + exper, data = twoyear)
> summary(hoiquy1)
Call:
lm(formula = lwage ~ jc + univ + exper, data = twoyear)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4723256 0.0210602 69.910
<2e-16 ***
jc
0.0666967 0.0068288
9.767
<2e-16 ***
univ
0.0768762 0.0023087 33.298
<2e-16 ***
exper
0.0049442 0.0001575 31.397
<2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4301 on 6759 degrees of freedom
Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221
F-statistic: 644.5 on 3 and 6759 DF, p-value: < 2.2e-16
45
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Ma trận hiệp phương sai của hệ số hồi quy
> vcov(hoiquy1)
(Intercept)
jc
univ
exper
(Intercept) 4.435337e-04 -1.741432e-05 -1.573472e-05 -3.104756e-06
jc
-1.741432e-05 4.663243e-05 1.927929e-06 -1.718296e-08
univ
-1.573472e-05 1.927929e-06 5.330230e-06 3.933491e-08
exper
-3.104756e-06 -1.718296e-08 3.933491e-08 2.479792e-08
var( ˆ1 )  4, 66.10 5 ; var( ˆ2 )  5,33.106 ;cov( ˆ1 , ˆ2 )  1,93.106
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> hoiquy2<-lm(lwage ~ jc + I(jc + univ) + exper, data = twoyear)
> summary(hoiquy2)
Call:
lm(formula = lwage ~ jc + I(jc + univ) + exper, data = twoyear)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.4723256 0.0210602 69.910
<2e-16 ***
jc
-0.0101795 0.0069359 -1.468
0.142
I(jc + univ) 0.0768762 0.0023087 33.298
<2e-16 ***
exper
0.0049442 0.0001575 31.397
<2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4301 on 6759 degrees of freedom
Multiple R-squared: 0.2224,
Adjusted R-squared: 0.2221
• H0:  1=0 ; H1:  1≠0
• p-value(2p) = 0,142  p-value(1p) = 0,071
47
47
Phân tích hồi quy bội
Vấn đề suy diễn
4.5 Kiểm định nhiều ràng buộc tuyến tính: Kiểm định F
Kiểm định các ràng buộc loại trừ
Tiền lương của các
cầu thủ bóng chày
ở giải nhà nghề
Số năm thi đấu
chuyên nghiệp
Số trận tham gia thi
đấu trung bình mỗi
năm
4.28
Điểm đánh
bóng trung bình
Số lần đánh bóng
ghi điểm trực tiếp
trung bình mỗi năm
Số lần đánh bóng ghi
điểm mỗi năm
4.29
với H1: H0 là sai
4.30
Kiểm định việc các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động
đến tiền lương/ hoặc có thể loại bỏ khỏi phương trình hồi quy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình chưa gán ràng buộc (UR)
4.31
Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm
định đơn lẻ. tbavg = 0,89 ; thrunsyr = 0,89 ; trbisyr = 1,50
Gợi ý: Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô hình?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
49
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình đã gán ràng buộc (R)
4.33
RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không?
Thống kê kiểm định
Số các ràng buộc
4.37
Sự tăng lên tương đối của tổng bình
phương phần dư khi đi từ H1 đến H0
tuân theo một phân phối F (nếu H0
là đúng )
df = n-(k+1), với (k+1) : số tham số của mô hình UR
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
50
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Quy tắc bác bỏ (Hình 4.7)
( Rur2  Rr2 ) / q
F
(1  Rur2 ) / df ur
4.41
dfur : bậc tự do của mô hình UR
Một biến ngẫu nhiên có phân phối F chỉ
có thể nhận giá trị dương. Điều này tương
ứng với việc tổng bình phương phần dư chỉ
có thể tăng thêm khi đi từ H1 đến H0.
Chọn giá trị tới hạn sao cho giả thuyết không sẽ
bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù
nó đúng.
F > F(q,n-k-1): bác bỏ H0 4.40
Với mức ý nghĩa 5% ; q = 3 ; dfur = n-k-1 = 60 :
F0,05(3,60) = 2,76
Nếu F > F0,05(3,60) : bác bỏ H0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
51
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định vấn đề trong ví dụ
Số các ràng buộc cần kiểm định
F
(0,6278  0,5971) / 3
 9,55
(1  0,6278) / 347
F ~ F3,347 ; = 1% F0,01(3,347)= 3,78
Bậc tự do của mô hình
chưa gán ràng buộc (UR)
p-value = P(F-statistic > 9,55) = 4,47410-6
Bằng chứng bác bỏ giả thuyết
không là rất mạnh (thậm chí ở
mức ý nghĩa rất nhỏ).
Thảo luận
Ba biến được kiểm định là “có ý nghĩa đồng thời“
Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến
Có thể đã có đa cộng tuyến giữa chúng
F= 9,55 > F0,01(3,347)= 3,78
hay
p-value= 4,47410-6 < 0,01:
bác bỏ H0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
52
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
26
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Tập tin mlb1.wf1
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg +
hrunsyr + rbisyr, data = mlb1)
> summary(hoiquy1)
Call:
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr
+ rbisyr, data = mlb1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
years
6.886e-02 1.211e-02
5.684 2.79e-08 ***
gamesyr
1.255e-02 2.647e-03
4.742 3.09e-06 ***
bavg
9.786e-04 1.104e-03
0.887
0.376
hrunsyr
1.443e-02 1.606e-02
0.899
0.369
rbisyr
1.077e-02 7.175e-03
1.500
0.134
--Residual standard error: 0.7266 on 347 degrees of freedom
Multiple R-squared: 0.6278,
Adjusted R-squared: 0.6224
> nobs(hoiquy1)
[1] 353
R2 = 0.6278
n = df + số tham số = 347+6 = 353
53
53
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> anova(hoiquy1)
Analysis of Variance Table
Response: log(salary)
Df Sum Sq Mean Sq F value
Pr(>F)
years
1 165.980 165.980 314.4067 < 2.2e-16
gamesyr
1 127.884 127.884 242.2441 < 2.2e-16
bavg
1
0.881
0.881
1.6695
0.1972
hrunsyr
1 13.055 13.055 24.7299 1.039e-06
rbisyr
1
1.189
1.189
2.2514
0.1344
Residuals 347 183.186
0.528
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05
0.1 ‘ ’ 1
***
***
***
‘.’
SSR = 183.186
SSR  ˆ 2 .df  0, 7266 2 * 347
54
54
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
27
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> #Load package car
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquy1, c("bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test
Hypothesis:
bavg = 0
hrunsyr = 0
rbisyr = 0
Model 1: restricted model
Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
1
350 198.31
2
347 183.19 3
15.125 9.5503 4.474e-06 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
• F = 9,5503 > F0,05(3,347) = 2,6 : bác bỏ H0
• p-value = 4,47410-6 < 0,05 : bác bỏ H0
55
55
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Phaân phoái Fisher F
 Trong EXCEL:
Ñeå tính F0,05(1,6) = 5.987
goõ coâng thöùc sau: =FINV(0.05,1,6)
p–value cuûa phaân phoái F ñöôïc tính theo coâng thöùc:
p–value= P(F >F)
goõ coâng thöùc =FDIST(5.987,1,6) ta ñöôïc p–value = 0.05
> # Gia tri
> c(F_alpha
F_alpha
3.0984
> # p-value
> c(p_value
p_value
0.05
toi han F0,05(3,20)
= round(qf(1-0.05,3,20),digits=4))
cua F= 3,0984 voi bac tu do 3 va 20
= round(1-pf(3.0984,3,20),digits=4))
56
56
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
28
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định ý nghĩa toàn bộ của mô hình hồi quy
4.34
UR:
Giả thuyết không phát biểu rằng các biến
4.44
R:
4.45
độc lập hoàn toàn không có tác dụng giải
thích cho biến phụ thuộc
Mô hình đã gán ràng buộc
(hồi quy với hệ số chặn)
4.46
Kiểm định ý nghĩa toàn bộ của mô hình hồi quy được trình bày trong
hầu hết các phần mềm hồi quy. Giả thuyết không thường bị bác bỏ
H0: R2 = 0 (Hàm hồi quy mẫu SRF không phù hợp với mẫu khảo sát) 4.44
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
57
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Tập tin mlb1.wf1
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg
+ hrunsyr + rbisyr, data = mlb1)
> summary(hoiquy1)
Call:
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr
+ rbisyr, data = mlb1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
years
6.886e-02 1.211e-02
5.684 2.79e-08 ***
gamesyr
1.255e-02 2.647e-03
4.742 3.09e-06 ***
bavg
9.786e-04 1.104e-03
0.887
0.376
hrunsyr
1.443e-02 1.606e-02
0.899
0.369
rbisyr
1.077e-02 7.175e-03
1.500
0.134
--Multiple R-squared: 0.6278,
Adjusted R-squared: 0.6224
F-statistic: 117.1 on 5 and 347 DF, p-value: < 2.2e-16
• H0: β1 = … = β5 = 0 ;
• p-value <
2,210-16
H1: H0 sai
< 0,05 : bác bỏ H0
58
58
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
29
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Tập tin mlb1.wf1
> linearHypothesis(hoiquy1, c("years=0", "gamesyr=0",
"bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test
Hypothesis:
years = 0
gamesyr = 0
bavg = 0
hrunsyr = 0
rbisyr = 0
Model 1: restricted model
Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisy
r
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
1
352 492.18
2
347 183.19
5
308.99 117.06 < 2.2e-16 ***
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
• H0: β1 = … = β5 = 0 ;
• p-value <
2,210-16
H1: H0 sai
< 0,05 : bác bỏ H0
59
59
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
• Mô hình chưa gán ràng buộc (UR)
y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + u
• H0: β2 = 2, β4 = 0, β5 = -3
; H1: H0 sai
• Mô hình đã gán ràng buộc (R)
y = β0 + β1x1 + 2x2 + β3x3 -3x5 + β6x6 + u
(không chạy được)
 y - 2x2 + 3x5 = β0 + β1x1 + β3x3 + β6x6 + u
(chạy được)
Chỉ dùng công thức (4.37), không dùng được công thức (4.41)
60
60
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
30
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
Giá nhà thực tế
Giá dự kiến (giá được định ra
trước khi căn nhà được bán)
Kích thước lô đất
(tính bằng feet)
4.47
Diện tích bình phương
Số phòng ngủ
4.48
Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong
giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế.
Hơn nữa, các yếu tố khác nhất thiết
không có tác động đến giá thực tế
một khi đã kiểm soát giá dự kiến.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
61
Phân tích hồi quy bội
Vấn đề suy diễn
Mô hình chưa gán ràng buộc (UR)
y   0  1 x1   2 x2   3 x3   4 x4  u
Mô hình đã gán ràng buộc (R)
4.49
Mô hình đã gán ràng buộc thực
chất là mô hình hồi quy [y-x1]
theo một hằng số
y   0  x1  u  y  x1   0  u
4.50
Thống kê kiểm định
F ~ F4,83 ; = 5% F0,05(4,83)= 2,50
F= 0,661 < F0,05(4,83)= 2,50 : chấp nhận H0 với mức ý nghĩa 5%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
62
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
31
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Tập tin hprice1.wf1
> hoiquy1<-lm(log(price) ~ log(assess) + log(lotsize)
+ log(sqrft) + bdrms, data = hprice1)
> summary(hoiquy1)
Call:
lm(formula = log(price) ~ log(assess) + log(lotsize)
+ log(sqrft) + bdrms, data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
0.263743
0.569665
0.463
0.645
log(assess)
1.043066
0.151446
6.887 1.01e-09 ***
log(lotsize)
0.007438
0.038561
0.193
0.848
log(sqrft)
-0.103239
0.138430
-0.746
0.458
bdrms
0.033839
0.022098
1.531
0.129
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared:
0.7728,
Adjusted R-squared:
0.7619
F-statistic: 70.58 on 4 and 83 DF,
p-value: < 2.2e-16
63
63
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
> linearHypothesis(hoiquy1, c("log(assess)=1", "log(lotsize)=0",
"log(sqrft)=0","bdrms=0"))
Linear hypothesis test
Hypothesis:
log(assess) = 1
log(lotsize) = 0
log(sqrft) = 0
bdrms = 0
Model 1: restricted model
Model 2: log(price) ~ log(assess) + log(lotsize) + log(sqrft) + b
drms
1
2
Res.Df
RSS Df Sum of Sq
F Pr(>F)
87 1.8801
83 1.8215 4
0.05862 0.6678 0.6162
• p-value = 0,6162 > 0,05 : chấp nhận H0
64
64
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
32
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội
Vấn đề suy diễn
Kết quả hồi quy của mô hình chưa gán ràng buộc (UR)
Khi kiểm định riêng rẽ,
không có bằng chứng
chống lại sự hợp lý của
việc định giá nhà
Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết bội và tuyến tính
Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1 – MLR.6 được
giả định là thỏa mãn; nếu không các kiểm định sẽ không còn đáng tin cậy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
65
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
Kiểm định giả thiết đối 2 phía thì kết quả theo t và F là như nhau.
• Tập tin wage2.wf1
> hoiquy1<-lm(wage ~ educ + exper + tenure, data = wage2)
> summary(hoiquy1)
Call:
lm(formula = wage ~ educ + exper + tenure, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -276.240
106.702 -2.589 0.009778 **
educ
74.415
6.287 11.836 < 2e-16 ***
exper
14.892
3.253
4.578 5.33e-06 ***
tenure
8.257
2.498
3.306 0.000983 ***
--Multiple R-squared: 0.1459, Adjusted R-squared: 0.1431
66
66
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
33
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
1) H0: βeduc = 63 ; H0: βeduc ≠ 63
t
74,41486  63
 1,815631 ;  = 5%
6, 286993
|t| = 1,815631 < t0,025() = 1,96 : chấp nhận H0
Hay: p-value(2p) = P(|t| > 1,815631) = 0,0697 (phần mềm)
p-value(2p) > 0,05 : chấp nhận H0
2) H0: βeduc = 63 ; H0: βeduc > 63
t = 1,815631 > t0,05() = 1,645 : bác bỏ H0
Hay: p-value(1p) = 0,0697/2 = 0,0349 < 0,05 : bác bỏ H0
67
67
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
# Kiem dinh t
t_test <- function(reg, coefnum, val){
coefnum <- coefnum+1 # he so chan o vi tri so 1
co <- coef(summary(reg))
tstat <- (co[coefnum,1]-val)/co[coefnum,2]
p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE)
result1 <- c(t_stat = round(tstat, digits=4))
result2 = c(p_value_2p = round(p_value, digits=4))
result3 = c(p_value_1p = round(p_value/2, digits=4))
return(list(result1, result2,result3))
}
# y = b0 + b1*x1 + b2*x2 + b3*x3
# H0: b1 = 63 ; H1: b1 <> 63
# Chay ham Kiem dinh t truoc
t_test(hoiquy1,1,63) # nhap so 1 cho b1
68
68
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
34
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
> t_test(hoiquy1,1,63) # nhap so 1 cho b1
[[1]]
t_stat
1.8156
[[2]]
p_value_2p
0.0697
[[3]]
p_value_1p
0.0349
> 1.8156^2
[1] 3.296403
69
69
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
> #Load package car
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquy1, c("educ=63"))
Linear hypothesis test
Hypothesis:
educ = 63
Model 1: restricted model
Model 2: wage ~ educ + exper + tenure
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
1
932 130899834
2
931 130437974
1
461859 3.2965 0.06975 .
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘
’ 1
Nhận xét:
t2 = F
1,81562 = 3,2964
70
70
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
35
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• 4.6 Trình bày kết quả hồi quy (bằng tay)
• Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên
71
71
PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
• Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên
• salary lương của giáo viên
• b/s là viết tắt của “tỷ lệ phụ cấp trên lương”
• enroll quy mô của trường
• staff số giáo viên trên một nghìn học sinh
• droprate tỷ lệ học sinh bỏ học
• gradrate tỷ lệ học sinh tốt nghiệp
• totcomp tổng thu nhập hàng năm trung bình cho một giáo viên, bao gồm
lương và các phụ cấp (lương hưu, bảo hiểm y tế và các khoản khác)
•
72
72
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
36
Chương 4 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Môøi gheù thaêm trang web:
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
73
73
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
37
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Chương 5
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.1 Tính vững
Một ước lượng g gọi là vững cho 1 tham số tổng thể
Với mọi
Ký hiệu thay thế:
Giải thích:
P
 n 

và
nếu
.
Ước lượng hội tụ theo xác suất
tới giá trị đúng của tổng thể
Tính vững có nghĩa là xác suất mà ước lượng bất kỳ gần với giá trị thực
của tổng thể có thể được thực hiện cao một cách tùy ý bằng cách gia
tăng cỡ mẫu
Tính vững là một yêu cầu tối thiểu đối với một ước lượng hợp lý
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
 Giả thiết MLR.6 của mô hình tuyến tính cổ điển:
Sai số ngẫu nhiên u có phân phối chuẩn và độc lập với các biến giải thích.
Điều này cho phép ta rút ra được phân phối mẫu chính xác của các ước
lượng OLS (có điều kiện theo các biến giải thích trong mẫu).
 Định lý 4.1 đã chứng tỏ rằng các ước lượng OLS của mẫu có phân phối
chuẩn, từ đó suy ra ngay phân phối cho các thống kê t và F.
 Nếu sai số u không có phân phối chuẩn thì thống kê t sẽ không chính
xác là phân phối t, và thống kê F sẽ không chính xác là phân phối F với
một cỡ mẫu bất kỳ.
3
3
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Cho đến giờ chúng ta đã tập trung vào các tính chất của OLS đúng cho
mẫu bất kỳ (hữu hạn)
Các tính chất của OLS đúng cho mẫu/cỡ mẫu bất kỳ
Giá trị kỳ vọng/tính không chệch dưới giả thiết MLR.1 – MLR.4
Công thức phương sai của hệ số hồi quy mẫu dưới giả thiết MLR.1 – MLR.5
Định lý Gauss-Markov dưới giả thiết MLR.1 – MLR.5
Phân phối mẫu chính xác / kiểm định và KTC dưới giả thiết MLR.1 – MLR.6
Các tính chất của OLS đúng với mẫu lớn (tính tiệm cận)
Mặc dù giả định nhiễu
không có tính chuẩn!
Tính vững dưới giả thiết MLR.1 – MLR.4
Tính tiệm cận chuẩn/kiểm định dưới giả thiết MLR.1 – MLR.5
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
 Tính không chệch của các ước lượng, mặc dù quan trọng, nhưng không
phải lúc nào cũng đạt được.
 Các ước lượng OLS thì không chệch khi các giả thiết từ MLR.1 đến
MLR.4 thỏa.
 Trong Phần 3 của quyển sách này, chúng ta sẽ gặp một vài trường hợp
ước lượng bị chệch nhưng vẫn hữu dụng.
 Không phải tất cả các ước lượng hữu dụng đều không chệch.
 Gần như tất cả các nhà kinh tế học đều đồng ý rằng tính vững là yêu
cầu tối thiểu cần có của một ước lượng.
5
5
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
Tổng thể có phân phối X với E(X) = µ và var(X) = 2.
X1, X2, …, Xn là mẫu ngẫu nhiên với cỡ mẫu n lấy ra từ tổng thể. X1, X2, …, Xn có
cùng phân phối X với E(Xi) = µ và var(Xi) = 2.
Trung bình mẫu X 
X 1  ...  X n
n
Xét ước lượng của µ:




Ước lượng không chệch (unbiased) và vững (consistent)
X
Ước lượng không chệch (unbiased) và không vững (inconsistent)
X1
Ước lượng chệch (biased) và vững (consistent)
1
X
n
Ước lượng chệch (biased) và không vững (inconsistent)
X1+1
6
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
Tóm lại:
• Tính không chệch: phụ nữ có sắc đẹp (cái đẹp)
• Tính vững: phụ nữ có tính tình tốt (cái nết)
Kết luận:
• Một chàng trai đi lấy vợ: ưu tiên cái nào?
• Một người phụ nữ vừa không …. vừa không … thì …?
• Giống loài “đẹp người & đẹp nết” thì đã tc!
7
7
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
Tính vững của OLS:
Trường hợp đặc biệt của mô hình hồi quy đơn
5.2
8
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Định lý 5.1 (Tính vững của OLS)
Trường hợp đặc biệt của mô hình hồi quy đơn
5.3
Giả định MLR.4‘
Ta có thể thấy rằng ước lượng hệ số góc là vững
nếu biến giải thích là ngoại sinh, nghĩa là không
tương quan với sai số: Cov(x1,u) = 0.
Tất cả các biến giải thích phải không tương quan với sai số.
Giả định này thì yếu hơn so với giả định kỳ vọng có điều
kiện bằng 0 trong MLR.4.
 Giả thiết MLR.4 có thể suy ra giả thiết MLR.4’
E(u/x1,…,xk) = 0  E(u) = 0 và Cov(xj,u) = 0 , j
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Giả thiết MLR.4 suy ra giả thiết MLR.4’
Với tính vững của OLS, chỉ có giả thiết yếu hơn MLR.4‘ là cần thiết
Tính tiệm cận tương tự sự chệch do biến bị bỏ sót
Mô hình đúng
Lỗi chỉ định mô hình
(bỏ sót biến x2)
Chệch (phần
không vững)
Không có sự chệch do bỏ sót biến nếu biến bỏ sót là không
thích hợp hoặc không tương quan với biến được bao gồm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Tính tiệm cận của OLS
5.2 Tính tiệm cận chuẩn và suy luận trên mẫu lớn
Trong thực hành, giả định tính chuẩn MLR.6 thì thường có vấn đề
Nếu MLR.6 không đúng, kết quả của kiểm định t hoặc F có thể sai
May thay, kiểm định F và t vẫn còn hiệu lực nếu cỡ mẫu đủ lớn
Ngoài ra, ước lượng OLS có thể xấp xỉ phân phối chuẩn với mẫu lớn ngay cả
nếu không có MLR.6 (theo định lý giới hạn trung tâm)
Định lý 5.2 (Tính tiệm cận chuẩn của OLS)
Dưới các giả định MLR.1 – MLR.5:
Với mẫu lớn, ước lượng
chuẩn hóa có phân phối
xấp xỉ chuẩn tắc
5.7
Ngoài ra
a: asymptotic / approximation
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
11
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Hệ quả thực hành
Với mẫu lớn, phân phối t tiến tới phân phối chuẩn tắc N(0,1)
Như 1 hệ quả, kiểm định t có hiệu lực với mẫu lớn mà không có MLR.6
Tương tự cho ước lượng khoảng tin cậy và kiểm định F
Quan trọng: MLR.1 – MLR.5 thì vẫn cần thiết, đặc biệt là giả thiết phương
sai không đổi
Phân tích tiệm cận của phương sai ước lượng OLS
Hội tụ tới
5.9
Hội tụ tới
Hội tụ tới một số cố định nằm giữa 0 và 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Tính tiệm cận của OLS
Phân tích tiệm cận của phương sai ước lượng OLS (tt)
co lại với tốc độ
co lại với tốc độ
5.10
Đây là lý do tại sao mẫu lớn thì tốt hơn
Ví dụ 5.2: Sai số chuẩn trong phương trình cân nặng khi sinh
Chỉ sử dụng nửa đầu của các quan sát
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
13
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
• Tập tin bwght.wf1
> summary(hoiquy1)
Call:
lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.7185937 0.0182445 258.631 < 2e-16 ***
cigs
-0.0040816 0.0008582 -4.756 2.18e-06 ***
log(faminc) 0.0162657 0.0055833
2.913 0.00363 **
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1883 on 1385 degrees of freedom
Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435
F-statistic: 18.31 on 2 and 1385 DF, p-value: 1.417e-08
> nobs(hoiquy1)
[1] 1388
14
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
TÍNH TIỆM CẬN CỦA OLS
> summary(hoiquy2)
Call:
lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.705583
0.027053 173.939 < 2e-16 ***
cigs
-0.004637
0.001332 -3.481 0.000531 ***
log(faminc) 0.019404
0.008188
2.370 0.018074 *
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1961 on 691 degrees of freedom
Multiple R-squared: 0.02955, Adjusted R-squared: 0.02674
> nobs(hoiquy2)
[1] 694
0.000858/0.001332 = 0.644144
694 / 1388  0.707107
15
15
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Thống kê này phù hợp với mẫu lớn mà không cần giả thiết phân phối
chuẩn.
• Ta dùng thống kê nhân tử Lagrange (LM) thực hiện kiểm định ràng
buộc loại bỏ biến.
5.11
Kiểm định xem liệu q biến cuối có các tham số tổng thể đồng thời bằng 0
hay không
5.12
H1: H0 sai
16
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Thống kê LM chỉ yêu cầu ước lượng mô hình đã gán ràng buộc.
• B1) Ta thực hiện hồi quy (k-q biến độc lập)
5.13
B2) Chạy hồi quy phụ:
u
theo x1, x2,…, xk (tất cả biến độc lập)
5.14
2
ta thu được Ru
B3) Tính LM  nRu2
B4) Với mức ý nghĩa , tra giá trị tới hạn  (q ) có phân phối Chi bình
phương với q bậc tự do.
2
Nếu LM >  (q ) : bác bỏ H0
2
2
Hoặc: p  value  P (  ( q )  LM )
p-value < mức ý nghĩa  (0,05) : bác bỏ H0
17
17
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• VD 5.3: Mô hình kinh tế của tội phạm
H0: β2=0 , β3=0
H1: H0 sai
18
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Tập tin crime1.wf1
> hoiquygh<-lm(narr86 ~ pcnv + ptime86 + qemp86, data=crime1)
> hoiquygh
Call:
lm(formula = narr86 ~ pcnv + ptime86 + qemp86, data = crime1)
Coefficients:
(Intercept)
0.71177
pcnv
-0.14993
ptime86
-0.03442
qemp86
-0.10411
> unga<-resid(hoiquygh)
19
19
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
> hoiquyphu<-lm(unga ~ pcnv + ptime86 + qemp86
+ avgsen + tottime, data=crime1)
> r2LM<-summary(hoiquyphu)$r.squared
> r2LM
[1] 0.001493846
•> hoiquyphu
nobs(hoiquyphu)
[1] 2725
> LM<-r2LM*nobs(hoiquyphu)
> LM
[1] 4.070729
> print("chi binh phuong voi muc y nghia 10%, bac tu do 2")
[1] "chi binh phuong voi muc y nghia 10%, bac tu do 2"
> qchisq(1-0.1, 2)
[1] 4.60517
> print("p-value")
[1] "p-value"
> 1-pchisq(LM,2)
[1] 0.1306328
20
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• VD 5.3: Mô hình kinh tế của tội phạm
LM = 2725*0,001494 = 4,071
Với mức ý nghĩa 10% và bật tự do q = 2 ta có
2
 0,1
(2) = 4,61
Ta có LM= 4,071 < 4,61 =  0,1 (2) : chấp nhận H0
Hoặc:
p-value = P(2(2) > 4,071) = 0,1306
Ta có p-value = 0,1306 > 0,1 =  : chấp nhận H0
2
21
21
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
• Dùng kiểm định F:
>
>
>
>
#Load package car
library(car)
# Kiem dinh F
hoiquyf <- lm(narr86 ~ pcnv + ptime86 + qemp86
+ avgsen + tottime, data=crime1)
> linearHypothesis(hoiquyf, c("avgsen=0", "tottime=0"))
Linear hypothesis test
Hypothesis:
avgsen = 0
tottime = 0
Model 1: restricted model
Model 2: narr86 ~ pcnv + ptime86 + qemp86 + avgsen + tottime
1
2
Res.Df
RSS Df Sum of Sq
F Pr(>F)
2721 1927.3
2719 1924.4 2
2.879 2.0339 0.131
p-value = 0,131 > 0,1 : chấp nhận H0
22
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN:
THỐNG KÊ NHÂN TỬ LAGRANGE (LM)
Trong EXCEL:
 Xác định phân vị  2 ( df ) như sau:
=CHIINV(xác suất, bậc tự do)
Thí dụ:
2
=CHIINV(0.05,8) cho ta  0,05
(8) = 15.5073
 Xác định p-value = P(  
2
02 ) bằng công thức:
=CHIDIST(  0 , bậc tự do)
Thí dụ:
=CHIDIST(15.5073, 8) cho kết quả là
2
p-value = P(  >15.5073) = 0.05
2
23
23
DÙNG KIỂM ĐỊNH F HAY KIỂM ĐỊNH LM?
• Kiểm định F:
– Nếu nhiễu u có phân phối chuẩn:
Dùng được với cỡ mẫu nhỏ hay lớn
– Nếu nhiễu u không có phân phối chuẩn:
Chỉ dùng được khi cỡ mẫu lớn
• Kiểm định LM:
– Không quan tâm nhiễu u có phân phối chuẩn hay không
– Chỉ dùng được khi cỡ mẫu lớn
24
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 5 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
LƯU Ý:
• Log(x) = ln(x)
• Exp(x) = e^x (e mũ x)
• 2.1E+05 = 2,1*105
• 4.5E-03 = 4,5*10-3
• Nếu câu hỏi kiểm định cho mức ý nghĩa không thông dụng
(3,5%, 7,1%,…) thì nên suy nghĩ dùng phương pháp kiểm định gì.
25
25
Môøi gheù thaêm trang web:
26
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Chương 6
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
6.1 Vấn đề đơn vị tính trong hồi quy OLS
• bwght : cân nặng của trẻ sơ sinh, đơn vị tính là ounce
cigs : số điếu thuốc mà người mẹ hút hàng ngày trong thời gian mang thai
faminc : thu nhập của gia đình, đơn vị nghìn đôla
Đơn vị đo mới:
• bwghtlbs = bwght/16 ; bwghtlbs là cân nặng của em bé với đơn vị pound
1 pound tương ứng 16 ounce
• packs = cigs/20 ; packs là số gói thuốc người mẹ hút trong một ngày
1 packs có 20 cigs
• fincdol = 1000 faminc
; fincdol là thu nhập của gia đình (usd)
faminc là thu nhập của gia đình (ngàn usd)
Tập tin bwght.RData
2
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
•
•
> hoiquy1 <- lm(bwght ~ cigs + faminc, data = bwght)
> summary(hoiquy1)
Call:
lm(formula = bwght ~ cigs + faminc, data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.97413
1.04898 111.512 < 2e-16 ***
cigs
-0.46341
0.09158 -5.060 4.75e-07 ***
faminc
0.09276
0.02919
3.178 0.00151 **
--Multiple R-squared: 0.0298, Adjusted R-squared: 0.02
84
> nobs(hoiquy1)
[1] 1388
3
3
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
•
> hoiquy2 <- lm(bwghtlbs ~ packs + fincdol, data = bwght)
> summary(hoiquy2)
Call:
lm(formula = bwghtlbs ~ packs + fincdol, data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.311e+00 6.556e-02 111.512 < 2e-16
packs
-5.793e-01 1.145e-01 -5.060 4.75e-07
fincdol
5.798e-06 1.824e-06
3.178 0.00151
--Multiple R-squared: 0.0298, Adjusted R-squared:
> nobs(hoiquy2)
[1] 1388
***
***
**
0.0284
4
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy3 <- lm(bwght ~ cigs + log(faminc), data = bwght)
> summary(hoiquy3)
Call:
lm(formula = bwght ~ cigs + log(faminc), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 113.99070
1.94392 58.640 < 2e-16 ***
cigs
-0.46723
0.09144 -5.110 3.68e-07 ***
log(faminc)
1.85072
0.59489
3.111
0.0019 **
--Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
> nobs(hoiquy3)
[1] 1388
5
5
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy4 <- lm(bwght ~ cigs + log(fincdol), data = bwght)
> summary(hoiquy4)
Call:
lm(formula = bwght ~ cigs + log(fincdol), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 101.20641
5.99489 16.882 < 2e-16
cigs
-0.46723
0.09144 -5.110 3.68e-07
log(fincdol)
1.85072
0.59489
3.111
0.0019
--Multiple R-squared: 0.02951, Adjusted R-squared:
> nobs(hoiquy4)
[1] 1388
***
***
**
0.02811
6
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy7 <- lm(bwght ~ packs + log(faminc), data = bwght)
> summary(hoiquy7)
Call:
lm(formula = bwght ~ packs + log(faminc), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 113.9907
1.9439 58.640 < 2e-16 ***
packs
-9.3446
1.8288 -5.110 3.68e-07 ***
log(faminc)
1.8507
0.5949
3.111
0.0019 **
--Residual standard error: 20.07 on 1385 degrees of freedom
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10
> nobs(hoiquy7)
[1] 1388
7
7
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy8 <- lm(bwghtlbs ~ packs + log(fincdol), data = bwght)
> summary(hoiquy8)
Call:
lm(formula = bwghtlbs ~ packs + log(fincdol), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
6.32540
0.37468 16.882 < 2e-16 ***
packs
-0.58403
0.11430 -5.110 3.68e-07 ***
log(fincdol) 0.11567
0.03718
3.111
0.0019 **
--Residual standard error: 1.254 on 1385 degrees of freedom
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10
> nobs(hoiquy8)
[1] 1388
8
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy5 <- lm(log(bwght) ~ packs + log(faminc), data = bwght)
> summary(hoiquy5)
Call:
lm(formula = log(bwght) ~ packs + log(faminc), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.718594
0.018244 258.631 < 2e-16 ***
packs
-0.081632
0.017164 -4.756 2.18e-06 ***
log(faminc) 0.016266
0.005583
2.913 0.00363 **
--Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435
> nobs(hoiquy5)
[1] 1388
9
9
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
> hoiquy6 <- lm(log(bwghtlbs) ~ packs + log(fincdol), data = bwght)
> summary(hoiquy6)
Call:
lm(formula = log(bwghtlbs) ~ packs + log(fincdol), data = bwght)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.833646
0.056265 32.590 < 2e-16
packs
-0.081632
0.017164 -4.756 2.18e-06
log(fincdol) 0.016266
0.005583
2.913 0.00363
--Multiple R-squared: 0.02576, Adjusted R-squared:
> nobs(hoiquy6)
[1] 1388
***
***
**
0.02435
10
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
Công thức
Hàm hồi quy mẫu theo đơn vị đo cũ
ŷ  ˆ0  ˆ1 x1  ˆ2 x2
Hàm hồi quy mẫu theo đơn vị đo mới
ŷ *  ˆ0*  ˆ1* x1*  ˆ2* x2*
Với
y*  k0 y ; x1*  k1 x1 ; x2*  k2 x2
ˆ0*  k0 ˆ0 ; ˆ1* 
k0 ˆ ˆ * k0 ˆ
1 ;  2   2
k1
k2
11
11
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS
Nhận xét
* Biến gốc
Khi thay đổi đơn vị đo của biến phụ thuộc và các biến độc lập, ta thấy:
Không bị thay đổi: Cột t-Statistic, cột Prob, R-squared, F-statistic,
Prob(F-statistic)
Bị thay đổi: Cột Coefficient, cột Std. Error, S.E. of regression, Sum
squared resid
Các mục còn lại tự nghiên cứu tiếp.
* Biến có lấy log
• Log chỉ biến phụ thuộc
• Log chỉ biến độc lập
• Log cả biến phụ thuộc và biến độc lập
Tự rút ra nhận xét.
12
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit
Bài tập:
y: chi tiêu của gia đình (triệu đ)
x1: thu nhập của vợ (USD)
x2: số năm đi học của vợ (năm)
x3: thu nhập của chồng (triệu đ)
Các hệ số hồi quy (ở từng mô hình) sẽ thay đổi như thế nào nếu đơn vị của
các biến là:
y*: chi tiêu của gia đình (trăm ngàn đ)
x1* : thu nhập của vợ (trăm USD)
x2*: số năm đi học của vợ (tháng)
x3*: thu nhập của chồng (USD) ; 1 USD = 20 ngàn đ
13
13
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit (bài tập tt)
Xét mô hình 1:
y   0  1 x1   2 x2   3 log( x3 )  u
Xét mô hình 2:
log( y )   0  1 x1   2 x2   3 x3  u
Xét mô hình 3:
log( y )   0  1 log( x1 )   2 x2   3 x3  u
14
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
6.2 Bàn thêm về dạng hàm hồi quy
Bàn thêm về dạng hàm logarit
Thuận lợi khi giải thích bằng tỷ lệ phần trăm/ hệ số co giãn
Hệ số góc của các biến lấy log là bất biến đối với thay đổi tỷ lệ
Lấy log thường loại bỏ / giảm nhẹ vấn đề các giá trị bất thường
Lấy log thường giúp bảo đảm tính chuẩn và phương sai không đổi
Các biến sử dụng đơn vị đo lường như năm thì không nên lấy log
Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy log
Log không được sử dụng nếu biến có giá trị 0 hoặc âm
Có khó khăn khi lấy toán tử ngược của log trong dự đoán
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
15
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
Sự khác nhau giữa điểm phần trăm (percentage point) và
phần trăm (percent)
Điểm phần trăm là đơn vị đo khác biệt số học của hai trị
số phần trăm.
Ví dụ 1: Tỷ lệ sản xuất CN năm 2000 là 40%, năm 2001 là
44%.
Tỷ lệ sản xuất CN năm 2001 tăng so với 2000 là 4 điểm phần
trăm, nhưng là tăng
44  40
 0,1  1 0 % .
40
Ví dụ 2: Năm 1980 có 50% dân số hút thuốc, năm 1990 có
40%.
Từ 1980 đến 1990, tỷ lệ hút thuốc giảm 10 điểm phần trăm,
nhưng là giảm
50  40
 0, 2  20%
50
16
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit : Khi nào có thể xem 2.43 như 6.9 ?
%y  (100. 2 ) x2
2.43
giả sử β2^ >0
Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*β2^ (%)
Cách khác:
Cố định x1 , ta có:
6.8
Suy ra:
thì
6.9
Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*[exp(β2^)-1] (%)
17
17
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Sử dụng dạng hàm bậc 2
Dạng hàm lõm
Ví dụ: Phương trình lương
6.12
Số năm kinh nghiệm tăng lên 1 năm (từ 0
lên 1) thì lương tăng là 0,298 $,
Số năm kinh nghiệm tăng lên 1 năm (từ 1
lên 2) thì lương tăng là 0,298-2(0,0061)(1)
= 0,286 $ ...
Tác động biên
6.10
6.11
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Cực đại của lương tương ứng với số năm kinh nghiệm
6.13
Liệu điều này có nghĩa là số năm kinh nghiệm
nhiều hơn 24,4 năm trở nên tiêu cực?
Không
hợp lý
Không nhất thiết là như vậy. Điều đó phụ thuộc
vào có bao nhiêu quan sát trong mẫu nằm bên
phải điểm cực đại.
Trong ví dụ trên, có khoảng 28% các quan sát
nằm bên phải. Có thể có một vấn đề lỗi chỉ định
mô hình (ví dụ biến bị bỏ sót, dạng hàm sai...).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Phân tích hồi quy bội: Một số
vấn đề mở rộng
Nitơ oxit trong không khí, khoảng cách từ
trung tâm việc làm, tỷ lệ sinh viên/giáo viên
Ví dụ 6.2: Ảnh hưởng của ô nhiễm tới giá nhà đất
Điều này có nghĩa rằng, ở một số ít các phòng,
nhiều phòng có liên quan với giá thấp hơn?
 log( price)
 0,545  2(0,062)rooms
rooms
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Tính toán điểm cực tiểu
-54.5+12.4*5
Điểm cực tiểu:
Diện tích này có thể bỏ qua
vì nó liên quan đến chỉ có
1% các quan sát.
Gia tăng số phòng từ 5 lên 6 thì giá tăng:
= -54,5+12,4*5 = +7,5%
Không
hợp lý
Gia tăng số phòng từ 6 lên 7 thì giá tăng:
= -54,5+12,4*6 = +19,9%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
21
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Khả năng khác
6.15
6.16
Đa thức bậc cao hơn
cost = (β1 + 2β2 quantity + 3β3 quantity2).quantity
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Mô hình với các số hạng tương tác
price   0  1sqrft   2bdrms
Số hạng tương tác
  3 sqrft.bdrms   4bthrms  u
price
  2   3 sqrft
bdrms
Tác động của số phòng ngủ
phụ thuộc vào diện tích
6.17
Việc giải thích các tham số khá phức tạp khi có tác động tương tác
Tác động của số phòng ngủ, nhưng ứng với diện tích là 0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
23
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Xác định lại tham số của tác động tương tác
Trung bình tổng thể; có thể được
thay thế bởi trung bình mẫu
Tác động của x2 nếu tất cả các biến cố định tại giá trị trung bình
Lợi ích của việc xác định lại các tham số
Dễ dàng giải thích tất cả các tham số
Sai số chuẩn được tính cho các tác động riêng phần tại giá trị trung bình.
Nếu cần thiết, giá trị μ1 và μ2 có thể được thay thế bằng một giá trị khác
cần quan tâm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
6.3 Bàn thêm về độ phù hợp và vấn đề lựa chọn biến độc lập
Nhận xét chung về R2
Một R2 cao không ngụ ý rằng có một quan hệ nhân quả
Một R2 thấp không loại trừ tính hiệu quả của các tác động riêng phần
R2
hiệu chỉnh (Adjusted R-squared):
R2 thông thường được định nghĩa là gì?
là 1 ước lượng của
6.20
R2 tổng thể
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
25
Phân tích hồi quy bội:
Một số vấn đề mở rộng
R2 hiệu chỉnh (tt)
Bậc tự do đúng của tử số và mẫu số là
Một ước lượng tốt hơn có xét đến bậc tự do sẽ là
6.21
R2 hiệu chỉnh có tính đến hệ quả của việc thêm các biến độc lập mới
R2 hiệu chỉnh tăng nếu và chỉ nếu thống kê t (F) của một (một số ) biến độc lập
mới được thêm vào có trị tuyệt đối lớn hơn 1
Mối liên hệ giữa R2 và R2 hiệu chỉnh
6.22
Ví dụ:
R2 hiệu chỉnh có thể lấy giá trị âm
R 2  0,1, n  51, k  10  R 2  0,125  0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
Tóm lại:
 SSR là hàm giảm theo số biến độc lập trong mô hình
SST không phụ thuộc vào số biến độc lập trong mô hình
 R2 là hàm tăng theo số biến độc lập trong mô hình
R 2 không là hàm tăng theo số biến độc lập trong mô hình
 Nếu số tham số (k+1) > 1 thì R 2  R 2  1
Nếu số tham số càng lớn thì R 2 càng nhỏ hơn R2
Ta cần xem xét có nên đánh đổi giữa việc thêm biến độc lập vào mô
hình để R2 tăng và những bất lợi có thể có khi thêm biến độc lập.
27
27
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Sử dụng R2 hiệu chỉnh để chọn lựa giữa các mô hình không lồng nhau
Các mô hình được gọi là không lồng nhau nếu cái này không phải là trường
hợp đặc biệt của cái kia
6.23
6.24
Việc so sánh R2 của hai mô hình sẽ là không công bằng với mô hình đầu
tiên bởi vì mô hình đầu tiên chứa ít tham số hơn
Trong ví dụ trên, ngay cả sau khi đã điều chỉnh cho sự khác biệt về bậc tự
do (dùng R2 hiệu chỉnh), mô hình bậc hai vẫn được ưa thích hơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
So sánh các mô hình với biến phụ thuộc có dạng khác nhau
R2 hoặc R2 hiệu chỉnh không được sử dụng để so sánh các mô hình
mà chúng có dạng hàm của biến phụ thuộc khác nhau
Ví dụ 6.4: Mức đãi ngộ đối với CEO và hiệu quả doanh nghiệp
6.25
log(salary) biến
thiên ít hơn so
với salary (xem
TSS)
6.26
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
29
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
Lựa chọn giữa các mô hình:
Có các tiêu chuẩn lựa chọn mô hình trong R như sau:
• Các tiêu chuẩn sau càng lớn càng tốt
– R2 hiệu chỉnh
• Các tiêu chuẩn sau càng nhỏ càng tốt
– Akaike information criterion (AIC)
– Bayesian information criterion (BIC)
– Cp của Mallows (Cp)
• Điều kiện sử dụng các tiêu chuẩn này:
– Cùng dạng hàm của biến phụ thuộc
– Cùng cỡ mẫu
30
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn AIC và BIC
> load("E:/# Slide Viet 2019-01/Chuong 6/bwght.RData")
> bwght_data <- na.omit(data)
> names(bwght_data)
[1] "faminc"
"cigtax"
"cigprice" "bwght"
"fatheduc" "motheduc" "parity"
"male"
"white"
[10] "cigs"
"lbwght"
"bwghtlbs" "packs"
"lfaminc"
> bwght_data1 <- bwght[, -c(11:14)]
> names(bwght_data1)
[1] "faminc"
"cigtax"
"cigprice" "bwght"
"fatheduc" "motheduc" "parity"
"male"
"white"
[10] "cigs"
> attach(bwght_data1)
The following object is masked _by_ .GlobalEnv:
bwght
> rest_model <- lm(bwght ~faminc+cigtax, data=bwght_data1)
> AIC(rest_model)
[1] 10529.48
> BIC(rest_model)
[1] 10549.81
31
31
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn Cp (cách 1)
> install.packages("olsrr")
> library(olsrr)
Attaching package: ‘olsrr’
The following object is masked from ‘package:datasets’:
rivers
> full_modelfull <- lm(bwght ~ faminc+cigtax+cigprice+fatheduc,
data=bwght_data1)
> rest_model <-lm(bwght ~faminc+cigtax, data=bwght_data1)
> ols_mallows_cp(rest_model, full_modelfull)
[1] 4.079621
rest_model là mô hình lồng trong mô hình full_modelfull
32
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn Cp (cách 1)
• > full_model1 <- lm(bwght ~ ., data = bwght_data1)
> rest_model <- lm(bwght ~ faminc+cigtax, data = bwght_data1)
> ols_mallows_cp(rest_model, full_model1)
[1] 54.61653
Minh họa
Tuyến tính Tuyến
tính-log
AIC
0,5
0,51
BIC
0,47
0,46
Cp
2,1
1,9
R2 hiệu 0,73
0,68
chỉnh
Hồi quy qua
gốc tọa độ
0,63
0,56
1,7
0,72
Dạng hàm
bậc 2
0,72
0,78
1,2
0,85
Chọn mô hình
Tuyến tính
Tuyến tính-log
Dạng hàm bậc 2
Dạng hàm bậc 2
33
33
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Trong một số trường hợp, một số biến không nên kiểm soát trong mô hình
Trong hồi quy của tử vong do giao thông (fatalities) theo thuế bia của bang
(tax) (và các yếu tố khác như miles – tổng số dặm đã lái xe , percmale – phần
trăm nam giới trong dân số,...) không nên kiểm soát trực tiếp (đưa biến vào mô
hình) lượng bia tiêu thụ trên đầu người (beercons) giữa các địa phương
fatalities = 0+ 1 tax+ 2 miles+ 3 percmale +…
Trong hồi quy của chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của
nông dân không nên kiểm soát số lần đi khám bác sĩ
Chi phí sức khỏe bao gồm số lần khám bệnh, và chúng ta chỉ muốn đo lường toàn
bộ tác động của việc sử dụng thuốc trừ sâu lên chi phí y tế gia đình
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau
Trong hồi quy giá nhà - log(price) theo các đặc điểm của ngôi nhà như
log(lotsize), log(sqrft), bdrms ... chúng ta cần thêm biến định giá – log(assess)
của giá nhà nếu mục đích của hồi quy là nghiên cứu sự hợp lý của của việc định
giá; nếu không thì ta sẽ không thêm biến định giá vào
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
35
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Thêm biến độc lập để giảm phương sai của nhiễu
Việc thêm biến độc lập có thể làm trầm trọng thêm vấn đề đa cộng tuyến
Mặt khác, việc thêm biến độc lập làm giảm phương sai của nhiễu
Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì chúng
làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến
Tuy nhiên, các biến không tương quan như vậy rất khó tìm thấy
Ví dụ: lượng bia tiêu thụ của mỗi cá nhân và giá bia
Việc bao gồm các đặc điểm cá nhân trong hồi quy lượng bia tiêu thụ theo giá bia
dẫn đến ước lượng hệ số co giãn của lượng cầu bia theo giá bia “chính xác” hơn
Giả định hợp lý là đặc điểm cá nhân (tuổi, số năm đi học,…) không tương quan với giá bia
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Dự đoán điểm cho giá trị trung bình và giá trị cá biệt (cụ thể)
6.27
Giả sử c1, c2,…, ck là giá trị cụ thể của x1, x2,…, xk
Dự đoán (ước lượng) điểm của giá trị trung bình E(y/x1=c1,…,xk=ck)
hay giá trị cá biệt y0 là:
y0 ^ =
6.29
37
37
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5: Khoảng tin cậy dự đoán điểm trung bình GPA đại học
6.32
Dự đoán trung bình GPA đại học khi sat= 1200, hsperc= 30, hsize= 5?
Dự đoán điểm:
0^= y0^= 1.493 + 0.00149*1200 - 0.01386*30 - 0.06088*5 + 0.00546*52 = 2.70
hsperc: phân vị trung học, từ trên xuống (xếp hạng của sv tại trường trung học)
38
hsize: quy mô lớp tốt nghiệp
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Dự đoán khoảng cho giá trị trung bình
Thay
vào hồi quy trên
Ta được:
6.30
Tức là ta chạy hồi quy y theo hệ số chặn, (x1-c1), (x2-c2),…, (xk-ck)
6.31
Giá trị dự đoán và sai số chuẩn của 0^ dễ dàng tìm được thông qua hệ
số chặn của hàm hồi quy (6.31)
Khoảng tin cậy dự đoán 1- của giá trị trung bình là:
0^  t/2(n-k-1)*se(0^)
39
39
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Đặt sat0= sat-1200, hsperc0= hsperc-30, hsize0= hsize-5, hsizesq0= hsize2-25
Khoảng tin cậy dự đoán 95% cho điểm trung bình GPA đại học là:
2.70  1.96*0.02 hay (2.66 ; 2.74)
40
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1
> hoiquy <- lm(colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)
> summary(hoiquy)
Call:
lm(formula = colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.493e+00 7.534e-02 19.812 < 2e-16 ***
sat
1.492e-03 6.521e-05 22.886 < 2e-16 ***
hsperc
-1.386e-02 5.610e-04 -24.698 < 2e-16 ***
hsize
-6.088e-02 1.650e-02 -3.690 0.000228 ***
I(hsize^2)
5.460e-03 2.270e-03
2.406 0.016191 *
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5599 on 4132 degrees of freedom
Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774
> nobs(hoiquy)
[1] 4137
41
41
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1
> # hoi quy du bao
> hoiquy1 <- lm(colgpa ~ I(sat-1200) + I(hsperc-30) + I(hsize-5)
+ I(hsize^2-25), data = gpa2)
> summary(hoiquy1)
Call:
lm(formula = colgpa ~ I(sat - 1200) + I(hsperc - 30)
+ I(hsize - 5) + I(hsize^2 - 25), data = gpa2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
2.700e+00 1.988e-02 135.833 < 2e-16 ***
I(sat - 1200)
1.492e-03 6.521e-05 22.886 < 2e-16 ***
I(hsperc - 30) -1.386e-02 5.610e-04 -24.698 < 2e-16 ***
I(hsize - 5)
-6.088e-02 1.650e-02 -3.690 0.000228 ***
I(hsize^2 - 25) 5.460e-03 2.270e-03
2.406 0.016191 *
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5599 on 4132 degrees of freedom
Multiple R-squared: 0.2781,
Adjusted R-squared: 0.2774
> nobs(hoiquy1)
[1] 4137
42
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Khoảng tin cậy dự đoán của giá trị cá biệt y0
6.33
Sai số dự đoán là:
6.34
Phương sai của sai số dự đoán:
6.35
Sai số chuẩn:
6.36
Khoảng tin cậy dự đoán 1- của dự đoán giá trị cá biệt y0 là:
y0^  t/2(n-k-1)*se(e0^)
6.37
43
43
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5 Khoảng tin cậy dự đoán điểm cá biệt GPA đại học
Ta có:
;
= 0.5604
Khoảng tin cậy dự đoán 95% của điểm GPA từng học sinh cụ thể :
2.70  1.96*0.5604 hay (1.6016 đến 3.7984)
44
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1
> # du bao diem
> cvalues <- data.frame(sat=1200, hsperc=30, hsize=5)
> predict(hoiquy,cvalues)
1
2.700075
> # du bao khoang cho gia tri trung binh
> predict(hoiquy,cvalues, interval = "confidence", level = 0.95)
fit
lwr
upr
1 2.700075 2.661104 2.739047
> # du bao khoang cho gia tri ca biet
> predict(hoiquy,cvalues, interval = "prediction", level = 0.95)
fit
lwr
upr
1 2.700075 1.601749 3.798402
45
45
Phân tích hồi quy bội:
Một số vấn đề mở rộng
Dự đoán y khi biến phụ thuộc là log(y)
6.38
* yˆ

 exp(log(
y )). exp(ˆ 2 / 2)
* Dưới giả định là
6.40 Cần điều kiện u có phân phối chuẩn N(0,2)
độc lập với :
1 n


yˆ  exp(log(
y )).   exp(uˆi ) 
 n i 1

Dự đoán của y
u không có phân phối chuẩn
6.42-6.43
Không cần điều kiện u có phân phối chuẩn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Phân tích hồi quy bội:
Một số vấn đề mở rộng
So sánh R2 của mô hình có log và không có log ở biến phụ thuộc
VD 6.7 và 6.8
6.47
Log(mktval)
6.45
Đây là các R2 cho dự đoán của biến salary không
có log (mặc dù hồi quy thứ hai nguyên gốc là
log(salary). Bây giờ có thể so sánh trực tiếp hai R2.
R2~ = r(y, y^)2, với y^ tính theo công thức (6.40) hoặc (6.42-6.43)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
47
PHÂN TÍCH HỒI QUY BỘI:
MỘT SỐ VẤN ĐỀ MỞ RỘNG
Chọn lựa dạng hàm y hoặc lny theo BoxCox
Y = a+bX
lnY = c+dX
Cỡ mẫu là n
1) Tính trung bình hình học
Y G  n Y1  ...  Yn
2) Tính Y * 
Y
YG
3) Chạy hồi quy Y* = a+bX  SSRY
Chạy hồi quy lnY* = c+dX  SSRlnY
n
4) Tính BoxCox  .ln(SSRlớn/SSRnhỏ)
2
5) H0: 2 mô hình tốt như nhau ; H1: H0 sai
Quy tắc bác bỏ:
BoxCox  2 (1) : bác bỏ H0
Mô hình nào có SSR nhỏ hơn sẽ tốt hơn
48
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 6 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
06.08.2021
Môøi gheù thaêm trang web:
49
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
49
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội với biến
định tính
Chương 7
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Phân tích hồi quy bội:
Biến định tính
7.1 Mô tả thông tin định tính
Ví dụ: giới tính, chủng tộc, công nghiệp, khu vực, đánh giá cấp độ, ...
Một cách để kết hợp thông tin định tính là sử dụng biến giả
Chúng có thể xuất hiện như là biến phụ thuộc hay biến độc lập
7.2 Trường hợp đơn giản: Có một biến độc lập là biến giả
7.1
= mức lương thu được/mất đi nếu
người này là nữ chứ không phải là
nam (các yếu tố khác giữ cố định)
Biến giả:
=1 nếu là nữ
=0 nếu là nam
Câu hỏi: Tại sao chọn số 0 và 1 ???
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
3
3
Phân tích hồi quy bội:
Biến định tính
Đồ thị minh họa
Cách giải thích khác của hệ số:
7.2
nghĩa là, sự khác biệt về mức lương trung
bình giữa nam và nữ có cùng một trình độ
giáo dục (nữ so với nam).
female=0 : nhóm cơ sở (tham chiếu)
Cùng hệ số góc, khác tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Bẫy biến giả
Mô hình này không thể ước lượng được (đa cộng tuyến
hoàn hảo do Male + female = 1 (hệ số chặn))
Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ:
Nhóm cơ sở là nam
Nhóm cơ sở là nữ
Ngoài ra, có thể bỏ qua tung độ gốc:
Nhược điểm:
1)
Khó khăn hơn để kiểm định sự
khác biệt giữa các tham số
2) Công thức R2 chỉ có ý nghĩa
nếu hồi quy có tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
5
Phân tích hồi quy bội:
Biến định tính
VD 7.1: Ước lượng phương trình tiền lương với sự khác biệt về hệ số chặn
7.4
Cố định các biến giáo dục, kinh
nghiệm, và thâm niên chức vụ, tiền
lương trung bình của nữ ít hơn nam
là 1,81 USD/giờ
Điều đó có nghĩa rằng có sự phân biệt đối xử với nữ giới?
Không hẳn vậy. Bởi vì yếu tố giới tính nữ có thể tương quan với các đặc điểm
lao động khác chưa được kiểm soát.
H0: female = 0 ; H1: female ≠ 0 Xét xem yếu tố giới tính có ảnh hưởng đến lương không
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
So sánh trung bình của các tổng thể con được mô tả bằng biến giả
7.5
Thảo luận
Trong điều kiện không kiểm soát các yếu tố
khác, tiền lương trung bình của nữ ít hơn nam
là 2,51 USD/giờ; nghĩa là, sự khác biệt giữa mức
lương trung bình của nam và nữ là 2,51
USD/giờ.
Có thể dễ dàng kiểm định sự chênh lệch trung bình giữa hai tổng thể con có ý nghĩa thống kê hay
không (|t|= 9.65).
Sự khác biệt về mức lương giữa nam và nữ sẽ lớn hơn nếu không kiểm soát các yếu tố khác; nghĩa
là một phần của sự khác biệt là do sự khác nhau trong giáo dục, kinh nghiệm và thâm niên chức vụ
giữa nam và nữ. Số 1.81 trong (7.4) nhỏ hơn 2.51 trong (7.5).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
7
Phân tích hồi quy bội:
Biến định tính
Ví dụ 7.3: Ảnh hưởng của trợ cấp đào tạo lên số giờ đào tạo
Giờ đào tạo mỗi nhân viên
Biến giả biểu thị công ty có nhận trợ cấp đào tạo nghề hay không
7.7
Đây là một ví dụ về đánh giá chương trình
nhóm tác động (= có nhận trợ cấp) so với nhóm đối chứng (= không có nhận
trợ cấp). Nhóm đối chứng còn gọi là nhóm kiểm soát.
Liệu có phải tác động của chương trình đến biến phụ thuộc là quan hệ nhân quả?
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Sử dụng biến độc lập là biến giả trong phương trình log(y)
VD 7.4: Hàm hồi quy giá nhà
7.8
Biến giả biểu thị ngôi
nhà kiểu colonial
colonial = 1 nếu ngôi
nhà có phong cách
thuộc địa
Nhà có phong cách thuộc địa
có giá cao hơn nhà có phong
cách khác là 5,4 (%)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
9
Phân tích hồi quy bội:
Biến định tính
7.3 Sử dụng biến giả cho trường hợp biến định tính có nhiều lựa chọn
1) Xác định thành phần trong mỗi nhóm bằng một biến giả
2) Bỏ ra một nhóm (nhóm này sẽ trở thành nhóm cơ sở)
Câu hỏi: Nên dùng
bao nhiêu biến giả?
VD 7.6: Phương trình log tiền lương theo giờ
7.11
Giữ những yếu tố khác cố định, tiền lương
trung bình của nữ đã kết hôn ít hơn nam
độc thân (= nhóm cơ sở) là 19,8%
Giữ những yếu tố khác cố định, tiền lương trung bình của nam đã kết hôn nhiều hơn nam độc thân là 21,3%
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
Dùng bao nhiêu biến giả là đủ?
A) Biến định tính có nhiều thuộc tính
1) Giới tính (nữ, nam), dùng 2-1 = 1 biến giả
nu (nu=1: nữ)
Nhóm cơ sở là: nam
2) Giới tính (nữ, nam, hifi), dùng 3-1 = 2 biến giả
nu (nu=1: nữ)
nam (nam=1: nam)
Nhóm cơ sở là: hifi
11
11
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
B) Tương tác giữa các biến giả
1) Các biến giả có 2 thuộc tính
Giới tính (nữ, nam)
Tình trạng hôn nhân (có gia đình, độc thân)
Kết hợp giới tính và tình trạng hôn nhân: 2*2 = 4 trường hợp,
dùng 4-1 = 3 biến giả
nu*cogd: nữ và có gia đình
nu*docthan: nữ và độc thân
nam*cogd: nam và có gia đình
Nhóm cơ sở là: nam*docthan
12
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
B) Tương tác giữa các biến giả
2) Các biến giả có 2, 3 thuộc tính
Giới tính (nữ, nam)
Chủng tộc (da trắng, da vàng, da đen)
Kết hợp Giới tính và Chủng tộc: 2*3 = 6 trường hợp,
dùng 6-1 = 5 biến giả
Nu*datrang: nữ và da trắng
Nu*davang: nữ và da vàng
Nu*daden: nữ và da đen
Nam*datrang: nam và da trắng
Nam*davang : nam và da vàng
Nhóm cơ sở là: nam*daden
13
13
Phân tích hồi quy bội:
Biến định tính
Sử dụng biến giả cho trường hợp biến thứ bậc
Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị
Lãi suất trái phiếu đô thị
Xếp hạng tín dụng từ 0-4 (0=tệ, 4=rất tốt)
Mô tả này có lẽ không phù hợp nếu như xếp hạng tín dụng chỉ chứa thông tin thứ bậc.
Một cách tốt hơn để đưa thông tin thứ bậc này vào hồi quy là sử dụng nhiều biến giả:
7.12
Các biến giả được đặt tương ứng với các mức xếp hạng tín dụng. Nghĩa là, CR1 = 1 nếu CR = 1
và CR1 = 0 cho các trường hợp khác.
Tất cả các tác động được so sánh với mức xếp hạng tệ nhất (= nhóm cơ sở).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
Lưu ý:
• log(wage) = 0 + 0female + 1married + 2female.married +…+u
7.14
• H0: 2=0 ; H1: 2≠0
• Kiểm tra xem tác động của giới tính lên tiền lương có phụ thuộc vào
tình trạng hôn nhân không.
• Kiểm tra xem tác động của tình trạng hôn nhân lên tiền lương có phụ
thuộc vào giới tính không.
15
15
Phân tích hồi quy bội:
Biến định tính
7.4 Thành phần tương tác có biến giả
Thành phần tương tác
Cho phép hệ số góc khác nhau giữa các nhóm
7.17
= hệ số chặn của nam
= hệ số góc của nam
= hệ số chặn của nữ
= hệ số góc của nữ
Giả thuyết quan tâm
H1: H0 sai
Tác động của học vấn là như nhau giữa nam
và nữ. Mức chênh lệch tiền lương giữa nữ và
nam là như nhau ở mọi mức học vấn.
Tiền lương là như nhau giữa nam và nữ, có cùng mức học
vấn. Hay yếu tố giới tính không ảnh hưởng đến tiền lương
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Đồ thị minh họa
Việc sử dụng vừa biến giả vừa biến
tương tác cho phép hai phương trình
tiền lương hoàn toàn khác nhau giữa
nam và nữ
Khác hệ số góc,
khác tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
17
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
• Tập tin wage1.wf1
> # Khac tung do goc
> hoiquy1 <- lm(wage ~ female + educ, data = wage1)
> summary(hoiquy1)
Call:
lm(formula = wage ~ female + educ, data = wage1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.62282
0.67253
0.926
0.355
female
-2.27336
0.27904 -8.147 2.76e-15 ***
educ
0.50645
0.05039 10.051 < 2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.186 on 523 degrees of freedom
Multiple R-squared: 0.2588, Adjusted R-squared: 0.256
F-statistic: 91.32 on 2 and 523 DF, p-value: < 2.2e-16
18
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
• Tập tin wage1.wf1
• wage =  0 +  1educ + 0female.educ + u
• H0: 0 = 0 ; H1: 0 ≠ 0
khác hệ số góc
Xét xem yếu tố giới tính có ảnh hưởng đến lương không
> # Khac he so goc
> hoiquy2 <- lm(wage ~ educ + female:educ, data = wage1)
> summary(hoiquy2)
Call:
lm(formula = wage ~ educ + female:educ, data = wage1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.28526
0.65041 -0.439
0.661
educ
0.57548
0.05039 11.421 < 2e-16 ***
educ:female -0.17764
0.02183 -8.138 2.95e-15 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.186 on 523 degrees of freedom
Multiple R-squared: 0.2586, Adjusted R-squared: 0.2558
F-statistic: 91.23 on 2 and 523 DF, p-value: < 2.2e-16
19
19
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
• Tập tin wage1.wf1
> # Khac tung do goc va he so goc
> hoiquy3 <- lm(wage ~ female + educ + female:educ, data = wage1)
> summary(hoiquy3)
Call:
lm(formula = wage ~ female + educ + female:educ, data = wage1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.20050
0.84356
0.238
0.812
female
-1.19852
1.32504 -0.905
0.366
educ
0.53948
0.06422
8.400 4.24e-16 ***
female:educ -0.08600
0.10364 -0.830
0.407
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.186 on 522 degrees of freedom
Multiple R-squared: 0.2598, Adjusted R-squared: 0.2555
F-statistic: 61.07 on 3 and 522 DF, p-value: < 2.2e-16
20
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
Cách thay đổi hệ số góc và tung độ gốc
1) Mô hình hồi quy:
y   0  1 x  u
Biến giả biểu thị nơi sống: urban = 1 : thành thị
 Thay đổi tung độ gốc:
y   0  1 x   0urban  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)
 Thay đổi hệ số góc:
y   0  1 x   0urban.x  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)
 Thay đổi tung độ gốc và hệ số góc:
y   0  1 x   0urban  1urban.x  u
H 0 :  0  0, 1  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)
21
21
PHÂN TÍCH HỒI QUY BỘI: BIẾN
ĐỊNH TÍNH
Cách thay đổi hệ số góc và tung độ gốc
2) Mô hình hồi quy:
y   0  1 x1   2 x2  u
Biến giả biểu thị nơi sống: urban = 1 : thành thị
 Thay đổi tung độ gốc:
y   0  1 x1   2 x2   0urban  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)
 Thay đổi hệ số góc:
y   0  1 x1   2 x2   0urban.x1  1urban.x2  u
H 0 :  0  0, 1  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)
 Thay đổi tung độ gốc và hệ số góc:
y   0  1 x1   2 x2   0urban  1urban.x1   2urban.x2  u
H 0 :  0  0, 1  0,  2  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)
22
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Ước lượng phương trình lương với thành phần tương tác
VD 7.10: phương trình log tiền lương theo giờ
7.18
Không có bằng chứng thống kê
chống lại giả thuyết rằng tác động
học vấn là như nhau cho nam và nữ
(thống kê |t|= 0.43)
Liệu điều này có hàm ý rằng khi có cùng trình độ học vấn, số
năm kinh nghiệm, và thâm niên chức vụ, thì không có bằng
chứng thống kê cho thấy tiền lương của nữ sẽ thấp hơn nam
(|t|= 1.35)? Không: đây chỉ là tác động khi educ= 0.
Để trả lời câu hỏi này, người ta phải quy tâm thành phần
tương tác, ví dụ xét educ = 12,5 (= mức học vấn trung bình).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
23
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
• Tập tin wage1.wf1
> hoiquya <- lm(log(wage) ~ female + educ + female:educ
+ exper + I(exper^2) + tenure + I(tenure^2), data = wage1)
> summary(hoiquya)
Call:
lm(formula = log(wage) ~ female + educ + female:educ + exper +
I(exper^2) + tenure + I(tenure^2), data = wage1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.3888060 0.1186871
3.276 0.00112 **
female
-0.2267886 0.1675394 -1.354 0.17644
educ
0.0823692 0.0084699
9.725 < 2e-16 ***
exper
0.0293366 0.0049842
5.886 7.11e-09 ***
I(exper^2) -0.0005804 0.0001075 -5.398 1.03e-07 ***
tenure
0.0318967 0.0068640
4.647 4.28e-06 ***
I(tenure^2) -0.0005900 0.0002352 -2.509 0.01242 *
female:educ -0.0055645 0.0130618 -0.426 0.67028
--Residual standard error: 0.4001 on 518 degrees of freedom
Multiple R-squared: 0.441,
Adjusted R-squared: 0.4334
24
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquya, c("female=0", "female:educ=0"))
Linear hypothesis test
Hypothesis:
female = 0
female:educ = 0
Model 1: restricted model
Model 2: log(wage) ~ female + educ + female:educ
+ exper + I(exper^2) + tenure + I(tenure^2)
1
2
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
520 93.911
518 82.922 2
10.99 34.325 1.002e-14 ***
p-value = 1,002*10-14 < 0,05 : bác bỏ H0
25
25
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> hoiquyb <- lm(log(wage) ~ female + educ + female:I(educ-12.5)
+ exper + I(exper^2) + tenure + I(tenure^2), data = wage1)
> summary(hoiquyb)
Call:
lm(formula = log(wage) ~ female + educ + female:I(educ - 12.5) +
exper + I(exper^2) + tenure + I(tenure^2), data = wage1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
0.3888060 0.1186871
3.276 0.00112
female
-0.2963450 0.0358358 -8.270 1.14e-15
educ
0.0823692 0.0084699
9.725 < 2e-16
exper
0.0293366 0.0049842
5.886 7.11e-09
I(exper^2)
-0.0005804 0.0001075 -5.398 1.03e-07
tenure
0.0318967 0.0068640
4.647 4.28e-06
I(tenure^2)
-0.0005900 0.0002352 -2.509 0.01242
female:I(educ - 12.5) -0.0055645 0.0130618 -0.426 0.67028
--Residual standard error: 0.4001 on 518 degrees of freedom
Multiple R-squared: 0.441,
Adjusted R-squared: 0.4334
**
***
***
***
***
***
*
26
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (phương pháp biến giả)
Mô hình chưa gán ràng buộc (chứa toàn bộ các thành phần tương tác)
Điểm trung bình đánh giá (GPA)
Xếp hạng của sinh viên
tại trường trung học
điểm thi SAT
7.20
Tổng số giờ học
chính khóa
Mô hình đã gán ràng buộc (R) (hàm hồi quy giống nhau cho cả 2 nhóm)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
27
Phân tích hồi quy bội:
Biến định tính
Giả thuyết không
H0: Hàm hồi quy giống nhau cho cả 2 nhóm
7.21
Tất cả tác động của thành phần tương
tác là bằng 0, nghĩa là, các hệ số hồi quy
giống nhau cho cả nam và nữ. Không có
sự chênh lệch về hệ số chặn và hệ số góc
trong hồi quy của nữ và nam.
Ước lượng mô hình chưa gán ràng buộc (UR)
7.22
Kiểm định riêng lẻ từng hệ
số của từng thành phần
tương tác, giả thuyết cho
rằng tác động của thành
phần tương tác bằng 0
không thể bị bác bỏ
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1
> # mo hinh UR
> hoiquy1 <- lm(cumgpa ~ female + sat + female:sat + hsperc + female:hsperc
+ tothrs + female:tothrs, data = gpa3, subset=(spring==1))
> summary(hoiquy1)
Call:
lm(formula = cumgpa ~ female + sat + female:sat + hsperc + female:hsperc +
tothrs + female:tothrs, data = gpa3, subset = (spring ==
1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.4808117 0.2073336
7.142 5.17e-12 ***
female
-0.3534862 0.4105293 -0.861 0.38979
sat
0.0010516 0.0001811
5.807 1.40e-08 ***
hsperc
-0.0084516 0.0013704 -6.167 1.88e-09 ***
tothrs
0.0023441 0.0008624
2.718 0.00688 **
female:sat
0.0007506 0.0003852
1.949 0.05211 .
female:hsperc -0.0005498 0.0031617 -0.174 0.86206
female:tothrs -0.0001158 0.0016277 -0.071 0.94331
--Residual standard error: 0.4678 on 358 degrees of freedom
Multiple R-squared: 0.4059,
Adjusted R-squared: 0.3943
29
29
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1
> nobs(hoiquy1)
[1] 366
> anova(hoiquy1)
Analysis of Variance Table
Response: cumgpa
Df
female
1
sat
1
hsperc
1
tothrs
1
female:sat
1
female:hsperc
1
female:tothrs
1
Residuals
358
Sum Sq
13.143
24.558
12.321
2.510
1.000
0.006
0.001
78.355
Mean Sq F value
Pr(>F)
13.1429 60.0495 9.648e-14 ***
24.5582 112.2057 < 2.2e-16 ***
12.3205 56.2923 4.988e-13 ***
2.5104 11.4701 0.0007858 ***
0.9999
4.5687 0.0332376 *
0.0061
0.0279 0.8674503
0.0011
0.0051 0.9433072
0.2189
30
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1
> # mo hinh R
> hoiquy2 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1))
> summary(hoiquy2)
Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4908498 0.1836782
8.117 7.57e-15 ***
sat
0.0011850 0.0001648
7.191 3.71e-12 ***
hsperc
-0.0099569 0.0012446 -8.000 1.70e-14 ***
tothrs
0.0023429 0.0007554
3.102 0.00208 **
--Residual standard error: 0.486 on 362 degrees of freedom
Multiple R-squared: 0.3516,
Adjusted R-squared: 0.3463
31
31
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> nobs(hoiquy2)
[1] 366
> anova(hoiquy2)
Analysis of Variance Table
Response: cumgpa
Df Sum Sq Mean Sq F value
Pr(>F)
sat
1 26.616 26.6158 112.6692 < 2.2e-16 ***
hsperc
1 17.490 17.4904 74.0398 2.364e-16 ***
tothrs
1 2.272 2.2725
9.6197 0.002076 **
Residuals 362 85.515 0.2362
32
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Kiểm định đồng thời với thống kê F (phương pháp biến giả)
H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai
Với mức ý nghĩa 5%:
F = 8,18 > 2,37 = F0,05(4,358) : bác bỏ H0
Vậy có sự khác biệt trong hàm hồi quy giữa nhóm nam và nữ
Tóm lại (phương pháp biến giả):
Kiểm tra xem có sự khác biệt trong hàm hồi quy của nhóm nam và nữ không
y = 0 + 0 male + 1x1 + 1 male.x1 + 2x2 + 2 male.x2 + u
H0: 0=0 ; 1=0 ; 2=0 (Không có sự khác biệt trong hàm hồi quy giữa các nhóm)
H1: H0 sai
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
33
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> library(car)
> linearHypothesis(hoiquy1, matchCoefs(hoiquy1, "female"))
Linear hypothesis test
Hypothesis:
female = 0
female:sat = 0
female:hsperc = 0
female:tothrs = 0
Model 1: restricted model
Model 2: cumgpa ~ female + sat + female:sat + hsperc + femal
e:hsperc +
tothrs + female:tothrs
1
2
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
362 85.515
358 78.355 4
7.1606 8.1791 2.545e-06 ***
H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai
p-value = 2,545*10-6 < 0,05 : bác bỏ H0
34
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (kiểm định Chow)
Cách khác để tính thống kê F trong trường hợp đã cho
Chạy hồi quy mô hình đã gán ràng buộc (R) riêng biệt cho nam và nữ ; tính SSR cho mô
hình chưa gán ràng buộc bằng cách lấy tổng SSR của hai hàm hồi quy này.
Chạy hồi quy cho mô hình đã gán ràng buộc (R) và tính SSR cho mô hình này
Kiểm định theo cách làm này được gọi là kiểm định Chow
Quan trọng: Kiểm định Chow giả định rằng phương sai của nhiễu là như nhau giữa các
nhóm
Nữ
Nam
n1= 90
n2= 276
SSR1= 19,603 SSR2= 58,752
Toàn bộ mẫu
n= n1+n2 = 366
SSRp= 85,515
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
35
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
cumgpa = 0 + 1 sat + 2 hsperc + 3 tothrs + u
(số tham số = 4)
> # mo hinh nu
> hoiquy3 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==1))
> summary(hoiquy3)
Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring ==
1 & female == 1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.1273255 0.3615951
3.118 0.00248 **
sat
0.0018022 0.0003469
5.195 1.36e-06 ***
hsperc
-0.0090013 0.0029078 -3.096 0.00265 **
tothrs
0.0022283 0.0014088
1.582 0.11739
--Residual standard error: 0.4774 on 86 degrees of freedom
Multiple R-squared: 0.4014,
Adjusted R-squared: 0.3805
36
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> nobs(hoiquy3)
[1] 90
> anova(hoiquy3)
Analysis of Variance Table
Response: cumgpa
Df Sum Sq Mean Sq F value
Pr(>F)
sat
1 10.1724 10.1724 44.6275 2.247e-09 ***
hsperc
1 2.4040 2.4040 10.5464 0.001661 **
tothrs
1 0.5703 0.5703 2.5018 0.117387
Residuals 86 19.6028 0.2279
37
37
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> # mo hinh nam
> hoiquy4 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1 & female==0))
> summary(hoiquy4)
Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1 & female == 0))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4808117 0.2059706
7.189 6.29e-12 ***
sat
0.0010516 0.0001799
5.846 1.44e-08 ***
hsperc
-0.0084516 0.0013613 -6.208 1.99e-09 ***
tothrs
0.0023441 0.0008567
2.736 0.00662 **
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4648 on 272 degrees of freedom
Multiple R-squared: 0.3169,
Adjusted R-squared: 0.3093
38
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> nobs(hoiquy4)
[1] 276
> anova(hoiquy4)
Analysis of Variance Table
Response: cumgpa
Df Sum Sq Mean Sq F value
Pr(>F)
sat
1 15.493 15.4925 71.7250 1.568e-15 ***
hsperc
1 10.140 10.1401 46.9449 4.871e-11 ***
tothrs
1 1.617 1.6172 7.4869 0.006624 **
Residuals 272 58.752 0.2160
39
39
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> # mo hinh toan bo
> hoiquy5 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1))
> summary(hoiquy5)
Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4908498 0.1836782
8.117 7.57e-15 ***
sat
0.0011850 0.0001648
7.191 3.71e-12 ***
hsperc
-0.0099569 0.0012446 -8.000 1.70e-14 ***
tothrs
0.0023429 0.0007554
3.102 0.00208 **
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.486 on 362 degrees of freedom
Multiple R-squared: 0.3516,
Adjusted R-squared: 0.3463
40
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> nobs(hoiquy5)
[1] 366
> anova(hoiquy5)
Analysis of Variance Table
Response: cumgpa
Df Sum Sq Mean Sq F value
Pr(>F)
sat
1 26.616 26.6158 112.6692 < 2.2e-16 ***
hsperc
1 17.490 17.4904 74.0398 2.364e-16 ***
tothrs
1 2.272 2.2725
9.6197 0.002076 **
Residuals 362 85.515 0.2362
41
41
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai
Công thức F của kiểm định Chow:
F
[ SSR p  ( SSR1  SSR2 )] / sts
( SSR1  SSR2 ) / ( n  2.sts )
7.24
sts = k+1: số tham số trong mô hình hồi quy
F > F(sts, n-2.sts) : bác bỏ H0
Ví dụ về cumGPA:
F
[85,515  (19,603  58,752)] / 4
 8,18
(19,603  58,752) / (366  2* 4)
Với = 5% : F = 8,18 > 2,37 = F0,05(4, 358) : bác bỏ H0
42
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
# mo hinh nu
hoiquy_nu <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==1))
SSR_nu <-sum(summary(hoiquy_nu)$resid^2)
SSR_nu
# mo hinh nam
hoiquy_nam <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==0))
SSR_nam <-sum(summary(hoiquy_nam)$resid^2)
SSR_nam
# mo hinh chung
hoiquy_chung <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1))
SSR_chung <-sum(summary(hoiquy_chung)$resid^2)
SSR_chung
43
43
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
# tinh bac tu do
df_tu <- summary(hoiquy_nu)$df[1]
df_mau <- (nobs(hoiquy_chung)-2*df_tu)
# tinh tu so va mau so cua Fc
tuso <- (SSR_chung - SSR_nu - SSR_nam)/df_tu
mauso <- (SSR_nu + SSR_nam)/df_mau
# thong ke Fc
Fc <- tuso/mauso
Fc
# p-value cua Fc
p_value <- 1-pf(Fc, df_tu, df_mau)
p_value
# tinh F_0.05(df_tu,df_mau)
F_0.05 <- qf(0.95, df_tu, df_mau)
F_0.05
44
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
> SSR_nu
[1] 19.60279
> SSR_nam
[1] 58.75172
> SSR_chung
[1] 85.51507
> df_tu
[1] 4
> df_mau
[1] 358
> tuso
[1] 1.79014
> mauso
[1] 0.2188673
> Fc
[1] 8.179112
> p_value
[1] 2.544637e-06
> F_0.05
[1] 2.396882
45
45
Phân tích hồi quy bội:
Biến định tính
7.5 Biến phụ thuộc nhị phân: mô hình xác suất tuyến tính (tự đọc)
Hồi quy tuyến tính khi biến phụ thuộc nhị phân
7.26
Nếu biến phụ thuộc chỉ có 2
giá trị 1 và 0
= P(y=1/x)
Mô hình xác suất
tuyến tính (LPM)
7.27
Hay:
7.28
Trong mô hình xác suất tuyến tính, các
hệ số cho biết tác động của biến độc lập
lên xác suất y=1
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Ví dụ: Việc tham gia lực lượng lao động của phụ nữ đã kết hôn
=1 có việc làm, =0 ngược lại
Thu nhập của người chồng (nghìn USD mỗi năm)
7.29
Nếu số con dưới sáu tuổi tăng
thêm 1, xác suất người phụ nữ
có việc làm giảm 26,2%
Có vẻ không có ý nghĩa, |t|= 0,98 (nhưng xem slide kế tiếp)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
47
Phân tích hồi quy bội:
Biến định tính
Ví dụ: Tham gia lực lượng lao động của phụ nữ đã kết hôn (tt)
Đồ thị với nwifeinc=50, exper=5,
age=30, kidslt6=1, kidsge6=0
Học vấn cao nhất trong mẫu là
educ = 17. Khi đó, xác suất có
việc làm dự đoán của phụ nữ đã kết
hôn là 50%.
17
Xác suất dự đoán âm nhưng không
sao vì không có người phụ nữ nào
trong mẫu có educ <5.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Nhược điểm của mô hình xác suất tuyến tính
Xác suất dự đoán có thể lớn hơn 1 hoặc nhỏ hơn 0
Tác động biên lên xác suất là hằng số đôi khi không đúng về mặt logic
Mô hình xác suất tuyến tính thì luôn có phương sai thay đổi
Phương sai của biến
ngẫu nhiên Bernoulli
7.30
Cần tính sai số chuẩn cải thiện cho trường hợp phương sai thay đổi này (Chương 8)
Ưu điểm của mô hình xác suất tuyến tính
Dễ dàng ước lượng và giải thích
Tác động ước lượng và dự đoán thường khá tốt trong thực tế
 Xem mô hình Logit và Probit ở Chương 17
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
49
Phân tích hồi quy bội:
Biến định tính
7.6 Bàn thêm về phân tích chính sách và đánh giá chương trình
Ví dụ: Tác động tài trợ đào tạo nghề đến năng suất lao động của công nhân
Tỷ lệ sản phẩm lỗi
=1 nếu công ty có nhận tài trợ đào tạo, =0 ngược lại
7.33
Không có tác động rõ ràng
của tài trợ lên năng suất,
|t|=0,12
Nhóm tác động: được nhận tài trợ, nhóm đối chứng: các công ty không nhận được tài trợ
Tài trợ được đưa ra trên cơ sở: đến trước phục vụ trước. Điều này không giống như tài trợ
một cách ngẫu nhiên. Có thể là những doanh nghiệp với năng suất thấp sẽ xin nhận tài trợ
đầu tiên vì họ nhận thấy cơ hội cải thiện năng suất.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
50
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Biến định tính
Nội sinh do vấn đề “tự lựa chọn” (self-selection) tham gia vào chương trình
Trong ví dụ trên và các ví dụ tương tự, việc tham gia vào chương trình có thể liên quan đến các
đặc điểm khác mà các đặc điểm này cũng ảnh hưởng đến biến phụ thuộc
Lý do là các đối tượng tự lựa chọn việc tham gia vào chương trình phụ thuộc vào đặc điểm và
triển vọng cá nhân của họ. Sự tham gia này không được xác định ngẫu nhiên.
Đánh giá thực nghiệm
Trong các thí nghiệm, việc tham gia vào nhóm tác động là ngẫu nhiên
Trong trường hợp này, tác động nhân quả có thể được suy ra bằng cách sử dụng hồi quy đơn
7.34
partic =1: có tham gia
Biến giả biểu thị có hay không có tham gia thì
không liên quan đến các yếu tố khác ảnh hưởng
đến biến phụ thuộc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
51
Phân tích hồi quy bội:
Biến định tính
Ví dụ khác về biến độc lập là biến giả bị nội sinh
Có phải khách hàng da màu bị phân biệt đối xử?
Biến giả biểu thị vốn vay có
được phê duyệt không
Biến giả chủng tộc
H0: 1 = 0
H1: 1 < 0
Sự giàu có
Xếp hạng tín dụng
Điều cần thiết là kiểm soát các đặc điểm quan trọng khác có thể tác động đến
việc phê duyệt vốn vay (ví dụ nghề nghiệp, thất nghiệp)
Việc bỏ qua đặc điểm quan trọng mà có tương quan với biến giả da màu sẽ tạo
ra bằng chứng thống kê giả cho sự phân biệt đối xử
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
52
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
26
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc
7.35
Cố định tuổi, nếu số năm đi học tăng 1 năm thì số con trung bình của phụ nữ
giảm 0,09 con.
Hay: Xét 1 nhóm 100 phụ nữ (cùng tuổi), nếu mỗi người có số năm đi học tăng 1
thì tổng số con trung bình của nhóm này sẽ giảm 9 người.
Cố định số năm đi học, nếu tuổi tăng 1 năm thì số con trung bình của phụ nữ
tăng 0,175 con.
Hay: Xét 1 nhóm 1000 phụ nữ (cùng số năm đi học), nếu mỗi người có số tuổi
tăng 1 thì tổng số con trung bình của nhóm này sẽ tăng 175 người.
53
53
PHÂN TÍCH HỒI QUY BỘI:
BIẾN ĐỊNH TÍNH
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc
7.37
electric= 1: phụ nữ sống trong ngôi nhà có điện
Cố định tuổi và mức học vấn. Phụ nữ sống trong nhà có điện có số con
trung bình ít hơn phụ nữ sống trong ngôi nhà không có điện là 0,362 người.
Hay: Cùng tuổi và mức học vấn. Xét nhóm 1000 phụ nữ sống trong nhà có
điện so với nhóm 1000 phụ nữ sống trong nhà không có điện. Số con trung
bình của nhóm 1 ít hơn nhóm 2 là 362 người.
Cùng tuổi, nếu mức học vấn tăng 1 năm thì số con trung bình của người phụ
nữ giảm 0,079 người.
54
54
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
27
Chương 7 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Môøi gheù thaêm trang web:
55
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
55
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
28
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phương sai thay đổi
Chương 8
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Phân tích hồi quy bội:
Phương sai thay đổi
8.1 Hậu quả của phương sai thay đổi đối với OLS
OLS vẫn không chệch và vững khi có phương sai thay đổi
Ngoài ra, sự giải thích của R2 không thay đổi
Phương sai sai số không có điều kiện không bị
ảnh hưởng bởi phương sai thay đổi (đề cập đến
phương sai sai số có điều kiện)
Phương sai thay đổi làm vô hiệu các công thức phương sai đối với các ước lượng OLS
Các kiểm định F và kiểm định t thông thường, khoảng tin cậy thì không còn hiệu lực
khi có phương sai thay đổi
Với phương sai thay đổi, OLS không còn là ước lượng tuyến tính không chệch tốt
nhất (BLUE); Có thể có các ước lượng tuyến tính hiệu quả hơn (phải biết dạng của
phương sai thay đổi)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
Lưu ý:
Khi có đa cộng tuyến không hoàn hảo giữa các biến độc lập:
Ước lượng theo OLS vẫn có tính chất BLUE
Tính chất BLUE:
- Tuyến tính
- Không chệch
- Có phương sai nhỏ nhất
3
3
Phân tích hồi quy bội:
Phương sai thay đổi
8.2 Thống kê suy diễn cải thiện khi có phương sai thay đổi
Công thức cải thiện cho sai số chuẩn OLS và các thống kê liên quan được phát triển
cho trường hợp không biết dạng thay đổi của phương sai
Tất cả các công thức chỉ có hiệu lực trong các mẫu lớn
Công thức sai số chuẩn cải thiện cho OLS khi có phương sai thay đổi
Còn được gọi là sai số chuẩn White/Huber/Eicker.
Chúng bao gồm bình phương các phần dư từ hồi quy và
từ hồi quy biến xj theo tất cả các biến giải thích khác.
8.4
Sử dụng các công thức này, kiểm định t là tiệm cận hợp lý
Thống kê F thông thường không dùng được khi có phương sai thay đổi, nhưng các
phiên bản cải thiện phương sai thay đổi có sẵn trong hầu hết các phần mềm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
Mô hình hồi quy 2 biến:
Y   0  1 X  u
Đặt xi  X i  X
ˆ 2

var( ˆ1 ) 
(a)
 xi2
n

var( ˆ1 ) 
Ta có:

var( ˆ )
1 (a)
 rˆ uˆ
i 1
2 2
i1 i
SSR12
(8.4)
var( ˆ1 ) 
var( ˆ ) 
1
2
(2.57)
x
2
i
 x .
 x 
2
i
2
i
2
i
2
(8.2)
là ước lượng không chệch của var( ˆ1 )(2.57)

var( ˆ1 ) ( a ) là ước lượng chệch của var( ˆ1 )(8.2)

var( ˆ1 ) (8.4) là ước lượng “đúng” của var( ˆ1 )(8.2)
Lưu ý:
̂1 là ước lượng không chệch của β1
5
5
Phân tích hồi quy bội: Phương sai thay đổi
• VD 8.1: Phương trình log tiền lương khi có phương sai thay đổi
• Tập tin wage1.wf1
>
>
>
>
male <- 1-female
single <- 1-married
# ols
hoiquy <- lm(log(wage) ~ married:male + married:female
+ single:female + educ + exper + I(exper^2)
+ tenure + I(tenure^2), data = wage1)
# ols cai thien, chon hc1
coeftest(hoiquy, vcov = hccm)
coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc0'))
coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc1'))
linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male"),
vcov = hccm(hoiquy, type= 'hc1'))
6
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
• Sai số chuẩn OLS
> library(lmtest)
> coeftest(hoiquy)
t test of coefficients:
(Intercept)
educ
exper
I(exper^2)
tenure
I(tenure^2)
married:male
married:female
female:single
Estimate
0.32137810
0.07891028
0.02680057
-0.00053525
0.02908752
-0.00053314
0.21267568
-0.19826760
-0.11035021
Std. Error
0.10000899
0.00669450
0.00524285
0.00011043
0.00676200
0.00023124
0.05535718
0.05783546
0.05574205
t value
3.2135
11.7873
5.1118
-4.8471
4.3016
-2.3056
3.8419
-3.4281
-1.9797
Pr(>|t|)
0.0013931
< 2.2e-16
4.499e-07
1.659e-06
2.028e-05
0.0215306
0.0001373
0.0006562
0.0482719
**
***
***
***
***
*
***
***
*
7
7
Phân tích hồi quy bội: Phương sai thay đổi
• Sai số chuẩn cải thiện (robust)
> coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc1'))
t test of coefficients:
(Intercept)
educ
exper
I(exper^2)
tenure
I(tenure^2)
married:male
married:female
female:single
Estimate
0.32137810
0.07891028
0.02680057
-0.00053525
0.02908752
-0.00053314
0.21267568
-0.19826760
-0.11035021
Std. Error
0.10946899
0.00741467
0.00513912
0.00010634
0.00694092
0.00024368
0.05714191
0.05877001
0.05711626
t value
2.9358
10.6425
5.2150
-5.0334
4.1907
-2.1878
3.7219
-3.3736
-1.9320
Pr(>|t|)
0.0034751
< 2.2e-16
2.663e-07
6.665e-07
3.270e-05
0.0291286
0.0002194
0.0007975
0.0539021
**
***
***
***
***
*
***
***
.
8
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
• Kiểm định F theo OLS
> library(car)
> linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male"))
Linear hypothesis test
Hypothesis:
married:male = 0
married:female = 0
female:single = 0
Model 1: restricted model
Model 2: log(wage) ~ married:male + married:female
+ single:female+ educ + exper + I(exper^2) + tenure + I(tenure^2)
1
2
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
520 93.911
517 79.968 3
13.943 30.048 < 2.2e-16 ***
p-value < 2,2×10-16 < 0,05 : bác bỏ H0
9
9
Phân tích hồi quy bội: Phương sai thay đổi
• Kiểm định F theo cải thiện
> linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male"),
vcov = hccm(hoiquy, type= 'hc1'))
Linear hypothesis test
Hypothesis:
married:male = 0
married:female = 0
female:single = 0
Model 1: restricted model
Model 2: log(wage) ~ married:male + married:female
+ single:female + educ + exper + I(exper^2) + tenure + I(tenure^2)
Note: Coefficient covariance matrix supplied.
1
2
Res.Df Df
F
Pr(>F)
520
517 3 29.866 < 2.2e-16 ***
10
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Ví dụ 8.1’: Phương trình tiền lương theo giờ
Sai số chuẩn cải thiện cho phương sai thay đổi có
thể lớn hay nhỏ hơn khi không cải thiện. Sự khác
biệt thường nhỏ trong thực tế.
Thống kê F cũng thường không quá khác nhau.
Nếu có phương sai thay đổi nhiều, sự khác biệt có thể lớn hơn.
Để an toàn, nên tính các sai số chuẩn cải thiện.
Robust : cải thiện
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
11
Phân tích hồi quy bội:
Phương sai thay đổi
8.3 Kiểm định phương sai thay đổi
Việc kiểm tra sự hiện diện của phương sai thay đổi vẫn được quan tâm vì khi đó
OLS có thể không phải là ước lượng tuyến tính hiệu quả nhất.
Kiểm định Breusch-Pagan để phát hiện phương sai thay đổi
8.11
Với giả thiết MLR.4
Trung bình của u2 không được khác
nhau theo x1, x2, …, xk
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Kiểm định Breusch-Pagan để phát hiện phương sai thay đổi (tt)
 Rû22
8.14
Hồi quy các bình phương phần dư theo tất cả
các biến giải thích và kiểm định xem liệu mô
hình có phù hợp hay không.
8.13
2
8.15
Một trị số thống kê kiểm định lớn
(khi R2 cao) là bằng chứng chống
lại giả thuyết không.
2
2
8.16
Thống kê kiểm định thay thế (bằng cách dùng Thống kê nhân
tử Lagrange, LM). Một lần nữa, thống kê kiểm định có giá trị
lớn (khi R2 cao) sẽ dẫn đến sự bác bỏ giả thuyết không rằng
giá trị kỳ vọng của u2 không liên quan đến các biến giải thích.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
13
Phân tích hồi quy bội:
Phương sai thay đổi
Ví dụ 8.4: Phương sai thay đổi trong các phương trình định giá nhà
H0: Phương sai không đổi ; H1: Phương sai thay đổi
8.17
Phương sai thay đổi
2
8.18
2
Trong dạng hàm logarit, Phương sai không đổi
p-value < mức ý nghĩa  (0.05) : bác bỏ H0
; p-value   (0.05) : chấp nhận H0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin hprice1.wf1
> hoiquy
Call:
lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1)
Coefficients:
(Intercept)
-21.770308
lotsize
0.002068
sqrft
0.122778
bdrms
13.852522
15
15
Phân tích hồi quy bội: Phương sai thay đổi
>
>
>
>
hoiquy <- lm(price ~ lotsize + sqrft + bdrms, data = hprice1)
library(lmtest)
# BP test (phuong phap LM)
bptest(hoiquy)
studentized Breusch-Pagan test
data: hoiquy
BP = 14.092, df = 3, p-value = 0.002782
p-value = 0,002782 < 0,05 : bác bỏ H0
Vậy phương sai thay đổi
16
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
> # BP test (phuong phap F)
> bptestF <- lm(resid(hoiquy)^2 ~ lotsize + sqrft + bdrms,
data = hprice1)
> summary(bptestF)
Call:
lm(formula = resid(hoiquy)^2 ~ lotsize + sqrft + bdrms,
data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.523e+03 3.259e+03 -1.694 0.09390 .
lotsize
2.015e-01 7.101e-02
2.838 0.00569 **
sqrft
1.691e+00 1.464e+00
1.155 0.25128
bdrms
1.042e+03 9.964e+02
1.046 0.29877
--F-statistic: 5.339 on 3 and 84 DF, p-value: 0.002048
17
17
Phân tích hồi quy bội:
Phương sai thay đổi
Kiểm định White để phát hiện phương sai thay đổi
Hồi quy các bình phương
phần dư theo tất cả các biến
giải thích, các bình phương
của chúng, và các tương tác
(ở đây: ví dụ k=3)
8.19
Kiểm định White tổng quát hơn kiểm định
Breusch-Pagan để phát hiện phương sai thay đổi
2
x1.x2, x1.x3, x2.x3 gọi là số hạng tích chéo
Nhược điểm của dạng kiểm định White
Bao gồm tất cả các bình phương và các tương tác dẫn đến một số lượng lớn các tham
số được ước lượng (vd: k=6 dẫn đến 27 tham số được ước lượng)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Dạng thay thế (rút gọn) của kiểm định White
8.20
Hồi quy này gián tiếp kiểm định sự phụ thuộc của bình phương phần dư
theo các biến giải thích, các bình phương và các tương tác, bởi vì giá trị dự
đoán của y và bình phương của nó ngầm chứa tất cả các số hạng này.
2
Ví dụ 8.4: Phương sai thay đổi trong phương trình (log) giá nhà
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: hprice1.wf1
> # White test rut gon (phuong phap LM)
> bptest(hoiquy, ~ fitted(hoiquy) + I(fitted(hoiquy)^2))
studentized Breusch-Pagan test
data: hoiquy
BP = 16.268, df = 2, p-value = 0.0002933
> # White test (phuong phap LM)
> bptest(hoiquy, ~ lotsize*sqrft + lotsize*bdrms + sqrft*bdrms
+ I(lotsize^2) + I(sqrft^2) + I(bdrms^2),data = hprice1)
studentized Breusch-Pagan test
data: hoiquy
BP = 33.732, df = 9, p-value = 9.953e-05
20
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: hprice1.wf1
> # White test (phuong phap F)
> wtestF <- lm(resid(hoiquy)^2 ~ lotsize*sqrft + lotsize*bdrms
+ sqrft*bdrms + I(lotsize^2) + I(sqrft^2) + I(bdrms^2),
data = hprice1)
> summary(wtestF)
Call:
lm(formula = resid(hoiquy)^2 ~ lotsize * sqrft + lotsize * bdrms
+ sqrft * bdrms + I(lotsize^2) + I(sqrft^2) + I(bdrms^2),
data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.563e+04 1.137e+04
1.374 0.17325
lotsize
-1.860e+00 6.371e-01 -2.919 0.00459 **
sqrft
-2.674e+00 8.662e+00 -0.309 0.75838
bdrms
-1.983e+03 5.438e+03 -0.365 0.71640
I(lotsize^2) -4.978e-07 4.631e-06 -0.107 0.91467
I(sqrft^2)
3.523e-04 1.840e-03
0.191 0.84864
I(bdrms^2)
2.898e+02 7.588e+02
0.382 0.70362
lotsize:sqrft 4.568e-04 2.769e-04
1.650 0.10303
lotsize:bdrms 3.146e-01 2.521e-01
1.248 0.21572
sqrft:bdrms
-1.021e+00 1.667e+00 -0.612 0.54210
--F-statistic: 5.387 on 9 and 78 DF, p-value: 1.013e-05
21
21
Phân tích hồi quy bội:
Phương sai thay đổi
Phương sai thay đổi theo dạng nhân với một hằng số
8.21
Ví dụ: Tiết kiệm và thu nhập
8.22
Dạng hàm phương sai
thay đổi được biết
8.23
Lưu ý rằng mô hình hồi quy
này không có hệ số chặn
Mô hình biến đổi có phương sai không đổi
Nếu các giả thiết Gauss-Markov khác cũng được thỏa mãn, OLS áp dụng cho mô
hình biến đổi (gọi là GLS) là ước lượng tuyến tính không chệch tốt nhất
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
8.4 Ước lượng bình phương nhỏ nhất có trọng số (WLS)
Phương sai thay đổi theo dạng nhân với một hằng số
Dạng hàm phương sai
thay đổi được biết
8.21
8.24
8.25
Mô hình biến đổi
8.26
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
23
Phân tích hồi quy bội:
Phương sai thay đổi
OLS trong mô hình biến đổi là bình phương nhỏ nhất có trọng số (WLS)
Các quan sát với
phương sai lớn nhận
một trọng số nhỏ hơn
trong bài toán tối ưu
8.27
Tại sao WLS hiệu quả hơn OLS trong mô hình ban đầu?
Các quan sát có phương sai lớn thì ít thông tin hơn so với các quan sát có phương sai
nhỏ và do đó nhận trọng số nhỏ hơn
WLS là một trường hợp đặc biệt của bình phương nhỏ nhất tổng quát (GLS)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Ví dụ 8.6: Phương trình tài sản tài chính
Tài sản tài chính ròng
(Net financial wealth)
Dạng giả định của phương sai thay đổi:
Ước lượng theo WLS có sai số chuẩn
nhỏ hơn đáng kể (phù hợp với mong
đợi rằng chúng hiệu quả hơn).
Tham gia vào kế hoạch
lương hưu 401k
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
25
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: 401ksubs.wf1
> # OLS
> hqols <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k,
data = d401k, subset=(fsize==1))
> summary(hqols)
Call:
lm(formula = nettfa ~ inc + I((age - 25)^2) + male + e401k,
data = d401k, subset = (fsize == 1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
-20.984990
2.472022 -8.489
<2e-16 ***
inc
0.770583
0.061452 12.540
<2e-16 ***
I((age - 25)^2)
0.025127
0.002593
9.689
<2e-16 ***
male
2.477927
2.047776
1.210
0.2264
e401k
6.886223
2.123275
3.243
0.0012 **
--Residual standard error: 44.49 on 2012 degrees of freedom
Multiple R-squared: 0.1279, Adjusted R-squared: 0.1261
> nobs(hqols)
[1] 2017
26
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
OLS:
> library(lmtest)
> # BP test (phuong phap LM)
> bptest(hqols)
studentized Breusch-Pagan test
data: hqols
BP = 15.711, df = 4, p-value = 0.003433
• p-value = 0,003433 < 0,05 : bác bỏ H0
27
27
Phân tích hồi quy bội: Phương sai thay đổi
OLS:
> # OLS cai thien
> library(car)
> coeftest(hqols, vcov = hccm(hqols, type= 'hc1'))
t test of coefficients:
Estimate
(Intercept)
-20.9849901
inc
0.7705833
I((age - 25)^2)
0.0251267
male
2.4779269
e401k
6.8862229
Std. Error t value Pr(>|t|)
3.4951860 -6.0040 2.279e-09 ***
0.0995719 7.7390 1.574e-14 ***
0.0043442 5.7840 8.437e-09 ***
2.0583585 1.2038 0.228794
2.2865772 3.0116 0.002631 **
28
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
GLS - Generalized Least Squares:
2
Giả sử var(u / x)   inc
> # GLS
> hqgls <- lm(I(nettfa/sqrt(inc)) ~ 0 + I(1/sqrt(inc)) + sqrt(inc)
+ I((age-25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)),
data = d401k, subset=(fsize==1))
> summary(hqgls)
Call:
lm(formula = I(nettfa/sqrt(inc)) ~ 0 + I(1/sqrt(inc)) + sqrt(inc)
+ I((age - 25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)),
data = d401k, subset = (fsize == 1))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
I(1/sqrt(inc))
-16.702521
1.957995 -8.530 < 2e-16 ***
sqrt(inc)
0.740384
0.064303 11.514 < 2e-16 ***
I((age - 25)^2/sqrt(inc))
0.017537
0.001931
9.080 < 2e-16 ***
I(male/sqrt(inc))
1.840529
1.563587
1.177 0.23929
I(e401k/sqrt(inc))
5.188281
1.703426
3.046 0.00235 **
--Residual standard error: 7.065 on 2012 degrees of freedom
Multiple R-squared: 0.1591, Adjusted R-squared: 0.157
> nobs(hqgls)
[1] 2017
29
29
Phân tích hồi quy bội: Phương sai thay đổi
GLS:
> # BP test (phuong phap LM)
> bptest(hqgls)
studentized Breusch-Pagan test
data: hqgls
BP = 8.332, df = 4, p-value = 0.08015
• p-value = 0,08015 > 0,05 : chấp nhận H0
30
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
GLS:
>
>
>
+
# BP test (phuong phap F)
d401k_f1 <- subset(d401k, fsize==1)
hqglsF <- lm(resid(hqgls)^2 ~ I(1/sqrt(inc)) + sqrt(inc)
I((age-25)^2/sqrt(inc))+ I(male/sqrt(inc)) + I(e401k/sqrt(inc)),
data = d401k_f1)
> summary(hqglsF)
Call:
lm(formula = resid(hqgls)^2 ~ I(1/sqrt(inc)) + sqrt(inc) + I((age 25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)),
data = d401k_f1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
103.7683
470.9569
0.220
0.8256
I(1/sqrt(inc))
-734.2996 1238.4991 -0.593
0.5533
sqrt(inc)
6.9543
43.1690
0.161
0.8720
I((age - 25)^2/sqrt(inc))
0.4725
0.2260
2.091
0.0367 *
I(male/sqrt(inc))
187.4389
182.9764
1.024
0.3058
I(e401k/sqrt(inc))
108.7663
200.5111
0.542
0.5876
--Residual standard error: 826.3 on 2011 degrees of freedom
Multiple R-squared: 0.004137, Adjusted R-squared: 0.001661
F-statistic: 1.671 on 5 and 2011 DF, p-value: 0.1383
> nobs(hqglsF)
[1] 2017
• p-value = 0,1383 > 0,05 : chấp nhận H0
31
31
Phân tích hồi quy bội: Phương sai thay đổi
GLS:
> # White test rut gon (phuong phap LM)
> bptest(hqgls, ~ fitted(hqgls) + I(fitted(hqgls)^2),
data = d401k_f1)
studentized Breusch-Pagan test
data: hqgls
BP = 10.114, df = 2, p-value = 0.006365
• p-value = 0,006365 < 0,05 : bác bỏ H0
32
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
WLS:
Giả sử var(u / x)   inc
2
> # WLS
> hqwls <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k,
weight = 1/inc, data = d401k, subset=(fsize==1))
> summary(hqwls)
Call:
lm(formula = nettfa ~ inc + I((age - 25)^2) + male + e401k,
data = d401k, subset = (fsize == 1), weights = 1/inc)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
-16.702521
1.957995 -8.530 < 2e-16 ***
inc
0.740384
0.064303 11.514 < 2e-16 ***
I((age - 25)^2)
0.017537
0.001931
9.080 < 2e-16 ***
male
1.840529
1.563587
1.177 0.23929
e401k
5.188281
1.703426
3.046 0.00235 **
--Residual standard error: 7.065 on 2012 degrees of freedom
Multiple R-squared: 0.1115, Adjusted R-squared: 0.1097
> nobs(hqwls)
[1] 2017
33
33
Phân tích hồi quy bội: Phương sai thay đổi
WLS:
load("H:/Bai giang 2020 hk3/Chuong 08/401ksubs.RData")
d401k <- data
d401k_f1 <- subset(d401k, fsize==1)
options(digits=7)
hqwls <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k,
weight = 1/inc, data=d401k_f1)
> # White test rut gon (phuong phap LM)
> bptest(hqwls, ~ fitted(hqwls) + I(fitted(hqwls)^2),
data = d401k_f1)
>
>
>
>
>
studentized Breusch-Pagan test
data: hqwls
BP = 15.077, df = 2, p-value = 0.0005323
34
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
WLS:
> # BP test (phuong phap F)
> hqwlsF <- lm(resid(hqwls)^2 ~ inc + I((age-25)^2) + male + e401k,
data = d401k_f1)
> summary(hqwlsF)
Call:
lm(formula = resid(hqwls)^2 ~ inc + I((age - 25)^2) + male +
e401k, data = d401k_f1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
-4669.601
1862.345 -2.507
0.0122 *
inc
114.774
46.296
2.479
0.0133 *
I((age - 25)^2)
4.920
1.954
2.518
0.0119 *
male
2341.567
1542.732
1.518
0.1292
e401k
1181.817
1599.610
0.739
0.4601
--Residual standard error: 33520 on 2012 degrees of freedom
Multiple R-squared: 0.00793, Adjusted R-squared: 0.005957
F-statistic: 4.02 on 4 and 2012 DF, p-value: 0.002985
> nobs(hqwlsF)
[1] 2017
35
35
Phân tích hồi quy bội: Phương sai thay đổi
Phần dư của 3 phương pháp ước lượng OLS, GLS, WLS
### Phan du cua OLS, GLS, WLS
> um_ols <- resid(hqols)
> um_gls <- resid(hqgls)
> um_wls <- resid(hqwls)
> phandu <- data.frame(um_ols,um_gls,um_wls)
> options(digits=3)
> phandu
um_ols
um_gls
um_wls
1
9.7579 2.088913....
7.5808
2
115.9254 14.89927.... 116.5862
5
2.3097 0.979986....
4.6602
10
8.7462 1.986047....
10.7136
16
-4.3321 -1.13161....
-4.9422
24
7.8292 1.038733....
5.2200
26
-9.4303 -1.93732.... -10.0667
31
-23.4549 -5.48167.... -25.3914
51
-3.9814 -0.34099....
-2.2715
…………………………………………………….
>
>
>
>
>
>
>
### Tong binh phuong phan du
SSR_ols <- sum(hqols$resid^2)
SSR_gls <- sum(hqgls$resid^2)
SSR_wls <- sum(hqwls$resid^2)
SSR <- data.frame(SSR_ols,SSR_gls,SSR_wls)
options(digits=9)
sort(SSR)
SSR_gls
SSR_ols
SSR_wls
1 100427.099 3982123.72 4001427.78
36
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Trường hợp đặc biệt quan trọng của phương sai thay đổi
Nếu các quan sát là trung bình ở cấp thành phố / quận / tiểu bang / quốc gia / công
ty, chúng phải được lấy trọng số là kích thước của đơn vị
Đóng góp trung bình vào kế
hoạch lương hưu của công ty i
Thu nhập trung bình
và tuổi trung bình ở
công ty i
Phần trăm đóng góp của
công ty vào kế hoạch
sai số phương sai
thay đổi
8.29
Phương sai sai số khi sai số
ở mức độ nhân viên có
phương sai không đổi
e
Nếu sai số có phương sai không đổi ở mức độ nhân viên, cần sử dụng WLS với trọng số bằng quy
mô mi của công ty. Nếu giả định về phương sai không đổi ở cấp nhân viên không đảm bảo, người
ta có thể tính toán các sai số chuẩn cải thiện sau WLS (tức là, cho mô hình biến đổi).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
37
Phân tích hồi quy bội:
Phương sai thay đổi
Khi không biết hàm phương sai thay đổi (GLS khả thi - FGLS)
8.30
8.31
Sai số nhân (giả thiết: độc lập
với các biến giải thích)
 ĝ
8.32
hˆ  exp( gˆ )
8.33
GLS khả thi là vững và tiệm cận hiệu quả hơn OLS.
Dạng giả định tổng
quát của phương sai
thay đổi; Hàm mũ
được sử dụng để đảm
bảo dương
: giá trị ước lượng
Sử dụng các giá trị nghịch
đảo của hàm phương sai
thay đổi ước lượng được
như là trọng số trong WLS
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Ví dụ 8.7: Nhu cầu thuốc lá
Có hạn chế hút thuốc
trong nhà hàng
Ước lượng theo OLS
Thuốc lá hút mỗi ngày
Log thu nhập và Log giá thuốc lá
8.35
Bác bỏ giả
thuyết phương
sai không đổi
H0: Phương sai không đổi ; H1: Phương sai thay đổi
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
39
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: smoke.wf1
> hqols <- lm(cigs ~ log(income) + log(cigpric) + educ
+ age + I(age^2) + restaurn, data = smoke)
> summary(hqols)
Call:
lm(formula = cigs ~ log(income) + log(cigpric) + educ + age +
I(age^2) + restaurn, data = smoke)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3.639826 24.078659 -0.151 0.87988
log(income)
0.880268
0.727783
1.210 0.22682
log(cigpric) -0.750862
5.773342 -0.130 0.89655
educ
-0.501498
0.167077 -3.002 0.00277 **
age
0.770694
0.160122
4.813 1.78e-06 ***
I(age^2)
-0.009023
0.001743 -5.176 2.86e-07 ***
restaurn
-2.825085
1.111794 -2.541 0.01124 *
--Residual standard error: 13.4 on 800 degrees of freedom
Multiple R-squared: 0.05274, Adjusted R-squared: 0.04563
40
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: smoke.wf1
OLS:
> library(lmtest)
> # BP test (phuong phap LM)
> bptest(hqols)
studentized Breusch-Pagan test
data: hqols
BP = 32.258, df = 6, p-value = 1.456e-05
41
41
Phân tích hồi quy bội: Phương sai thay đổi
Tập tin: smoke.wf1
> # FGLS
> logu2 <- log(resid(hqols)^2)
> hqphu <- lm(logu2 ~ log(income) + log(cigpric) + educ
+ age + I(age^2) + restaurn, data = smoke)
> gm <- fitted(hqphu)
> hm <- exp(gm)
> hqwls <- lm(cigs ~ log(income) + log(cigpric) + educ
+ age + I(age^2) + restaurn, weight = 1/hm, data = smoke)
FGLS:
> # BP test (phuong phap LM)
> bptest(hqwls)
studentized Breusch-Pagan test
data: hqwls
BP = 32.258, df = 6, p-value = 1.456e-05
42
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
FGLS:
> summary(hqwls)
Call:
lm(formula = cigs ~ log(income) + log(cigpric) + educ + age
+ I(age^2) + restaurn, data = smoke, weights = 1/hm)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
5.6354627 17.8031394
0.317 0.751673
log(income)
1.2952393 0.4370117
2.964 0.003128 **
log(cigpric) -2.9403117 4.4601446 -0.659 0.509931
educ
-0.4634464 0.1201587 -3.857 0.000124 ***
age
0.4819480 0.0968082
4.978 7.86e-07 ***
I(age^2)
-0.0056272 0.0009395 -5.990 3.17e-09 ***
restaurn
-3.4610640 0.7955050 -4.351 1.53e-05 ***
--Residual standard error: 1.579 on 800 degrees of freedom
Multiple R-squared: 0.1134,
Adjusted R-squared: 0.1068
43
43
Phân tích hồi quy bội: Phương sai thay đổi
### Phan du cua OLS, WLS
> um_ols <- resid(hqols)
> um_wls <- resid(hqwls)
> phandu1 <- data.frame(um_ols,um_wls)
> options(digits=3)
> phandu1
um_ols
um_wls
1
-10.33299
-9.247
2
-10.75479
-9.914
3
-7.71989
-7.528
4
-10.26064
-9.667
5
-7.50415
-8.440
6
2.43942
-2.049
…………………………….
>
>
>
>
>
>
### Tong binh phuong phan du
SSR_ols <- sum(hqols$resid^2)
SSR_wls <- sum(hqwls$resid^2)
SSR <- data.frame(SSR_ols,SSR_wls)
options(digits=9)
sort(SSR)
SSR_ols
SSR_wls
1 143750.658 144812.657
44
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Phương sai thay đổi
Ước lượng theo FGLS
Bây giờ có ý nghĩa thống kê
8.36
Thảo luận
Hệ số co giãn của thu nhập bây giờ có ý nghĩa thống kê; Các hệ số khác cũng được
ước lượng chính xác hơn (mà không thay đổi chất lượng kết quả).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
45
Phân tích hồi quy bội:
Phương sai thay đổi
Điều gì sẽ xảy ra nếu giả định sai hàm phương sai thay đổi?
Nếu hàm phương sai thay đổi là sai, WLS vẫn là vững với các giả thiết MLR.1 – MLR.4, nhưng
nên tính toán các sai số chuẩn cải thiện
WLS là vững với giả thiết MLR.4 nhưng không đúng với MLR.4‘
Nếu OLS và WLS tạo ra các ước lượng rất khác nhau, điều này thường cho thấy một số giả
thiết khác là sai (ví dụ: MLR.4). Ngoài ra, sự khác nhau lớn giữa các hệ số ước lượng
OLS và WLS là dấu hiệu của việc xác định sai dạng hàm phương sai thay đổi.
Nếu có phương sai thay đổi nhiều, dù dùng dạng sai của phương sai thay đổi để làm tăng tính
hiệu quả vẫn tốt hơn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
46
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
•Dự đoán điểm và dự đoán khoảng cho giá
trị trung bình và giá trị cá biệt khi có
phương sai thay đổi
•Xem trang 331-333
47
47
Phân tích hồi quy bội:
Phương sai thay đổi
8.5 WLS trong mô hình xác suất tuyến tính (tự đọc)
8.45
8.47
Thảo luận
Trong LPM, dạng chính xác của
phương sai thay đổi được biết
Sử dụng giá trị nghịch đảo
như là trọng số trong WLS
Không khả dụng nếu dự đoán theo LPM dưới 0 hoặc lớn hơn 1
Nếu các trường hợp như vậy là rất hiếm, chúng có thể được điều chỉnh theo các giá trị
như 0.01 / 0.99
Trong các trường hợp khác, có thể tốt hơn là sử dụng OLS với các sai số chuẩn cải thiện
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
48
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
24
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội: Phương sai thay đổi
• Cách phát hiện phương sai của nhiễu thay đổi:
– Bản chất vấn đề nghiên cứu
– Vẽ đồ thị phần dư
– Kiểm định Park, Glejser, Goldfeld-Quandt, Harvey
– Kiểm định Breusch-Pagan-Godfrey , White
• Cách khắc phục phương sai thay đổi:
– Phương pháp bình phương bé nhất tổng quát GLS (Generalized Least Squares)
Phương pháp GLS thực chất là phương pháp OLS áp dụng cho các biến đã được biến
đổi từ một mô hình vi phạm các giả thiết Gauss-Markov thành một mô hình mới thỏa
các giả thiết Gauss-Markov. Do đó các tham số ước lượng được từ mô hình mới sẽ có
tính chất BLUE.
Giả sử var(u/x) = 2.x1 thì chia phương trình hồi quy cho sqr(x1)
Giả sử var(u/x) = 2.x12 thì chia phương trình hồi quy cho x1
– Phương pháp WLS
– Phương pháp FGLS
– Lấy log các biến
– Phương pháp OLS cải thiện (chỉ cải thiện sai số chuẩn của ước lượng OLS)
49
49
Phân tích hồi quy bội: Phương sai thay đổi
Tóm lại chương 8:
Kiểm định phương sai thay đổi:
• Nếu thấy phương sai không đổi: Cuộc đời vẫn đẹp sao, tình yêu vẫn
đẹp sao!
• Nếu thấy phương sai thay đổi: Nếu biết sống giữa trời tình yêu là con
nước trôi!
– Tìm dạng hàm thay đổi “đúng” của phương sai, rồi dùng GLS hoặc
WLS.
– Nếu việc tìm dạng hàm thay đổi “đúng” của phương sai là “yêu
người trong mộng” thì dùng FGLS.
– Nếu muốn một cuộc đời “lãng đãng chiều nay em nhớ anh” thì “xài
đỡ” OLS cải thiện
50
50
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
25
Chương 8 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Môøi gheù thaêm trang web:
51
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
51
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
26
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
MỘT SỐ VẤN ĐỀ MỞ RỘNG
VỀ DẠNG HÀM VÀ DỮ LIỆU
Chương 9
Wooldridge: Introductory Econometrics:
A Modern Approach, 5e
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
1
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.1 Vấn đề xác định sai dạng hàm
Chúng ta có thể kiểm định xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn
của một biến độc lập hay không bằng cách thêm các số hạng này vào mô hình và kiểm định
xem thành phần thêm vào có ý nghĩa thống kê không.
Ngoài ra, có thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey.
Kiểm định sai dạng hàm (RESET)
Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ
thuộc vào hàm hồi quy (giống với kiểm định White rút gọn)
y   0  1 x1  ...   k xk  u
9.2
y   0  1 x1  ...   k xk  1 yˆ 2   2 yˆ 3  saiso
9.3
Kiểm định xem có nên loại bỏ thành phần này hay không. Nếu ta không thể loại bỏ chúng, nghĩa là mô
hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm.
H0: 1=0, 2=0  H0: mô hình (9.2) có dạng hàm đúng
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
2
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
1
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ví dụ 9.2: Hàm hồi quy giá nhà
9.4
Bằng chứng cho thấy
có sai dạng hàm
Dạng hàm có log:
9.5
Ít bằng chứng cho thấy
có sai dạng hàm
Thảo luận
Chúng ta có thể thêm vào các bậc cao hơn của
ŷ
, hàm ý là thêm vào mô hình các
biến tương tác phức tạp và bậc cao hơn của các biến độc lập.
RESET cung cấp ít thông tin về nguyên nhân sai dạng hàm.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
3
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
• Tập tin hprice1.wf1
> summary(hoiquy1)
Call:
lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.177e+01 2.948e+01 -0.739 0.46221
lotsize
2.068e-03 6.421e-04
3.220 0.00182 **
sqrft
1.228e-01 1.324e-02
9.275 1.66e-14 ***
bdrms
1.385e+01 9.010e+00
1.537 0.12795
--Residual standard error: 59.83 on 84 degrees of freedom
Multiple R-squared: 0.6724,
Adjusted R-squared: 0.6607
4
4
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
2
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> library(lmtest)
> resettest(hoiquy1)
RESET test
data: hoiquy1
RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202
> resettest(hoiquy1 , power=2:3, type="fitted")
RESET test
data: hoiquy1
RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202
> resettest(hoiquy1 , power=2:5, type="fitted")
RESET test
data: hoiquy1
RESET = 3.2259, df1 = 4, df2 = 80, p-value = 0.01656
H0: Mô hình (9.4) có dạng hàm đúng . Với = 3%
p-value = 0.0120 (0.01656) < 0.03 =: bác bỏ H0
5
5
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
• Dạng hàm có log:
> summary(hoiquy2)
Call:
lm(formula = log(price) ~ log(lotsize) + log(sqrft) + bdrms,
data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.29704
0.65128 -1.992
0.0497 *
log(lotsize) 0.16797
0.03828
4.388 3.31e-05 ***
log(sqrft)
0.70023
0.09287
7.540 5.01e-11 ***
bdrms
0.03696
0.02753
1.342
0.1831
--Residual standard error: 0.1846 on 84 degrees of freedom
Multiple R-squared: 0.643,
Adjusted R-squared: 0.6302
6
6
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
3
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> library(lmtest)
> resettest(hoiquy2)
RESET test
data: hoiquy2
RESET = 2.565, df1 = 2, df2 = 82, p-value = 0.08308
H0: Mô hình (9.5) có dạng hàm đúng . Với = 6%
p-value = 0.0831 > 0.06 = : chấp nhận H0
7
7
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
• Tập tin crime1.wf1
> summary(hoiquy1)
Call:
lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86
+ inc86 + black + hispan, data = crime1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.5686855 0.0360461 15.777 < 2e-16
pcnv
-0.1332344 0.0403502 -3.302 0.000973
avgsen
-0.0113177 0.0122401 -0.925 0.355233
tottime
0.0120224 0.0094352
1.274 0.202698
ptime86
-0.0408417 0.0088120 -4.635 3.74e-06
qemp86
-0.0505398 0.0144397 -3.500 0.000473
inc86
-0.0014887 0.0003406 -4.370 1.29e-05
black
0.3265035 0.0454156
7.189 8.38e-13
hispan
0.1939144 0.0397113
4.883 1.10e-06
--Residual standard error: 0.8286 on 2716 degrees of
Multiple R-squared: 0.07232, Adjusted R-squared:
Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị.
***
***
***
***
***
***
***
freedom
0.06959
8
8
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
4
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
> resettest(hoiquy1)
RESET test
data: hoiquy1
RESET = 6.2607, df1 = 2, df2 = 2714, p-value = 0.001938
H0: Mô hình có dạng hàm đúng
H1: Mô hình có dạng hàm sai
p-value = 0,001938 < 0,05 : bác bỏ H0
Vậy mô hình có dạng hàm sai
9
9
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
> summary(hoiquy2)
Call:
lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86
+ black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2), data = crime1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
5.046e-01 3.684e-02 13.699 < 2e-16 ***
pcnv
5.525e-01 1.542e-01
3.582 0.000347 ***
avgsen
-1.702e-02 1.205e-02 -1.412 0.158028
tottime
1.195e-02 9.282e-03
1.288 0.197924
ptime86
2.874e-01 4.426e-02
6.494 9.88e-11 ***
qemp86
-1.409e-02 1.736e-02 -0.812 0.416970
inc86
-3.415e-03 8.037e-04 -4.249 2.22e-05 ***
black
2.923e-01 4.483e-02
6.520 8.35e-11 ***
hispan
1.636e-01 3.945e-02
4.147 3.47e-05 ***
I(pcnv^2)
-7.302e-01 1.561e-01 -4.677 3.05e-06 ***
I(ptime86^2) -2.961e-02 3.863e-03 -7.664 2.50e-14 ***
I(inc86^2)
7.186e-06 2.556e-06
2.811 0.004969 **
--Residual standard error: 0.8151 on 2713 degrees of freedom
Multiple R-squared: 0.1035,
Adjusted R-squared: 0.09982
10
10
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
5
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy2, c("I(pcnv^2)=0", "I(ptime86^2)=0",
"I(inc86^2)=0"))
Linear hypothesis test
Hypothesis:
I(pcnv^2) = 0
I(ptime86^2) = 0
I(inc86^2) = 0
Model 1: restricted model
Model 2: narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86
+ black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2)
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
1
2716 1865.0
2
2713 1802.4 3
62.589 31.404 < 2.2e-16 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
p-value < 2,2*10-16 < 0,05 : bác bỏ H0
Vậy nên chọn mô hình 2.
11
11
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Kiểm định đối với mô hình không lồng nhau, x hay log(x)
9.6
Mô hình 1:
Dạng hàm nào sẽ
phù hợp hơn?
9.7
Mô hình 2:
Xây dựng một mô hình hỗn hợp và mỗi mô hình ban đầu là trường hợp đặc biệt
của mô hình hỗn hợp và kiểm định:
y   0   1 x1   2 x2   3 log( x1 )   4 log( x2 )  u
9.8
H0: 1=0, 2=0 cho mô hình 9.7
Thảo luận
H0: 3=0, 4=0 cho mô hình 9.6
Luôn có thể thực hiện; tuy nhiên, không có mô hình chiếm ưu thế rõ ràng.
Không thể sử dụng nếu các mô hình có biến phụ thuộc có dạng hàm khác nhau.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
12
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
6
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
• Tập tin hprice1.wf1
> summary(hoiquy)
Call:
lm(formula = price ~ lotsize + sqrft + log(lotsize) + log(sqrft),
data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.404e+03 9.707e+02
1.446 0.151905
lotsize
-4.931e-04 1.020e-03 -0.483 0.630273
sqrft
2.475e-01 6.369e-02
3.886 0.000204 ***
log(lotsize) 6.022e+01 2.004e+01
3.004 0.003518 **
log(sqrft)
-2.826e+02 1.405e+02 -2.011 0.047556 *
--Residual standard error: 56.31 on 83 degrees of freedom
Multiple R-squared: 0.7133,
Adjusted R-squared: 0.6995
13
13
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy, c("lotsize=0", "sqrft=0"))
Linear hypothesis test
Hypothesis:
lotsize = 0
sqrft = 0
Model 1: restricted model
Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft)
1
2
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
85 312570
83 263156 2
49415 7.7927 0.0007916 ***
p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0
Mô hình (9.7) không chiếm ưu thế hơn (9.6)
14
14
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
7
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy, c("log(lotsize)=0", "log(sqrft)=0"))
Linear hypothesis test
Hypothesis:
log(lotsize) = 0
log(sqrft) = 0
Model 1: restricted model
Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft)
1
2
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
85 309186
83 263156 2
46030 7.2591 0.001244 **
p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0
Mô hình (9.6) không chiếm ưu thế hơn (9.7)
15
15
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> # dung encomptest
> hoiquy1 <- lm(price ~ lotsize + sqrft, data = hprice1)
> hoiquy2 <- lm(price ~ log(lotsize) + log(sqrft), data = hprice1)
> library(lmtest)
> encomptest(hoiquy1, hoiquy2, data = hprice1)
Encompassing test
Model 1: price ~
Model 2: price ~
Model E: price ~
Res.Df
M1 vs. ME
83
M2 vs. ME
83
lotsize + sqrft
log(lotsize) + log(sqrft)
lotsize + sqrft + log(lotsize) + log(sqrft)
Df
F
Pr(>F)
-2 7.2591 0.0012437 **
-2 7.7927 0.0007916 ***
16
16
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
8
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả
thiết được chấp nhận.
• Có thể dùng kiểm định Davidson-MacKinnon, trang 350.
17
17
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.2 Sử dụng biến đại diện cho các biến giải thích không quan sát được
Ví dụ 9.3: Bỏ sót biến năng lực trong mô hình tiền lương
Thay bằng biến đại diện
9.9
Thông thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mô hình
có thể bỏ sót biến năng lực không quan sát được.
Ý tưởng: tìm một biến đại diện cho năng lực, có thể kiểm soát và thể hiện được năng lực khác nhau
giữa các cá nhân, khi đó hệ số hồi quy của các biến khác không còn chệch. Một trong những biến
đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự.
Cách sử dụng biến đại diện trong mô hình:
9.10
9.11
Biến bỏ sót, chẳng hạn: năng lực
Hồi quy biến bỏ sót theo biến đại diện của nó (x3 đại diện cho x3*)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
18
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
9
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Giả thiết đối với biến đại diện
Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi
quy tổng thể, nghĩa là, nó không tương quan với nhiễu.
Nếu nhiễu và biến đại diện có tương quan, biến đại
diện cần có mặt trong mô hình hồi quy tổng thể
Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm
vào không giúp gì trong dự đoán biến bị bỏ sót.
9.13
Nếu điều này không thỏa,
thì x1 và x2 cần được thêm
vào mô hình hồi quy của
biến bị bỏ sót.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
19
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Khi thỏa các giả định trên, biến đại diện được sử dụng như sau:
Trong mô hình hồi quy này, sai số ngẫu nhiên e= u+β3v3 không tương quan với tất cả biến giải
thích. Khi đó, hệ số hồi quy sẽ được ước lượng đúng bằng OLS. Hệ số của biến x1 và x2 sẽ xác
định đúng. Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nó là bội số
của hệ số đứng trước biến bị bỏ sót).
Thảo luận về giả thiết biến đại diện trong hàm tiền lương
Giả thiết 1: Chỉ số IQ phải hoàn toàn không tác động trực tiếp đến tiền lương; quan trọng
là một cá nhân chứng minh năng lực trong công việc như thế nào.
Giả thiết 2: Hầu hết sự biến động của biến năng lực có thể được giải thích bởi sự thay đổi
trong chỉ số IQ, chỉ có một số ít được giải thích bởi học vấn và kinh nghiệm.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
20
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
10
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
Giống với kỳ vọng, suất sinh lợi giáo
dục giảm nếu IQ được đưa vào mô
hình để làm đại diện cho biến năng lực
không quan sát được.
Hệ số hồi quy đứng trước biến IQ cho
biết sự khác nhau trong năng lực giữa
các cá nhân có ý nghĩa quan trọng đến
tiền lương (ví dụ, mức chênh lệnh 15
điểm IQ dẫn đến mức chênh lên 5,4
điểm phần trăm trong tiền lương).
Ngay cả khi chỉ số IQ không hoàn toàn
giải thích sự thay đổi do năng lực, việc
thêm nó vào mô hình ít nhất làm giảm
tính chệch của suất sinh lợi giáo dục.
Có thể có đa cộng tuyến cao giữa IQ và educ
Tương tác giữa năng lực và học vấn
không có ý nghĩa.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
21
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
• Tập tin wage2.wf1
> summary(hoiquy1)
Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.395497
0.113225 47.653 < 2e-16
educ
0.065431
0.006250 10.468 < 2e-16
exper
0.014043
0.003185
4.409 1.16e-05
tenure
0.011747
0.002453
4.789 1.95e-06
married
0.199417
0.039050
5.107 3.98e-07
south
-0.090904
0.026249 -3.463 0.000558
urban
0.183912
0.026958
6.822 1.62e-11
black
-0.188350
0.037667 -5.000 6.84e-07
--Residual standard error: 0.3655 on 927 degrees of
Multiple R-squared: 0.2526,
Adjusted R-squared:
***
***
***
***
***
***
***
***
freedom
0.2469
22
22
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
11
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
> summary(hoiquy2)
Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black + IQ, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.1764391 0.1280006 40.441 < 2e-16 ***
educ
0.0544106 0.0069285
7.853 1.12e-14 ***
exper
0.0141459 0.0031651
4.469 8.82e-06 ***
tenure
0.0113951 0.0024394
4.671 3.44e-06 ***
married
0.1997644 0.0388025
5.148 3.21e-07 ***
south
-0.0801695 0.0262529 -3.054 0.002325 **
urban
0.1819463 0.0267929
6.791 1.99e-11 ***
black
-0.1431253 0.0394925 -3.624 0.000306 ***
IQ
0.0035591 0.0009918
3.589 0.000350 ***
--Residual standard error: 0.3632 on 926 degrees of freedom
Multiple R-squared: 0.2628,
Adjusted R-squared: 0.2564
23
23
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
> summary(hoiquy3)
Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black + IQ + educ:IQ, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.6482478 0.5462963 10.339 < 2e-16 ***
educ
0.0184560 0.0410608
0.449 0.653192
exper
0.0139072 0.0031768
4.378 1.34e-05 ***
tenure
0.0113929 0.0024397
4.670 3.46e-06 ***
married
0.2008658 0.0388267
5.173 2.82e-07 ***
south
-0.0802354 0.0262560 -3.056 0.002308 **
urban
0.1835758 0.0268586
6.835 1.49e-11 ***
black
-0.1466989 0.0397013 -3.695 0.000233 ***
IQ
-0.0009418 0.0051625 -0.182 0.855290
educ:IQ
0.0003399 0.0003826
0.888 0.374564
--Residual standard error: 0.3632 on 925 degrees of freedom
Multiple R-squared: 0.2634,
Adjusted R-squared: 0.2563
Chọn hoiquy2
24
24
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
12
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Sử dụng biến trễ của biến phụ thuộc làm biến đại diện
Trong nhiều trường hợp, yếu tố không quan sát được bị bỏ sót có thể được đại diện
bởi giá trị của biến phụ thuộc ở các thời điểm trước.
Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố
9.16
Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mô hình ít nhất kiểm soát được phần nào các
yếu tố bị bỏ sót có tác động đến tỷ lệ tội phạm trong năm đang xét.
So sánh hai thành phố có cùng tỷ lệ tội phạm vào năm trước; nghĩa là, chúng ta đã tránh trường
hợp so sánh hai thành phố có sự khác biệt rất lớn trong các yếu tố tác động đến tỷ lệ tội phạm
không quan sát được.
Kỳ vọng dấu của β3>0.
Nếu 2 thành phố có cùng tỷ lệ tội phạm trước đây (crime-1) và tỷ lệ thất nghiệp hiện tại (unem), β2
đo lường tác động của expend lên crime.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
25
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Tập tin crime2.wf1
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố
>
>
>
>
>
>
>
# Tao ra cac bien tuong ung voi nam 82 va 87
crmrte87 <- subset(crmrte, d87==1)
crmrte82 <- subset(crmrte, d87==0)
unem87 <- subset(unem, d87==1)
unem82 <- subset(unem, d87==0)
lawexpc87 <- subset(lawexpc, d87==1)
lawexpc82 <- subset(lawexpc, d87==0)
26
26
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
13
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Tập tin crime2.wf1
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố
> summary(hoiquy1)
Call:
lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87), data = crime2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
3.34290
1.25053
2.673
0.0106 *
unem87
-0.02900
0.03234 -0.897
0.3748
log(lawexpc87) 0.20337
0.17265
1.178
0.2453
--Residual standard error: 0.3231 on 43 degrees of freedom
Multiple R-squared: 0.05712, Adjusted R-squared: 0.01326
Dấu của UNEM87 và LOG(LAWEXPC87) trái với kỳ vọng.
27
27
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố
> summary(hoiquy2)
Call:
lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87) + log(crmrte82),
data = crime2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
0.076450
0.821143
0.093
0.926
unem87
0.008621
0.019517
0.442
0.661
log(lawexpc87) -0.139576
0.108641 -1.285
0.206
log(crmrte82)
1.193923
0.132099
9.038 2.1e-11 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1905 on 42 degrees of freedom
Multiple R-squared: 0.6798, Adjusted R-squared: 0.657
Dấu của UNEM87 và LOG(LAWEXPC87) đúng với kỳ vọng.
28
28
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
14
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.3 Mô hình với hệ số góc ngẫu nhiên (= Mô hình có hệ số ngẫu nhiên) (tự đọc)
Mô hình có hệ số chặn ngẫu nhiên
và hệ số góc ngẫu nhiên
9.18
Hệ số chặn
trung bình
Thành phần
ngẫu nhiên
Hệ số góc
trung bình
Thành phần
ngẫu nhiên
Sai số
Thành phần ngẫu nhiên của
một cá nhân độc lập với biến
giải thích
Giả thiết:
WLS hay OLS với sai số chuẩn cải
thiện sẽ giúp ước lượng vững hệ số
chặn trung bình và hệ số góc trung
bình của tổng thể.
9.20
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
29
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Khi chúng ta sử dụng 1 thước đo không chính xác cho 1 biến kinh tế trong 1 mô hình
hồi quy, thì có nghĩa là mô hình của chúng ta hàm chứa vấn đề sai số đo lường.
9.4 Tính chất của OLS khi có sai số trong đo lường
Sai số đo lường ở biến phụ thuộc
Giá trị sai = Giá trị đúng + Sai số đo lường
9.24
Hàm hồi quy tổng thể
Mô hình được ước lượng
9.25
Hậu quả của sai số đo lường ở biến phụ thuộc
Ước lượng kém hiệu quả hơn do phương sai sai số cao hơn.
Tuy nhiên, ước lượng OLS vẫn không chệch và vững (với giả thiết sai số đo lường e0
không tương quan với các biến giải thích xj). Ngoài ra, các thống kê t, F, LM vẫn hợp lệ.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
30
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
15
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.5: Hàm tiết kiệm với sai số đo lường
• sav* = β0 + β1inc + β2size + β3educ + β4age + u
• sav*: tiết kiệm thật sự, sav: tiết kiệm báo cáo
• e0 = sav-sav*
• Khá hợp lý nếu giả thiết sai số đo lường không tương quan với inc,
size, educ, age.
• Chúng ta có thể không bao giờ biết được sai số đo lường có
tương quan với inc, educ hay không, trừ khi chúng ta thu thập
được dữ liệu về sav*.
• Ví dụ 9.6: Sai số đo lường trong tỷ lệ phế phẩm
• log(scrap*)= β0 + β1grant + u
• scrap*: tỷ lệ phế phẩm thực tế, scrap: tỷ lệ phế phẩm công ty báo cáo
• e0 = log(scrap) - log(scrap*)
31
31
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Sai số đo lường ở 1 biến giải thích
9.28
Giá trị sai = Giá trị đúng + Sai số đo lường
9.27
Hàm hồi quy tổng thể
Mô hình được ước lượng
9.30
Sai số không
tương quan với
giá trị đúng
Giả thiết sai số trong đo lường cổ điển: 9.31
9.32
-
Giá trị sai x1 có
tương quan với sai
số của mô hình
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
32
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
16
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Hậu quả của sai số đo lường trong biến giải thích
Dưới giả thiết sai số trong đo lường cổ điển (CEV), OLS cho ước lượng chệch và
không vững vì biến đo sai x1 bị nội sinh.
Có thể biểu diễn tính không vững của ước lượng như sau:
Nhân tử này (liên quan đến phương sai
của nhiễu trong hàm hồi quy giá trị đúng
9.33
của x1 theo các biến giải thích khác) luôn
nhận giá trị từ 0 đến nhỏ hơn 1.
Tác động của biến đo sai bị chệch suy giảm, nghĩa là độ lớn tác động của biến đo
sai luôn gần với giá trị 0 hơn so với tác động của biến đúng. Ví dụ nếu β1 >0 thì β1^
sẽ có xu hướng ước lượng thấp hơn β1.
Ngoài ra, tác động của các biến giải thích khác cũng bị chệch.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
33
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
•
•
•
•
•
•
Ví dụ 9.7: Phương trình GPA với sai số đo lường
colGPA = β0 + β1faminc* + β2hsGPA + β3SAT + u
faminc*: thu nhập thực tế hàng năm của hộ gia đình
faminc: thu nhập hàng năm của hộ gia đình do sinh viên kê khai
e1 = faminc - faminc*
Nếu dùng faminc thay cho faminc* sẽ làm chệch ước lượng OLS của
β1 về phía 0. Một hậu quả của sự chệch dưới là kiểm định giả thiết
H0: β1 = 0 ; H1: β1 > 0 sẽ thường cho kết quả chấp nhận H0 (do |t|
nhỏ).
34
34
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
17
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.5 Dữ liệu bị khuyết, mẫu phi ngẫu nhiên, các quan sát bất thường (tự đọc)
Dữ liệu bị khuyết do chọn mẫu
Dữ liệu khuyết là trường hợp đặc biệt của vấn đề chọn mẫu (mẫu phi ngẫu nhiên) khi
quan sát bị thiếu thông tin không thể sử dụng được.
Nếu mẫu được chọn dựa trên các biến độc lập thì hàm hồi quy không gặp bất kỳ
vấn đề nào vì hàm hồi quy xét điều kiện dựa trên các biến dộc lập.
Nói chung, việc chọn mẫu sẽ không có vấn đề gì trong trường hợp nó không liên quan
tới sai số của mô hình (= chọn mẫu ngoại sinh).
Việc chọn mẫu sẽ có vấn đề nếu nó dựa trên biến phụ thuộc hoặc sai số (= chọn
mẫu nội sinh).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
35
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ví dụ về chọn mẫu ngoại sinh
9.37
Nếu mẫu phi ngẫu nhiên được chọn theo nhóm thu nhập, nhóm tuổi, quy mô gia đình, thì hàm hồi
quy không có bất kỳ vấn đề gì bởi vì nó nghiên cứu tiết kiệm cho một tập con của tổng thể được
xác định bởi thu nhập, tuổi và quy mô gia đình.
Ví dụ về chọn mẫu nội sinh
9.38
Nếu mẫu phi ngẫu nhiên là do các cá nhân từ chối tham gia cuộc khảo sát vì giá trị tài sản của họ
(wealth) quá cao hoặc thấp, kết quả ước lượng sẽ bị chệch vì những cá nhân này có sự khác biệt
một cách hệ thống với những cá nhân không từ chối tham gia mẫu khảo sát.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
36
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
18
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Quan sát bất thường và quan sát có ảnh hưởng lớn
Quan sát có giá trị cách xa hay bất thường là vấn đề đặc trưng của OLS vì phương
pháp này dựa trên bình phương phần dư.
Nếu quan sát bất thường do sai sót khi nhập liệu, ta chỉ cần bỏ đi các quan sát đó.
Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc quyết định giữ
lại hay bỏ đi những quan sát này không phải dễ dàng.
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
9.40
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
37
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp (tiếp tục)
Giá trị bất thường này không phải là lỗi
nhập liệu: Một trong các công ty trong dữ
liệu có quy mô lớn hơn các công ty khác
Kết quả ước lượng khi không có quan sát
bất thường thì có ý nghĩa hơn.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
38
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
19
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
• Tập tin rdchem.wf1
> # hoi quy OLS
> ols <- lm(rdintens ~ sales + profmarg, data = rdchem)
> summary(ols)
Call:
lm(formula = rdintens ~ sales + profmarg, data = rdchem)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.625e+00 5.855e-01
4.484 0.000106 ***
sales
5.338e-05 4.407e-05
1.211 0.235638
profmarg
4.462e-02 4.618e-02
0.966 0.341966
--Residual standard error: 1.862 on 29 degrees of freedom
Multiple R-squared: 0.07612, Adjusted R-squared: 0.0124
> nobs(ols)
[1] 32
39
39
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
> # hoi quy OLS bo gia tri bat thuong
> ols_bo <- lm(rdintens ~ sales + profmarg, data = rdchem,
sales != 39709)
> summary(ols_bo)
Call:
lm(formula = rdintens ~ sales + profmarg, data = rdchem,
subset = sales != 39709)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.2968508 0.5918045
3.881 0.000577 ***
sales
0.0001856 0.0000842
2.204 0.035883 *
profmarg
0.0478411 0.0444831
1.075 0.291336
--Residual standard error: 1.792 on 28 degrees of freedom
Multiple R-squared: 0.1728,
Adjusted R-squared: 0.1137
> nobs(ols_bo)
[1] 31
40
40
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
20
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Phân tích hồi quy bội:
Vấn đề dạng hàm và dữ liệu
9.6 Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD)
Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách cực tiểu hóa tổng trị tuyệt đối của các
phần dư (thay vì tổng bình phương phần dư, OLS)
9.45
Ít nhạy cảm hơn với các giá trị bất thường vì không bình phương phần dư.
Phương pháp độ lệch tuyệt đối nhỏ nhất ước lượng các tham số của trung vị có điều
kiện (thay vì trung bình có điều kiện như OLS)
Các ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt của hồi quy phân vị
(ước lượng các tham số của phân vị có điều kiện).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
41
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
•
•
•
•
Nhược điểm của LAD:
Không thể viết thành các công thức đối với các ước lượng LAD.
LAD cần nhiều tính toán hơn so với OLS.
Các suy diễn thống kê liên quan tới các ước lượng LAD chỉ đúng khi cỡ
mẫu lớn.
• LAD luôn luôn ước lượng không vững các tham số xuất hiện trong hàm
hồi quy trung bình có điều kiện E(y/x1,…xk).
• Để LAD ước lượng vững trung bình có điều kiện E(y/x1,…xk) thì cần
thêm 2 giả thiết (ngoài các giả thiết đã biết):
– Phân phối của u|x1,…, xk đối xứng qua giá trị 0.
– u độc lập với (x1,…, xk).
42
42
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
21
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
>
>
>
>
# hoi quy LAD
library(quantreg)
lad <- rq(rdintens ~ sales + profmarg, tau = 0.5, data = rdchem)
summary(lad)
Call: rq(formula = rdintens ~ sales + profmarg, tau = 0.5, data = rdchem)
tau: [1] 0.5
(Median)
Coefficients:
coefficients lower bd upper bd
(Intercept) 1.62309
1.34386 2.66171
sales
0.00002
-0.00011 0.00055
profmarg
0.11790
-0.00002 0.13495
43
43
PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Kiểm tra giả thiết MLR4:
Xem Chương 15, mục 15.5
44
44
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
22
Chương 9 - Nhập môn Kinh tế lượng *
Jeffrey M. Wooldridge
03.08.2021
Môøi gheù thaêm trang web:
45
 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/
45
https://sites.google.com/a/ueh.edu.vn/ph
amtricao/
23
Download