Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh Tế Lượng và Dữ liệu kinh tế Chương 1 Wooldridge: Giới thiệu Kinh tế lượng : Một phương pháp tiếp cận hiện đại, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế 1.1 Kinh tế lượng là gì? Kinh tế lượng = sử dụng các phương pháp thống kê để phân tích dữ liệu kinh tế Các nhà Kinh tế lượng thường phân tích dữ liệu phi thí nghiệm (quan sát) Các mục tiêu đặc trưng của phân tích kinh tế lượng Ước lượng các mối quan hệ giữa các biến kinh tế Kiểm định các lý thuyết và các giả thuyết kinh tế Dự báo các biến kinh tế Đánh giá và bổ sung chính sách của chính phủ và doanh nghiệp © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 1 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế 1.2 Các bước trong việc phân tích kinh tế lượng 1) Mô hình kinh tế (bước này thường bị bỏ qua) 2) Mô hình kinh tế lượng Các mô hình kinh tế Có thể là các mô hình vi mô hoặc vĩ mô Thường sử dụng hành vi tối ưu, mô hình cân bằng, … Thiết lập mối quan hệ giữa các biến kinh tế Ví dụ: các hàm cầu, phương trình giá, … © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 3 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.1 Mô hình kinh tế về tội phạm (Becker - 1968) Thiết lập phương trình đối với hoạt động phạm tội dựa trên nguyên tắc tối đa hoá lợi ích 1.1 Số giờ tiêu tốn cho hoạt động phạm tội “Số tiền nhận được“ của hoạt động phạm tội * Tuổi Tiền lương cho việc làm hợp pháp Thu nhập khác Khả năng bị bắt # Khả năng bị kết án nếu bị bắt # Mức án dự kiến nếu bị kết án # Dạng hàm của mối liên hệ không được nêu rõ Phương trình có thể thừa nhận mà không dựa trên mô hình kinh tế © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 2 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.1 (tt) Mô hình kinh tế lượng về hoạt động phạm tội Dạng hàm phải được định rõ Các biến có thể phải xấp xỉ bởi các đại lượng khác Đo lường mức độ hoạt động phạm tội Tiền lương cho việc làm hợp pháp Thu nhập khác Số lần bị bắt giữ trước đây # Các yếu tố tác động đến hoạt động phạm tội nhưng không quan sát được 1.3 Số lần bị kết án # Độ dài bản án trung bình nếu bị kết tội # Tuổi Ví dụ: Tính cách, số tiền thu được từ hoạt động phạm tội, nền tảng gia đình… © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.2 Mô hình kinh tế về đào tạo nghề và năng suất người lao động Việc đào tạo nghề tác động đến năng suất người lao động như thế nào? Lý thuyết kinh tế chính thức không thực sự cần thiết để xây dựng phương trình 1.2 Lương theo giờ Số năm đi học chính thức Số năm kinh nghiệm Số tuần tham gia vào đào tạo nghề Còn có nhiều yếu tố khác có thể liên quan đến phương trình trên nhưng đây là các yếu tố quan trọng nhất © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 3 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.2 (tt) Mô hình kinh tế lượng về đào tạo nghề và năng suất người lao động Các yếu tố tác động đến tiền lương nhưng không quan sát được 1.4 Tiền lương theo giờ Số năm đi học chính thức Số năm kinh nghiệm Số tuần tham gia vào đào tạo nghề Ví dụ: Năng lực bẩm sinh, chất lượng giáo dục, nền tảng gia đình … Phần lớn nội dung kinh tế lượng là xử lý vấn đề định dạng sai số u Các mô hình kinh tế lượng có thể được dùng để kiểm định giả thuyết Ví dụ, tham số β3 cho biết tác động của việc đào tạo lên tiền lương Tác động này lớn ra sao? Tác động này có khác 0 hay không? © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế 1.3 Phân tích kinh tế lượng đòi hỏi cần có dữ liệu Các loại dữ liệu kinh tế Dữ liệu chéo Dữ liệu chuỗi thời gian Dữ liệu chéo gộp Dữ liệu bảng/dữ liệu dọc (longitudinal data) Phương pháp kinh tế lượng phụ thuộc vào bản chất của dữ liệu được sử dụng Sử dụng các phương pháp không thích hợp có thể dẫn đến kết quả sai lầm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 4 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chéo Mẫu gồm các cá nhân, các hộ gia đình, các doanh nghiệp, các tỉnh thành, các quốc gia, hay các đơn vị quan tâm khác tại một thời điểm hoặc trong một khoảng thời gian đã cho Các quan sát chéo có thể ít nhiều độc lập với nhau Ví dụ, lấy mẫu ngẫu nhiên từ một tổng thể Đôi khi việc lấy mẫu ngẫu nhiên bị vi phạm, ví dụ: các đơn vị từ chối trả lời trong các cuộc khảo sát, hay nếu việc lấy mẫu được phân theo cụm Dữ liệu chéo thường gặp trong kinh tế vi mô ứng dụng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chéo về tiền lương và các biến về đặc điểm nhân khẩu Biến chỉ báo (1= đúng, 0= sai) Số quan sát Tiền lương theo giờ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 10 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 5 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chéo về tốc độ tăng trưởng và các đặc điểm của quốc gia Tỷ lệ tăng của GDP thực bình quân đầu người Phần trăm của chi tiêu chính phủ trên GDP Tỷ lệ người lớn hoàn thành trung học cơ sở © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chuỗi thời gian Các quan sát của một hay nhiều biến theo thời gian Ví dụ, giá chứng khoán, cung tiền, chỉ số giá tiêu dùng, tổng sản phẩm trong nước, doanh số bán xe hơi, … Các quan sát chuỗi thời gian thường gặp vấn đề tương quan chuỗi Thứ tự của các quan sát cũng truyền tải những thông tin quan trọng Tần suất dữ liệu: hàng ngày, hàng tuần, hàng tháng, hàng quý, hàng năm, … Đặc điểm tiêu biểu của chuỗi thời gian: xu thế và thời vụ Các ứng dụng thường gặp: Kinh tế vĩ mô và tài chính ứng dụng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 6 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu thời gian về tiền lương tối thiểu và các biến liên quan Tiền lương tối thiểu trung bình trong một năm cho trước Tỷ lệ bảo hộ trung bình (bởi luật lương tối thiểu) Tỷ lệ thất nghiệp Tổng sản phẩm quốc gia © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 13 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chéo gộp Hai hay nhiều bộ dữ liệu chéo được kết hợp thành một tập dữ liệu Các dữ liệu chéo được rút ra độc lập với nhau Dữ liệu chéo gộp thường được dùng để đánh giá các thay đổi chính sách Ví dụ: • Đánh giá tác động của thay đổi thuế tài sản lên giá nhà • Mẫu ngẫu nhiên về giá nhà trong năm 1993 • Mẫu ngẫu nhiên khác của giá nhà trong năm 1995 • So sánh trước/sau (1993: trước thay đổi, 1995: sau thay đổi) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 14 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 7 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu chéo gộp về giá nhà Thuế tài sản Số phòng ngủ Kích thước của ngôi nhà tính bằng feet vuông Số phòng tắm Trước thay đổi Sau thay đổi © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 15 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu bảng (hay dữ liệu dọc) Cùng các đơn vị chéo được quan sát theo thời gian Dữ liệu bảng có chiều thời gian và chiều dữ liệu chéo Dữ liệu bảng có thể được dùng để kiểm soát những yếu tố không quan sát được nhưng không đổi theo thời gian Dữ liệu bảng có thể được dùng để lập mô hình các trường hợp có biến trễ của biến phụ thuộc © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 16 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 8 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Ví dụ: • Thống kê tội phạm trong thành phố; mỗi thành phố được quan sát trong hai năm • Các đặc điểm không quan sát được nhưng không thay đổi theo thời gian của thành phố có thể được kiểm soát trong mô hình • Tác động của cảnh sát đến tỷ lệ tội phạm có thể có tính trễ theo thời gian © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 17 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế Dữ liệu bảng hai năm về thống kê tội phạm trong thành phố Mỗi thành phố có hai quan sát theo thời gian Số cảnh sát trong năm 1986 Số cảnh sát trong năm 1990 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 9 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế 1.4 Quan hệ nhân quả và khái niệm về “phân tích trong điều kiện các yếu tố khác không đổi“ Định nghĩa về tác động nhân quả của đến Cách thức biến thay đổi khi biến kiện các yếu tố khác không đổi“ thay đổi “trong điều Đa số các câu hỏi kinh tế là câu hỏi phân tích trong điều kiện các yếu tố khác không đổi Điều quan trọng là xác định tác động nhân quả nào mà người ta quan tâm Cần thiết phải mô tả cách thiết kế một thí nghiệm để có thể suy diễn được về quan hệ nhân quả mà câu hỏi nghiên cứu đặt ra © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.3: Tác động nhân quả của phân bón lên năng suất cây trồng “Sản lượng đậu nành sẽ tăng lên bao nhiêu nếu tăng lượng phân bón cho đất?“ Giả thiết ngầm: tất cả các yếu tố khác tác động đến năng suất cây trồng như chất lượng đất, lượng mưa, sự hiện diện của ký sinh trùng, vv ... được giữ cố định Thí nghiệm: Chọn các thửa đất có diện tích một mẫu; gán ngẫu nhiên số lượng phân bón khác nhau cho các thửa khác nhau; so sánh sản lượng Cách thí nghiệm này áp dụng được lượng phân bón sử dụng không liên quan đến các yếu tố khác tác động đến năng suất cây trồng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 10 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.4: Đo lường suất sinh lợi giáo dục “Nếu một người được chọn từ tổng thể và số năm đi học của người này tăng thêm một, tiền lương của họ sẽ tăng bao nhiêu?“ Giả thiết ngầm: tất cả các yếu tố khác tác động đến tiền lương như kinh nghiệm, nền tảng gia đình, sự thông minh, vv... được giữ cố định Thí nghiệm: Chọn một nhóm người; gán ngẫu nhiên số năm học khác nhau cho họ (không khả thi!); so sánh kết quả tiền lương Vấn đề khi không thể gán ngẫu nhiên: số năm đi học của một người có liên hệ với các yếu tố khác mà tác động tiền lương (Ví dụ: sự thông minh) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 21 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.5: Tác động của việc thực thi pháp luật đến mức tội phạm của thành phố “Nếu chọn ngẫu nhiên một thành phố và tăng thêm 10 cảnh sát cho thành phố này, tỉ lệ phạm tội của nó sẽ giảm khoảng bao nhiêu?“ Nói cách khác: “Nếu hai thành phố giống nhau ở mọi khía cạnh, ngoại trừ thành phố A có nhiều hơn 10 cảnh sát, tỉ lệ phạm tội của hai thành phố sẽ khác biệt nhau khoảng bao nhiêu?“ Cách thí nghiệm: Gán ngẫu nhiên số cảnh sát cho một số lớn các thành phố Thực tế, số cảnh sát sẽ được quyết định bởi tỷ lệ tội phạm (có sự đồng thời trong vấn đề xác định tỷ lệ tội phạm và số cảnh sát) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 22 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 11 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.6: Tác động của lương tối thiểu đến thất nghiệp “Số người thất nghiệp sẽ tăng bao nhiêu nếu tiền lương tối thiểu được tăng lên một lượng nào đó“? (các yếu tố khác không đổi) Cách thí nghiệm: Chính phủ chọn ngẫu nhiên lương tối thiểu mỗi năm và quan sát kết quả thất nghiệp Thí nghiệm sẽ có hiệu lực vì mức lương tối thiểu không liên hệ với các yếu tố khác tác động đến sự thất nghiệp Thực tế, mức lương tối thiểu sẽ phụ thuộc vào các yếu tố kinh tế và chính trị mà những yếu tố này cũng tác động đến thất nghiệp © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 23 Bản chất của Kinh tế lượng và Dữ liệu Kinh tế VD 1.7: Kiểm định các dự đoán của lý thuyết kinh tế Các lý thuyết kinh tế không phải lúc nào cũng được phát biểu dưới dạng tác động nhân quả Ví dụ, giả thuyết kỳ vọng nói rằng lãi suất dài hạn bằng kỳ vọng của lãi kép ngắn hạn Hàm ý là lãi suất của một trái phiếu kỳ hạn ba tháng nên bằng với lãi suất kỳ vọng trong ba tháng đầu tiên của một trái phiếu kỳ hạn sáu tháng; điều này có thể được kiểm định bằng cách sử dụng các phương pháp kinh tế lượng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 24 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 12 Chương 1 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03/08/2021 Môøi gheù thaêm trang web: 25 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 25 https://sites.google.com/a/ueh.edu.vn/ phamtricao/ 13 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Chương 2 Wooldridge: Kinh tế lượng nhập môn: Cách tiếp cận hiện đại, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Mô hình hồi quy đơn 2.1 Định nghĩa về mô hình hồi quy tuyến tính đơn Giải thích biến y theo biến x Hệ số chặn Hệ số góc 2.1 Biến phụ thuộc, Biến được giải thích, Biến được hồi quy,… Thành phần sai số ngẫu nhiên, Biến độc lập, Biến giải thích, Biến hồi quy,… nhiễu (đại diện các yếu tố không quan sát được) Nhiễu u luôn luôn tồn tại © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN β0: hệ số chặn (hệ số tự do, tung độ gốc) β1: hệ số góc (độ dốc) 3 3 Mô hình hồi quy đơn Cách diễn giải mô hình hồi quy tuyến tính đơn “Nghiên cứu sự thay đổi của tương ứng với sự thay đổi trong :“ 2.2 với điều kiện Biến phụ thuộc thay đổi bao nhiêu đơn vị nếu biến độc lập tăng lên một đơn vị? Việc giải thích chỉ đúng khi tất cả các yếu tố khác giữ nguyên, khi biến độc lập tăng một đơn vị 1 > 0: Biến phụ thuộc tăng bao nhiêu đơn vị nếu biến độc lập tăng lên một đơn vị? Mô hình hồi quy tuyến tính đơn hiếm khi áp dụng trong thực tế nhưng cần thiết thảo luận về mô hình này vì lý do sư phạm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn VD 2.1: Sản lượng đậu nành và phân bón 2.3 Lượng mưa, chất lượng đất, sự hiện diện của vật ký sinh, … Đo lường tác động của phân bón lên sản lượng, trong điều kiện các yếu tố khác không đổi VD 2.2: Một phương trình tiền lương dạng đơn giản 2.4 Kinh nghiệm tham gia lực lượng lao động, thâm niên chức vụ, đạo đức công việc, sự thông minh … Đo sự thay đổi trong tiền lương theo giờ khi thêm 1 năm đi học, giữ các yếu tố khác cố định © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5 Mô hình hồi quy đơn Khi nào có thể diễn giải dưới dạng quan hệ nhân quả? Một hàm bất kỳ của biến x không tương quan với u 2.5 & 2.6 Biến giải thích phải không hàm chứa thông tin về trung bình của các yếu tố không quan sát được Giả thiết 2.5 & 2.6 có thể đúng/sai trong thực tế VD 2.2 tt: phương trình tiền lương Ví dụ: Sự thông minh, tuổi … Giả thiết sự độc lập về trung bình có điều kiện ít khi được thoả mãn vì xét trung bình, những người có học vấn cao hơn cũng thường thông minh hơn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Hàm hồi quy tổng thể (PRF) Giả thiết sự độc lập của trung bình có điều kiện hàm ý rằng 2.8 Điều này có nghĩa là giá trị trung bình của biến phụ thuộc có thể được biểu diễn như một hàm tuyến tính của biến giải thích © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7 Mô hình hồi quy đơn Hàm hồi quy tổng thể PRF Đối với cá nhân có giá trị trung bình của y là , E ( y / x2 ) 0 1 x2 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn 2.2 Tìm các ước lượng bình phương nhỏ nhất (OLS) Để ước lượng mô hình hồi quy, ta cần dữ liệu Một mẫu ngẫu nhiên gồm quan sát Quan sát thứ nhất Quan sát thứ hai Quan sát thứ ba Giá trị của Giá trị của biến độc lập biến phụ thuộc ở quan sát thứ i ở quan sát thứ i Quan sát thứ n © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9 MÔ HÌNH HỒI QUY ĐƠN known already-> no need for numbers NOT measurement of y, cuz y known already 10 10 known already-> no uhat https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Tìm một đường hồi quy xuyên qua các điểm dữ liệu “càng phù hợp càng tốt“: 2.9 Ví dụ, điểm dữ liệu thứ i Đường hồi quy ước lượng (SRF) 2.20 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11 Mô hình hồi quy đơn “càng phù hợp càng tốt“ nghĩa là gì? yi^ càng gần yi , với mọi i Các phần dư hồi quy 2.21 Cực tiểu hóa tổng bình phương các phần dư hồi quy 2.22 Ước lượng bình phương nhỏ nhất thông thường (OLS) 2.17 & 2.19 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn VD 2.3 Tiền lương CEO và tỷ số lợi nhuận trên vốn chủ sở hữu Tiền lương (ngàn USD/năm) Lợi nhuận trên vốn chủ sở hữu (Return on equity) của doanh nghiệp mà CEO đang làm việc (%) Hồi quy ước lượng được 2.26 Hệ số chặn Diễn giải ý nghĩa nhân quả? Nếu lợi nhuận trên vốn chủ sở hữu tăng 1 (%) thì tiền lương tăng 18,501 ngàn USD/năm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 13 Mô hình hồi quy đơn Đường hồi quy tổng thể có duy nhất không? Đường hồi quy mẫu có duy nhất không? Đường hồi quy ước lượng SRF (phụ thuộc vào mẫu) (biết) tons Đường hồi quy tổng thể PRF (không biết) only one © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn VD 2.4 Tiền lương và học vấn Tiền lương (USD/giờ) Số năm đi học (năm) Hàm hồi quy ước lượng 2.27 Hệ số chặn Diễn giải ý nghĩa nhân quả? Nếu số năm đi học tăng 1 năm thì tiền lương tăng 0,54 USD/giờ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 15 Mô hình hồi quy đơn VD 2.5 Kết quả bỏ phiếu và chi phí tranh cử (giữa hai đảng) Tỷ lệ bỏ phiếu cho ứng cử viên A (%) Fitted regression Phần trăm chi phí tranh cử của ứng cử viên A (%) 2.28 Hệ số chặn Diễn giải ý nghĩa nhân quả? Nếu chi phí tranh cử của ứng cử viên A tăng thêm 1 % thì tỷ lệ bỏ phiếu cho ứng cử viên A tăng thêm 0,464 % tổng số phiếu bầu © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn 2.3 Các tính chất của OLS trên mẫu dữ liệu bất kỳ Các giá trị ước lượng và các phần dư Các giá trị ước lượng hay giá trị dự đoán Độ lệch so với đường hồi quy (= phần dư) Các tính chất đại số của hồi quy OLS 2.30 Tổng các phần dư bằng 0 2.31 Tương quan giữa phần dư và biến độc lập bằng 0 (Hiệp phương sai mẫu giữa x và u^ bằng 0) Trung bình mẫu của y và x nằm trên đường hồi quy mẫu SRF © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 17 Mô hình hồi quy đơn Ví dụ, tiền lương của CEO số 12 thấp hơn mức tiền lương dự đoán khi sử dụng thông tin về lợi nhuận trên vốn chủ sở hữu của doanh nghiệp nơi CEO này làm việc là 526,0231 USD © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Mức độ phù hợp của SRF so với mẫu khảo sát “Mức độ giải thích của biến độc lập cho biến phụ thuộc ra sao?“ ; Đo lường sự biến động 2.33 2 SSE ˆ12 ( xi x ) 2.34 Tổng bình phương toàn phần, cho biết toàn bộ biến thiên trong biến phụ thuộc Tổng bình phương hồi quy, cho biết phần biến thiên được giải thích bởi hàm hồi quy 2.35 Tổng bình phương phần dư, cho biết phần biến thiên không được giải thích bởi hàm hồi quy © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Mô hình hồi quy đơn Phân rã tổng mức độ biến thiên SST, SSE, SSR cố định hay biến đổi? Nếu biến đổi thì biến đổi theo yếu tố gì? 2.36 Toàn bộ phần biến thiên Phần biến thiên được giải thích Phần biến thiên không được giải thích Đo lường sự phù hợp (R2) (R-squared) 2.38 R2 cho biết tỷ lệ phần biến thiên của y được giải thích bằng hàm hồi quy Tính chất: 0 R2 1 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn VD 2.8 Tiền lương CEO và tỷ số lợi nhuận trên vốn chủ sở hữu 2.39 Hồi quy chỉ giải thích 1,32 % toàn bộ biến thiên trong tiền lương CEO VD 2.9 Kết quả bỏ phiếu và chi phí tranh cử (giữa 2 đảng) 2.40 Hồi quy giải thích 85,6 % toàn bộ biến thiên trong kết quả bầu cử Cảnh báo: R2 không nhất thiết hàm ý về mối quan hệ nhân quả trong hàm hồi quy VD: lượng mưa = β0 + β1 năng suất lúa + u © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 21 MÔ HÌNH HỒI QUY ĐƠN > > > > load("I:/Bai giang 2020 hk3/Chuong 02/wage2.RData") wage2<-data hq1 <-lm(wage~IQ, data=wage2) summary(hq1) Call: lm(formula = wage ~ IQ, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 116.9916 85.6415 1.366 0.172 IQ 8.3031 0.8364 9.927 <2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 384.8 on 933 degrees of freedom Multiple R-squared: 0.09554, Adjusted R-squared: 0.09457 F-statistic: 98.55 on 1 and 933 DF, p-value: < 2.2e-16 > hq2 <-lm(IQ~wage, data=wage2) > summary(hq2) Call: lm(formula = IQ ~ wage, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 90.260206 1.205063 74.901 <2e-16 *** wage 0.011506 0.001159 9.927 <2e-16 *** --Residual standard error: 14.32 on 933 degrees of freedom Multiple R-squared: 0.09554, Adjusted R-squared: 0.09457 F-statistic: 98.55 on 1 and 933 DF, p-value: < 2.2e-16 22 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN 2.4 Vấn đề về đơn vị tính của biến và dạng hàm Mối liên hệ giữa đơn vị đo cũ và mới y (tấn) y* (kg) 1 1000 = k0 x (trăm ngàn đ) x* (triệu đ) 1 0,1 = k1 y (tháng) y* (năm) 1 1/12 = k0 x (năm) x* (tháng) 1 12 = k1 y (tấn/tháng) y* (tấn/năm) 1 12 = k0 x (triệu đ/năm) x* (ngàn đ/tháng) 1 103/12 = k1 x (USD/kg) x* (ngàn đ/g) Tỷ giá 1 20/1000 = k1 1 USD = 20 ngàn đ y* = k0y ; x*= k1x 23 23 MÔ HÌNH HỒI QUY ĐƠN Chương 6, sách dịch Kinh tế lượng, trang 205-207 Công thức: Z (đơn vị cũ) Z* (đơn vị mới) 1 k Z* = k = k.1 = k.Z Áp dụng: 1) 1 pound = 16 ounce Bwght (ounce) Bwghtlbs (pound) Bwght (ounce) Bwghtlbs (pound) 1 1/16 Bwghtlbs = 1/16 = (1/16).1 = (1/16) Bwght 2) 1 packs = 20 cigs (1 gói có 20 điếu) cigs (điếu) packs (gói) cigs (điếu) packs (gói) 1 1/20 packs = 1/20 = (1/20).1 = (1/20) cigs 24 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN Hàm hồi quy mẫu theo đơn vị đo cũ ŷ ˆ 0 ˆ1 x Hàm hồi quy mẫu theo đơn vị đo mới ŷ * ˆ 0* ˆ1* x * k ˆ1* 0 ˆ1 Với ˆ 0* k 0 ˆ 0 ; k1 * k yˆ x* ˆ 0 ˆ1 Cm: ŷ ˆ 0 ˆ1 x yˆ * k 0 ˆ 0 0 ˆ1 x * k0 k1 k1 VD: yˆ 2 0, 0 0 7 x ; k0= 1000 ; k1= 0,1 1 0 00 yˆ * 10 0 0 * 2 0, 0 07 x * 2 00 0 70 x * 0,1 Câu hỏi: R2 có phụ thuộc vào đơn vị đo của biến x và y không? 25 25 MÔ HÌNH HỒI QUY ĐƠN Khái niệm biên tế Giả sử ta có Y = f(X). X là lượng thay đổi tuyệt đối của biến X Biên tế của Y theo X được tính bằng: MYX = Y/ X Hay: Y = MYX .X Ý nghĩa: Khi X tăng 1 đơn vị thì Y thay đổi MYX đơn vị. MYX > 0: X tăng 1 đơn vị thì Y tăng MYX đơn vị. Khi X rất nhỏ (X0), giá trị biên tế được tính x ấp xỉ là đạo hàm của Y theo X, tức là: MYX dY/dX = f’(X) 26 • Biên tế phụ thuộc đơn vị đo của biến 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN Khái niệm hệ số co giãn X/X là lượng thay đổi tương đối của biến X Hệ số co giãn của Y theo X được tính bằng: Y / Y E YX X / X Y X Hay: 100 E Y X (10 0 ) Y X Ý nghĩa: Khi X tăng 1% thì Y thay đổi EYX %. EYX > 0 : Khi X tăng 1% thì Y tăng EYX %. Khi X rất nhỏ (X0), ta có: dY / Y X EYX f '( X ) dX / X Y • Hệ số co giãn không phụ thuộc đơn vị đo của biến 27 27 MÔ HÌNH HỒI QUY ĐƠN Tên Dạng hàm gọi Tuyến y 0 1 x tínhTuyến tính Tuyến y 0 1 log( x) tính -log log( y ) 0 1 x Log -Tuyến tính log( y ) 0 1 log( x) Log -Log Biên tế Dẫn xuất từ biên tế β1 y ( 1 )(x) Hệ số co giãn β1 .(x/y) β1 (1/x) y ( 1 / 100)(100x / x) β1 .(1/y) β1 (y) 100y / y ( 1.100)( x) β1 .(x) β1 (y/x) 100y / y ( 1 )(100x / x ) β1 Ý nghĩa của hệ số góc Khi x tăng 1 % thì y thay đổi (β1 /100) đơn vị Khi x tăng 1 đơn vị thì y thay đổi (β1.100)% Khi x tăng 1 đơn vị thì y thay đổi β1 đơn vị Khi x tăng 1% thì y thay đổi β1 % Tuyến tính – Tuyến tính (tuyến tính) Tuyến tính – log (lin – log) ; linear Log – Tuyến tính (log – lin) Log – Log (tuyến tính log / log kép) 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN 29 29 MÔ HÌNH HỒI QUY ĐƠN Ví dụ: Y: chi tiêu (triệu đ) X : thu nhập (USD), 1 USD = 20 ngàn đ 1) yˆ 1,2 0,07 x Khi thu nhập tăng lên 1 USD thì chi tiêu tăng lên 0,07 triệu đ, với các yếu tố khác cố định 2) yˆ 0,9 2ln x Khi thu nhập tăng lên 1 % thì chi tiêu tăng lên 2/100 = 0,02 triệu đ, với các yếu tố khác cố định y 0,4 0,06 x 3) ln Khi thu nhập tăng lên 1 USD thì chi tiêu tăng lên 0,06*100 = 6 %, với các yếu tố khác cố định y 0,8 0,03ln x 4) ln Khi thu nhập tăng lên 1 % thì chi tiêu tăng lên 0,03 %, với các yếu tố khác cố định 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn 2.4 Vấn đề về đơn vị tính của biến và dạng hàm Kết hợp phi tuyến tính: Dạng semi-log VD 2.10 Hồi quy log tiền lương theo số năm đi học 2.42 logarit tự nhiên của tiền lương Điều này thay đổi sự giải thích của hệ số hồi quy: Tỷ lệ thay đổi của tiền lương … nếu số năm đi học tăng 1 năm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 31 Mô hình hồi quy đơn 2.43 Hồi quy ước lượng 2.44 Nếu số năm đi học tăng thêm 1 năm thì tiền lương tăng thêm 8,3 % (= suất sinh lợi giáo dục) Ví dụ: Mức tăng của lương là 8,3 % cho mỗi năm đi học tăng thêm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Dạng hàm phi tuyến: Dạng Log-log (tuyến tính log, log kép) VD 2.11 Lương CEO và doanh số bán hàng 2.45 logarit tự nhiên của tiền lương CEO logarit tự nhiên của doanh số bán của công ty nơi ông ấy/ cô ấy làm việc Điều này thay đổi sự giải thích của hệ số hồi quy: Tỷ lệ thay đổi tiền lương … nếu doanh số tăng 1 % Các thay đổi Logarit luôn là thay đổi phần trăm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 33 Mô hình hồi quy đơn VD 2.11 (tt): Tiền lương CEO và doanh số bán hàng 2.46 VD: Nếu doanh số tăng 1 % thì tiền lương CEO tăng 0,257 % Dạng log-log hàm ý về mô hình hệ số co giãn không đổi trong khi dạng semi-log cho phép giả định về mô hình với hệ số bán co giãn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn 2.5 Các giá trị kỳ vọng và phương sai của các ước lượng OLS Các hệ số hồi quy ước lượng được là các biến ngẫu nhiên vì chúng được tính từ một mẫu ngẫu nhiên Dữ liệu là ngẫu nhiên và phụ thuộc vào mẫu cụ thể được rút ra Câu hỏi là trung bình các tham số ước lượng bằng bao nhiêu và chúng biến thiên ra sao trong mẫu lặp lại © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 35 Mô hình hồi quy đơn Các giả thiết (thông thường) cho mô hình hồi quy tuyến tính Giả thiết SLR.1 (Sự tuyến tính theo tham số ) 2.47 Trong tổng thể, mối quan hệ giữa y và x là tuyến tính theo tham số Giả thiết SLR.2 (Mẫu ngẫu nhiên) Dữ liệu là một mẫu ngẫu nhiên rút ra từ tổng thể 2.48 Mỗi điểm dữ liệu vì thế tuân theo phương trình tổng thể © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN Hiểu chữ tuyến tính như thế nào cho đúng? Trong các phương trình sau, phương trình nào được gọi là pt tuyến tính, tại sao? 1) x y 2 3 1 2) x 2 y 3) x 3 y 0 4) 2 x 3 y 5 5) x y 3 6) e x y 7 7) x ln y 2 8) tgx y 6 9) x / y 4 y 5 10) 2 xy 3 x 7 37 37 MÔ HÌNH HỒI QUY ĐƠN Trong các mô hình hồi quy sau, mô hình nào là hồi quy tuyến tính? 1 U X 1) Y 1 2 2) ln Y ln X U 3) Y X X 2 U 1 2 3 1 4) Y X U 5) Y 1 U X 1 e 1 2 38 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Thảo luận về mẫu ngẫu nhiên: Tiền lương và học vấn Tổng thể, ví dụ bao gồm tất cả người lao động của nước A Trong tổng thể, mối quan hệ tuyến tính giữa tiền lương (hay log tiền lương) và số năm đi học được thỏa mãn Rút ngẫu nhiên một người lao động từ tổng thể Tiền lương và số năm đi học của lao động trên là ngẫu nhiên vì người ta không biết trước người lao động nào được rút ra Trả người lao động lại vào tổng thể và lặp lại việc rút ngẫu nhiên lần Tiền lương và số năm đi học của các lao động đã rút ra sẽ được sử dụng để ước lượng mối quan hệ tuyến tính giữa tiền lương và học vấn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 39 Mô hình hồi quy đơn Các giá trị ứng với lao động thứ i đã rút ra Chênh lệch so với mối quan hệ tổng thể ở công nhân thứ i: © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Các giả thiết (thông thường) cho mô hình hồi quy tuyến tính (tt) Giả thiết SLR.3 (Biến thiên trong mẫu của biến độc lập) Giá trị của biến độc lập không giống nhau hoàn toàn (nếu không sẽ không thể nghiên cứu các giá trị khác nhau của biến độc lập dẫn đến các giá trị khác nhau của biến phụ thuộc như thế nào) Giả thiết SLR.4 (Kỳ vọng có điều kiện bằng 0) Giá trị của biến độc lập không được chứa thông tin về giá trị trung bình của các yếu tố không quan sát được © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 41 Mô hình hồi quy đơn Định lý 2.1 (Tính không chệch của OLS) 2.53 Giải thích về tính không chệch Các hệ số ước lượng được có thể nhỏ hơn hay lớn hơn hệ số hồi quy tổng thể (hệ số hồi quy đúng), phụ thuộc vào mẫu ngẫu nhiên được chọn Tuy nhiên, xét trung bình, chúng sẽ bằng giá trị của hệ số hồi quy đúng thể hiện mối quan hệ giữa y và x trong tổng thể “Xét trung bình“ có nghĩa nếu việc lấy mẫu được lặp lại, nghĩa là lấy mẫu ngẫu nhiên và thực hiện ước lượng lặp lại nhiều lần Với một mẫu cho trước, các giá trị ước lượng có thể khác đáng kể với các giá trị đúng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Phương sai của hệ số ước lượng bằng OLS Phụ thuộc vào mẫu, các giá trị ước lượng sẽ gần hơn hay xa hơn so với các giá trị đúng của tổng thể Chúng ta có thể kỳ vọng các giá trị ước lượng, xét trung bình, cách bao xa các giá trị đúng của tổng thể, (= độ biến thiên của mẫu)? Độ biến thiên của mẫu được đo bằng phương sai của các ước lượng Giả thiết SLR.5 (Phương sai thuần nhất) Giá trị của biến giải thích phải không chứa thông tin về độ biến thiên của các yếu tố không quan sát được (nhiễu) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 43 Mô hình hồi quy đơn Đồ thị minh họa về phương sai thuần nhất (không đổi) Độ biến thiên của các tác động không quan sát được không phụ thuộc vào giá trị của biến độc lập © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn VD 2.13: Phương sai không thuần nhất (thay đổi): Tiền lương và học vấn Phương sai của các yếu tố không quan sát được tác động đến tiền lương tăng cùng với mức học vấn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 45 Mô hình hồi quy đơn Định lý 2.2 (Phương sai của các hệ số ước lượng bằng OLS ) Dưới các giả thiết SLR.1 – SLR.5: 2.57 2.58 Kết luận: Biến thiên mẫu của các hệ số hồi quy ước lượng được sẽ càng lớn khi biến thiên của các yếu tố không quan sát được càng lớn Biến thiên mẫu của các hệ số hồi quy ước lượng được sẽ càng nhỏ khi biến thiên của biến độc lập càng lớn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Mô hình hồi quy đơn Ước lượng phương sai của sai số Giả định u và x độc lập E(u/x) = E(u), Var(u/x) = Var(u) Phương sai của u không phụ thuộc vào x, nghĩa là bằng với phương sai không điều kiện Người ta có thể ước lượng phương sai của sai số bằng cách tính phương sai của các phần dư trong mẫu; không may là ước lượng này bị chệch 2.61 Một ước lượng không chệch của phương sai sai số có thể tính được bằng cách lấy số quan sát trừ đi số hệ số hồi quy ˆ : S .E. of regression (Sai số chuẩn hồi quy) 2.62 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 47 Mô hình hồi quy đơn Định lý 2.3 (Tính không chệch của phương sai sai số) 2.62 sd ( ˆ1 ) Var ( ˆ1 ) 2 / SSTx Tính toán sai số chuẩn cho các hệ số hồi quy Thay cho không biết Độ lệch chuẩn tính toán được (estimated standard deviation) của các hệ số hồi quy được gọi là “các sai số chuẩn“ (standard errors). Chúng giúp đo lường độ “chính xác“ (precise) của các hệ số hồi quy ước lượng được. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN 2.6 HỒI QUY QUA GỐC TỌA ĐỘ Hàm hồi quy mẫu của hồi quy qua gốc tọa độ: 2.63 Công thức tính hệ số góc: 2.66 49 49 MÔ HÌNH HỒI QUY ĐƠN Hệ số xác định R 2 tính theo cách thông thường có thể âm R2 = 2.68 50 50 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN Do đó, hệ số xác định R 2 tính theo công thức sau R2 = 2.67 Lưu ý: Không thể so sánh R2 theo công thức (2.38) với R2 theo công thức (2.68) vì hai mô hình khác số tham số. Dùng R2 hiệu chỉnh (xem Chương 6) Không thể so sánh R2 theo công thức (2.38) với R2 theo công thức 51 (2.67) vì hai công thức tính khác nhau. 51 MÔ HÌNH HỒI QUY ĐƠN Call: lm(formula = wage ~ brthord) Không qua gốc tọa độ Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1054.736 23.876 44.176 < 2e-16 *** brthord -36.822 8.589 -4.287 2.02e-05 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 399.8 on 850 degrees of freedom (83 observations deleted due to missingness) Multiple R-squared: 0.02117, Adjusted R-squared: 0.02001 Call: lm(formula = wage ~ 0 + brthord) Qua gốc tọa độ Coefficients: Estimate Std. Error t value Pr(>|t|) brthord 273.960 8.939 30.65 <2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 725.4 on 851 degrees of freedom (83 observations deleted due to missingness) Multiple R-squared: 0.5246, Adjusted R-squared: 0.5241 ( R2 = -2.2262 và R2 hiệu chỉnh = -2.2262 ) 52 52 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 26 Chương 2 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MÔ HÌNH HỒI QUY ĐƠN Tập tin wage2.wf1 Không qua gốc tọa độ Call: lm(formula = wage ~ age) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 283.483 139.782 2.028 0.0428 * age 20.389 4.207 4.846 1.47e-06 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 399.6 on 933 degrees of freedom Multiple R-squared: 0.02456, Adjusted R-squared: 0.02351 Qua gốc tọa độ Call: lm(formula = wage ~ 0 + age) Coefficients: Estimate Std. Error t value Pr(>|t|) age 28.883 0.394 73.32 <2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 400.2 on 934 degrees of freedom Multiple R-squared: 0.852, Adjusted R-squared: 0.8518 ( R2 = 0.020255 và R2 hiệu chỉnh = 0.020255 ) 53 53 Môøi gheù thaêm trang web: 54 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 54 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 27 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Chương 3 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG • Hồi quy đơn (hồi quy 2 biến) • y = β0+β1x1+u • β0: hệ số chặn • β1: hệ số góc • Hồi quy bội 3 biến • y = β0+β1x1+β2x2+u 3.3 • Hồi quy bội 4 biến • y = β0+β1x1+β2x2+β3x3+u • β0: hệ số chặn • β1, β2, β3: hệ số góc • β0, β1, β2, β3: hệ số hồi quy • y: biến phụ thuộc • x1, x2, x3: biến độc lập • u: sai số ngẫu nhiên, nhiễu 2 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng 3.1 Sự cần thiết nghiên cứu hồi quy bội Định nghĩa mô hình hồi quy bội (k+1 biến) “Giải thích biến theo các biến Hệ số chặn “ Các hệ số góc 3.6 Biến phụ thuộc Biến được giải thích, Biến phản ứng,… Sai số ngẫu nhiên, Nhiễu, Phần chưa quan sát được,… Biến độc lập, Biến giải thích, Biến kiểm soát,… 3.8 Một hàm bất kỳ của biến xj không tương quan với u, với mọi biến xj © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 3 Phân tích hồi quy bội: Vấn đề ước lượng Sự cần thiết của hồi quy bội Đưa thêm nhiều biến độc lập vào mô hình Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi, trừ các yếu tố trong Cho phép sử dụng dạng hàm đa dạng hơn Ví dụ 3.2: Phương trình tiền lương Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi Tất cả các yếu tố khác 3.1 Tiền lương (USD/giờ) Số năm đi học Số năm kinh nghiệm làm việc © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên 3.2 Các yếu tố khác Điểm trung bình của bài thi chuẩn hóa Chi phí trên mỗi sinh viên của trường Thu nhập trung bình của gia đình các sinh viên trong trường Chi phí trên mỗi sinh viên có thể tương quan với thu nhập trung bình của các gia đình do vấn đề tài chính Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung bình bị chệch. Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ: Thu nhập và chi tiêu của hộ gia đình 3.4 Các yếu tố khác Chi tiêu của hộ Thu nhập của hộ Thu nhập của hộ bình phương Mô hình có hai biến độc lập: thu nhập và thu nhập bình phương Chi tiêu được giải thích bằng hàm bậc hai của thu nhập Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy: Mức chi tiêu tăng thêm bao nhiêu đơn vị nếu thu nhập tăng thêm một đơn vị? Phụ thuộc vào mức chi tiêu cụ thể đang xét © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO 3.7 Log của thu nhập CEO Log của doanh thu Hàm bậc hai của số năm thâm niên làm CEO Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh thu của doanh nghiệp là hằng số. Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên làm CEO có dạng hàm bậc hai Ý nghĩa của sự “tuyến tính“ trong hồi quy Mô hình phải tuyến tính theo tham số (không phải theo biến số) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7 Phân tích hồi quy bội: Vấn đề ước lượng 3.2 Cách thực hiện và diễn giải của phương pháp OLS Ước lượng OLS của mô hình hồi quy bội: Mẫu ngẫu nhiên Phần dư 3.11’ Cực tiểu tổng bình phương phần dư 3.12’ Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Diễn giải ý nghĩa của mô hình hồi quy bội Cho biết lượng thay đổi của biến phụ thuộc khi biến độc lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc lập khác và sai số không đổi Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến độc lập khác không đổi, ngay cả khi trong thực tế có thể các biến độc lập này là có tương quan với nhau. Cách diễn giải này được gọi là “Các yếu tố khác không đổi“ Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ không thay đổi khi biến độc lập thay đổi. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ 3.1: Các yếu tố tác động đến điểm GPA 3.15 Điểm GPA trung bình của sinh viên ở đại học Điểm GPA trung bình khi học phổ thông trung học Kết quả bài kiểm tra thành tích Diễn giải Trong điều kiện ACT không đổi, nếu GPA trung học tăng thêm 1 điểm thì GPA đại học tăng thêm 0,453 điểm Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng sinh viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B Trong điều kiện điểm hsGPA như nhau, nếu ACT tăng thêm 10 điểm thì colGAP tăng thêm 0,0094*10 = 0,094 điểm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG • SAT (Scholastic Assessment Test) là một trong những bài thi chuẩn hóa cho việc đăng ký vào nhiều trường đại học tại Hoa Kỳ. SAT được quản lý bởi tổ chức phi lợi nhuận College Board và được các trường đại học dùng để kiểm tra trình độ tiếng Anh, đánh giá kiến thức tự nhiên, xã hội và kỹ năng phân tích, giải quyết vấn đề của học sinh. Do vậy, những câu hỏi trong bài thi thường khá “bẫy”, yêu cầu học sinh cần phát triển khả năng suy luận của mình. Tất cả các trường cao đẳng và đại học của Mỹ đều chấp nhận điểm thi SAT vì đó sẽ là thước đo dự đoán sự thành công trong việc học tập của học sinh khi lên đại học. • Từ tháng 3 năm 2016, bài thi SAT đã được thay đổi theo format mới và được gọi là New SAT. • ACT (American College Testing), là một kỳ thi đầu vào được chuẩn hóa dành cho các học sinh trung học muốn nộp đơn vào các trường cao đẳng và đại học Hoa Kỳ. Song hành cùng với SAT, bài thi ACT bao gồm các môn English (tiếng Anh), Mathematics (toán), Reading (đọc), Science Reasoning (khoa học luận), và Writing (viết). • Giống như SAT, bài thi ACT được bài kiểm tra chuẩn hoá trên giấy được quản lí cấp quốc gia nhằm giúp các trường đại học đánh giá ứng viên. Tất cả các trường đại học hiện nay đều chấp nhận cả 2 điểm SAT và ACT. Điều này có nghĩa là bạn sẽ có cơ hội quyết định sẽ tập trung vào bài thi nào hơn. Và trong nhiều trường hợp, nhiều học sinh chuẩn bị để tham gia cả 2. • (Theo Internet) 11 11 Phân tích hồi quy bội: Vấn đề ước lượng Cách diễn giải tác động riêng phần trong hồi quy bội: Hệ số hồi quy của biến độc lập trong mô hình hồi quy bội có thể được ước lượng và có thể tính toán được bằng hai bước sau: 1) Hồi quy biến độc lập này theo tất cả các biến độc lập còn lại 2) Hồi quy theo phần dư của hàm hồi quy ở bước 1 Tại sao cách này có thể thực hiện được? Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến độc lập và phần còn lại này không tương quan với các biến độc lập khác trong mô hình Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt của riêng biến độc lập đó đến biến phụ thuộc © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG > load("I:/Bai giang 2020 hk3/Chuong 03/gpa1.RData") > gpa1<-data > hq<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1) > summary(hq) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age) Residuals: Min 1Q Median -0.86321 -0.23315 -0.03006 3Q 0.24839 Max 0.80606 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.90206 0.65037 1.387 0.16771 hsGPA 0.43379 0.09709 4.468 1.65e-05 *** ACT 0.01449 0.01058 1.370 0.17309 skipped -0.08066 0.02617 -3.082 0.00249 ** age 0.01990 0.02284 0.872 0.38498 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.3298 on 136 degrees of freedom Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 13 13 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG hsGPA = β0 + β1 ACT + β2 skipped + β3 age + v > hqp<-lm(hsGPA~ACT+skipped+age, data=gpa1) > summary(hqp) Call: lm(formula = hsGPA ~ ACT + skipped + age, data = gpa1) Residuals: Min 1Q -0.9925 -0.1561 Median 0.0029 3Q 0.1899 Max 0.6300 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.793037 0.471721 8.041 3.74e-13 *** ACT 0.038582 0.008705 4.432 1.90e-05 *** skipped -0.043514 0.022730 -1.914 0.05765 . age -0.061095 0.019407 -3.148 0.00202 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.2902 on 137 degrees of freedom Multiple R-squared: 0.1948, Adjusted R-squared: 0.1772 F-statistic: 11.05 on 3 and 137 DF, p-value: 1.522e-06 > vmu<-resid(hqp) # hoac vmu <-hqp$residuals 14 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG > hqp1<- lm(colGPA ~ vmu, data=gpa1) > summary(hqp1) Call: lm(formula = colGPA ~ vmu, data = gpa1) Residuals: Min 1Q Median -0.83002 -0.28206 -0.03992 3Q 0.26128 Max 0.86387 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.05674 0.02965 103.079 < 2e-16 *** vmu 0.43379 0.10367 4.184 5.04e-05 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.3521 on 139 degrees of freedom Multiple R-squared: 0.1119, Adjusted R-squared: 0.1055 F-statistic: 17.51 on 1 and 139 DF, p-value: 5.041e-05 15 15 Phân tích hồi quy bội: Vấn đề ước lượng Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ Giá trị ước lượng (Fitted values) và phần dư 3.21 3.20 Giá trị ước lượng/Giá trị dự đoán Phần dư Tính chất đại số của hồi quy OLS Tổng phần dư bằng 0 Tương quan giữa biến độc lập xj và phần dư bằng 0 (Hiệp phương sai mẫu giữa xj và u^ bằng 0) Trung bình mẫu của biến phụ thuộc và các biến độc lập nằm trên đường hồi quy © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Mức độ phù hợp của hàm SRF so với mẫu khảo sát Sự phân rã của tổng mức biến động SST SSE SSR 3.27 Lưu ý rằng R2 luôn tăng khi thêm biến độc lập vào hàm hồi quy R bình phương (R2) 3.28 R2 bằng bình phương của hệ số tương quan giữa giá trị thực tế và giá trị ước lượng của biến phụ thuộc Các biểu diễn khác của R bình phương = {r(y,y^)}2 3.29 Tính chất: 0 R2 1 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 17 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ Số lần bị bắt giữ trong năm 1986 Tỷ lệ số lần bắt giữ có dẫn đến bị buộc tội trước đó (không phải %) Số tháng bị giam trong năm 1986 Số quý làm việc trong năm 1986 Diễn giải: Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người) Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó giảm 0,034*12 = 0,408 lần Số quý làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt) Nếu thêm một biến độc lập khác avgsen vào mô hình: Mức phạt trung bình của các lần phạm tội trước R2 chỉ tăng nhẹ Diễn giải: Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?) Vai trò của biến độc lập mới thêm vào khá hạn chế khi R2 tăng rất ít Lưu ý chung về R2 Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Phân tích hồi quy bội: Vấn đề ước lượng 3.3 Giá trị kỳ vọng của ước lượng OLS Các giả thiết của mô hình hồi quy bội: Giả thiết MLR.1 (Tuyến tính theo tham số) 3.31 Trong tổng thể, mối liên hệ giữa biến phụ thuộc y và các biến độc lập là tuyến tính theo tham số Giả thiết MLR.2 (Mẫu ngẫu nhiên) Mẫu dữ liệu được chọn ngẫu nhiên từ tổng thể 3.32 Vì vậy, mỗi quan sát đều tuân theo hàm hồi quy tổng thể © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Khaùi nieäm ña coäng tuyeán (cách tiếp cận hình học) Xeùt moâ hình hoài quy boäi: y = β0 + β1x1 + β2x2 + u y x1 y x2 x1 Khoâng coù ÑCT y x1 ÑCT thaáp y x2 ÑCT vöøa x1 x2 x2 x2 x1 ÑCT cao ÑCT hoaøn haûo 21 21 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Cách tiếp cận đại số của vấn đề đa cộng tuyến: Nếu tồn tại các số thực 1, …, k không đồng thời bằng 0 và “số thực” c sao cho: 1x1 + 2x2 + … + kxk = c thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến tính chính xác. Nếu tồn tại các số thực 1, ..., k không đồng thời bằng 0 và “số thực” c sao cho: 1x1 + 2x2 + … + kxk + v = c với v là sai số ngẫu nhiên thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến tính không chính xác. 22 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Xét mô hình hồi quy bội với hai biến độc lập x1, x2: y = β0+β1x1+ β2x2+u * Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i 0 (i= 1, 2) và c sao cho: 1x1+2x2 = c Giả sử 2 ≠ 0 c x 1 x x c' 2 1 2 1 2 * Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i 0 (i= 1, 2) và c sao cho: 1x1+2x2+v = c (v là sai số ngẫu nhiên) Giả sử 2 ≠ 0 x 1 x 1 v c x v ' c ' 2 1 2 1 2 2 23 23 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Xét mô hình hồi quy bội với hai biến độc lập x1, x2: y = β0+β1x1+ β2x2+u Xét hệ số tương quan r = r(x1,x2), ta có: 0 |r| 1 • • r = 0: x1, x2 không có đa cộng tuyến r ≠ 0: x1, x2 có đa cộng tuyến – |r| càng gần 1 thì mức độ ĐCT càng cao – |r| càng gần 0 thì mức độ ĐCT càng thấp – |r|=1: ĐCT hoàn hảo Lưu ý: Chỉ đúng cho mô hình có 2 biến độc lập. 24 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Ví dụ: Ta có dữ liệu giả định của các biến sau: x1 10 15 18 24 30 x2 50 75 90 120 150 x2 * 52 75 97 129 152 v 2 0 7 9 2 x1, x2 có đa cộng tuyến hoàn hảo? x1, x2* có đa cộng tuyến hoàn hảo? 25 25 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Ví dụ (tt): Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo. Ta thấy hệ số tương quan r(x1,x2) = 1. Ta có x2*= 5x1+v, nên x1 và x2* có đa cộng tuyến không hoàn hảo. Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2* có đa cộng tuyến cao, gần hoàn hảo. 26 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo) Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập Lưu ý về giả thiết MLR.3 Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có thể xảy ra Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra khỏi hàm hồi quy Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 27 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là như nhau Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập Có mối liên hệ tuyến tính chính xác giữa shareA và shareB và hệ số chặn: shareA + shareB = 1 (hệ số chặn của mô hình) Cách 1: shareA hoặc shareB sẽ bị loại ra khỏi mô hình Cách 2: không khuyến khích làm voteA = 1shareA + 2shareB + u © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.4 (Trung bình có điều kiện bằng 0) Một hàm bất kỳ của biến xj không tương quan với u, với mọi biến xj 3.36 Giá trị của các biến độc lập không chứa bất kỳ thông tin nào về giá trị trung bình của các yếu tố không quan sát được Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0 có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào sai số ngẫu nhiên hơn so với hồi quy đơn. Ví dụ: Điểm kiểm tra trung bình Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 29 Phân tích hồi quy bội: Vấn đề ước lượng Thảo luận về giả thiết trung bình có điều kiện bằng 0 Các biến độc lập có tương quan với sai số được gọi là biến nội sinh; Sự nội sinh là trường hợp vi phạm giả thiết MLR.4 Các biến độc lập không tương quan với sai số được gọi là biến ngoại sinh; MLR.4 được thỏa mãn nếu tất cả các biến độc lập là ngoại sinh Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả của hồi quy bội, và cho tính không chệch của ước lượng OLS Định lý 3.1 (Tính không chệch của OLS) 3.37 Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Việc thêm biến không liên quan vào mô hình hồi quy x3 không có tác động riêng phần tới y trong tổng thể 3.38 = 0 trong tổng thể Không có vấn đề gì vì Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu. Bỏ sót biến có liên quan: trường hợp đơn giản 3.40 Mô hình đúng (chứa x1 và x2) Mô hình ước lượng (x2 bị bỏ sót) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 31 Phân tích hồi quy bội: Vấn đề ước lượng Chệch do bỏ sót biến Đây là hệ số chặn ước lượng được khi y chỉ hồi quy theo x1 Giả sử x1 và x2 có tương quan và mối quan hệ giữa chúng là tuyến tính Đây là hệ số góc của x1 khi y chỉ hồi quy theo x1 Phần sai số Kết luận: Tất cả các hệ số ước lượng được đều bị chệch © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương 3.42 Cả hai đều có thể mang dấu dương Suất sinh lợi giáo dục sẽ bị ước lượng cao hơn thực tế do .t . . Kết quả hồi quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng cao thì nhìn chung năng lực cũng càng cao. Khi nào bỏ sót biến không gây ra sự chệch cho ước lượng? Khi biến bỏ sót không liên quan hoặc không tương quan với các biến độc lập trong mô hình. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 33 Phân tích hồi quy bội: Vấn đề ước lượng Tính chệch do bỏ sót biến: trường hợp tổng quát hơn Mô hình đúng (gồm x1, x2 và x3) 3.49 Mô hình ước lượng (x3 bị bỏ sót) Không thể xác định rõ được chiều hướng của phần chệch Phân tích như trường hợp đơn giản nếu một biến độc lập không tương quan với các biến độc lập khác Ví dụ: Bỏ sót biến ability trong phương trình hồi quy tiền lương Nếu exper gần như không tương quan với educ và abil, thì chiều hướng của phần chệch do bỏ sót biến có thể được phân tích như trong trường hợp đơn giản chỉ có hai biến đã xét trước đó. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng 3.4 Phương sai của ước lượng OLS Các giả thiết của mô hình hồi quy bội: (tt) Giả thiết MLR.5 (Phương sai thuần nhất) Giá trị của các biến độc lập không hàm chứa bất kỳ thông tin nào về phương sai của các yếu tố chưa quan sát được. Ví dụ: phương trình tiền lương Giả thiết này có thể sẽ khó kiểm chứng trong nhiều trường hợp Tất cả các biến độc lập được ký hiệu chung dưới dạng vector Cách ký hiệu ngắn gọn với © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 35 Phân tích hồi quy bội: Vấn đề ước lượng Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS) Dưới các giả thiết từ MLR.1 đến MLR.5: Phương sai của sai số Tổng biến động trong mẫu của biến độc lập xj: R2 có được khi hồi quy biến độc lập xj theo tất cả các biến độc lập khác (hồi quy có hệ số chặn) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến): 1) Phương sai của sai số Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều “nhiễu“ hơn trong phương trình Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác Phương sai sai số không giảm khi kích thước mẫu tăng lên 2) Tổng biến động trong mẫu của biến giải thích Tổng biến động trong mẫu của biến độc lập càng nhiều thì ước lượng thu được càng chính xác (more precise) Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 37 Phân tích hồi quy bội: Vấn đề ước lượng 3) Mối quan hệ tuyến tính giữa các biến độc lập Hồi quy theo tất cả các biến độc lập khác (có hệ số chặn) R2 của hồi quy này càng cao thì xj càng được giải thích nhiều hơn bởi các biến độc lập khác Phương sai mẫu của sẽ càng lớn khi càng được giải thích nhiều bởi các biến độc lập khác Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi là vấn đề đa cộng tuyến (nghĩa là . với một vài nào đó) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Một ví dụ về đa cộng tuyến Điểm trung bình bài thi chuẩn hóa của trường Chi phí cho giáo viên Các chi phí cho nguyên vật liệu dạy học Các chi phí khác Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ chi tiêu lớn cho tất cả các khoản chi. Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise), chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể. Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 39 Phân tích hồi quy bội: Vấn đề ước lượng Thảo luận về vấn đề đa cộng tuyến Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào thành một yếu tố vì không thể tách biệt tác động của từng khoản chi Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến) Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng của các biến độc lập khác có thể không bị ảnh hưởng. Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3 Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương sai“ Kinh nghiệm: nhân tử phóng đại phương sai không nên lớn hơn 10 VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG > hq<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1) > summary(hq) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1) Residuals: Min 1Q Median -0.86321 -0.23315 -0.03006 3Q 0.24839 Max 0.80606 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.90206 0.65037 1.387 0.16771 hsGPA 0.43379 0.09709 4.468 1.65e-05 *** ACT 0.01449 0.01058 1.370 0.17309 skipped -0.08066 0.02617 -3.082 0.00249 ** age 0.01990 0.02284 0.872 0.38498 --Residual standard error: 0.3298 on 136 degrees of freedom Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 > library(car) > vif(hq) hsGPA ACT skipped age 1.242002 1.165185 1.045578 1.084732 VIF < 10 : các biến độc lập có đa cộng tuyến thấp 41 41 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG • • • • • • Cách phát hiện đa cộng tuyến: Dấu của hệ số hồi quy bị sai Hệ số xác định R2 cao nhưng tỷ số |t| thấp Hệ số tương quan cặp giữa các biến độc lập cao Kiểm định sử dụng hồi quy phụ Nhân tử phóng đại phương sai VIF • Cách khắc phục đa cộng tuyến: • • • • • • Sử dụng thông tin tiên nghiệm Thu thập thêm số liệu hoặc lấy thêm mẫu mới Kết hợp số liệu chéo và số liệu chuỗi thời gian Bỏ bớt biến độc lập Dùng sai phân cấp 1 Thay đổi dạng hàm của biến 42 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Phương sai trong mô hình bị định dạng sai Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính hiệu quả của ước lượng Mô hình đúng của tổng thể 3.52 3.53 Mô hình ước lượng 1 p Mô hình ước lượng 2 Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được bù đắp bằng phương sai nhỏ của ước lượng thu được © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 43 Phân tích hồi quy bội: Vấn đề ước lượng Phương sai trong mô hình bị định dạng sai (tt.) 3.54 Xét điều kiện theo x1 và x2 , phương sai trong mô hình 2 luôn nhỏ hơn trong mô hình 1 3.55 Kết luận: Không thêm biến không liên quan vào mô hình Trường hợp 1: Trường hợp 2: Sự đánh đổi giữa tính chệch và tính hiệu quả Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG 45 45 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Tính chất Biến Ước lượng không chệch (Phụ nữ có sắc đẹp) Phương sai nhỏ (Phụ nữ có tính tình tốt) ? ? ? ? Thừa (dư) biến không có liên quan Thiếu (sót) biến có liên quan (có tương quan với các biến độc lập khác) Chọn: cái nết hay cái đẹp ???!!! Ngày xưa: Cái nết … cái đẹp Ngày nay: Cái đẹp … cái nết Giống loài “đẹp người & đẹp nết” thì đã tc! 46 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng Ước lượng phương sai của sai số 3.56 Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số. Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài toán tìm cực tiểu. df = n-(k+1) = số quan sát – số tham số cần ước lượng >0 3.57 Định lý 3.3 (Ước lượng không chệch của phương sai sai số) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 47 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG > # Truong hop: n=4 < so tham so=5 > data1 <- gpa1[c(1:4),] > dim(data1) [1] 4 29 > hq1<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=data1) > summary(hq1) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = data1) Residuals: ALL 4 residuals are 0: no residual degrees of freedom! Coefficients: (1 not defined because of singularities) Estimate Std. Error t value Pr(>|t|) (Intercept) 4.46667 NA NA NA hsGPA -2.33333 NA NA NA ACT 0.26667 NA NA NA skipped -0.03333 NA NA NA age NA NA NA NA Residual standard error: NaN on 0 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: NaN F-statistic: NaN on 3 and 0 DF, p-value: NA NA : Not Available (Không có sẵn) NaN : Not a Number (không phải số) 48 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG > # Truong hop: n = 5 = so tham so > data2 <- gpa1[c(1:5),] > dim(data2) [1] 5 29 > hq2<-lm(colGPA ~ hsGPA + ACT + skipped + age, data=data2) > summary(hq2) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = data2) Residuals: ALL 5 residuals are 0: no residual degrees of freedom! Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -18.9715 NA NA NA hsGPA -3.4286 NA NA NA ACT 0.8143 NA NA NA skipped 0.6786 NA NA NA age 0.6571 NA NA NA Residual standard error: NaN on 0 degrees of freedom Multiple R-squared: 1, Adjusted R-squared: NaN F-statistic: NaN on 4 and 0 DF, p-value: NA 49 49 Phân tích hồi quy bội: Vấn đề ước lượng Ước lượng phương sai mẫu của các ước lượng OLS Độ lệch chuẩn đúng của ước lượng của Thay Độ lệch chuẩn ước lượng của ước lượng của cho phương sai chưa biết 3.58 Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1 đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 50 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề ước lượng 3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là không chệch Ước lượng không chệch nào có phương sai nhỏ nhất? Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc. 3.60 Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu của tất cả các biến độc lập; ước lượng OLS luôn có thể đưa về dạng này © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 51 Phân tích hồi quy bội: Vấn đề ước lượng BLUE là viết tắt của Best Linear Unbiased Estimator Định lý 3.4 (Định lý Gauss-Markov) Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến tính không chệch tốt nhất (BLUE) của các hệ số hồi quy. “Tốt nhất ” nghĩa là “có phương sai nhỏ nhất ” : với mọi sao cho. OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ có ước lượng khác tốt hơn. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 52 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 26 Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Giả thiết MLR1-5: Phương sai nhỏ nhất trong lớp: Tuyến tính Không chệch Tuyến tính Chệch Phi tuyến Không chệch Phi tuyến Chệch Phi tuyến Không tuyến tính 53 53 Môøi gheù thaêm trang web: 54 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 54 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 27 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề suy diễn thống kê Chương 4 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Phân tích hồi quy bội Vấn đề suy diễn Suy diễn thống kê trong mô hình hồi quy Kiểm định giả thuyết về tham số tổng thể Xây dựng khoảng tin cậy (đối xứng) 4.1 Phân phối mẫu của ước lượng OLS Ước lượng OLS là các biến ngẫu nhiên Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả thuyết thống kê Để suy luận về phân phối, chúng ta cần thêm giả thiết Giả thiết về phân phối của sai số: sai số có phân phối chuẩn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Giả thiết MLR.6 (Phân phối chuẩn của sai số) và độc lập với các biến Nếu có MLR.6 thì sẽ có MLR.4 và MLR.5 Giả sử rằng phần sai số của hồi quy tổng thể có phân phối chuẩn. Dạng phân phối và phương sai không phụ thuộc vào bất kỳ biến độc lập nào. Suy ra: © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 3 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Định lý giới hạn trung tâm (CLT) • Có x1,..., xk là các biến ngẫu nhiên Xét biến ngẫu nhiên tổng x = x1+…+xk Nếu các điều kiện sau thỏa: • Các xi là độc lập • Các xi có cùng phân phối xác suất • Các xi có cùng kỳ vọng và phương sai (hữu hạn) • k lớn (thường k 30) thì x sẽ có phân phối xấp xỉ chuẩn 4 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Thảo luận về giả thiết phân phối chuẩn Phần sai số được xem là tổng của “nhiều“ yếu tố không quan sát được Tổng của các yếu tố độc lập có phân phối xấp xỉ chuẩn (Định lý giới hạn trung tâm - Central Limit Theorem - CLT) Các vấn đề nảy sinh: • Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không? • Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau • Các yếu tố này độc lập với nhau ở mức nào? Phân phối của sai số là một vấn đề thuộc về thực nghiệm Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5 Phân tích hồi quy bội Vấn đề suy diễn Thảo luận về giả thiết phân phối chuẩn (tt) Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn: • Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu) • Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm) • Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1) Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage) Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất (kể cả ước lượng phi tuyến) Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn có thể thay thế bằng cỡ mẫu lớn (xem Chương 5) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Giả thiết MLR1-6: Phương sai nhỏ nhất trong lớp: Tuyến tính Không chệch Tuyến tính Chệch Phi tuyến Không chệch Phi tuyến Chệch 7 7 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) Tập tin gpa1.wf1 > hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1) > summary(hoiquy1) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.90206 0.65037 1.387 0.16771 hsGPA 0.43379 0.09709 4.468 1.65e-05 *** ACT 0.01449 0.01058 1.370 0.17309 skipped -0.08066 0.02617 -3.082 0.00249 ** age 0.01990 0.02284 0.872 0.38498 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.3298 on 136 degrees of freedom Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 > # Lay phan du > phandu1=resid(hoiquy1) 8 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) > # install.packages("fBasics") > library(fBasics) Loading required package: timeDate Loading required package: timeSeries > jarqueberaTest(phandu1) Title: Jarque - Bera Normalality Test Test Results: STATISTIC: X-squared: 1.5592 P VALUE: Asymptotic p Value: 0.4586 H0: phần dư có phân phối chuẩn H1: phần dư không có phân phối chuẩn p-value = 0,4586 > 0,05 : chấp nhận H0 Vậy phần dư có phân phối chuẩn 9 9 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) > shapiro.test(phandu1) Shapiro-Wilk normality test data: phandu1 W = 0.9893, p-value = 0.3537 > require(nortest) Loading required package: nortest > # Kiem dinh Anderson-Darling > ad.test(phandu1) Anderson-Darling normality test data: phandu1 A = 0.60863, p-value = 0.1116 > # Kiem dinh Kolmogorov-Smirnov > lillie.test(phandu1) Lilliefors (Kolmogorov-Smirnov) normality test data: phandu1 D = 0.071506, p-value = 0.07439 10 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) > # Chay hoi quy > hoiquy2 <- lm(log(wage) ~ educ+exper+age+married, data=wage2) > # Lay phan du > phandu2=resid(hoiquy2) > # kiem dinh Jarque-Bera > library(fBasics) > jarqueberaTest(phandu2) Title: Jarque - Bera Normalality Test Test Results: STATISTIC: X-squared: 43.649 P VALUE: Asymptotic p Value: 3.325e-10 H0: phần dư có phân phối chuẩn H1: phần dư không có phân phối chuẩn p-value = 3,325 10-10 < 0,05 : bác bỏ H0 Vậy phần dư không có phân phối chuẩn 11 11 Phân tích hồi quy bội Vấn đề suy diễn Một số thuật ngữ “các giả thiết Gauss-Markov“ Các giả thiết của “mô hình hồi quy tuyến tính cổ điển (CLM - classical linear model )“ Định lý 4.1 (Phân phối chuẩn trong mẫu) Dưới các giả thiết MLR.1 – MLR.6: 4.1 Các ước lượng OLS có phân phối mẫu với phương sai như đã thiết lập trong chương trước Ước lượng chuẩn hóa tuân theo phân phối chuẩn tắc © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn 4.2 Kiểm định giả thuyết về từng tham số tổng thể Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa) Dưới các giả thiết MLR.1 – MLR.6: 4.3 Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân phối chuẩn tắc sẽ được thay thế bằng phân phối t Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn. Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau) 4.4 Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát các biến độc lập khác, xj không tác động đến y © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 13 Phân tích hồi quy bội Vấn đề suy diễn Thống kê t (hay tỷ số t) ˆ 0 t ˆ j j se( ˆ ) j 4.5 Thống kê t sẽ được sử dụng để kiểm định giả thuyết không đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả thuyết không càng ít khả năng đúng. Nhưng khi nào thì được gọi là “xa“ giá trị 0? Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được, nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng bao nhiêu lần độ lệch chuẩn. Phân phối của thống kê t nếu giả thuyết không là đúng Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội : Vấn đề suy diễn Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải) t0,05(28)= 1,701 Kiểm định H 0 : j 0 với giả thuyết đối H1 : j 0 . 4.6 Bác bỏ giả thuyết không và ủng hộ giả thuyết đối một phía này nếu hệ số hồi quy ước lượng được là quá lớn (cụ thể là lớn hơn giá trị tới hạn t(n-k-1)). Xây dựng giá trị tới hạn sao cho, nếu giả thuyết không là đúng thì khả năng giả thuyết không bị bác bỏ, chẳng hạn, là 5% trong tổng số các trường hợp. t t (n k 1) : bac bo H 0 4.7 Trong ví dụ đã cho, đây là giá trị của phân phối t với 28 bậc tự do mà 5% số các trường hợp sẽ lớn hơn giá trị này. Bác bỏ H0 nếu thống kê t lớn hơn 1,701 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 15 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.1: Phương trình tiền lương Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không Sai số chuẩn Kiểm định với giả thuyết đối . Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ) hoặc không tác động gì cả. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.1: Phương trình tiền lương (tt) Thống kê t Bậc tự do; Ở đây, sự xấp xỉ phân phối chuẩn tắc có thể được áp dụng t0,05 (522) 1,645 t0,01 (522) 2,326 Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp). Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới hạn t(n-k-1). texper= 2,41 > t0,05(522)= 1,645 : bác bỏ H0 “Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có ý nghĩa thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 17 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái) t0,05(18)= 1,734 Kiểm định H 0 : j 0 với giả thuyết đối H1 : j 0 4.8 Bác bỏ giả thuyết không với giả thuyết đối một phía này nếu hệ số ước lượng được là “quá nhỏ“ (nghĩa là, nhỏ hơn so với giá trị tới hạn -t(n-k-1)). Xây dựng giá trị tới hạn sao cho nếu giả thuyết không là đúng thì giả thuyết này sẽ bị bác bỏ, chẳng hạn, trong 5% tổng số các trường hợp. Trong ví dụ đã cho, đây là điểm giá trị mà tại đó phân phối t với 18 bậc tự do sẽ có 5% các trường hợp nhỏ hơn giá trị này. Bác bỏ H0 nếu thống kê t nhỏ hơn -1,734 t t ( n k 1) : bac bo H 0 4.9 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập của sinh viên sẽ tốt hơn hay không Phần trăm sinh viên vượt qua bài kiểm tra môn Toán Thu nhập trung bình Tỷ lệ giáo viên trên hàng năm của giáo viên 1000 sinh viên Kiểm định . Lượng sinh viên theo học (= quy mô trường học) với giả thuyết đối Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học không hề có tác động đến kết quả học tập? © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt) Thống kê t Bậc tự do; Trường hợp này có thể áp dụng xấp xỉ phân phối chuẩn tắc t0,05 (404) 1, 645 Bảng z: t0,15 (404) 1, 04 Giá trị tới hạn với mức ý nghĩa 5% và 15%. Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn giá trị tới hạn. tenroll= -0,91 > -t0,05(404)= -1,645 : chấp nhận H0 Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%). © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt) Một dạng hàm có log: R2 cao hơn một chút Kiểm định với giả thuyết đối . © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 21 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt) Thống kê t t0,05 (404) 1, 645 Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0 Độ lớn của tác động ra sao? Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%) Ví dụ: (tác động rất nhỏ) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định với giả thuyết đối hai phía t0,025(25)= 2,06 Kiểm định H 0 : j 0 với H 0 : j 0 . 4.10 Bác bỏ giả thuyết không với giả thiết đối hai phía nếu giá trị tuyệt đối của hệ số ước lượng quá lớn. Xây dựng giá trị tới hạn sao cho nếu giả thuyết không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5% trong tổng số các trường hợp. Trong ví dụ đã cho, những điểm ứng với 5% các trường hợp này nằm ở hai phía đuôi của hàm phân phối. Bác bỏ H0 nếu giá trị tuyệt đối của thống kê lớn hơn 2,06 | t | t / 2 ( n k 1) : bac bo H 0 4.11 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 23 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.3: Các yếu tố tác động đến điểm GPA Số buổi cúp học Dùng phân phối chuẩn tắc để tìm giá trị tới hạn | thsGPA | 4, 38 t0,005 (137) 2,576 : bac bo H 0 | t ACT | 1,36 t0,05 (137) 1, 645 : chap nhan H 0 Tác động của hsGPA và số buổi cúp học khác 0 có ý nghĩa ở mức ý nghĩa 1%. Tác động của ACT khác 0 không có ý nghĩa thống kê, thậm chí ở mức ý nghĩa 10%. | t skipped | 3,19 t0,005 (137) 2,576 : bac bo H 0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Biến độc lập “có ý nghĩa thống kê“ trong hồi quy Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc lập tương ứng với hệ số hồi quy đó được gọi là “có ý nghĩa thống kê“ Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối chuẩn thì quy tắc sau đây có thể áp dụng: “có ý nghĩa thống kê ở mức 10% “ “có ý nghĩa thống kê ở mức 5%“ “có ý nghĩa thống kê ở mức 1%“ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 25 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Biến độc lập có ý nghĩa thống kê, mức ý nghĩa 5% > hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1) > summary(hoiquy1) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.90206 0.65037 1.387 0.16771 hsGPA 0.43379 0.09709 4.468 1.65e-05 *** ACT 0.01449 0.01058 1.370 0.17309 skipped -0.08066 0.02617 -3.082 0.00249 ** age 0.01990 0.02284 0.872 0.38498 --Residual standard error: 0.3298 on 136 degrees of freedom Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 * H0: 1 = 0 ; H1: 1 ≠ 0 p-value(2p) = 1,6510-5 < = 0,05 : bác bỏ H0 Hoặc |t|= 4,468 > t/2(136) = 1,96 : bác bỏ H0 Biến hsGPA có ý nghĩa thống kê * H0: 4 = 0 ; H1: 4 ≠ 0 p-value(2p) = 0,38498 > = 0,05 : chấp nhận H0 Hoặc |t|= 0,872 < t/2(136) = 1,96 : chấp nhận H0 Biến age không có ý nghĩa thống kê 26 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc ý nghĩa thực tiễn! Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị “sai“ dấu, mô hình hồi quy có thể bị định dạng sai Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường (10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi quy (cẩn thận bởi vấn đề chệch do bỏ sót biến có liên quan) Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng “kém chính xác“ (imprecise) vì vậy bằng chứng để bỏ biến sẽ yếu hơn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 27 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định các giả thuyết tổng quát về hệ số hồi quy Giả thuyết không Giá trị cần kiểm định của các hệ số hồi quy 4.12 Thống kê t 4.13 Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các thống kê kiểm định © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.4: Vấn đề tội phạm trong trường học và số sinh viên theo học Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh viên theo học tăng 1% Giá trị ước lượng là khác 1 nhưng sự khác nhau có ý nghĩa thống kê hay không? 1, 27 1 | t | 2, 45 t0,025 (95) 1,987 : bac bo H 0 0,11 Giả thuyết bị bác bỏ ở mức ý nghĩa 5% © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 29 Phân tích hồi quy bội Vấn đề suy diễn Tính toán p-value cho các kiểm định t Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết không không thể bị bác bỏ Lý do là, bằng cách hạ thấp mức ý nghĩa, người ta muốn tránh sai lầm bác bỏ một giả thuyết H0 đúng Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-value của kiểm định giả thuyết Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì người ta sẽ bác bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không p-value giúp dễ dàng kết luận hơn so với các giá trị thống kê ở những mức ý nghĩa cho trước © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Cách tính p-value (trường hợp kiểm định hai phía) p-value = P(|T|>|t|) Những giá trị này là giá trị tới hạn cho mức ý nghĩa 5% 4.15 Trong trường hợp kiểm định hai phía, p-value là xác suất sao cho các biến ngẫu nhiên có phân phối t sẽ nhận giá trị tuyệt đối lớn hơn giá trị thực tế, nghĩa là: Khi đó, giả thuyết không sẽ bị bác bỏ nếu p-value tương ứng nhỏ hơn mức ý nghĩa. Ví dụ, với mức ý nghĩa 5%, thống kê t sẽ không nằm trong miền bác bỏ. Giá trị thống kê kiểm định © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 31 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Tóm tắt kiểm định t Mô hình Phía phải H0: βj = aj H1: βj > aj y 0 1 x1 ... k xk u Phía trái H0: βj = aj H0: βj < aj t ˆ j a j Hai phía H0: βj = aj H0: βj ≠ aj se( ˆ j ) t(n-k-1) t(n-k-1) t/2(n-k-1) t > t(n-k-1) t < -t(n-k-1) |t| > t/2(n-k-1) = 5%, n= 27, k+1= 7 t(n-k-1) = t0,05(20) = 1,725 t/2(n-k-1) = t0,025(20) = 2,086 = 5%, n= 207, k+1= 7 t0,05() = 1,645 t0,025() = 1,960 p-value(1p) = P(T>|t|) p-value(2p) = P(|T|>|t|) p-value(1p) < (0,05) p-value(2p) < (0,05) p-value(1p) = p-value(2p)/2 Quy tắc bác bỏ H0 Tra bảng thống kê Tính p-value Quy tắc bác bỏ H0 32 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Trong EXCEL: Phaân phoái Student t Caùc phaân vò t/2, t ñöôïc xaùc ñònh theo coâng thöùc: =TINV(xaùc suaát, baäc töï do). Thí duï vôùi coâng thöùc =TINV(0.05,6) ta ñöôïc t0,025(6) = 2.4469 Ñeå tính p–value cho kieåm ñònh hai phía vaø moät phía ta söû duïng coâng thöùc sau: =TDIST(|t|, baäc töï do, ñuoâi) vôùi ñuoâi=1: moät phía, ñuoâi=2: hai phía. Vôùi thí duï n= 6, t= 2.4469 thì trong EXCEL ta goõ coâng thöùc sau: =TDIST(2.4469,6,2) keát quaû ta ñöôïc p–value(2p) = 0.05 =TDIST(2.4469,6,1) ta ñöôïc p–value(1p) = 0.025 33 33 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN load("H:/BAI GIANG KTL 2021/ /Chuong 04/gpa1.RData") gpa1 <- data hq <- lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1) summary(hq) # Kiem dinh t t_test <- function(reg, coefnum, val){ coefnum <- coefnum+1 # he so chan o vi tri so 1 co <- coef(summary(reg)) tstat <- (co[coefnum,1]-val)/co[coefnum,2] p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE) result1 <- c(t_stat = round(tstat, digits=4)) result2 = c(p_value_2p = round(p_value, digits=4)) result3 = c(p_value_1p = round(p_value/2, digits=4)) return(list(result1, result2,result3)) } # y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 # H0: b1 = 0.8 ; H1: b1 <> 0.8 # Chay ham Kiem dinh t truoc t_test(hq,1,0.8) # nhap so 1 cho b1 34 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > t_test(hq,1,0.8) # nhap so 1 cho b1 [[1]] t_stat -3.7719 [[2]] p_value_2p 2e-04 [[3]] p_value_1p 1e-04 # Gia tri toi han cua Kiem dinh t t_critical <- function(alpha, df){ result1 <- c(t_alpha = round(abs(qt(alpha, df)),digits=4)) result2 <- c(t_alpha_chia2 = round(abs(qt(alpha/2, df)),digits=4)) return(list(result1, result2)) } # Muc y nghia alpha = 0,05, bac tu do df cua hoi quy # Chay ham gia tri toi han truoc df <- hq$df.residual t_critical(0.05,df) 35 35 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > t_critical(0.05,df) [[1]] t_alpha 1.6561 [[2]] t_alpha_chia2 1.9776 > summary(hq) Call: lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.90206 0.65037 1.387 0.16771 hsGPA 0.43379 0.09709 4.468 1.65e-05 *** ACT 0.01449 0.01058 1.370 0.17309 skipped -0.08066 0.02617 -3.082 0.00249 ** age 0.01990 0.02284 0.872 0.38498 --Residual standard error: 0.3298 on 136 degrees of freedom Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 36 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN 1) H 0 : 1 0,8 ; H1 : 1 0,8 với mức ý nghĩa 5% Phương pháp giá trị tới hạn: Ta có |t| = 3,7719 > t0,025(136) = 1,9776 : bác bỏ H0 Phương pháp p-value: Ta có p-value(2p) = 210-4 < 0,05 : bác bỏ H0 2) H 0 : 1 0,8 ; H1 : 1 0,8 với mức ý nghĩa 5% Phương pháp giá trị tới hạn: Ta có t = -3,7719 < -t0,05(136) = -1,6561 : bác bỏ H0 Phương pháp p-value: Ta có p-value(1p) = 110-4 < 0,05 : bác bỏ H0 37 37 Phân tích hồi quy bội Vấn đề suy diễn 4.3 Khoảng tin cậy (đối xứng) Định lý 4.2 giúp rút ra kết quả hàm ý rằng Giá trị tới hạn của kiểm định hai phía P ˆ j t / 2 ( n k 1).se( ˆ j ) j ˆ j t / 2 (n k 1).se( ˆ j ) 1 Giới hạn dưới của khoảng tin cậy j ˆ j t /2 (n k 1).se( ˆ j ) Giới hạn trên của khoảng tin cậy Độ tin cậy Diễn giải ý nghĩa của khoảng tin cậy (1- = 0,95) Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên Trong trường hợp lặp lại việc lấy mẫu, khoảng tin cậy như trên sẽ chứa hệ số hồi quy tổng thể trong 95% các trường hợp. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Các khoảng tin cậy ứng với các mức ý nghĩa thông thường P ˆ t P ˆ t (n k 1).se( ˆ ) 0, 95 ( n k 1).se( ˆ ) 0,90 P ˆ j t0,005 ( n k 1).se( ˆ j ) j ˆ j t0,005 (n k 1).se( ˆ j ) 0, 99 j 0,025 j 0,05 ( n k 1).se( ˆ j ) j ˆ j t0,025 ( n k 1).se( ˆ j ) j ˆ j t0,05 Quy tắc kinh nghiệm t0,005 () 4.16 j j 2,576; t0,025 () 1,96; t0,05 () 1, 645 Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết 2 phía Nếu aj không thuộc khoảng tin cậy bác bỏ H0: βj = aj ; ủng hộ H1: βj ≠ aj Nếu aj thuộc khoảng tin cậy chấp nhận H0: βj = aj © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 39 Phân tích hồi quy bội Vấn đề suy diễn Ví dụ 4.8: Mô hình hồi quy về chi phí R&D của doanh nghiệp Doanh thu hàng năm Chi tiêu cho R&D Phần trăm lợi nhuận trên doanh thu n 32; R 2 0,918; df 32 2 1 29; t0,025 (29) 2, 045 ˆ t (df ).se( ˆ ) ˆ t (df ).se( ˆ ) 1 1 /2 = 1 2 2 /2 2 = Tác động của doanh thu đến chi phí R&D ước lượng được có khoảng tin cậy 95% khá hẹp. Ngoài ra, tác động này khác 0 có ý nghĩa thống kê vì số 0 nằm ngoài khoảng tin cậy. Tác động ước lượng được của profmarg có khoảng tin cậy 95% rất rộng. Thậm chí tác động này không có ý nghĩa thống kê vì số 0 nằm trong khoảng tin cậy. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Tập tin rdchem.wf1 > hoiquy1<-lm(log(rd) ~ log(sales)+profmarg, data=rdchem) > summary(hoiquy1) Call: lm(formula = log(rd) ~ log(sales) + profmarg, data = rdchem) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -4.37827 0.46802 -9.355 2.93e-10 *** log(sales) 1.08422 0.06020 18.012 < 2e-16 *** profmarg 0.02166 0.01278 1.694 0.101 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.5136 on 29 degrees of freedom > # Khoang tin cay 95% > confint(hoiquy1,level = 0.95) 2.5 % 97.5 % (Intercept) -5.335478450 -3.4210681 log(sales) 0.961107256 1.2073325 profmarg -0.004487722 0.0477991 Khoảng tin cậy 95% của β1: 1.08422 2.045*0.0602 Hay (0.9611 ; 1.2073) 41 41 Phân tích hồi quy bội Vấn đề suy diễn 4.4 Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học (4 năm) Số năm đi học khi học hệ 2 năm Số năm đi học khi học hệ 4 năm 4.17 Kiểm định . với giả thuyết đối 4.18 4.19 Một thống kê kiểm định có thể dùng là : 4.20 Chênh lệch giữa các ước lượng được chuẩn hóa bằng cách chia cho độ lệch chuẩn của khoảng chênh lệch này. Giả thuyết H0 sẽ bị bác bỏ nếu giá trị thống kê t mang giá trị âm quá lớn để tin rằng sự khác nhau thực sự trong tổng thể giữa hai ước lượng là bằng 0. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Không thể tính toán với các kết quả hồi quy bình thường Cách làm khác Tính 4.23 Không có sẵn trong kết quả hồi quy thông thường và kiểm định với . 4.24 4.25 Thêm đại lượng này vào hàm hồi quy ban đầu Biến độc lập mới (= tổng số năm đi học ở cả hai hệ) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 43 Phân tích hồi quy bội Vấn đề suy diễn Kết quả ước lượng Tổng số năm đi học = jc+univ 4.27 Giả thuyết bị bác bỏ tại mức ý nghĩa 10%, nhưng không bị bác bỏ tại 5% t= -1,48 < -t0,1()= - 1,282 hay p-value(1p)= 0,07 < 0,1 : bác bỏ H0 t= -1,48 > -t0,05()= - 1,645 hay p-value(1p)= 0,07 > 0,05 : chấp nhận H0 Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Tập tin twoyear.wf1 > hoiquy1<-lm(lwage ~ jc + univ + exper, data = twoyear) > summary(hoiquy1) Call: lm(formula = lwage ~ jc + univ + exper, data = twoyear) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4723256 0.0210602 69.910 <2e-16 *** jc 0.0666967 0.0068288 9.767 <2e-16 *** univ 0.0768762 0.0023087 33.298 <2e-16 *** exper 0.0049442 0.0001575 31.397 <2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.4301 on 6759 degrees of freedom Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221 F-statistic: 644.5 on 3 and 6759 DF, p-value: < 2.2e-16 45 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Ma trận hiệp phương sai của hệ số hồi quy > vcov(hoiquy1) (Intercept) jc univ exper (Intercept) 4.435337e-04 -1.741432e-05 -1.573472e-05 -3.104756e-06 jc -1.741432e-05 4.663243e-05 1.927929e-06 -1.718296e-08 univ -1.573472e-05 1.927929e-06 5.330230e-06 3.933491e-08 exper -3.104756e-06 -1.718296e-08 3.933491e-08 2.479792e-08 var( ˆ1 ) 4, 66.10 5 ; var( ˆ2 ) 5,33.106 ;cov( ˆ1 , ˆ2 ) 1,93.106 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > hoiquy2<-lm(lwage ~ jc + I(jc + univ) + exper, data = twoyear) > summary(hoiquy2) Call: lm(formula = lwage ~ jc + I(jc + univ) + exper, data = twoyear) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4723256 0.0210602 69.910 <2e-16 *** jc -0.0101795 0.0069359 -1.468 0.142 I(jc + univ) 0.0768762 0.0023087 33.298 <2e-16 *** exper 0.0049442 0.0001575 31.397 <2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.4301 on 6759 degrees of freedom Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221 • H0: 1=0 ; H1: 1≠0 • p-value(2p) = 0,142 p-value(1p) = 0,071 47 47 Phân tích hồi quy bội Vấn đề suy diễn 4.5 Kiểm định nhiều ràng buộc tuyến tính: Kiểm định F Kiểm định các ràng buộc loại trừ Tiền lương của các cầu thủ bóng chày ở giải nhà nghề Số năm thi đấu chuyên nghiệp Số trận tham gia thi đấu trung bình mỗi năm 4.28 Điểm đánh bóng trung bình Số lần đánh bóng ghi điểm trực tiếp trung bình mỗi năm Số lần đánh bóng ghi điểm mỗi năm 4.29 với H1: H0 là sai 4.30 Kiểm định việc các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động đến tiền lương/ hoặc có thể loại bỏ khỏi phương trình hồi quy. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Ước lượng mô hình chưa gán ràng buộc (UR) 4.31 Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm định đơn lẻ. tbavg = 0,89 ; thrunsyr = 0,89 ; trbisyr = 1,50 Gợi ý: Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô hình? © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 49 Phân tích hồi quy bội Vấn đề suy diễn Ước lượng mô hình đã gán ràng buộc (R) 4.33 RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không? Thống kê kiểm định Số các ràng buộc 4.37 Sự tăng lên tương đối của tổng bình phương phần dư khi đi từ H1 đến H0 tuân theo một phân phối F (nếu H0 là đúng ) df = n-(k+1), với (k+1) : số tham số của mô hình UR © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 50 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Quy tắc bác bỏ (Hình 4.7) ( Rur2 Rr2 ) / q F (1 Rur2 ) / df ur 4.41 dfur : bậc tự do của mô hình UR Một biến ngẫu nhiên có phân phối F chỉ có thể nhận giá trị dương. Điều này tương ứng với việc tổng bình phương phần dư chỉ có thể tăng thêm khi đi từ H1 đến H0. Chọn giá trị tới hạn sao cho giả thuyết không sẽ bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù nó đúng. F > F(q,n-k-1): bác bỏ H0 4.40 Với mức ý nghĩa 5% ; q = 3 ; dfur = n-k-1 = 60 : F0,05(3,60) = 2,76 Nếu F > F0,05(3,60) : bác bỏ H0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 51 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định vấn đề trong ví dụ Số các ràng buộc cần kiểm định F (0,6278 0,5971) / 3 9,55 (1 0,6278) / 347 F ~ F3,347 ; = 1% F0,01(3,347)= 3,78 Bậc tự do của mô hình chưa gán ràng buộc (UR) p-value = P(F-statistic > 9,55) = 4,47410-6 Bằng chứng bác bỏ giả thuyết không là rất mạnh (thậm chí ở mức ý nghĩa rất nhỏ). Thảo luận Ba biến được kiểm định là “có ý nghĩa đồng thời“ Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến Có thể đã có đa cộng tuyến giữa chúng F= 9,55 > F0,01(3,347)= 3,78 hay p-value= 4,47410-6 < 0,01: bác bỏ H0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 52 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 26 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Tập tin mlb1.wf1 > hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr, data = mlb1) > summary(hoiquy1) Call: lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr, data = mlb1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 *** years 6.886e-02 1.211e-02 5.684 2.79e-08 *** gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 *** bavg 9.786e-04 1.104e-03 0.887 0.376 hrunsyr 1.443e-02 1.606e-02 0.899 0.369 rbisyr 1.077e-02 7.175e-03 1.500 0.134 --Residual standard error: 0.7266 on 347 degrees of freedom Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224 > nobs(hoiquy1) [1] 353 R2 = 0.6278 n = df + số tham số = 347+6 = 353 53 53 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > anova(hoiquy1) Analysis of Variance Table Response: log(salary) Df Sum Sq Mean Sq F value Pr(>F) years 1 165.980 165.980 314.4067 < 2.2e-16 gamesyr 1 127.884 127.884 242.2441 < 2.2e-16 bavg 1 0.881 0.881 1.6695 0.1972 hrunsyr 1 13.055 13.055 24.7299 1.039e-06 rbisyr 1 1.189 1.189 2.2514 0.1344 Residuals 347 183.186 0.528 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 0.1 ‘ ’ 1 *** *** *** ‘.’ SSR = 183.186 SSR ˆ 2 .df 0, 7266 2 * 347 54 54 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 27 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > #Load package car > library(car) > # Kiem dinh F > linearHypothesis(hoiquy1, c("bavg=0","hrunsyr=0", "rbisyr=0")) Linear hypothesis test Hypothesis: bavg = 0 hrunsyr = 0 rbisyr = 0 Model 1: restricted model Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr Res.Df RSS Df Sum of Sq F Pr(>F) 1 350 198.31 2 347 183.19 3 15.125 9.5503 4.474e-06 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 • F = 9,5503 > F0,05(3,347) = 2,6 : bác bỏ H0 • p-value = 4,47410-6 < 0,05 : bác bỏ H0 55 55 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Phaân phoái Fisher F Trong EXCEL: Ñeå tính F0,05(1,6) = 5.987 goõ coâng thöùc sau: =FINV(0.05,1,6) p–value cuûa phaân phoái F ñöôïc tính theo coâng thöùc: p–value= P(F >F) goõ coâng thöùc =FDIST(5.987,1,6) ta ñöôïc p–value = 0.05 > # Gia tri > c(F_alpha F_alpha 3.0984 > # p-value > c(p_value p_value 0.05 toi han F0,05(3,20) = round(qf(1-0.05,3,20),digits=4)) cua F= 3,0984 voi bac tu do 3 va 20 = round(1-pf(3.0984,3,20),digits=4)) 56 56 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 28 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định ý nghĩa toàn bộ của mô hình hồi quy 4.34 UR: Giả thuyết không phát biểu rằng các biến 4.44 R: 4.45 độc lập hoàn toàn không có tác dụng giải thích cho biến phụ thuộc Mô hình đã gán ràng buộc (hồi quy với hệ số chặn) 4.46 Kiểm định ý nghĩa toàn bộ của mô hình hồi quy được trình bày trong hầu hết các phần mềm hồi quy. Giả thuyết không thường bị bác bỏ H0: R2 = 0 (Hàm hồi quy mẫu SRF không phù hợp với mẫu khảo sát) 4.44 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 57 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Tập tin mlb1.wf1 > hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr, data = mlb1) > summary(hoiquy1) Call: lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr, data = mlb1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 *** years 6.886e-02 1.211e-02 5.684 2.79e-08 *** gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 *** bavg 9.786e-04 1.104e-03 0.887 0.376 hrunsyr 1.443e-02 1.606e-02 0.899 0.369 rbisyr 1.077e-02 7.175e-03 1.500 0.134 --Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224 F-statistic: 117.1 on 5 and 347 DF, p-value: < 2.2e-16 • H0: β1 = … = β5 = 0 ; • p-value < 2,210-16 H1: H0 sai < 0,05 : bác bỏ H0 58 58 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 29 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Tập tin mlb1.wf1 > linearHypothesis(hoiquy1, c("years=0", "gamesyr=0", "bavg=0","hrunsyr=0", "rbisyr=0")) Linear hypothesis test Hypothesis: years = 0 gamesyr = 0 bavg = 0 hrunsyr = 0 rbisyr = 0 Model 1: restricted model Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisy r Res.Df RSS Df Sum of Sq F Pr(>F) 1 352 492.18 2 347 183.19 5 308.99 117.06 < 2.2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 • H0: β1 = … = β5 = 0 ; • p-value < 2,210-16 H1: H0 sai < 0,05 : bác bỏ H0 59 59 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F • Mô hình chưa gán ràng buộc (UR) y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + u • H0: β2 = 2, β4 = 0, β5 = -3 ; H1: H0 sai • Mô hình đã gán ràng buộc (R) y = β0 + β1x1 + 2x2 + β3x3 -3x5 + β6x6 + u (không chạy được) y - 2x2 + 3x5 = β0 + β1x1 + β3x3 + β6x6 + u (chạy được) Chỉ dùng công thức (4.37), không dùng được công thức (4.41) 60 60 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 30 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F Ví dụ: Kiểm định sự hợp lý của việc định giá nhà Giá nhà thực tế Giá dự kiến (giá được định ra trước khi căn nhà được bán) Kích thước lô đất (tính bằng feet) 4.47 Diện tích bình phương Số phòng ngủ 4.48 Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế. Hơn nữa, các yếu tố khác nhất thiết không có tác động đến giá thực tế một khi đã kiểm soát giá dự kiến. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 61 Phân tích hồi quy bội Vấn đề suy diễn Mô hình chưa gán ràng buộc (UR) y 0 1 x1 2 x2 3 x3 4 x4 u Mô hình đã gán ràng buộc (R) 4.49 Mô hình đã gán ràng buộc thực chất là mô hình hồi quy [y-x1] theo một hằng số y 0 x1 u y x1 0 u 4.50 Thống kê kiểm định F ~ F4,83 ; = 5% F0,05(4,83)= 2,50 F= 0,661 < F0,05(4,83)= 2,50 : chấp nhận H0 với mức ý nghĩa 5% © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 62 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 31 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Tập tin hprice1.wf1 > hoiquy1<-lm(log(price) ~ log(assess) + log(lotsize) + log(sqrft) + bdrms, data = hprice1) > summary(hoiquy1) Call: lm(formula = log(price) ~ log(assess) + log(lotsize) + log(sqrft) + bdrms, data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.263743 0.569665 0.463 0.645 log(assess) 1.043066 0.151446 6.887 1.01e-09 *** log(lotsize) 0.007438 0.038561 0.193 0.848 log(sqrft) -0.103239 0.138430 -0.746 0.458 bdrms 0.033839 0.022098 1.531 0.129 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Multiple R-squared: 0.7728, Adjusted R-squared: 0.7619 F-statistic: 70.58 on 4 and 83 DF, p-value: < 2.2e-16 63 63 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN > linearHypothesis(hoiquy1, c("log(assess)=1", "log(lotsize)=0", "log(sqrft)=0","bdrms=0")) Linear hypothesis test Hypothesis: log(assess) = 1 log(lotsize) = 0 log(sqrft) = 0 bdrms = 0 Model 1: restricted model Model 2: log(price) ~ log(assess) + log(lotsize) + log(sqrft) + b drms 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 87 1.8801 83 1.8215 4 0.05862 0.6678 0.6162 • p-value = 0,6162 > 0,05 : chấp nhận H0 64 64 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 32 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội Vấn đề suy diễn Kết quả hồi quy của mô hình chưa gán ràng buộc (UR) Khi kiểm định riêng rẽ, không có bằng chứng chống lại sự hợp lý của việc định giá nhà Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết bội và tuyến tính Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1 – MLR.6 được giả định là thỏa mãn; nếu không các kiểm định sẽ không còn đáng tin cậy. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 65 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: Kiểm định giả thiết đối 2 phía thì kết quả theo t và F là như nhau. • Tập tin wage2.wf1 > hoiquy1<-lm(wage ~ educ + exper + tenure, data = wage2) > summary(hoiquy1) Call: lm(formula = wage ~ educ + exper + tenure, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -276.240 106.702 -2.589 0.009778 ** educ 74.415 6.287 11.836 < 2e-16 *** exper 14.892 3.253 4.578 5.33e-06 *** tenure 8.257 2.498 3.306 0.000983 *** --Multiple R-squared: 0.1459, Adjusted R-squared: 0.1431 66 66 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 33 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: 1) H0: βeduc = 63 ; H0: βeduc ≠ 63 t 74,41486 63 1,815631 ; = 5% 6, 286993 |t| = 1,815631 < t0,025() = 1,96 : chấp nhận H0 Hay: p-value(2p) = P(|t| > 1,815631) = 0,0697 (phần mềm) p-value(2p) > 0,05 : chấp nhận H0 2) H0: βeduc = 63 ; H0: βeduc > 63 t = 1,815631 > t0,05() = 1,645 : bác bỏ H0 Hay: p-value(1p) = 0,0697/2 = 0,0349 < 0,05 : bác bỏ H0 67 67 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: # Kiem dinh t t_test <- function(reg, coefnum, val){ coefnum <- coefnum+1 # he so chan o vi tri so 1 co <- coef(summary(reg)) tstat <- (co[coefnum,1]-val)/co[coefnum,2] p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE) result1 <- c(t_stat = round(tstat, digits=4)) result2 = c(p_value_2p = round(p_value, digits=4)) result3 = c(p_value_1p = round(p_value/2, digits=4)) return(list(result1, result2,result3)) } # y = b0 + b1*x1 + b2*x2 + b3*x3 # H0: b1 = 63 ; H1: b1 <> 63 # Chay ham Kiem dinh t truoc t_test(hoiquy1,1,63) # nhap so 1 cho b1 68 68 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 34 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: > t_test(hoiquy1,1,63) # nhap so 1 cho b1 [[1]] t_stat 1.8156 [[2]] p_value_2p 0.0697 [[3]] p_value_1p 0.0349 > 1.8156^2 [1] 3.296403 69 69 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: > #Load package car > library(car) > # Kiem dinh F > linearHypothesis(hoiquy1, c("educ=63")) Linear hypothesis test Hypothesis: educ = 63 Model 1: restricted model Model 2: wage ~ educ + exper + tenure Res.Df RSS Df Sum of Sq F Pr(>F) 1 932 130899834 2 931 130437974 1 461859 3.2965 0.06975 . --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Nhận xét: t2 = F 1,81562 = 3,2964 70 70 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 35 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • 4.6 Trình bày kết quả hồi quy (bằng tay) • Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên 71 71 PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên • salary lương của giáo viên • b/s là viết tắt của “tỷ lệ phụ cấp trên lương” • enroll quy mô của trường • staff số giáo viên trên một nghìn học sinh • droprate tỷ lệ học sinh bỏ học • gradrate tỷ lệ học sinh tốt nghiệp • totcomp tổng thu nhập hàng năm trung bình cho một giáo viên, bao gồm lương và các phụ cấp (lương hưu, bảo hiểm y tế và các khoản khác) • 72 72 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 36 Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Môøi gheù thaêm trang web: https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 73 73 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 37 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Tính tiệm cận của OLS Chương 5 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Phân tích hồi quy bội: Tính tiệm cận của OLS 5.1 Tính vững Một ước lượng g gọi là vững cho 1 tham số tổng thể Với mọi Ký hiệu thay thế: Giải thích: P n và nếu . Ước lượng hội tụ theo xác suất tới giá trị đúng của tổng thể Tính vững có nghĩa là xác suất mà ước lượng bất kỳ gần với giá trị thực của tổng thể có thể được thực hiện cao một cách tùy ý bằng cách gia tăng cỡ mẫu Tính vững là một yêu cầu tối thiểu đối với một ước lượng hợp lý © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Giả thiết MLR.6 của mô hình tuyến tính cổ điển: Sai số ngẫu nhiên u có phân phối chuẩn và độc lập với các biến giải thích. Điều này cho phép ta rút ra được phân phối mẫu chính xác của các ước lượng OLS (có điều kiện theo các biến giải thích trong mẫu). Định lý 4.1 đã chứng tỏ rằng các ước lượng OLS của mẫu có phân phối chuẩn, từ đó suy ra ngay phân phối cho các thống kê t và F. Nếu sai số u không có phân phối chuẩn thì thống kê t sẽ không chính xác là phân phối t, và thống kê F sẽ không chính xác là phân phối F với một cỡ mẫu bất kỳ. 3 3 Phân tích hồi quy bội: Tính tiệm cận của OLS Cho đến giờ chúng ta đã tập trung vào các tính chất của OLS đúng cho mẫu bất kỳ (hữu hạn) Các tính chất của OLS đúng cho mẫu/cỡ mẫu bất kỳ Giá trị kỳ vọng/tính không chệch dưới giả thiết MLR.1 – MLR.4 Công thức phương sai của hệ số hồi quy mẫu dưới giả thiết MLR.1 – MLR.5 Định lý Gauss-Markov dưới giả thiết MLR.1 – MLR.5 Phân phối mẫu chính xác / kiểm định và KTC dưới giả thiết MLR.1 – MLR.6 Các tính chất của OLS đúng với mẫu lớn (tính tiệm cận) Mặc dù giả định nhiễu không có tính chuẩn! Tính vững dưới giả thiết MLR.1 – MLR.4 Tính tiệm cận chuẩn/kiểm định dưới giả thiết MLR.1 – MLR.5 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Tính không chệch của các ước lượng, mặc dù quan trọng, nhưng không phải lúc nào cũng đạt được. Các ước lượng OLS thì không chệch khi các giả thiết từ MLR.1 đến MLR.4 thỏa. Trong Phần 3 của quyển sách này, chúng ta sẽ gặp một vài trường hợp ước lượng bị chệch nhưng vẫn hữu dụng. Không phải tất cả các ước lượng hữu dụng đều không chệch. Gần như tất cả các nhà kinh tế học đều đồng ý rằng tính vững là yêu cầu tối thiểu cần có của một ước lượng. 5 5 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Tổng thể có phân phối X với E(X) = µ và var(X) = 2. X1, X2, …, Xn là mẫu ngẫu nhiên với cỡ mẫu n lấy ra từ tổng thể. X1, X2, …, Xn có cùng phân phối X với E(Xi) = µ và var(Xi) = 2. Trung bình mẫu X X 1 ... X n n Xét ước lượng của µ: Ước lượng không chệch (unbiased) và vững (consistent) X Ước lượng không chệch (unbiased) và không vững (inconsistent) X1 Ước lượng chệch (biased) và vững (consistent) 1 X n Ước lượng chệch (biased) và không vững (inconsistent) X1+1 6 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Tóm lại: • Tính không chệch: phụ nữ có sắc đẹp (cái đẹp) • Tính vững: phụ nữ có tính tình tốt (cái nết) Kết luận: • Một chàng trai đi lấy vợ: ưu tiên cái nào? • Một người phụ nữ vừa không …. vừa không … thì …? • Giống loài “đẹp người & đẹp nết” thì đã tc! 7 7 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Tính vững của OLS: Trường hợp đặc biệt của mô hình hồi quy đơn 5.2 8 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Tính tiệm cận của OLS Định lý 5.1 (Tính vững của OLS) Trường hợp đặc biệt của mô hình hồi quy đơn 5.3 Giả định MLR.4‘ Ta có thể thấy rằng ước lượng hệ số góc là vững nếu biến giải thích là ngoại sinh, nghĩa là không tương quan với sai số: Cov(x1,u) = 0. Tất cả các biến giải thích phải không tương quan với sai số. Giả định này thì yếu hơn so với giả định kỳ vọng có điều kiện bằng 0 trong MLR.4. Giả thiết MLR.4 có thể suy ra giả thiết MLR.4’ E(u/x1,…,xk) = 0 E(u) = 0 và Cov(xj,u) = 0 , j © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9 Phân tích hồi quy bội: Tính tiệm cận của OLS Giả thiết MLR.4 suy ra giả thiết MLR.4’ Với tính vững của OLS, chỉ có giả thiết yếu hơn MLR.4‘ là cần thiết Tính tiệm cận tương tự sự chệch do biến bị bỏ sót Mô hình đúng Lỗi chỉ định mô hình (bỏ sót biến x2) Chệch (phần không vững) Không có sự chệch do bỏ sót biến nếu biến bỏ sót là không thích hợp hoặc không tương quan với biến được bao gồm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Tính tiệm cận của OLS 5.2 Tính tiệm cận chuẩn và suy luận trên mẫu lớn Trong thực hành, giả định tính chuẩn MLR.6 thì thường có vấn đề Nếu MLR.6 không đúng, kết quả của kiểm định t hoặc F có thể sai May thay, kiểm định F và t vẫn còn hiệu lực nếu cỡ mẫu đủ lớn Ngoài ra, ước lượng OLS có thể xấp xỉ phân phối chuẩn với mẫu lớn ngay cả nếu không có MLR.6 (theo định lý giới hạn trung tâm) Định lý 5.2 (Tính tiệm cận chuẩn của OLS) Dưới các giả định MLR.1 – MLR.5: Với mẫu lớn, ước lượng chuẩn hóa có phân phối xấp xỉ chuẩn tắc 5.7 Ngoài ra a: asymptotic / approximation © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11 Phân tích hồi quy bội: Tính tiệm cận của OLS Hệ quả thực hành Với mẫu lớn, phân phối t tiến tới phân phối chuẩn tắc N(0,1) Như 1 hệ quả, kiểm định t có hiệu lực với mẫu lớn mà không có MLR.6 Tương tự cho ước lượng khoảng tin cậy và kiểm định F Quan trọng: MLR.1 – MLR.5 thì vẫn cần thiết, đặc biệt là giả thiết phương sai không đổi Phân tích tiệm cận của phương sai ước lượng OLS Hội tụ tới 5.9 Hội tụ tới Hội tụ tới một số cố định nằm giữa 0 và 1 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Tính tiệm cận của OLS Phân tích tiệm cận của phương sai ước lượng OLS (tt) co lại với tốc độ co lại với tốc độ 5.10 Đây là lý do tại sao mẫu lớn thì tốt hơn Ví dụ 5.2: Sai số chuẩn trong phương trình cân nặng khi sinh Chỉ sử dụng nửa đầu của các quan sát © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 13 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS • Tập tin bwght.wf1 > summary(hoiquy1) Call: lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 4.7185937 0.0182445 258.631 < 2e-16 *** cigs -0.0040816 0.0008582 -4.756 2.18e-06 *** log(faminc) 0.0162657 0.0055833 2.913 0.00363 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1883 on 1385 degrees of freedom Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435 F-statistic: 18.31 on 2 and 1385 DF, p-value: 1.417e-08 > nobs(hoiquy1) [1] 1388 14 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS > summary(hoiquy2) Call: lm(formula = log(bwght) ~ cigs + log(faminc), data = mydata2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 4.705583 0.027053 173.939 < 2e-16 *** cigs -0.004637 0.001332 -3.481 0.000531 *** log(faminc) 0.019404 0.008188 2.370 0.018074 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1961 on 691 degrees of freedom Multiple R-squared: 0.02955, Adjusted R-squared: 0.02674 > nobs(hoiquy2) [1] 694 0.000858/0.001332 = 0.644144 694 / 1388 0.707107 15 15 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Thống kê này phù hợp với mẫu lớn mà không cần giả thiết phân phối chuẩn. • Ta dùng thống kê nhân tử Lagrange (LM) thực hiện kiểm định ràng buộc loại bỏ biến. 5.11 Kiểm định xem liệu q biến cuối có các tham số tổng thể đồng thời bằng 0 hay không 5.12 H1: H0 sai 16 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Thống kê LM chỉ yêu cầu ước lượng mô hình đã gán ràng buộc. • B1) Ta thực hiện hồi quy (k-q biến độc lập) 5.13 B2) Chạy hồi quy phụ: u theo x1, x2,…, xk (tất cả biến độc lập) 5.14 2 ta thu được Ru B3) Tính LM nRu2 B4) Với mức ý nghĩa , tra giá trị tới hạn (q ) có phân phối Chi bình phương với q bậc tự do. 2 Nếu LM > (q ) : bác bỏ H0 2 2 Hoặc: p value P ( ( q ) LM ) p-value < mức ý nghĩa (0,05) : bác bỏ H0 17 17 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • VD 5.3: Mô hình kinh tế của tội phạm H0: β2=0 , β3=0 H1: H0 sai 18 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Tập tin crime1.wf1 > hoiquygh<-lm(narr86 ~ pcnv + ptime86 + qemp86, data=crime1) > hoiquygh Call: lm(formula = narr86 ~ pcnv + ptime86 + qemp86, data = crime1) Coefficients: (Intercept) 0.71177 pcnv -0.14993 ptime86 -0.03442 qemp86 -0.10411 > unga<-resid(hoiquygh) 19 19 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) > hoiquyphu<-lm(unga ~ pcnv + ptime86 + qemp86 + avgsen + tottime, data=crime1) > r2LM<-summary(hoiquyphu)$r.squared > r2LM [1] 0.001493846 •> hoiquyphu nobs(hoiquyphu) [1] 2725 > LM<-r2LM*nobs(hoiquyphu) > LM [1] 4.070729 > print("chi binh phuong voi muc y nghia 10%, bac tu do 2") [1] "chi binh phuong voi muc y nghia 10%, bac tu do 2" > qchisq(1-0.1, 2) [1] 4.60517 > print("p-value") [1] "p-value" > 1-pchisq(LM,2) [1] 0.1306328 20 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • VD 5.3: Mô hình kinh tế của tội phạm LM = 2725*0,001494 = 4,071 Với mức ý nghĩa 10% và bật tự do q = 2 ta có 2 0,1 (2) = 4,61 Ta có LM= 4,071 < 4,61 = 0,1 (2) : chấp nhận H0 Hoặc: p-value = P(2(2) > 4,071) = 0,1306 Ta có p-value = 0,1306 > 0,1 = : chấp nhận H0 2 21 21 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Dùng kiểm định F: > > > > #Load package car library(car) # Kiem dinh F hoiquyf <- lm(narr86 ~ pcnv + ptime86 + qemp86 + avgsen + tottime, data=crime1) > linearHypothesis(hoiquyf, c("avgsen=0", "tottime=0")) Linear hypothesis test Hypothesis: avgsen = 0 tottime = 0 Model 1: restricted model Model 2: narr86 ~ pcnv + ptime86 + qemp86 + avgsen + tottime 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 2721 1927.3 2719 1924.4 2 2.879 2.0339 0.131 p-value = 0,131 > 0,1 : chấp nhận H0 22 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 CÁC KIỂM ĐỊNH KHÁC VỚI MẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) Trong EXCEL: Xác định phân vị 2 ( df ) như sau: =CHIINV(xác suất, bậc tự do) Thí dụ: 2 =CHIINV(0.05,8) cho ta 0,05 (8) = 15.5073 Xác định p-value = P( 2 02 ) bằng công thức: =CHIDIST( 0 , bậc tự do) Thí dụ: =CHIDIST(15.5073, 8) cho kết quả là 2 p-value = P( >15.5073) = 0.05 2 23 23 DÙNG KIỂM ĐỊNH F HAY KIỂM ĐỊNH LM? • Kiểm định F: – Nếu nhiễu u có phân phối chuẩn: Dùng được với cỡ mẫu nhỏ hay lớn – Nếu nhiễu u không có phân phối chuẩn: Chỉ dùng được khi cỡ mẫu lớn • Kiểm định LM: – Không quan tâm nhiễu u có phân phối chuẩn hay không – Chỉ dùng được khi cỡ mẫu lớn 24 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 5 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 LƯU Ý: • Log(x) = ln(x) • Exp(x) = e^x (e mũ x) • 2.1E+05 = 2,1*105 • 4.5E-03 = 4,5*10-3 • Nếu câu hỏi kiểm định cho mức ý nghĩa không thông dụng (3,5%, 7,1%,…) thì nên suy nghĩ dùng phương pháp kiểm định gì. 25 25 Môøi gheù thaêm trang web: 26 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng Chương 6 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG 6.1 Vấn đề đơn vị tính trong hồi quy OLS • bwght : cân nặng của trẻ sơ sinh, đơn vị tính là ounce cigs : số điếu thuốc mà người mẹ hút hàng ngày trong thời gian mang thai faminc : thu nhập của gia đình, đơn vị nghìn đôla Đơn vị đo mới: • bwghtlbs = bwght/16 ; bwghtlbs là cân nặng của em bé với đơn vị pound 1 pound tương ứng 16 ounce • packs = cigs/20 ; packs là số gói thuốc người mẹ hút trong một ngày 1 packs có 20 cigs • fincdol = 1000 faminc ; fincdol là thu nhập của gia đình (usd) faminc là thu nhập của gia đình (ngàn usd) Tập tin bwght.RData 2 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS • • > hoiquy1 <- lm(bwght ~ cigs + faminc, data = bwght) > summary(hoiquy1) Call: lm(formula = bwght ~ cigs + faminc, data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 116.97413 1.04898 111.512 < 2e-16 *** cigs -0.46341 0.09158 -5.060 4.75e-07 *** faminc 0.09276 0.02919 3.178 0.00151 ** --Multiple R-squared: 0.0298, Adjusted R-squared: 0.02 84 > nobs(hoiquy1) [1] 1388 3 3 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS • > hoiquy2 <- lm(bwghtlbs ~ packs + fincdol, data = bwght) > summary(hoiquy2) Call: lm(formula = bwghtlbs ~ packs + fincdol, data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 7.311e+00 6.556e-02 111.512 < 2e-16 packs -5.793e-01 1.145e-01 -5.060 4.75e-07 fincdol 5.798e-06 1.824e-06 3.178 0.00151 --Multiple R-squared: 0.0298, Adjusted R-squared: > nobs(hoiquy2) [1] 1388 *** *** ** 0.0284 4 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy3 <- lm(bwght ~ cigs + log(faminc), data = bwght) > summary(hoiquy3) Call: lm(formula = bwght ~ cigs + log(faminc), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 113.99070 1.94392 58.640 < 2e-16 *** cigs -0.46723 0.09144 -5.110 3.68e-07 *** log(faminc) 1.85072 0.59489 3.111 0.0019 ** --Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811 > nobs(hoiquy3) [1] 1388 5 5 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy4 <- lm(bwght ~ cigs + log(fincdol), data = bwght) > summary(hoiquy4) Call: lm(formula = bwght ~ cigs + log(fincdol), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 101.20641 5.99489 16.882 < 2e-16 cigs -0.46723 0.09144 -5.110 3.68e-07 log(fincdol) 1.85072 0.59489 3.111 0.0019 --Multiple R-squared: 0.02951, Adjusted R-squared: > nobs(hoiquy4) [1] 1388 *** *** ** 0.02811 6 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy7 <- lm(bwght ~ packs + log(faminc), data = bwght) > summary(hoiquy7) Call: lm(formula = bwght ~ packs + log(faminc), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 113.9907 1.9439 58.640 < 2e-16 *** packs -9.3446 1.8288 -5.110 3.68e-07 *** log(faminc) 1.8507 0.5949 3.111 0.0019 ** --Residual standard error: 20.07 on 1385 degrees of freedom Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811 F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10 > nobs(hoiquy7) [1] 1388 7 7 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy8 <- lm(bwghtlbs ~ packs + log(fincdol), data = bwght) > summary(hoiquy8) Call: lm(formula = bwghtlbs ~ packs + log(fincdol), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.32540 0.37468 16.882 < 2e-16 *** packs -0.58403 0.11430 -5.110 3.68e-07 *** log(fincdol) 0.11567 0.03718 3.111 0.0019 ** --Residual standard error: 1.254 on 1385 degrees of freedom Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811 F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10 > nobs(hoiquy8) [1] 1388 8 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy5 <- lm(log(bwght) ~ packs + log(faminc), data = bwght) > summary(hoiquy5) Call: lm(formula = log(bwght) ~ packs + log(faminc), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 4.718594 0.018244 258.631 < 2e-16 *** packs -0.081632 0.017164 -4.756 2.18e-06 *** log(faminc) 0.016266 0.005583 2.913 0.00363 ** --Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435 > nobs(hoiquy5) [1] 1388 9 9 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS > hoiquy6 <- lm(log(bwghtlbs) ~ packs + log(fincdol), data = bwght) > summary(hoiquy6) Call: lm(formula = log(bwghtlbs) ~ packs + log(fincdol), data = bwght) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.833646 0.056265 32.590 < 2e-16 packs -0.081632 0.017164 -4.756 2.18e-06 log(fincdol) 0.016266 0.005583 2.913 0.00363 --Multiple R-squared: 0.02576, Adjusted R-squared: > nobs(hoiquy6) [1] 1388 *** *** ** 0.02435 10 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS Công thức Hàm hồi quy mẫu theo đơn vị đo cũ ŷ ˆ0 ˆ1 x1 ˆ2 x2 Hàm hồi quy mẫu theo đơn vị đo mới ŷ * ˆ0* ˆ1* x1* ˆ2* x2* Với y* k0 y ; x1* k1 x1 ; x2* k2 x2 ˆ0* k0 ˆ0 ; ˆ1* k0 ˆ ˆ * k0 ˆ 1 ; 2 2 k1 k2 11 11 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.1 Vấn đề đơn vị tính trong hồi quy OLS Nhận xét * Biến gốc Khi thay đổi đơn vị đo của biến phụ thuộc và các biến độc lập, ta thấy: Không bị thay đổi: Cột t-Statistic, cột Prob, R-squared, F-statistic, Prob(F-statistic) Bị thay đổi: Cột Coefficient, cột Std. Error, S.E. of regression, Sum squared resid Các mục còn lại tự nghiên cứu tiếp. * Biến có lấy log • Log chỉ biến phụ thuộc • Log chỉ biến độc lập • Log cả biến phụ thuộc và biến độc lập Tự rút ra nhận xét. 12 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Bàn thêm về dạng hàm logarit Bài tập: y: chi tiêu của gia đình (triệu đ) x1: thu nhập của vợ (USD) x2: số năm đi học của vợ (năm) x3: thu nhập của chồng (triệu đ) Các hệ số hồi quy (ở từng mô hình) sẽ thay đổi như thế nào nếu đơn vị của các biến là: y*: chi tiêu của gia đình (trăm ngàn đ) x1* : thu nhập của vợ (trăm USD) x2*: số năm đi học của vợ (tháng) x3*: thu nhập của chồng (USD) ; 1 USD = 20 ngàn đ 13 13 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Bàn thêm về dạng hàm logarit (bài tập tt) Xét mô hình 1: y 0 1 x1 2 x2 3 log( x3 ) u Xét mô hình 2: log( y ) 0 1 x1 2 x2 3 x3 u Xét mô hình 3: log( y ) 0 1 log( x1 ) 2 x2 3 x3 u 14 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng 6.2 Bàn thêm về dạng hàm hồi quy Bàn thêm về dạng hàm logarit Thuận lợi khi giải thích bằng tỷ lệ phần trăm/ hệ số co giãn Hệ số góc của các biến lấy log là bất biến đối với thay đổi tỷ lệ Lấy log thường loại bỏ / giảm nhẹ vấn đề các giá trị bất thường Lấy log thường giúp bảo đảm tính chuẩn và phương sai không đổi Các biến sử dụng đơn vị đo lường như năm thì không nên lấy log Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy log Log không được sử dụng nếu biến có giá trị 0 hoặc âm Có khó khăn khi lấy toán tử ngược của log trong dự đoán © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 15 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG Sự khác nhau giữa điểm phần trăm (percentage point) và phần trăm (percent) Điểm phần trăm là đơn vị đo khác biệt số học của hai trị số phần trăm. Ví dụ 1: Tỷ lệ sản xuất CN năm 2000 là 40%, năm 2001 là 44%. Tỷ lệ sản xuất CN năm 2001 tăng so với 2000 là 4 điểm phần trăm, nhưng là tăng 44 40 0,1 1 0 % . 40 Ví dụ 2: Năm 1980 có 50% dân số hút thuốc, năm 1990 có 40%. Từ 1980 đến 1990, tỷ lệ hút thuốc giảm 10 điểm phần trăm, nhưng là giảm 50 40 0, 2 20% 50 16 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Bàn thêm về dạng hàm logarit : Khi nào có thể xem 2.43 như 6.9 ? %y (100. 2 ) x2 2.43 giả sử β2^ >0 Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*β2^ (%) Cách khác: Cố định x1 , ta có: 6.8 Suy ra: thì 6.9 Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*[exp(β2^)-1] (%) 17 17 Phân tích hồi quy bội: Một số vấn đề mở rộng Sử dụng dạng hàm bậc 2 Dạng hàm lõm Ví dụ: Phương trình lương 6.12 Số năm kinh nghiệm tăng lên 1 năm (từ 0 lên 1) thì lương tăng là 0,298 $, Số năm kinh nghiệm tăng lên 1 năm (từ 1 lên 2) thì lương tăng là 0,298-2(0,0061)(1) = 0,286 $ ... Tác động biên 6.10 6.11 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng Cực đại của lương tương ứng với số năm kinh nghiệm 6.13 Liệu điều này có nghĩa là số năm kinh nghiệm nhiều hơn 24,4 năm trở nên tiêu cực? Không hợp lý Không nhất thiết là như vậy. Điều đó phụ thuộc vào có bao nhiêu quan sát trong mẫu nằm bên phải điểm cực đại. Trong ví dụ trên, có khoảng 28% các quan sát nằm bên phải. Có thể có một vấn đề lỗi chỉ định mô hình (ví dụ biến bị bỏ sót, dạng hàm sai...). © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Phân tích hồi quy bội: Một số vấn đề mở rộng Nitơ oxit trong không khí, khoảng cách từ trung tâm việc làm, tỷ lệ sinh viên/giáo viên Ví dụ 6.2: Ảnh hưởng của ô nhiễm tới giá nhà đất Điều này có nghĩa rằng, ở một số ít các phòng, nhiều phòng có liên quan với giá thấp hơn? log( price) 0,545 2(0,062)rooms rooms © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng Tính toán điểm cực tiểu -54.5+12.4*5 Điểm cực tiểu: Diện tích này có thể bỏ qua vì nó liên quan đến chỉ có 1% các quan sát. Gia tăng số phòng từ 5 lên 6 thì giá tăng: = -54,5+12,4*5 = +7,5% Không hợp lý Gia tăng số phòng từ 6 lên 7 thì giá tăng: = -54,5+12,4*6 = +19,9% © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 21 Phân tích hồi quy bội: Một số vấn đề mở rộng Khả năng khác 6.15 6.16 Đa thức bậc cao hơn cost = (β1 + 2β2 quantity + 3β3 quantity2).quantity © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng Mô hình với các số hạng tương tác price 0 1sqrft 2bdrms Số hạng tương tác 3 sqrft.bdrms 4bthrms u price 2 3 sqrft bdrms Tác động của số phòng ngủ phụ thuộc vào diện tích 6.17 Việc giải thích các tham số khá phức tạp khi có tác động tương tác Tác động của số phòng ngủ, nhưng ứng với diện tích là 0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 23 Phân tích hồi quy bội: Một số vấn đề mở rộng Xác định lại tham số của tác động tương tác Trung bình tổng thể; có thể được thay thế bởi trung bình mẫu Tác động của x2 nếu tất cả các biến cố định tại giá trị trung bình Lợi ích của việc xác định lại các tham số Dễ dàng giải thích tất cả các tham số Sai số chuẩn được tính cho các tác động riêng phần tại giá trị trung bình. Nếu cần thiết, giá trị μ1 và μ2 có thể được thay thế bằng một giá trị khác cần quan tâm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng 6.3 Bàn thêm về độ phù hợp và vấn đề lựa chọn biến độc lập Nhận xét chung về R2 Một R2 cao không ngụ ý rằng có một quan hệ nhân quả Một R2 thấp không loại trừ tính hiệu quả của các tác động riêng phần R2 hiệu chỉnh (Adjusted R-squared): R2 thông thường được định nghĩa là gì? là 1 ước lượng của 6.20 R2 tổng thể © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 25 Phân tích hồi quy bội: Một số vấn đề mở rộng R2 hiệu chỉnh (tt) Bậc tự do đúng của tử số và mẫu số là Một ước lượng tốt hơn có xét đến bậc tự do sẽ là 6.21 R2 hiệu chỉnh có tính đến hệ quả của việc thêm các biến độc lập mới R2 hiệu chỉnh tăng nếu và chỉ nếu thống kê t (F) của một (một số ) biến độc lập mới được thêm vào có trị tuyệt đối lớn hơn 1 Mối liên hệ giữa R2 và R2 hiệu chỉnh 6.22 Ví dụ: R2 hiệu chỉnh có thể lấy giá trị âm R 2 0,1, n 51, k 10 R 2 0,125 0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG Tóm lại: SSR là hàm giảm theo số biến độc lập trong mô hình SST không phụ thuộc vào số biến độc lập trong mô hình R2 là hàm tăng theo số biến độc lập trong mô hình R 2 không là hàm tăng theo số biến độc lập trong mô hình Nếu số tham số (k+1) > 1 thì R 2 R 2 1 Nếu số tham số càng lớn thì R 2 càng nhỏ hơn R2 Ta cần xem xét có nên đánh đổi giữa việc thêm biến độc lập vào mô hình để R2 tăng và những bất lợi có thể có khi thêm biến độc lập. 27 27 Phân tích hồi quy bội: Một số vấn đề mở rộng Sử dụng R2 hiệu chỉnh để chọn lựa giữa các mô hình không lồng nhau Các mô hình được gọi là không lồng nhau nếu cái này không phải là trường hợp đặc biệt của cái kia 6.23 6.24 Việc so sánh R2 của hai mô hình sẽ là không công bằng với mô hình đầu tiên bởi vì mô hình đầu tiên chứa ít tham số hơn Trong ví dụ trên, ngay cả sau khi đã điều chỉnh cho sự khác biệt về bậc tự do (dùng R2 hiệu chỉnh), mô hình bậc hai vẫn được ưa thích hơn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng So sánh các mô hình với biến phụ thuộc có dạng khác nhau R2 hoặc R2 hiệu chỉnh không được sử dụng để so sánh các mô hình mà chúng có dạng hàm của biến phụ thuộc khác nhau Ví dụ 6.4: Mức đãi ngộ đối với CEO và hiệu quả doanh nghiệp 6.25 log(salary) biến thiên ít hơn so với salary (xem TSS) 6.26 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 29 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG Lựa chọn giữa các mô hình: Có các tiêu chuẩn lựa chọn mô hình trong R như sau: • Các tiêu chuẩn sau càng lớn càng tốt – R2 hiệu chỉnh • Các tiêu chuẩn sau càng nhỏ càng tốt – Akaike information criterion (AIC) – Bayesian information criterion (BIC) – Cp của Mallows (Cp) • Điều kiện sử dụng các tiêu chuẩn này: – Cùng dạng hàm của biến phụ thuộc – Cùng cỡ mẫu 30 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Lựa chọn giữa các mô hình: • Tiêu chuẩn AIC và BIC > load("E:/# Slide Viet 2019-01/Chuong 6/bwght.RData") > bwght_data <- na.omit(data) > names(bwght_data) [1] "faminc" "cigtax" "cigprice" "bwght" "fatheduc" "motheduc" "parity" "male" "white" [10] "cigs" "lbwght" "bwghtlbs" "packs" "lfaminc" > bwght_data1 <- bwght[, -c(11:14)] > names(bwght_data1) [1] "faminc" "cigtax" "cigprice" "bwght" "fatheduc" "motheduc" "parity" "male" "white" [10] "cigs" > attach(bwght_data1) The following object is masked _by_ .GlobalEnv: bwght > rest_model <- lm(bwght ~faminc+cigtax, data=bwght_data1) > AIC(rest_model) [1] 10529.48 > BIC(rest_model) [1] 10549.81 31 31 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Lựa chọn giữa các mô hình: • Tiêu chuẩn Cp (cách 1) > install.packages("olsrr") > library(olsrr) Attaching package: ‘olsrr’ The following object is masked from ‘package:datasets’: rivers > full_modelfull <- lm(bwght ~ faminc+cigtax+cigprice+fatheduc, data=bwght_data1) > rest_model <-lm(bwght ~faminc+cigtax, data=bwght_data1) > ols_mallows_cp(rest_model, full_modelfull) [1] 4.079621 rest_model là mô hình lồng trong mô hình full_modelfull 32 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • Lựa chọn giữa các mô hình: • Tiêu chuẩn Cp (cách 1) • > full_model1 <- lm(bwght ~ ., data = bwght_data1) > rest_model <- lm(bwght ~ faminc+cigtax, data = bwght_data1) > ols_mallows_cp(rest_model, full_model1) [1] 54.61653 Minh họa Tuyến tính Tuyến tính-log AIC 0,5 0,51 BIC 0,47 0,46 Cp 2,1 1,9 R2 hiệu 0,73 0,68 chỉnh Hồi quy qua gốc tọa độ 0,63 0,56 1,7 0,72 Dạng hàm bậc 2 0,72 0,78 1,2 0,85 Chọn mô hình Tuyến tính Tuyến tính-log Dạng hàm bậc 2 Dạng hàm bậc 2 33 33 Phân tích hồi quy bội: Một số vấn đề mở rộng Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy Trong một số trường hợp, một số biến không nên kiểm soát trong mô hình Trong hồi quy của tử vong do giao thông (fatalities) theo thuế bia của bang (tax) (và các yếu tố khác như miles – tổng số dặm đã lái xe , percmale – phần trăm nam giới trong dân số,...) không nên kiểm soát trực tiếp (đưa biến vào mô hình) lượng bia tiêu thụ trên đầu người (beercons) giữa các địa phương fatalities = 0+ 1 tax+ 2 miles+ 3 percmale +… Trong hồi quy của chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của nông dân không nên kiểm soát số lần đi khám bác sĩ Chi phí sức khỏe bao gồm số lần khám bệnh, và chúng ta chỉ muốn đo lường toàn bộ tác động của việc sử dụng thuốc trừ sâu lên chi phí y tế gia đình © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau Trong hồi quy giá nhà - log(price) theo các đặc điểm của ngôi nhà như log(lotsize), log(sqrft), bdrms ... chúng ta cần thêm biến định giá – log(assess) của giá nhà nếu mục đích của hồi quy là nghiên cứu sự hợp lý của của việc định giá; nếu không thì ta sẽ không thêm biến định giá vào © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 35 Phân tích hồi quy bội: Một số vấn đề mở rộng Thêm biến độc lập để giảm phương sai của nhiễu Việc thêm biến độc lập có thể làm trầm trọng thêm vấn đề đa cộng tuyến Mặt khác, việc thêm biến độc lập làm giảm phương sai của nhiễu Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì chúng làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến Tuy nhiên, các biến không tương quan như vậy rất khó tìm thấy Ví dụ: lượng bia tiêu thụ của mỗi cá nhân và giá bia Việc bao gồm các đặc điểm cá nhân trong hồi quy lượng bia tiêu thụ theo giá bia dẫn đến ước lượng hệ số co giãn của lượng cầu bia theo giá bia “chính xác” hơn Giả định hợp lý là đặc điểm cá nhân (tuổi, số năm đi học,…) không tương quan với giá bia © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Dự đoán điểm cho giá trị trung bình và giá trị cá biệt (cụ thể) 6.27 Giả sử c1, c2,…, ck là giá trị cụ thể của x1, x2,…, xk Dự đoán (ước lượng) điểm của giá trị trung bình E(y/x1=c1,…,xk=ck) hay giá trị cá biệt y0 là: y0 ^ = 6.29 37 37 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán • VD 6.5: Khoảng tin cậy dự đoán điểm trung bình GPA đại học 6.32 Dự đoán trung bình GPA đại học khi sat= 1200, hsperc= 30, hsize= 5? Dự đoán điểm: 0^= y0^= 1.493 + 0.00149*1200 - 0.01386*30 - 0.06088*5 + 0.00546*52 = 2.70 hsperc: phân vị trung học, từ trên xuống (xếp hạng của sv tại trường trung học) 38 hsize: quy mô lớp tốt nghiệp 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Dự đoán khoảng cho giá trị trung bình Thay vào hồi quy trên Ta được: 6.30 Tức là ta chạy hồi quy y theo hệ số chặn, (x1-c1), (x2-c2),…, (xk-ck) 6.31 Giá trị dự đoán và sai số chuẩn của 0^ dễ dàng tìm được thông qua hệ số chặn của hàm hồi quy (6.31) Khoảng tin cậy dự đoán 1- của giá trị trung bình là: 0^ t/2(n-k-1)*se(0^) 39 39 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Đặt sat0= sat-1200, hsperc0= hsperc-30, hsize0= hsize-5, hsizesq0= hsize2-25 Khoảng tin cậy dự đoán 95% cho điểm trung bình GPA đại học là: 2.70 1.96*0.02 hay (2.66 ; 2.74) 40 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Tập tin gpa2.wf1 > hoiquy <- lm(colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2) > summary(hoiquy) Call: lm(formula = colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.493e+00 7.534e-02 19.812 < 2e-16 *** sat 1.492e-03 6.521e-05 22.886 < 2e-16 *** hsperc -1.386e-02 5.610e-04 -24.698 < 2e-16 *** hsize -6.088e-02 1.650e-02 -3.690 0.000228 *** I(hsize^2) 5.460e-03 2.270e-03 2.406 0.016191 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.5599 on 4132 degrees of freedom Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774 > nobs(hoiquy) [1] 4137 41 41 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Tập tin gpa2.wf1 > # hoi quy du bao > hoiquy1 <- lm(colgpa ~ I(sat-1200) + I(hsperc-30) + I(hsize-5) + I(hsize^2-25), data = gpa2) > summary(hoiquy1) Call: lm(formula = colgpa ~ I(sat - 1200) + I(hsperc - 30) + I(hsize - 5) + I(hsize^2 - 25), data = gpa2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.700e+00 1.988e-02 135.833 < 2e-16 *** I(sat - 1200) 1.492e-03 6.521e-05 22.886 < 2e-16 *** I(hsperc - 30) -1.386e-02 5.610e-04 -24.698 < 2e-16 *** I(hsize - 5) -6.088e-02 1.650e-02 -3.690 0.000228 *** I(hsize^2 - 25) 5.460e-03 2.270e-03 2.406 0.016191 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.5599 on 4132 degrees of freedom Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774 > nobs(hoiquy1) [1] 4137 42 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Khoảng tin cậy dự đoán của giá trị cá biệt y0 6.33 Sai số dự đoán là: 6.34 Phương sai của sai số dự đoán: 6.35 Sai số chuẩn: 6.36 Khoảng tin cậy dự đoán 1- của dự đoán giá trị cá biệt y0 là: y0^ t/2(n-k-1)*se(e0^) 6.37 43 43 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán • VD 6.5 Khoảng tin cậy dự đoán điểm cá biệt GPA đại học Ta có: ; = 0.5604 Khoảng tin cậy dự đoán 95% của điểm GPA từng học sinh cụ thể : 2.70 1.96*0.5604 hay (1.6016 đến 3.7984) 44 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG • 6.4 Phân tích về dự đoán và sai số dự đoán Tập tin gpa2.wf1 > # du bao diem > cvalues <- data.frame(sat=1200, hsperc=30, hsize=5) > predict(hoiquy,cvalues) 1 2.700075 > # du bao khoang cho gia tri trung binh > predict(hoiquy,cvalues, interval = "confidence", level = 0.95) fit lwr upr 1 2.700075 2.661104 2.739047 > # du bao khoang cho gia tri ca biet > predict(hoiquy,cvalues, interval = "prediction", level = 0.95) fit lwr upr 1 2.700075 1.601749 3.798402 45 45 Phân tích hồi quy bội: Một số vấn đề mở rộng Dự đoán y khi biến phụ thuộc là log(y) 6.38 * yˆ exp(log( y )). exp(ˆ 2 / 2) * Dưới giả định là 6.40 Cần điều kiện u có phân phối chuẩn N(0,2) độc lập với : 1 n yˆ exp(log( y )). exp(uˆi ) n i 1 Dự đoán của y u không có phân phối chuẩn 6.42-6.43 Không cần điều kiện u có phân phối chuẩn © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Phân tích hồi quy bội: Một số vấn đề mở rộng So sánh R2 của mô hình có log và không có log ở biến phụ thuộc VD 6.7 và 6.8 6.47 Log(mktval) 6.45 Đây là các R2 cho dự đoán của biến salary không có log (mặc dù hồi quy thứ hai nguyên gốc là log(salary). Bây giờ có thể so sánh trực tiếp hai R2. R2~ = r(y, y^)2, với y^ tính theo công thức (6.40) hoặc (6.42-6.43) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 47 PHÂN TÍCH HỒI QUY BỘI: MỘT SỐ VẤN ĐỀ MỞ RỘNG Chọn lựa dạng hàm y hoặc lny theo BoxCox Y = a+bX lnY = c+dX Cỡ mẫu là n 1) Tính trung bình hình học Y G n Y1 ... Yn 2) Tính Y * Y YG 3) Chạy hồi quy Y* = a+bX SSRY Chạy hồi quy lnY* = c+dX SSRlnY n 4) Tính BoxCox .ln(SSRlớn/SSRnhỏ) 2 5) H0: 2 mô hình tốt như nhau ; H1: H0 sai Quy tắc bác bỏ: BoxCox 2 (1) : bác bỏ H0 Mô hình nào có SSR nhỏ hơn sẽ tốt hơn 48 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 6 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 06.08.2021 Môøi gheù thaêm trang web: 49 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 49 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội với biến định tính Chương 7 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Phân tích hồi quy bội: Biến định tính 7.1 Mô tả thông tin định tính Ví dụ: giới tính, chủng tộc, công nghiệp, khu vực, đánh giá cấp độ, ... Một cách để kết hợp thông tin định tính là sử dụng biến giả Chúng có thể xuất hiện như là biến phụ thuộc hay biến độc lập 7.2 Trường hợp đơn giản: Có một biến độc lập là biến giả 7.1 = mức lương thu được/mất đi nếu người này là nữ chứ không phải là nam (các yếu tố khác giữ cố định) Biến giả: =1 nếu là nữ =0 nếu là nam Câu hỏi: Tại sao chọn số 0 và 1 ??? © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH 3 3 Phân tích hồi quy bội: Biến định tính Đồ thị minh họa Cách giải thích khác của hệ số: 7.2 nghĩa là, sự khác biệt về mức lương trung bình giữa nam và nữ có cùng một trình độ giáo dục (nữ so với nam). female=0 : nhóm cơ sở (tham chiếu) Cùng hệ số góc, khác tung độ gốc © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Bẫy biến giả Mô hình này không thể ước lượng được (đa cộng tuyến hoàn hảo do Male + female = 1 (hệ số chặn)) Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ: Nhóm cơ sở là nam Nhóm cơ sở là nữ Ngoài ra, có thể bỏ qua tung độ gốc: Nhược điểm: 1) Khó khăn hơn để kiểm định sự khác biệt giữa các tham số 2) Công thức R2 chỉ có ý nghĩa nếu hồi quy có tung độ gốc © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5 Phân tích hồi quy bội: Biến định tính VD 7.1: Ước lượng phương trình tiền lương với sự khác biệt về hệ số chặn 7.4 Cố định các biến giáo dục, kinh nghiệm, và thâm niên chức vụ, tiền lương trung bình của nữ ít hơn nam là 1,81 USD/giờ Điều đó có nghĩa rằng có sự phân biệt đối xử với nữ giới? Không hẳn vậy. Bởi vì yếu tố giới tính nữ có thể tương quan với các đặc điểm lao động khác chưa được kiểm soát. H0: female = 0 ; H1: female ≠ 0 Xét xem yếu tố giới tính có ảnh hưởng đến lương không © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính So sánh trung bình của các tổng thể con được mô tả bằng biến giả 7.5 Thảo luận Trong điều kiện không kiểm soát các yếu tố khác, tiền lương trung bình của nữ ít hơn nam là 2,51 USD/giờ; nghĩa là, sự khác biệt giữa mức lương trung bình của nam và nữ là 2,51 USD/giờ. Có thể dễ dàng kiểm định sự chênh lệch trung bình giữa hai tổng thể con có ý nghĩa thống kê hay không (|t|= 9.65). Sự khác biệt về mức lương giữa nam và nữ sẽ lớn hơn nếu không kiểm soát các yếu tố khác; nghĩa là một phần của sự khác biệt là do sự khác nhau trong giáo dục, kinh nghiệm và thâm niên chức vụ giữa nam và nữ. Số 1.81 trong (7.4) nhỏ hơn 2.51 trong (7.5). © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7 Phân tích hồi quy bội: Biến định tính Ví dụ 7.3: Ảnh hưởng của trợ cấp đào tạo lên số giờ đào tạo Giờ đào tạo mỗi nhân viên Biến giả biểu thị công ty có nhận trợ cấp đào tạo nghề hay không 7.7 Đây là một ví dụ về đánh giá chương trình nhóm tác động (= có nhận trợ cấp) so với nhóm đối chứng (= không có nhận trợ cấp). Nhóm đối chứng còn gọi là nhóm kiểm soát. Liệu có phải tác động của chương trình đến biến phụ thuộc là quan hệ nhân quả? © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Sử dụng biến độc lập là biến giả trong phương trình log(y) VD 7.4: Hàm hồi quy giá nhà 7.8 Biến giả biểu thị ngôi nhà kiểu colonial colonial = 1 nếu ngôi nhà có phong cách thuộc địa Nhà có phong cách thuộc địa có giá cao hơn nhà có phong cách khác là 5,4 (%) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9 Phân tích hồi quy bội: Biến định tính 7.3 Sử dụng biến giả cho trường hợp biến định tính có nhiều lựa chọn 1) Xác định thành phần trong mỗi nhóm bằng một biến giả 2) Bỏ ra một nhóm (nhóm này sẽ trở thành nhóm cơ sở) Câu hỏi: Nên dùng bao nhiêu biến giả? VD 7.6: Phương trình log tiền lương theo giờ 7.11 Giữ những yếu tố khác cố định, tiền lương trung bình của nữ đã kết hôn ít hơn nam độc thân (= nhóm cơ sở) là 19,8% Giữ những yếu tố khác cố định, tiền lương trung bình của nam đã kết hôn nhiều hơn nam độc thân là 21,3% © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH Dùng bao nhiêu biến giả là đủ? A) Biến định tính có nhiều thuộc tính 1) Giới tính (nữ, nam), dùng 2-1 = 1 biến giả nu (nu=1: nữ) Nhóm cơ sở là: nam 2) Giới tính (nữ, nam, hifi), dùng 3-1 = 2 biến giả nu (nu=1: nữ) nam (nam=1: nam) Nhóm cơ sở là: hifi 11 11 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH B) Tương tác giữa các biến giả 1) Các biến giả có 2 thuộc tính Giới tính (nữ, nam) Tình trạng hôn nhân (có gia đình, độc thân) Kết hợp giới tính và tình trạng hôn nhân: 2*2 = 4 trường hợp, dùng 4-1 = 3 biến giả nu*cogd: nữ và có gia đình nu*docthan: nữ và độc thân nam*cogd: nam và có gia đình Nhóm cơ sở là: nam*docthan 12 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH B) Tương tác giữa các biến giả 2) Các biến giả có 2, 3 thuộc tính Giới tính (nữ, nam) Chủng tộc (da trắng, da vàng, da đen) Kết hợp Giới tính và Chủng tộc: 2*3 = 6 trường hợp, dùng 6-1 = 5 biến giả Nu*datrang: nữ và da trắng Nu*davang: nữ và da vàng Nu*daden: nữ và da đen Nam*datrang: nam và da trắng Nam*davang : nam và da vàng Nhóm cơ sở là: nam*daden 13 13 Phân tích hồi quy bội: Biến định tính Sử dụng biến giả cho trường hợp biến thứ bậc Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị Lãi suất trái phiếu đô thị Xếp hạng tín dụng từ 0-4 (0=tệ, 4=rất tốt) Mô tả này có lẽ không phù hợp nếu như xếp hạng tín dụng chỉ chứa thông tin thứ bậc. Một cách tốt hơn để đưa thông tin thứ bậc này vào hồi quy là sử dụng nhiều biến giả: 7.12 Các biến giả được đặt tương ứng với các mức xếp hạng tín dụng. Nghĩa là, CR1 = 1 nếu CR = 1 và CR1 = 0 cho các trường hợp khác. Tất cả các tác động được so sánh với mức xếp hạng tệ nhất (= nhóm cơ sở). © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH Lưu ý: • log(wage) = 0 + 0female + 1married + 2female.married +…+u 7.14 • H0: 2=0 ; H1: 2≠0 • Kiểm tra xem tác động của giới tính lên tiền lương có phụ thuộc vào tình trạng hôn nhân không. • Kiểm tra xem tác động của tình trạng hôn nhân lên tiền lương có phụ thuộc vào giới tính không. 15 15 Phân tích hồi quy bội: Biến định tính 7.4 Thành phần tương tác có biến giả Thành phần tương tác Cho phép hệ số góc khác nhau giữa các nhóm 7.17 = hệ số chặn của nam = hệ số góc của nam = hệ số chặn của nữ = hệ số góc của nữ Giả thuyết quan tâm H1: H0 sai Tác động của học vấn là như nhau giữa nam và nữ. Mức chênh lệch tiền lương giữa nữ và nam là như nhau ở mọi mức học vấn. Tiền lương là như nhau giữa nam và nữ, có cùng mức học vấn. Hay yếu tố giới tính không ảnh hưởng đến tiền lương © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Đồ thị minh họa Việc sử dụng vừa biến giả vừa biến tương tác cho phép hai phương trình tiền lương hoàn toàn khác nhau giữa nam và nữ Khác hệ số góc, khác tung độ gốc © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 17 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin wage1.wf1 > # Khac tung do goc > hoiquy1 <- lm(wage ~ female + educ, data = wage1) > summary(hoiquy1) Call: lm(formula = wage ~ female + educ, data = wage1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.62282 0.67253 0.926 0.355 female -2.27336 0.27904 -8.147 2.76e-15 *** educ 0.50645 0.05039 10.051 < 2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.186 on 523 degrees of freedom Multiple R-squared: 0.2588, Adjusted R-squared: 0.256 F-statistic: 91.32 on 2 and 523 DF, p-value: < 2.2e-16 18 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin wage1.wf1 • wage = 0 + 1educ + 0female.educ + u • H0: 0 = 0 ; H1: 0 ≠ 0 khác hệ số góc Xét xem yếu tố giới tính có ảnh hưởng đến lương không > # Khac he so goc > hoiquy2 <- lm(wage ~ educ + female:educ, data = wage1) > summary(hoiquy2) Call: lm(formula = wage ~ educ + female:educ, data = wage1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.28526 0.65041 -0.439 0.661 educ 0.57548 0.05039 11.421 < 2e-16 *** educ:female -0.17764 0.02183 -8.138 2.95e-15 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.186 on 523 degrees of freedom Multiple R-squared: 0.2586, Adjusted R-squared: 0.2558 F-statistic: 91.23 on 2 and 523 DF, p-value: < 2.2e-16 19 19 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin wage1.wf1 > # Khac tung do goc va he so goc > hoiquy3 <- lm(wage ~ female + educ + female:educ, data = wage1) > summary(hoiquy3) Call: lm(formula = wage ~ female + educ + female:educ, data = wage1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.20050 0.84356 0.238 0.812 female -1.19852 1.32504 -0.905 0.366 educ 0.53948 0.06422 8.400 4.24e-16 *** female:educ -0.08600 0.10364 -0.830 0.407 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.186 on 522 degrees of freedom Multiple R-squared: 0.2598, Adjusted R-squared: 0.2555 F-statistic: 61.07 on 3 and 522 DF, p-value: < 2.2e-16 20 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH Cách thay đổi hệ số góc và tung độ gốc 1) Mô hình hồi quy: y 0 1 x u Biến giả biểu thị nơi sống: urban = 1 : thành thị Thay đổi tung độ gốc: y 0 1 x 0urban u H 0 : 0 0 ; H1 : 0 0 (Yếu tố nơi sống không ảnh hưởng lên y) Thay đổi hệ số góc: y 0 1 x 0urban.x u H 0 : 0 0 ; H1 : 0 0 (Yếu tố nơi sống không ảnh hưởng lên y) Thay đổi tung độ gốc và hệ số góc: y 0 1 x 0urban 1urban.x u H 0 : 0 0, 1 0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y) 21 21 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH Cách thay đổi hệ số góc và tung độ gốc 2) Mô hình hồi quy: y 0 1 x1 2 x2 u Biến giả biểu thị nơi sống: urban = 1 : thành thị Thay đổi tung độ gốc: y 0 1 x1 2 x2 0urban u H 0 : 0 0 ; H1 : 0 0 (Yếu tố nơi sống không ảnh hưởng lên y) Thay đổi hệ số góc: y 0 1 x1 2 x2 0urban.x1 1urban.x2 u H 0 : 0 0, 1 0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y) Thay đổi tung độ gốc và hệ số góc: y 0 1 x1 2 x2 0urban 1urban.x1 2urban.x2 u H 0 : 0 0, 1 0, 2 0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y) 22 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Ước lượng phương trình lương với thành phần tương tác VD 7.10: phương trình log tiền lương theo giờ 7.18 Không có bằng chứng thống kê chống lại giả thuyết rằng tác động học vấn là như nhau cho nam và nữ (thống kê |t|= 0.43) Liệu điều này có hàm ý rằng khi có cùng trình độ học vấn, số năm kinh nghiệm, và thâm niên chức vụ, thì không có bằng chứng thống kê cho thấy tiền lương của nữ sẽ thấp hơn nam (|t|= 1.35)? Không: đây chỉ là tác động khi educ= 0. Để trả lời câu hỏi này, người ta phải quy tâm thành phần tương tác, ví dụ xét educ = 12,5 (= mức học vấn trung bình). © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 23 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin wage1.wf1 > hoiquya <- lm(log(wage) ~ female + educ + female:educ + exper + I(exper^2) + tenure + I(tenure^2), data = wage1) > summary(hoiquya) Call: lm(formula = log(wage) ~ female + educ + female:educ + exper + I(exper^2) + tenure + I(tenure^2), data = wage1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.3888060 0.1186871 3.276 0.00112 ** female -0.2267886 0.1675394 -1.354 0.17644 educ 0.0823692 0.0084699 9.725 < 2e-16 *** exper 0.0293366 0.0049842 5.886 7.11e-09 *** I(exper^2) -0.0005804 0.0001075 -5.398 1.03e-07 *** tenure 0.0318967 0.0068640 4.647 4.28e-06 *** I(tenure^2) -0.0005900 0.0002352 -2.509 0.01242 * female:educ -0.0055645 0.0130618 -0.426 0.67028 --Residual standard error: 0.4001 on 518 degrees of freedom Multiple R-squared: 0.441, Adjusted R-squared: 0.4334 24 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > library(car) > # Kiem dinh F > linearHypothesis(hoiquya, c("female=0", "female:educ=0")) Linear hypothesis test Hypothesis: female = 0 female:educ = 0 Model 1: restricted model Model 2: log(wage) ~ female + educ + female:educ + exper + I(exper^2) + tenure + I(tenure^2) 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 520 93.911 518 82.922 2 10.99 34.325 1.002e-14 *** p-value = 1,002*10-14 < 0,05 : bác bỏ H0 25 25 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > hoiquyb <- lm(log(wage) ~ female + educ + female:I(educ-12.5) + exper + I(exper^2) + tenure + I(tenure^2), data = wage1) > summary(hoiquyb) Call: lm(formula = log(wage) ~ female + educ + female:I(educ - 12.5) + exper + I(exper^2) + tenure + I(tenure^2), data = wage1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.3888060 0.1186871 3.276 0.00112 female -0.2963450 0.0358358 -8.270 1.14e-15 educ 0.0823692 0.0084699 9.725 < 2e-16 exper 0.0293366 0.0049842 5.886 7.11e-09 I(exper^2) -0.0005804 0.0001075 -5.398 1.03e-07 tenure 0.0318967 0.0068640 4.647 4.28e-06 I(tenure^2) -0.0005900 0.0002352 -2.509 0.01242 female:I(educ - 12.5) -0.0055645 0.0130618 -0.426 0.67028 --Residual standard error: 0.4001 on 518 degrees of freedom Multiple R-squared: 0.441, Adjusted R-squared: 0.4334 ** *** *** *** *** *** * 26 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (phương pháp biến giả) Mô hình chưa gán ràng buộc (chứa toàn bộ các thành phần tương tác) Điểm trung bình đánh giá (GPA) Xếp hạng của sinh viên tại trường trung học điểm thi SAT 7.20 Tổng số giờ học chính khóa Mô hình đã gán ràng buộc (R) (hàm hồi quy giống nhau cho cả 2 nhóm) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 27 Phân tích hồi quy bội: Biến định tính Giả thuyết không H0: Hàm hồi quy giống nhau cho cả 2 nhóm 7.21 Tất cả tác động của thành phần tương tác là bằng 0, nghĩa là, các hệ số hồi quy giống nhau cho cả nam và nữ. Không có sự chênh lệch về hệ số chặn và hệ số góc trong hồi quy của nữ và nam. Ước lượng mô hình chưa gán ràng buộc (UR) 7.22 Kiểm định riêng lẻ từng hệ số của từng thành phần tương tác, giả thuyết cho rằng tác động của thành phần tương tác bằng 0 không thể bị bác bỏ © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin gpa3.wf1 > # mo hinh UR > hoiquy1 <- lm(cumgpa ~ female + sat + female:sat + hsperc + female:hsperc + tothrs + female:tothrs, data = gpa3, subset=(spring==1)) > summary(hoiquy1) Call: lm(formula = cumgpa ~ female + sat + female:sat + hsperc + female:hsperc + tothrs + female:tothrs, data = gpa3, subset = (spring == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4808117 0.2073336 7.142 5.17e-12 *** female -0.3534862 0.4105293 -0.861 0.38979 sat 0.0010516 0.0001811 5.807 1.40e-08 *** hsperc -0.0084516 0.0013704 -6.167 1.88e-09 *** tothrs 0.0023441 0.0008624 2.718 0.00688 ** female:sat 0.0007506 0.0003852 1.949 0.05211 . female:hsperc -0.0005498 0.0031617 -0.174 0.86206 female:tothrs -0.0001158 0.0016277 -0.071 0.94331 --Residual standard error: 0.4678 on 358 degrees of freedom Multiple R-squared: 0.4059, Adjusted R-squared: 0.3943 29 29 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin gpa3.wf1 > nobs(hoiquy1) [1] 366 > anova(hoiquy1) Analysis of Variance Table Response: cumgpa Df female 1 sat 1 hsperc 1 tothrs 1 female:sat 1 female:hsperc 1 female:tothrs 1 Residuals 358 Sum Sq 13.143 24.558 12.321 2.510 1.000 0.006 0.001 78.355 Mean Sq F value Pr(>F) 13.1429 60.0495 9.648e-14 *** 24.5582 112.2057 < 2.2e-16 *** 12.3205 56.2923 4.988e-13 *** 2.5104 11.4701 0.0007858 *** 0.9999 4.5687 0.0332376 * 0.0061 0.0279 0.8674503 0.0011 0.0051 0.9433072 0.2189 30 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH • Tập tin gpa3.wf1 > # mo hinh R > hoiquy2 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1)) > summary(hoiquy2) Call: lm(formula = cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset = (spring == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4908498 0.1836782 8.117 7.57e-15 *** sat 0.0011850 0.0001648 7.191 3.71e-12 *** hsperc -0.0099569 0.0012446 -8.000 1.70e-14 *** tothrs 0.0023429 0.0007554 3.102 0.00208 ** --Residual standard error: 0.486 on 362 degrees of freedom Multiple R-squared: 0.3516, Adjusted R-squared: 0.3463 31 31 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > nobs(hoiquy2) [1] 366 > anova(hoiquy2) Analysis of Variance Table Response: cumgpa Df Sum Sq Mean Sq F value Pr(>F) sat 1 26.616 26.6158 112.6692 < 2.2e-16 *** hsperc 1 17.490 17.4904 74.0398 2.364e-16 *** tothrs 1 2.272 2.2725 9.6197 0.002076 ** Residuals 362 85.515 0.2362 32 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Kiểm định đồng thời với thống kê F (phương pháp biến giả) H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai Với mức ý nghĩa 5%: F = 8,18 > 2,37 = F0,05(4,358) : bác bỏ H0 Vậy có sự khác biệt trong hàm hồi quy giữa nhóm nam và nữ Tóm lại (phương pháp biến giả): Kiểm tra xem có sự khác biệt trong hàm hồi quy của nhóm nam và nữ không y = 0 + 0 male + 1x1 + 1 male.x1 + 2x2 + 2 male.x2 + u H0: 0=0 ; 1=0 ; 2=0 (Không có sự khác biệt trong hàm hồi quy giữa các nhóm) H1: H0 sai © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 33 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > library(car) > linearHypothesis(hoiquy1, matchCoefs(hoiquy1, "female")) Linear hypothesis test Hypothesis: female = 0 female:sat = 0 female:hsperc = 0 female:tothrs = 0 Model 1: restricted model Model 2: cumgpa ~ female + sat + female:sat + hsperc + femal e:hsperc + tothrs + female:tothrs 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 362 85.515 358 78.355 4 7.1606 8.1791 2.545e-06 *** H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai p-value = 2,545*10-6 < 0,05 : bác bỏ H0 34 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (kiểm định Chow) Cách khác để tính thống kê F trong trường hợp đã cho Chạy hồi quy mô hình đã gán ràng buộc (R) riêng biệt cho nam và nữ ; tính SSR cho mô hình chưa gán ràng buộc bằng cách lấy tổng SSR của hai hàm hồi quy này. Chạy hồi quy cho mô hình đã gán ràng buộc (R) và tính SSR cho mô hình này Kiểm định theo cách làm này được gọi là kiểm định Chow Quan trọng: Kiểm định Chow giả định rằng phương sai của nhiễu là như nhau giữa các nhóm Nữ Nam n1= 90 n2= 276 SSR1= 19,603 SSR2= 58,752 Toàn bộ mẫu n= n1+n2 = 366 SSRp= 85,515 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 35 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH cumgpa = 0 + 1 sat + 2 hsperc + 3 tothrs + u (số tham số = 4) > # mo hinh nu > hoiquy3 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1 & female==1)) > summary(hoiquy3) Call: lm(formula = cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset = (spring == 1 & female == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.1273255 0.3615951 3.118 0.00248 ** sat 0.0018022 0.0003469 5.195 1.36e-06 *** hsperc -0.0090013 0.0029078 -3.096 0.00265 ** tothrs 0.0022283 0.0014088 1.582 0.11739 --Residual standard error: 0.4774 on 86 degrees of freedom Multiple R-squared: 0.4014, Adjusted R-squared: 0.3805 36 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > nobs(hoiquy3) [1] 90 > anova(hoiquy3) Analysis of Variance Table Response: cumgpa Df Sum Sq Mean Sq F value Pr(>F) sat 1 10.1724 10.1724 44.6275 2.247e-09 *** hsperc 1 2.4040 2.4040 10.5464 0.001661 ** tothrs 1 0.5703 0.5703 2.5018 0.117387 Residuals 86 19.6028 0.2279 37 37 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > # mo hinh nam > hoiquy4 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1 & female==0)) > summary(hoiquy4) Call: lm(formula = cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset = (spring == 1 & female == 0)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4808117 0.2059706 7.189 6.29e-12 *** sat 0.0010516 0.0001799 5.846 1.44e-08 *** hsperc -0.0084516 0.0013613 -6.208 1.99e-09 *** tothrs 0.0023441 0.0008567 2.736 0.00662 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.4648 on 272 degrees of freedom Multiple R-squared: 0.3169, Adjusted R-squared: 0.3093 38 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > nobs(hoiquy4) [1] 276 > anova(hoiquy4) Analysis of Variance Table Response: cumgpa Df Sum Sq Mean Sq F value Pr(>F) sat 1 15.493 15.4925 71.7250 1.568e-15 *** hsperc 1 10.140 10.1401 46.9449 4.871e-11 *** tothrs 1 1.617 1.6172 7.4869 0.006624 ** Residuals 272 58.752 0.2160 39 39 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > # mo hinh toan bo > hoiquy5 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1)) > summary(hoiquy5) Call: lm(formula = cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset = (spring == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.4908498 0.1836782 8.117 7.57e-15 *** sat 0.0011850 0.0001648 7.191 3.71e-12 *** hsperc -0.0099569 0.0012446 -8.000 1.70e-14 *** tothrs 0.0023429 0.0007554 3.102 0.00208 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.486 on 362 degrees of freedom Multiple R-squared: 0.3516, Adjusted R-squared: 0.3463 40 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > nobs(hoiquy5) [1] 366 > anova(hoiquy5) Analysis of Variance Table Response: cumgpa Df Sum Sq Mean Sq F value Pr(>F) sat 1 26.616 26.6158 112.6692 < 2.2e-16 *** hsperc 1 17.490 17.4904 74.0398 2.364e-16 *** tothrs 1 2.272 2.2725 9.6197 0.002076 ** Residuals 362 85.515 0.2362 41 41 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai Công thức F của kiểm định Chow: F [ SSR p ( SSR1 SSR2 )] / sts ( SSR1 SSR2 ) / ( n 2.sts ) 7.24 sts = k+1: số tham số trong mô hình hồi quy F > F(sts, n-2.sts) : bác bỏ H0 Ví dụ về cumGPA: F [85,515 (19,603 58,752)] / 4 8,18 (19,603 58,752) / (366 2* 4) Với = 5% : F = 8,18 > 2,37 = F0,05(4, 358) : bác bỏ H0 42 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH # mo hinh nu hoiquy_nu <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1 & female==1)) SSR_nu <-sum(summary(hoiquy_nu)$resid^2) SSR_nu # mo hinh nam hoiquy_nam <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1 & female==0)) SSR_nam <-sum(summary(hoiquy_nam)$resid^2) SSR_nam # mo hinh chung hoiquy_chung <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3, subset=(spring==1)) SSR_chung <-sum(summary(hoiquy_chung)$resid^2) SSR_chung 43 43 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH # tinh bac tu do df_tu <- summary(hoiquy_nu)$df[1] df_mau <- (nobs(hoiquy_chung)-2*df_tu) # tinh tu so va mau so cua Fc tuso <- (SSR_chung - SSR_nu - SSR_nam)/df_tu mauso <- (SSR_nu + SSR_nam)/df_mau # thong ke Fc Fc <- tuso/mauso Fc # p-value cua Fc p_value <- 1-pf(Fc, df_tu, df_mau) p_value # tinh F_0.05(df_tu,df_mau) F_0.05 <- qf(0.95, df_tu, df_mau) F_0.05 44 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH > SSR_nu [1] 19.60279 > SSR_nam [1] 58.75172 > SSR_chung [1] 85.51507 > df_tu [1] 4 > df_mau [1] 358 > tuso [1] 1.79014 > mauso [1] 0.2188673 > Fc [1] 8.179112 > p_value [1] 2.544637e-06 > F_0.05 [1] 2.396882 45 45 Phân tích hồi quy bội: Biến định tính 7.5 Biến phụ thuộc nhị phân: mô hình xác suất tuyến tính (tự đọc) Hồi quy tuyến tính khi biến phụ thuộc nhị phân 7.26 Nếu biến phụ thuộc chỉ có 2 giá trị 1 và 0 = P(y=1/x) Mô hình xác suất tuyến tính (LPM) 7.27 Hay: 7.28 Trong mô hình xác suất tuyến tính, các hệ số cho biết tác động của biến độc lập lên xác suất y=1 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Ví dụ: Việc tham gia lực lượng lao động của phụ nữ đã kết hôn =1 có việc làm, =0 ngược lại Thu nhập của người chồng (nghìn USD mỗi năm) 7.29 Nếu số con dưới sáu tuổi tăng thêm 1, xác suất người phụ nữ có việc làm giảm 26,2% Có vẻ không có ý nghĩa, |t|= 0,98 (nhưng xem slide kế tiếp) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 47 Phân tích hồi quy bội: Biến định tính Ví dụ: Tham gia lực lượng lao động của phụ nữ đã kết hôn (tt) Đồ thị với nwifeinc=50, exper=5, age=30, kidslt6=1, kidsge6=0 Học vấn cao nhất trong mẫu là educ = 17. Khi đó, xác suất có việc làm dự đoán của phụ nữ đã kết hôn là 50%. 17 Xác suất dự đoán âm nhưng không sao vì không có người phụ nữ nào trong mẫu có educ <5. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Nhược điểm của mô hình xác suất tuyến tính Xác suất dự đoán có thể lớn hơn 1 hoặc nhỏ hơn 0 Tác động biên lên xác suất là hằng số đôi khi không đúng về mặt logic Mô hình xác suất tuyến tính thì luôn có phương sai thay đổi Phương sai của biến ngẫu nhiên Bernoulli 7.30 Cần tính sai số chuẩn cải thiện cho trường hợp phương sai thay đổi này (Chương 8) Ưu điểm của mô hình xác suất tuyến tính Dễ dàng ước lượng và giải thích Tác động ước lượng và dự đoán thường khá tốt trong thực tế Xem mô hình Logit và Probit ở Chương 17 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 49 Phân tích hồi quy bội: Biến định tính 7.6 Bàn thêm về phân tích chính sách và đánh giá chương trình Ví dụ: Tác động tài trợ đào tạo nghề đến năng suất lao động của công nhân Tỷ lệ sản phẩm lỗi =1 nếu công ty có nhận tài trợ đào tạo, =0 ngược lại 7.33 Không có tác động rõ ràng của tài trợ lên năng suất, |t|=0,12 Nhóm tác động: được nhận tài trợ, nhóm đối chứng: các công ty không nhận được tài trợ Tài trợ được đưa ra trên cơ sở: đến trước phục vụ trước. Điều này không giống như tài trợ một cách ngẫu nhiên. Có thể là những doanh nghiệp với năng suất thấp sẽ xin nhận tài trợ đầu tiên vì họ nhận thấy cơ hội cải thiện năng suất. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 50 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Biến định tính Nội sinh do vấn đề “tự lựa chọn” (self-selection) tham gia vào chương trình Trong ví dụ trên và các ví dụ tương tự, việc tham gia vào chương trình có thể liên quan đến các đặc điểm khác mà các đặc điểm này cũng ảnh hưởng đến biến phụ thuộc Lý do là các đối tượng tự lựa chọn việc tham gia vào chương trình phụ thuộc vào đặc điểm và triển vọng cá nhân của họ. Sự tham gia này không được xác định ngẫu nhiên. Đánh giá thực nghiệm Trong các thí nghiệm, việc tham gia vào nhóm tác động là ngẫu nhiên Trong trường hợp này, tác động nhân quả có thể được suy ra bằng cách sử dụng hồi quy đơn 7.34 partic =1: có tham gia Biến giả biểu thị có hay không có tham gia thì không liên quan đến các yếu tố khác ảnh hưởng đến biến phụ thuộc © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 51 Phân tích hồi quy bội: Biến định tính Ví dụ khác về biến độc lập là biến giả bị nội sinh Có phải khách hàng da màu bị phân biệt đối xử? Biến giả biểu thị vốn vay có được phê duyệt không Biến giả chủng tộc H0: 1 = 0 H1: 1 < 0 Sự giàu có Xếp hạng tín dụng Điều cần thiết là kiểm soát các đặc điểm quan trọng khác có thể tác động đến việc phê duyệt vốn vay (ví dụ nghề nghiệp, thất nghiệp) Việc bỏ qua đặc điểm quan trọng mà có tương quan với biến giả da màu sẽ tạo ra bằng chứng thống kê giả cho sự phân biệt đối xử © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 52 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 26 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH 7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc 7.35 Cố định tuổi, nếu số năm đi học tăng 1 năm thì số con trung bình của phụ nữ giảm 0,09 con. Hay: Xét 1 nhóm 100 phụ nữ (cùng tuổi), nếu mỗi người có số năm đi học tăng 1 thì tổng số con trung bình của nhóm này sẽ giảm 9 người. Cố định số năm đi học, nếu tuổi tăng 1 năm thì số con trung bình của phụ nữ tăng 0,175 con. Hay: Xét 1 nhóm 1000 phụ nữ (cùng số năm đi học), nếu mỗi người có số tuổi tăng 1 thì tổng số con trung bình của nhóm này sẽ tăng 175 người. 53 53 PHÂN TÍCH HỒI QUY BỘI: BIẾN ĐỊNH TÍNH 7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc 7.37 electric= 1: phụ nữ sống trong ngôi nhà có điện Cố định tuổi và mức học vấn. Phụ nữ sống trong nhà có điện có số con trung bình ít hơn phụ nữ sống trong ngôi nhà không có điện là 0,362 người. Hay: Cùng tuổi và mức học vấn. Xét nhóm 1000 phụ nữ sống trong nhà có điện so với nhóm 1000 phụ nữ sống trong nhà không có điện. Số con trung bình của nhóm 1 ít hơn nhóm 2 là 362 người. Cùng tuổi, nếu mức học vấn tăng 1 năm thì số con trung bình của người phụ nữ giảm 0,079 người. 54 54 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 27 Chương 7 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Môøi gheù thaêm trang web: 55 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 55 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 28 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phương sai thay đổi Chương 8 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Phân tích hồi quy bội: Phương sai thay đổi 8.1 Hậu quả của phương sai thay đổi đối với OLS OLS vẫn không chệch và vững khi có phương sai thay đổi Ngoài ra, sự giải thích của R2 không thay đổi Phương sai sai số không có điều kiện không bị ảnh hưởng bởi phương sai thay đổi (đề cập đến phương sai sai số có điều kiện) Phương sai thay đổi làm vô hiệu các công thức phương sai đối với các ước lượng OLS Các kiểm định F và kiểm định t thông thường, khoảng tin cậy thì không còn hiệu lực khi có phương sai thay đổi Với phương sai thay đổi, OLS không còn là ước lượng tuyến tính không chệch tốt nhất (BLUE); Có thể có các ước lượng tuyến tính hiệu quả hơn (phải biết dạng của phương sai thay đổi) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Lưu ý: Khi có đa cộng tuyến không hoàn hảo giữa các biến độc lập: Ước lượng theo OLS vẫn có tính chất BLUE Tính chất BLUE: - Tuyến tính - Không chệch - Có phương sai nhỏ nhất 3 3 Phân tích hồi quy bội: Phương sai thay đổi 8.2 Thống kê suy diễn cải thiện khi có phương sai thay đổi Công thức cải thiện cho sai số chuẩn OLS và các thống kê liên quan được phát triển cho trường hợp không biết dạng thay đổi của phương sai Tất cả các công thức chỉ có hiệu lực trong các mẫu lớn Công thức sai số chuẩn cải thiện cho OLS khi có phương sai thay đổi Còn được gọi là sai số chuẩn White/Huber/Eicker. Chúng bao gồm bình phương các phần dư từ hồi quy và từ hồi quy biến xj theo tất cả các biến giải thích khác. 8.4 Sử dụng các công thức này, kiểm định t là tiệm cận hợp lý Thống kê F thông thường không dùng được khi có phương sai thay đổi, nhưng các phiên bản cải thiện phương sai thay đổi có sẵn trong hầu hết các phần mềm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Mô hình hồi quy 2 biến: Y 0 1 X u Đặt xi X i X ˆ 2 var( ˆ1 ) (a) xi2 n var( ˆ1 ) Ta có: var( ˆ ) 1 (a) rˆ uˆ i 1 2 2 i1 i SSR12 (8.4) var( ˆ1 ) var( ˆ ) 1 2 (2.57) x 2 i x . x 2 i 2 i 2 i 2 (8.2) là ước lượng không chệch của var( ˆ1 )(2.57) var( ˆ1 ) ( a ) là ước lượng chệch của var( ˆ1 )(8.2) var( ˆ1 ) (8.4) là ước lượng “đúng” của var( ˆ1 )(8.2) Lưu ý: ̂1 là ước lượng không chệch của β1 5 5 Phân tích hồi quy bội: Phương sai thay đổi • VD 8.1: Phương trình log tiền lương khi có phương sai thay đổi • Tập tin wage1.wf1 > > > > male <- 1-female single <- 1-married # ols hoiquy <- lm(log(wage) ~ married:male + married:female + single:female + educ + exper + I(exper^2) + tenure + I(tenure^2), data = wage1) # ols cai thien, chon hc1 coeftest(hoiquy, vcov = hccm) coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc0')) coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc1')) linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male"), vcov = hccm(hoiquy, type= 'hc1')) 6 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi • Sai số chuẩn OLS > library(lmtest) > coeftest(hoiquy) t test of coefficients: (Intercept) educ exper I(exper^2) tenure I(tenure^2) married:male married:female female:single Estimate 0.32137810 0.07891028 0.02680057 -0.00053525 0.02908752 -0.00053314 0.21267568 -0.19826760 -0.11035021 Std. Error 0.10000899 0.00669450 0.00524285 0.00011043 0.00676200 0.00023124 0.05535718 0.05783546 0.05574205 t value 3.2135 11.7873 5.1118 -4.8471 4.3016 -2.3056 3.8419 -3.4281 -1.9797 Pr(>|t|) 0.0013931 < 2.2e-16 4.499e-07 1.659e-06 2.028e-05 0.0215306 0.0001373 0.0006562 0.0482719 ** *** *** *** *** * *** *** * 7 7 Phân tích hồi quy bội: Phương sai thay đổi • Sai số chuẩn cải thiện (robust) > coeftest(hoiquy, vcov = hccm(hoiquy, type= 'hc1')) t test of coefficients: (Intercept) educ exper I(exper^2) tenure I(tenure^2) married:male married:female female:single Estimate 0.32137810 0.07891028 0.02680057 -0.00053525 0.02908752 -0.00053314 0.21267568 -0.19826760 -0.11035021 Std. Error 0.10946899 0.00741467 0.00513912 0.00010634 0.00694092 0.00024368 0.05714191 0.05877001 0.05711626 t value 2.9358 10.6425 5.2150 -5.0334 4.1907 -2.1878 3.7219 -3.3736 -1.9320 Pr(>|t|) 0.0034751 < 2.2e-16 2.663e-07 6.665e-07 3.270e-05 0.0291286 0.0002194 0.0007975 0.0539021 ** *** *** *** *** * *** *** . 8 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi • Kiểm định F theo OLS > library(car) > linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male")) Linear hypothesis test Hypothesis: married:male = 0 married:female = 0 female:single = 0 Model 1: restricted model Model 2: log(wage) ~ married:male + married:female + single:female+ educ + exper + I(exper^2) + tenure + I(tenure^2) 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 520 93.911 517 79.968 3 13.943 30.048 < 2.2e-16 *** p-value < 2,2×10-16 < 0,05 : bác bỏ H0 9 9 Phân tích hồi quy bội: Phương sai thay đổi • Kiểm định F theo cải thiện > linearHypothesis(hoiquy, matchCoefs(hoiquy,"female|male"), vcov = hccm(hoiquy, type= 'hc1')) Linear hypothesis test Hypothesis: married:male = 0 married:female = 0 female:single = 0 Model 1: restricted model Model 2: log(wage) ~ married:male + married:female + single:female + educ + exper + I(exper^2) + tenure + I(tenure^2) Note: Coefficient covariance matrix supplied. 1 2 Res.Df Df F Pr(>F) 520 517 3 29.866 < 2.2e-16 *** 10 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Ví dụ 8.1’: Phương trình tiền lương theo giờ Sai số chuẩn cải thiện cho phương sai thay đổi có thể lớn hay nhỏ hơn khi không cải thiện. Sự khác biệt thường nhỏ trong thực tế. Thống kê F cũng thường không quá khác nhau. Nếu có phương sai thay đổi nhiều, sự khác biệt có thể lớn hơn. Để an toàn, nên tính các sai số chuẩn cải thiện. Robust : cải thiện © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11 Phân tích hồi quy bội: Phương sai thay đổi 8.3 Kiểm định phương sai thay đổi Việc kiểm tra sự hiện diện của phương sai thay đổi vẫn được quan tâm vì khi đó OLS có thể không phải là ước lượng tuyến tính hiệu quả nhất. Kiểm định Breusch-Pagan để phát hiện phương sai thay đổi 8.11 Với giả thiết MLR.4 Trung bình của u2 không được khác nhau theo x1, x2, …, xk © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Kiểm định Breusch-Pagan để phát hiện phương sai thay đổi (tt) Rû22 8.14 Hồi quy các bình phương phần dư theo tất cả các biến giải thích và kiểm định xem liệu mô hình có phù hợp hay không. 8.13 2 8.15 Một trị số thống kê kiểm định lớn (khi R2 cao) là bằng chứng chống lại giả thuyết không. 2 2 8.16 Thống kê kiểm định thay thế (bằng cách dùng Thống kê nhân tử Lagrange, LM). Một lần nữa, thống kê kiểm định có giá trị lớn (khi R2 cao) sẽ dẫn đến sự bác bỏ giả thuyết không rằng giá trị kỳ vọng của u2 không liên quan đến các biến giải thích. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 13 Phân tích hồi quy bội: Phương sai thay đổi Ví dụ 8.4: Phương sai thay đổi trong các phương trình định giá nhà H0: Phương sai không đổi ; H1: Phương sai thay đổi 8.17 Phương sai thay đổi 2 8.18 2 Trong dạng hàm logarit, Phương sai không đổi p-value < mức ý nghĩa (0.05) : bác bỏ H0 ; p-value (0.05) : chấp nhận H0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Tập tin hprice1.wf1 > hoiquy Call: lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1) Coefficients: (Intercept) -21.770308 lotsize 0.002068 sqrft 0.122778 bdrms 13.852522 15 15 Phân tích hồi quy bội: Phương sai thay đổi > > > > hoiquy <- lm(price ~ lotsize + sqrft + bdrms, data = hprice1) library(lmtest) # BP test (phuong phap LM) bptest(hoiquy) studentized Breusch-Pagan test data: hoiquy BP = 14.092, df = 3, p-value = 0.002782 p-value = 0,002782 < 0,05 : bác bỏ H0 Vậy phương sai thay đổi 16 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi > # BP test (phuong phap F) > bptestF <- lm(resid(hoiquy)^2 ~ lotsize + sqrft + bdrms, data = hprice1) > summary(bptestF) Call: lm(formula = resid(hoiquy)^2 ~ lotsize + sqrft + bdrms, data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -5.523e+03 3.259e+03 -1.694 0.09390 . lotsize 2.015e-01 7.101e-02 2.838 0.00569 ** sqrft 1.691e+00 1.464e+00 1.155 0.25128 bdrms 1.042e+03 9.964e+02 1.046 0.29877 --F-statistic: 5.339 on 3 and 84 DF, p-value: 0.002048 17 17 Phân tích hồi quy bội: Phương sai thay đổi Kiểm định White để phát hiện phương sai thay đổi Hồi quy các bình phương phần dư theo tất cả các biến giải thích, các bình phương của chúng, và các tương tác (ở đây: ví dụ k=3) 8.19 Kiểm định White tổng quát hơn kiểm định Breusch-Pagan để phát hiện phương sai thay đổi 2 x1.x2, x1.x3, x2.x3 gọi là số hạng tích chéo Nhược điểm của dạng kiểm định White Bao gồm tất cả các bình phương và các tương tác dẫn đến một số lượng lớn các tham số được ước lượng (vd: k=6 dẫn đến 27 tham số được ước lượng) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Dạng thay thế (rút gọn) của kiểm định White 8.20 Hồi quy này gián tiếp kiểm định sự phụ thuộc của bình phương phần dư theo các biến giải thích, các bình phương và các tương tác, bởi vì giá trị dự đoán của y và bình phương của nó ngầm chứa tất cả các số hạng này. 2 Ví dụ 8.4: Phương sai thay đổi trong phương trình (log) giá nhà © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: hprice1.wf1 > # White test rut gon (phuong phap LM) > bptest(hoiquy, ~ fitted(hoiquy) + I(fitted(hoiquy)^2)) studentized Breusch-Pagan test data: hoiquy BP = 16.268, df = 2, p-value = 0.0002933 > # White test (phuong phap LM) > bptest(hoiquy, ~ lotsize*sqrft + lotsize*bdrms + sqrft*bdrms + I(lotsize^2) + I(sqrft^2) + I(bdrms^2),data = hprice1) studentized Breusch-Pagan test data: hoiquy BP = 33.732, df = 9, p-value = 9.953e-05 20 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: hprice1.wf1 > # White test (phuong phap F) > wtestF <- lm(resid(hoiquy)^2 ~ lotsize*sqrft + lotsize*bdrms + sqrft*bdrms + I(lotsize^2) + I(sqrft^2) + I(bdrms^2), data = hprice1) > summary(wtestF) Call: lm(formula = resid(hoiquy)^2 ~ lotsize * sqrft + lotsize * bdrms + sqrft * bdrms + I(lotsize^2) + I(sqrft^2) + I(bdrms^2), data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.563e+04 1.137e+04 1.374 0.17325 lotsize -1.860e+00 6.371e-01 -2.919 0.00459 ** sqrft -2.674e+00 8.662e+00 -0.309 0.75838 bdrms -1.983e+03 5.438e+03 -0.365 0.71640 I(lotsize^2) -4.978e-07 4.631e-06 -0.107 0.91467 I(sqrft^2) 3.523e-04 1.840e-03 0.191 0.84864 I(bdrms^2) 2.898e+02 7.588e+02 0.382 0.70362 lotsize:sqrft 4.568e-04 2.769e-04 1.650 0.10303 lotsize:bdrms 3.146e-01 2.521e-01 1.248 0.21572 sqrft:bdrms -1.021e+00 1.667e+00 -0.612 0.54210 --F-statistic: 5.387 on 9 and 78 DF, p-value: 1.013e-05 21 21 Phân tích hồi quy bội: Phương sai thay đổi Phương sai thay đổi theo dạng nhân với một hằng số 8.21 Ví dụ: Tiết kiệm và thu nhập 8.22 Dạng hàm phương sai thay đổi được biết 8.23 Lưu ý rằng mô hình hồi quy này không có hệ số chặn Mô hình biến đổi có phương sai không đổi Nếu các giả thiết Gauss-Markov khác cũng được thỏa mãn, OLS áp dụng cho mô hình biến đổi (gọi là GLS) là ước lượng tuyến tính không chệch tốt nhất © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi 8.4 Ước lượng bình phương nhỏ nhất có trọng số (WLS) Phương sai thay đổi theo dạng nhân với một hằng số Dạng hàm phương sai thay đổi được biết 8.21 8.24 8.25 Mô hình biến đổi 8.26 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 23 Phân tích hồi quy bội: Phương sai thay đổi OLS trong mô hình biến đổi là bình phương nhỏ nhất có trọng số (WLS) Các quan sát với phương sai lớn nhận một trọng số nhỏ hơn trong bài toán tối ưu 8.27 Tại sao WLS hiệu quả hơn OLS trong mô hình ban đầu? Các quan sát có phương sai lớn thì ít thông tin hơn so với các quan sát có phương sai nhỏ và do đó nhận trọng số nhỏ hơn WLS là một trường hợp đặc biệt của bình phương nhỏ nhất tổng quát (GLS) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Ví dụ 8.6: Phương trình tài sản tài chính Tài sản tài chính ròng (Net financial wealth) Dạng giả định của phương sai thay đổi: Ước lượng theo WLS có sai số chuẩn nhỏ hơn đáng kể (phù hợp với mong đợi rằng chúng hiệu quả hơn). Tham gia vào kế hoạch lương hưu 401k © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 25 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: 401ksubs.wf1 > # OLS > hqols <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k, data = d401k, subset=(fsize==1)) > summary(hqols) Call: lm(formula = nettfa ~ inc + I((age - 25)^2) + male + e401k, data = d401k, subset = (fsize == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -20.984990 2.472022 -8.489 <2e-16 *** inc 0.770583 0.061452 12.540 <2e-16 *** I((age - 25)^2) 0.025127 0.002593 9.689 <2e-16 *** male 2.477927 2.047776 1.210 0.2264 e401k 6.886223 2.123275 3.243 0.0012 ** --Residual standard error: 44.49 on 2012 degrees of freedom Multiple R-squared: 0.1279, Adjusted R-squared: 0.1261 > nobs(hqols) [1] 2017 26 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi OLS: > library(lmtest) > # BP test (phuong phap LM) > bptest(hqols) studentized Breusch-Pagan test data: hqols BP = 15.711, df = 4, p-value = 0.003433 • p-value = 0,003433 < 0,05 : bác bỏ H0 27 27 Phân tích hồi quy bội: Phương sai thay đổi OLS: > # OLS cai thien > library(car) > coeftest(hqols, vcov = hccm(hqols, type= 'hc1')) t test of coefficients: Estimate (Intercept) -20.9849901 inc 0.7705833 I((age - 25)^2) 0.0251267 male 2.4779269 e401k 6.8862229 Std. Error t value Pr(>|t|) 3.4951860 -6.0040 2.279e-09 *** 0.0995719 7.7390 1.574e-14 *** 0.0043442 5.7840 8.437e-09 *** 2.0583585 1.2038 0.228794 2.2865772 3.0116 0.002631 ** 28 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi GLS - Generalized Least Squares: 2 Giả sử var(u / x) inc > # GLS > hqgls <- lm(I(nettfa/sqrt(inc)) ~ 0 + I(1/sqrt(inc)) + sqrt(inc) + I((age-25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)), data = d401k, subset=(fsize==1)) > summary(hqgls) Call: lm(formula = I(nettfa/sqrt(inc)) ~ 0 + I(1/sqrt(inc)) + sqrt(inc) + I((age - 25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)), data = d401k, subset = (fsize == 1)) Coefficients: Estimate Std. Error t value Pr(>|t|) I(1/sqrt(inc)) -16.702521 1.957995 -8.530 < 2e-16 *** sqrt(inc) 0.740384 0.064303 11.514 < 2e-16 *** I((age - 25)^2/sqrt(inc)) 0.017537 0.001931 9.080 < 2e-16 *** I(male/sqrt(inc)) 1.840529 1.563587 1.177 0.23929 I(e401k/sqrt(inc)) 5.188281 1.703426 3.046 0.00235 ** --Residual standard error: 7.065 on 2012 degrees of freedom Multiple R-squared: 0.1591, Adjusted R-squared: 0.157 > nobs(hqgls) [1] 2017 29 29 Phân tích hồi quy bội: Phương sai thay đổi GLS: > # BP test (phuong phap LM) > bptest(hqgls) studentized Breusch-Pagan test data: hqgls BP = 8.332, df = 4, p-value = 0.08015 • p-value = 0,08015 > 0,05 : chấp nhận H0 30 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi GLS: > > > + # BP test (phuong phap F) d401k_f1 <- subset(d401k, fsize==1) hqglsF <- lm(resid(hqgls)^2 ~ I(1/sqrt(inc)) + sqrt(inc) I((age-25)^2/sqrt(inc))+ I(male/sqrt(inc)) + I(e401k/sqrt(inc)), data = d401k_f1) > summary(hqglsF) Call: lm(formula = resid(hqgls)^2 ~ I(1/sqrt(inc)) + sqrt(inc) + I((age 25)^2/sqrt(inc)) + I(male/sqrt(inc)) + I(e401k/sqrt(inc)), data = d401k_f1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 103.7683 470.9569 0.220 0.8256 I(1/sqrt(inc)) -734.2996 1238.4991 -0.593 0.5533 sqrt(inc) 6.9543 43.1690 0.161 0.8720 I((age - 25)^2/sqrt(inc)) 0.4725 0.2260 2.091 0.0367 * I(male/sqrt(inc)) 187.4389 182.9764 1.024 0.3058 I(e401k/sqrt(inc)) 108.7663 200.5111 0.542 0.5876 --Residual standard error: 826.3 on 2011 degrees of freedom Multiple R-squared: 0.004137, Adjusted R-squared: 0.001661 F-statistic: 1.671 on 5 and 2011 DF, p-value: 0.1383 > nobs(hqglsF) [1] 2017 • p-value = 0,1383 > 0,05 : chấp nhận H0 31 31 Phân tích hồi quy bội: Phương sai thay đổi GLS: > # White test rut gon (phuong phap LM) > bptest(hqgls, ~ fitted(hqgls) + I(fitted(hqgls)^2), data = d401k_f1) studentized Breusch-Pagan test data: hqgls BP = 10.114, df = 2, p-value = 0.006365 • p-value = 0,006365 < 0,05 : bác bỏ H0 32 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi WLS: Giả sử var(u / x) inc 2 > # WLS > hqwls <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k, weight = 1/inc, data = d401k, subset=(fsize==1)) > summary(hqwls) Call: lm(formula = nettfa ~ inc + I((age - 25)^2) + male + e401k, data = d401k, subset = (fsize == 1), weights = 1/inc) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -16.702521 1.957995 -8.530 < 2e-16 *** inc 0.740384 0.064303 11.514 < 2e-16 *** I((age - 25)^2) 0.017537 0.001931 9.080 < 2e-16 *** male 1.840529 1.563587 1.177 0.23929 e401k 5.188281 1.703426 3.046 0.00235 ** --Residual standard error: 7.065 on 2012 degrees of freedom Multiple R-squared: 0.1115, Adjusted R-squared: 0.1097 > nobs(hqwls) [1] 2017 33 33 Phân tích hồi quy bội: Phương sai thay đổi WLS: load("H:/Bai giang 2020 hk3/Chuong 08/401ksubs.RData") d401k <- data d401k_f1 <- subset(d401k, fsize==1) options(digits=7) hqwls <- lm(nettfa ~ inc + I((age-25)^2) + male + e401k, weight = 1/inc, data=d401k_f1) > # White test rut gon (phuong phap LM) > bptest(hqwls, ~ fitted(hqwls) + I(fitted(hqwls)^2), data = d401k_f1) > > > > > studentized Breusch-Pagan test data: hqwls BP = 15.077, df = 2, p-value = 0.0005323 34 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi WLS: > # BP test (phuong phap F) > hqwlsF <- lm(resid(hqwls)^2 ~ inc + I((age-25)^2) + male + e401k, data = d401k_f1) > summary(hqwlsF) Call: lm(formula = resid(hqwls)^2 ~ inc + I((age - 25)^2) + male + e401k, data = d401k_f1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -4669.601 1862.345 -2.507 0.0122 * inc 114.774 46.296 2.479 0.0133 * I((age - 25)^2) 4.920 1.954 2.518 0.0119 * male 2341.567 1542.732 1.518 0.1292 e401k 1181.817 1599.610 0.739 0.4601 --Residual standard error: 33520 on 2012 degrees of freedom Multiple R-squared: 0.00793, Adjusted R-squared: 0.005957 F-statistic: 4.02 on 4 and 2012 DF, p-value: 0.002985 > nobs(hqwlsF) [1] 2017 35 35 Phân tích hồi quy bội: Phương sai thay đổi Phần dư của 3 phương pháp ước lượng OLS, GLS, WLS ### Phan du cua OLS, GLS, WLS > um_ols <- resid(hqols) > um_gls <- resid(hqgls) > um_wls <- resid(hqwls) > phandu <- data.frame(um_ols,um_gls,um_wls) > options(digits=3) > phandu um_ols um_gls um_wls 1 9.7579 2.088913.... 7.5808 2 115.9254 14.89927.... 116.5862 5 2.3097 0.979986.... 4.6602 10 8.7462 1.986047.... 10.7136 16 -4.3321 -1.13161.... -4.9422 24 7.8292 1.038733.... 5.2200 26 -9.4303 -1.93732.... -10.0667 31 -23.4549 -5.48167.... -25.3914 51 -3.9814 -0.34099.... -2.2715 ……………………………………………………. > > > > > > > ### Tong binh phuong phan du SSR_ols <- sum(hqols$resid^2) SSR_gls <- sum(hqgls$resid^2) SSR_wls <- sum(hqwls$resid^2) SSR <- data.frame(SSR_ols,SSR_gls,SSR_wls) options(digits=9) sort(SSR) SSR_gls SSR_ols SSR_wls 1 100427.099 3982123.72 4001427.78 36 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Trường hợp đặc biệt quan trọng của phương sai thay đổi Nếu các quan sát là trung bình ở cấp thành phố / quận / tiểu bang / quốc gia / công ty, chúng phải được lấy trọng số là kích thước của đơn vị Đóng góp trung bình vào kế hoạch lương hưu của công ty i Thu nhập trung bình và tuổi trung bình ở công ty i Phần trăm đóng góp của công ty vào kế hoạch sai số phương sai thay đổi 8.29 Phương sai sai số khi sai số ở mức độ nhân viên có phương sai không đổi e Nếu sai số có phương sai không đổi ở mức độ nhân viên, cần sử dụng WLS với trọng số bằng quy mô mi của công ty. Nếu giả định về phương sai không đổi ở cấp nhân viên không đảm bảo, người ta có thể tính toán các sai số chuẩn cải thiện sau WLS (tức là, cho mô hình biến đổi). © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 37 Phân tích hồi quy bội: Phương sai thay đổi Khi không biết hàm phương sai thay đổi (GLS khả thi - FGLS) 8.30 8.31 Sai số nhân (giả thiết: độc lập với các biến giải thích) ĝ 8.32 hˆ exp( gˆ ) 8.33 GLS khả thi là vững và tiệm cận hiệu quả hơn OLS. Dạng giả định tổng quát của phương sai thay đổi; Hàm mũ được sử dụng để đảm bảo dương : giá trị ước lượng Sử dụng các giá trị nghịch đảo của hàm phương sai thay đổi ước lượng được như là trọng số trong WLS © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Ví dụ 8.7: Nhu cầu thuốc lá Có hạn chế hút thuốc trong nhà hàng Ước lượng theo OLS Thuốc lá hút mỗi ngày Log thu nhập và Log giá thuốc lá 8.35 Bác bỏ giả thuyết phương sai không đổi H0: Phương sai không đổi ; H1: Phương sai thay đổi © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 39 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: smoke.wf1 > hqols <- lm(cigs ~ log(income) + log(cigpric) + educ + age + I(age^2) + restaurn, data = smoke) > summary(hqols) Call: lm(formula = cigs ~ log(income) + log(cigpric) + educ + age + I(age^2) + restaurn, data = smoke) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -3.639826 24.078659 -0.151 0.87988 log(income) 0.880268 0.727783 1.210 0.22682 log(cigpric) -0.750862 5.773342 -0.130 0.89655 educ -0.501498 0.167077 -3.002 0.00277 ** age 0.770694 0.160122 4.813 1.78e-06 *** I(age^2) -0.009023 0.001743 -5.176 2.86e-07 *** restaurn -2.825085 1.111794 -2.541 0.01124 * --Residual standard error: 13.4 on 800 degrees of freedom Multiple R-squared: 0.05274, Adjusted R-squared: 0.04563 40 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: smoke.wf1 OLS: > library(lmtest) > # BP test (phuong phap LM) > bptest(hqols) studentized Breusch-Pagan test data: hqols BP = 32.258, df = 6, p-value = 1.456e-05 41 41 Phân tích hồi quy bội: Phương sai thay đổi Tập tin: smoke.wf1 > # FGLS > logu2 <- log(resid(hqols)^2) > hqphu <- lm(logu2 ~ log(income) + log(cigpric) + educ + age + I(age^2) + restaurn, data = smoke) > gm <- fitted(hqphu) > hm <- exp(gm) > hqwls <- lm(cigs ~ log(income) + log(cigpric) + educ + age + I(age^2) + restaurn, weight = 1/hm, data = smoke) FGLS: > # BP test (phuong phap LM) > bptest(hqwls) studentized Breusch-Pagan test data: hqwls BP = 32.258, df = 6, p-value = 1.456e-05 42 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi FGLS: > summary(hqwls) Call: lm(formula = cigs ~ log(income) + log(cigpric) + educ + age + I(age^2) + restaurn, data = smoke, weights = 1/hm) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.6354627 17.8031394 0.317 0.751673 log(income) 1.2952393 0.4370117 2.964 0.003128 ** log(cigpric) -2.9403117 4.4601446 -0.659 0.509931 educ -0.4634464 0.1201587 -3.857 0.000124 *** age 0.4819480 0.0968082 4.978 7.86e-07 *** I(age^2) -0.0056272 0.0009395 -5.990 3.17e-09 *** restaurn -3.4610640 0.7955050 -4.351 1.53e-05 *** --Residual standard error: 1.579 on 800 degrees of freedom Multiple R-squared: 0.1134, Adjusted R-squared: 0.1068 43 43 Phân tích hồi quy bội: Phương sai thay đổi ### Phan du cua OLS, WLS > um_ols <- resid(hqols) > um_wls <- resid(hqwls) > phandu1 <- data.frame(um_ols,um_wls) > options(digits=3) > phandu1 um_ols um_wls 1 -10.33299 -9.247 2 -10.75479 -9.914 3 -7.71989 -7.528 4 -10.26064 -9.667 5 -7.50415 -8.440 6 2.43942 -2.049 ……………………………. > > > > > > ### Tong binh phuong phan du SSR_ols <- sum(hqols$resid^2) SSR_wls <- sum(hqwls$resid^2) SSR <- data.frame(SSR_ols,SSR_wls) options(digits=9) sort(SSR) SSR_ols SSR_wls 1 143750.658 144812.657 44 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi Ước lượng theo FGLS Bây giờ có ý nghĩa thống kê 8.36 Thảo luận Hệ số co giãn của thu nhập bây giờ có ý nghĩa thống kê; Các hệ số khác cũng được ước lượng chính xác hơn (mà không thay đổi chất lượng kết quả). © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 45 Phân tích hồi quy bội: Phương sai thay đổi Điều gì sẽ xảy ra nếu giả định sai hàm phương sai thay đổi? Nếu hàm phương sai thay đổi là sai, WLS vẫn là vững với các giả thiết MLR.1 – MLR.4, nhưng nên tính toán các sai số chuẩn cải thiện WLS là vững với giả thiết MLR.4 nhưng không đúng với MLR.4‘ Nếu OLS và WLS tạo ra các ước lượng rất khác nhau, điều này thường cho thấy một số giả thiết khác là sai (ví dụ: MLR.4). Ngoài ra, sự khác nhau lớn giữa các hệ số ước lượng OLS và WLS là dấu hiệu của việc xác định sai dạng hàm phương sai thay đổi. Nếu có phương sai thay đổi nhiều, dù dùng dạng sai của phương sai thay đổi để làm tăng tính hiệu quả vẫn tốt hơn. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 46 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi •Dự đoán điểm và dự đoán khoảng cho giá trị trung bình và giá trị cá biệt khi có phương sai thay đổi •Xem trang 331-333 47 47 Phân tích hồi quy bội: Phương sai thay đổi 8.5 WLS trong mô hình xác suất tuyến tính (tự đọc) 8.45 8.47 Thảo luận Trong LPM, dạng chính xác của phương sai thay đổi được biết Sử dụng giá trị nghịch đảo như là trọng số trong WLS Không khả dụng nếu dự đoán theo LPM dưới 0 hoặc lớn hơn 1 Nếu các trường hợp như vậy là rất hiếm, chúng có thể được điều chỉnh theo các giá trị như 0.01 / 0.99 Trong các trường hợp khác, có thể tốt hơn là sử dụng OLS với các sai số chuẩn cải thiện © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 48 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 24 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Phương sai thay đổi • Cách phát hiện phương sai của nhiễu thay đổi: – Bản chất vấn đề nghiên cứu – Vẽ đồ thị phần dư – Kiểm định Park, Glejser, Goldfeld-Quandt, Harvey – Kiểm định Breusch-Pagan-Godfrey , White • Cách khắc phục phương sai thay đổi: – Phương pháp bình phương bé nhất tổng quát GLS (Generalized Least Squares) Phương pháp GLS thực chất là phương pháp OLS áp dụng cho các biến đã được biến đổi từ một mô hình vi phạm các giả thiết Gauss-Markov thành một mô hình mới thỏa các giả thiết Gauss-Markov. Do đó các tham số ước lượng được từ mô hình mới sẽ có tính chất BLUE. Giả sử var(u/x) = 2.x1 thì chia phương trình hồi quy cho sqr(x1) Giả sử var(u/x) = 2.x12 thì chia phương trình hồi quy cho x1 – Phương pháp WLS – Phương pháp FGLS – Lấy log các biến – Phương pháp OLS cải thiện (chỉ cải thiện sai số chuẩn của ước lượng OLS) 49 49 Phân tích hồi quy bội: Phương sai thay đổi Tóm lại chương 8: Kiểm định phương sai thay đổi: • Nếu thấy phương sai không đổi: Cuộc đời vẫn đẹp sao, tình yêu vẫn đẹp sao! • Nếu thấy phương sai thay đổi: Nếu biết sống giữa trời tình yêu là con nước trôi! – Tìm dạng hàm thay đổi “đúng” của phương sai, rồi dùng GLS hoặc WLS. – Nếu việc tìm dạng hàm thay đổi “đúng” của phương sai là “yêu người trong mộng” thì dùng FGLS. – Nếu muốn một cuộc đời “lãng đãng chiều nay em nhớ anh” thì “xài đỡ” OLS cải thiện 50 50 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 25 Chương 8 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Môøi gheù thaêm trang web: 51 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 51 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 26 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 MỘT SỐ VẤN ĐỀ MỞ RỘNG VỀ DẠNG HÀM VÀ DỮ LIỆU Chương 9 Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu 9.1 Vấn đề xác định sai dạng hàm Chúng ta có thể kiểm định xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn của một biến độc lập hay không bằng cách thêm các số hạng này vào mô hình và kiểm định xem thành phần thêm vào có ý nghĩa thống kê không. Ngoài ra, có thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey. Kiểm định sai dạng hàm (RESET) Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ thuộc vào hàm hồi quy (giống với kiểm định White rút gọn) y 0 1 x1 ... k xk u 9.2 y 0 1 x1 ... k xk 1 yˆ 2 2 yˆ 3 saiso 9.3 Kiểm định xem có nên loại bỏ thành phần này hay không. Nếu ta không thể loại bỏ chúng, nghĩa là mô hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm. H0: 1=0, 2=0 H0: mô hình (9.2) có dạng hàm đúng © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 1 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Ví dụ 9.2: Hàm hồi quy giá nhà 9.4 Bằng chứng cho thấy có sai dạng hàm Dạng hàm có log: 9.5 Ít bằng chứng cho thấy có sai dạng hàm Thảo luận Chúng ta có thể thêm vào các bậc cao hơn của ŷ , hàm ý là thêm vào mô hình các biến tương tác phức tạp và bậc cao hơn của các biến độc lập. RESET cung cấp ít thông tin về nguyên nhân sai dạng hàm. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 3 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà • Tập tin hprice1.wf1 > summary(hoiquy1) Call: lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.177e+01 2.948e+01 -0.739 0.46221 lotsize 2.068e-03 6.421e-04 3.220 0.00182 ** sqrft 1.228e-01 1.324e-02 9.275 1.66e-14 *** bdrms 1.385e+01 9.010e+00 1.537 0.12795 --Residual standard error: 59.83 on 84 degrees of freedom Multiple R-squared: 0.6724, Adjusted R-squared: 0.6607 4 4 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 2 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà > library(lmtest) > resettest(hoiquy1) RESET test data: hoiquy1 RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202 > resettest(hoiquy1 , power=2:3, type="fitted") RESET test data: hoiquy1 RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202 > resettest(hoiquy1 , power=2:5, type="fitted") RESET test data: hoiquy1 RESET = 3.2259, df1 = 4, df2 = 80, p-value = 0.01656 H0: Mô hình (9.4) có dạng hàm đúng . Với = 3% p-value = 0.0120 (0.01656) < 0.03 =: bác bỏ H0 5 5 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà • Dạng hàm có log: > summary(hoiquy2) Call: lm(formula = log(price) ~ log(lotsize) + log(sqrft) + bdrms, data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -1.29704 0.65128 -1.992 0.0497 * log(lotsize) 0.16797 0.03828 4.388 3.31e-05 *** log(sqrft) 0.70023 0.09287 7.540 5.01e-11 *** bdrms 0.03696 0.02753 1.342 0.1831 --Residual standard error: 0.1846 on 84 degrees of freedom Multiple R-squared: 0.643, Adjusted R-squared: 0.6302 6 6 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 3 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà > library(lmtest) > resettest(hoiquy2) RESET test data: hoiquy2 RESET = 2.565, df1 = 2, df2 = 82, p-value = 0.08308 H0: Mô hình (9.5) có dạng hàm đúng . Với = 6% p-value = 0.0831 > 0.06 = : chấp nhận H0 7 7 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm • Tập tin crime1.wf1 > summary(hoiquy1) Call: lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86 + black + hispan, data = crime1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.5686855 0.0360461 15.777 < 2e-16 pcnv -0.1332344 0.0403502 -3.302 0.000973 avgsen -0.0113177 0.0122401 -0.925 0.355233 tottime 0.0120224 0.0094352 1.274 0.202698 ptime86 -0.0408417 0.0088120 -4.635 3.74e-06 qemp86 -0.0505398 0.0144397 -3.500 0.000473 inc86 -0.0014887 0.0003406 -4.370 1.29e-05 black 0.3265035 0.0454156 7.189 8.38e-13 hispan 0.1939144 0.0397113 4.883 1.10e-06 --Residual standard error: 0.8286 on 2716 degrees of Multiple R-squared: 0.07232, Adjusted R-squared: Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị. *** *** *** *** *** *** *** freedom 0.06959 8 8 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 4 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm > resettest(hoiquy1) RESET test data: hoiquy1 RESET = 6.2607, df1 = 2, df2 = 2714, p-value = 0.001938 H0: Mô hình có dạng hàm đúng H1: Mô hình có dạng hàm sai p-value = 0,001938 < 0,05 : bác bỏ H0 Vậy mô hình có dạng hàm sai 9 9 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm > summary(hoiquy2) Call: lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86 + black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2), data = crime1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.046e-01 3.684e-02 13.699 < 2e-16 *** pcnv 5.525e-01 1.542e-01 3.582 0.000347 *** avgsen -1.702e-02 1.205e-02 -1.412 0.158028 tottime 1.195e-02 9.282e-03 1.288 0.197924 ptime86 2.874e-01 4.426e-02 6.494 9.88e-11 *** qemp86 -1.409e-02 1.736e-02 -0.812 0.416970 inc86 -3.415e-03 8.037e-04 -4.249 2.22e-05 *** black 2.923e-01 4.483e-02 6.520 8.35e-11 *** hispan 1.636e-01 3.945e-02 4.147 3.47e-05 *** I(pcnv^2) -7.302e-01 1.561e-01 -4.677 3.05e-06 *** I(ptime86^2) -2.961e-02 3.863e-03 -7.664 2.50e-14 *** I(inc86^2) 7.186e-06 2.556e-06 2.811 0.004969 ** --Residual standard error: 0.8151 on 2713 degrees of freedom Multiple R-squared: 0.1035, Adjusted R-squared: 0.09982 10 10 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 5 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm > # Kiem dinh F > library(car) > linearHypothesis(hoiquy2, c("I(pcnv^2)=0", "I(ptime86^2)=0", "I(inc86^2)=0")) Linear hypothesis test Hypothesis: I(pcnv^2) = 0 I(ptime86^2) = 0 I(inc86^2) = 0 Model 1: restricted model Model 2: narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86 + black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2) Res.Df RSS Df Sum of Sq F Pr(>F) 1 2716 1865.0 2 2713 1802.4 3 62.589 31.404 < 2.2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 p-value < 2,2*10-16 < 0,05 : bác bỏ H0 Vậy nên chọn mô hình 2. 11 11 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Kiểm định đối với mô hình không lồng nhau, x hay log(x) 9.6 Mô hình 1: Dạng hàm nào sẽ phù hợp hơn? 9.7 Mô hình 2: Xây dựng một mô hình hỗn hợp và mỗi mô hình ban đầu là trường hợp đặc biệt của mô hình hỗn hợp và kiểm định: y 0 1 x1 2 x2 3 log( x1 ) 4 log( x2 ) u 9.8 H0: 1=0, 2=0 cho mô hình 9.7 Thảo luận H0: 3=0, 4=0 cho mô hình 9.6 Luôn có thể thực hiện; tuy nhiên, không có mô hình chiếm ưu thế rõ ràng. Không thể sử dụng nếu các mô hình có biến phụ thuộc có dạng hàm khác nhau. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 6 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà • Tập tin hprice1.wf1 > summary(hoiquy) Call: lm(formula = price ~ lotsize + sqrft + log(lotsize) + log(sqrft), data = hprice1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.404e+03 9.707e+02 1.446 0.151905 lotsize -4.931e-04 1.020e-03 -0.483 0.630273 sqrft 2.475e-01 6.369e-02 3.886 0.000204 *** log(lotsize) 6.022e+01 2.004e+01 3.004 0.003518 ** log(sqrft) -2.826e+02 1.405e+02 -2.011 0.047556 * --Residual standard error: 56.31 on 83 degrees of freedom Multiple R-squared: 0.7133, Adjusted R-squared: 0.6995 13 13 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà > # Kiem dinh F > library(car) > linearHypothesis(hoiquy, c("lotsize=0", "sqrft=0")) Linear hypothesis test Hypothesis: lotsize = 0 sqrft = 0 Model 1: restricted model Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft) 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 85 312570 83 263156 2 49415 7.7927 0.0007916 *** p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0 Mô hình (9.7) không chiếm ưu thế hơn (9.6) 14 14 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 7 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà > # Kiem dinh F > library(car) > linearHypothesis(hoiquy, c("log(lotsize)=0", "log(sqrft)=0")) Linear hypothesis test Hypothesis: log(lotsize) = 0 log(sqrft) = 0 Model 1: restricted model Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft) 1 2 Res.Df RSS Df Sum of Sq F Pr(>F) 85 309186 83 263156 2 46030 7.2591 0.001244 ** p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0 Mô hình (9.6) không chiếm ưu thế hơn (9.7) 15 15 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.2: Hàm hồi quy giá nhà > # dung encomptest > hoiquy1 <- lm(price ~ lotsize + sqrft, data = hprice1) > hoiquy2 <- lm(price ~ log(lotsize) + log(sqrft), data = hprice1) > library(lmtest) > encomptest(hoiquy1, hoiquy2, data = hprice1) Encompassing test Model 1: price ~ Model 2: price ~ Model E: price ~ Res.Df M1 vs. ME 83 M2 vs. ME 83 lotsize + sqrft log(lotsize) + log(sqrft) lotsize + sqrft + log(lotsize) + log(sqrft) Df F Pr(>F) -2 7.2591 0.0012437 ** -2 7.7927 0.0007916 *** 16 16 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 8 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả thiết được chấp nhận. • Có thể dùng kiểm định Davidson-MacKinnon, trang 350. 17 17 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu 9.2 Sử dụng biến đại diện cho các biến giải thích không quan sát được Ví dụ 9.3: Bỏ sót biến năng lực trong mô hình tiền lương Thay bằng biến đại diện 9.9 Thông thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mô hình có thể bỏ sót biến năng lực không quan sát được. Ý tưởng: tìm một biến đại diện cho năng lực, có thể kiểm soát và thể hiện được năng lực khác nhau giữa các cá nhân, khi đó hệ số hồi quy của các biến khác không còn chệch. Một trong những biến đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự. Cách sử dụng biến đại diện trong mô hình: 9.10 9.11 Biến bỏ sót, chẳng hạn: năng lực Hồi quy biến bỏ sót theo biến đại diện của nó (x3 đại diện cho x3*) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 18 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 9 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Giả thiết đối với biến đại diện Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi quy tổng thể, nghĩa là, nó không tương quan với nhiễu. Nếu nhiễu và biến đại diện có tương quan, biến đại diện cần có mặt trong mô hình hồi quy tổng thể Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm vào không giúp gì trong dự đoán biến bị bỏ sót. 9.13 Nếu điều này không thỏa, thì x1 và x2 cần được thêm vào mô hình hồi quy của biến bị bỏ sót. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 19 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Khi thỏa các giả định trên, biến đại diện được sử dụng như sau: Trong mô hình hồi quy này, sai số ngẫu nhiên e= u+β3v3 không tương quan với tất cả biến giải thích. Khi đó, hệ số hồi quy sẽ được ước lượng đúng bằng OLS. Hệ số của biến x1 và x2 sẽ xác định đúng. Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nó là bội số của hệ số đứng trước biến bị bỏ sót). Thảo luận về giả thiết biến đại diện trong hàm tiền lương Giả thiết 1: Chỉ số IQ phải hoàn toàn không tác động trực tiếp đến tiền lương; quan trọng là một cá nhân chứng minh năng lực trong công việc như thế nào. Giả thiết 2: Hầu hết sự biến động của biến năng lực có thể được giải thích bởi sự thay đổi trong chỉ số IQ, chỉ có một số ít được giải thích bởi học vấn và kinh nghiệm. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 10 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Ví dụ 9.3: IQ là biến đại diện cho năng lực abil Giống với kỳ vọng, suất sinh lợi giáo dục giảm nếu IQ được đưa vào mô hình để làm đại diện cho biến năng lực không quan sát được. Hệ số hồi quy đứng trước biến IQ cho biết sự khác nhau trong năng lực giữa các cá nhân có ý nghĩa quan trọng đến tiền lương (ví dụ, mức chênh lệnh 15 điểm IQ dẫn đến mức chênh lên 5,4 điểm phần trăm trong tiền lương). Ngay cả khi chỉ số IQ không hoàn toàn giải thích sự thay đổi do năng lực, việc thêm nó vào mô hình ít nhất làm giảm tính chệch của suất sinh lợi giáo dục. Có thể có đa cộng tuyến cao giữa IQ và educ Tương tác giữa năng lực và học vấn không có ý nghĩa. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 21 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.3: IQ là biến đại diện cho năng lực abil • Tập tin wage2.wf1 > summary(hoiquy1) Call: lm(formula = log(wage) ~ educ + exper + tenure + married + south + urban + black, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.395497 0.113225 47.653 < 2e-16 educ 0.065431 0.006250 10.468 < 2e-16 exper 0.014043 0.003185 4.409 1.16e-05 tenure 0.011747 0.002453 4.789 1.95e-06 married 0.199417 0.039050 5.107 3.98e-07 south -0.090904 0.026249 -3.463 0.000558 urban 0.183912 0.026958 6.822 1.62e-11 black -0.188350 0.037667 -5.000 6.84e-07 --Residual standard error: 0.3655 on 927 degrees of Multiple R-squared: 0.2526, Adjusted R-squared: *** *** *** *** *** *** *** *** freedom 0.2469 22 22 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 11 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.3: IQ là biến đại diện cho năng lực abil > summary(hoiquy2) Call: lm(formula = log(wage) ~ educ + exper + tenure + married + south + urban + black + IQ, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.1764391 0.1280006 40.441 < 2e-16 *** educ 0.0544106 0.0069285 7.853 1.12e-14 *** exper 0.0141459 0.0031651 4.469 8.82e-06 *** tenure 0.0113951 0.0024394 4.671 3.44e-06 *** married 0.1997644 0.0388025 5.148 3.21e-07 *** south -0.0801695 0.0262529 -3.054 0.002325 ** urban 0.1819463 0.0267929 6.791 1.99e-11 *** black -0.1431253 0.0394925 -3.624 0.000306 *** IQ 0.0035591 0.0009918 3.589 0.000350 *** --Residual standard error: 0.3632 on 926 degrees of freedom Multiple R-squared: 0.2628, Adjusted R-squared: 0.2564 23 23 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.3: IQ là biến đại diện cho năng lực abil > summary(hoiquy3) Call: lm(formula = log(wage) ~ educ + exper + tenure + married + south + urban + black + IQ + educ:IQ, data = wage2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 5.6482478 0.5462963 10.339 < 2e-16 *** educ 0.0184560 0.0410608 0.449 0.653192 exper 0.0139072 0.0031768 4.378 1.34e-05 *** tenure 0.0113929 0.0024397 4.670 3.46e-06 *** married 0.2008658 0.0388267 5.173 2.82e-07 *** south -0.0802354 0.0262560 -3.056 0.002308 ** urban 0.1835758 0.0268586 6.835 1.49e-11 *** black -0.1466989 0.0397013 -3.695 0.000233 *** IQ -0.0009418 0.0051625 -0.182 0.855290 educ:IQ 0.0003399 0.0003826 0.888 0.374564 --Residual standard error: 0.3632 on 925 degrees of freedom Multiple R-squared: 0.2634, Adjusted R-squared: 0.2563 Chọn hoiquy2 24 24 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 12 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Sử dụng biến trễ của biến phụ thuộc làm biến đại diện Trong nhiều trường hợp, yếu tố không quan sát được bị bỏ sót có thể được đại diện bởi giá trị của biến phụ thuộc ở các thời điểm trước. Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố 9.16 Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mô hình ít nhất kiểm soát được phần nào các yếu tố bị bỏ sót có tác động đến tỷ lệ tội phạm trong năm đang xét. So sánh hai thành phố có cùng tỷ lệ tội phạm vào năm trước; nghĩa là, chúng ta đã tránh trường hợp so sánh hai thành phố có sự khác biệt rất lớn trong các yếu tố tác động đến tỷ lệ tội phạm không quan sát được. Kỳ vọng dấu của β3>0. Nếu 2 thành phố có cùng tỷ lệ tội phạm trước đây (crime-1) và tỷ lệ thất nghiệp hiện tại (unem), β2 đo lường tác động của expend lên crime. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 25 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin crime2.wf1 • Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố > > > > > > > # Tao ra cac bien tuong ung voi nam 82 va 87 crmrte87 <- subset(crmrte, d87==1) crmrte82 <- subset(crmrte, d87==0) unem87 <- subset(unem, d87==1) unem82 <- subset(unem, d87==0) lawexpc87 <- subset(lawexpc, d87==1) lawexpc82 <- subset(lawexpc, d87==0) 26 26 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 13 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin crime2.wf1 • Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố > summary(hoiquy1) Call: lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87), data = crime2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.34290 1.25053 2.673 0.0106 * unem87 -0.02900 0.03234 -0.897 0.3748 log(lawexpc87) 0.20337 0.17265 1.178 0.2453 --Residual standard error: 0.3231 on 43 degrees of freedom Multiple R-squared: 0.05712, Adjusted R-squared: 0.01326 Dấu của UNEM87 và LOG(LAWEXPC87) trái với kỳ vọng. 27 27 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố > summary(hoiquy2) Call: lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87) + log(crmrte82), data = crime2) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.076450 0.821143 0.093 0.926 unem87 0.008621 0.019517 0.442 0.661 log(lawexpc87) -0.139576 0.108641 -1.285 0.206 log(crmrte82) 1.193923 0.132099 9.038 2.1e-11 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1905 on 42 degrees of freedom Multiple R-squared: 0.6798, Adjusted R-squared: 0.657 Dấu của UNEM87 và LOG(LAWEXPC87) đúng với kỳ vọng. 28 28 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 14 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu 9.3 Mô hình với hệ số góc ngẫu nhiên (= Mô hình có hệ số ngẫu nhiên) (tự đọc) Mô hình có hệ số chặn ngẫu nhiên và hệ số góc ngẫu nhiên 9.18 Hệ số chặn trung bình Thành phần ngẫu nhiên Hệ số góc trung bình Thành phần ngẫu nhiên Sai số Thành phần ngẫu nhiên của một cá nhân độc lập với biến giải thích Giả thiết: WLS hay OLS với sai số chuẩn cải thiện sẽ giúp ước lượng vững hệ số chặn trung bình và hệ số góc trung bình của tổng thể. 9.20 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 29 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Khi chúng ta sử dụng 1 thước đo không chính xác cho 1 biến kinh tế trong 1 mô hình hồi quy, thì có nghĩa là mô hình của chúng ta hàm chứa vấn đề sai số đo lường. 9.4 Tính chất của OLS khi có sai số trong đo lường Sai số đo lường ở biến phụ thuộc Giá trị sai = Giá trị đúng + Sai số đo lường 9.24 Hàm hồi quy tổng thể Mô hình được ước lượng 9.25 Hậu quả của sai số đo lường ở biến phụ thuộc Ước lượng kém hiệu quả hơn do phương sai sai số cao hơn. Tuy nhiên, ước lượng OLS vẫn không chệch và vững (với giả thiết sai số đo lường e0 không tương quan với các biến giải thích xj). Ngoài ra, các thống kê t, F, LM vẫn hợp lệ. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 30 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 15 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.5: Hàm tiết kiệm với sai số đo lường • sav* = β0 + β1inc + β2size + β3educ + β4age + u • sav*: tiết kiệm thật sự, sav: tiết kiệm báo cáo • e0 = sav-sav* • Khá hợp lý nếu giả thiết sai số đo lường không tương quan với inc, size, educ, age. • Chúng ta có thể không bao giờ biết được sai số đo lường có tương quan với inc, educ hay không, trừ khi chúng ta thu thập được dữ liệu về sav*. • Ví dụ 9.6: Sai số đo lường trong tỷ lệ phế phẩm • log(scrap*)= β0 + β1grant + u • scrap*: tỷ lệ phế phẩm thực tế, scrap: tỷ lệ phế phẩm công ty báo cáo • e0 = log(scrap) - log(scrap*) 31 31 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Sai số đo lường ở 1 biến giải thích 9.28 Giá trị sai = Giá trị đúng + Sai số đo lường 9.27 Hàm hồi quy tổng thể Mô hình được ước lượng 9.30 Sai số không tương quan với giá trị đúng Giả thiết sai số trong đo lường cổ điển: 9.31 9.32 - Giá trị sai x1 có tương quan với sai số của mô hình © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 32 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 16 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Hậu quả của sai số đo lường trong biến giải thích Dưới giả thiết sai số trong đo lường cổ điển (CEV), OLS cho ước lượng chệch và không vững vì biến đo sai x1 bị nội sinh. Có thể biểu diễn tính không vững của ước lượng như sau: Nhân tử này (liên quan đến phương sai của nhiễu trong hàm hồi quy giá trị đúng 9.33 của x1 theo các biến giải thích khác) luôn nhận giá trị từ 0 đến nhỏ hơn 1. Tác động của biến đo sai bị chệch suy giảm, nghĩa là độ lớn tác động của biến đo sai luôn gần với giá trị 0 hơn so với tác động của biến đúng. Ví dụ nếu β1 >0 thì β1^ sẽ có xu hướng ước lượng thấp hơn β1. Ngoài ra, tác động của các biến giải thích khác cũng bị chệch. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 33 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • • • • • • Ví dụ 9.7: Phương trình GPA với sai số đo lường colGPA = β0 + β1faminc* + β2hsGPA + β3SAT + u faminc*: thu nhập thực tế hàng năm của hộ gia đình faminc: thu nhập hàng năm của hộ gia đình do sinh viên kê khai e1 = faminc - faminc* Nếu dùng faminc thay cho faminc* sẽ làm chệch ước lượng OLS của β1 về phía 0. Một hậu quả của sự chệch dưới là kiểm định giả thiết H0: β1 = 0 ; H1: β1 > 0 sẽ thường cho kết quả chấp nhận H0 (do |t| nhỏ). 34 34 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 17 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu 9.5 Dữ liệu bị khuyết, mẫu phi ngẫu nhiên, các quan sát bất thường (tự đọc) Dữ liệu bị khuyết do chọn mẫu Dữ liệu khuyết là trường hợp đặc biệt của vấn đề chọn mẫu (mẫu phi ngẫu nhiên) khi quan sát bị thiếu thông tin không thể sử dụng được. Nếu mẫu được chọn dựa trên các biến độc lập thì hàm hồi quy không gặp bất kỳ vấn đề nào vì hàm hồi quy xét điều kiện dựa trên các biến dộc lập. Nói chung, việc chọn mẫu sẽ không có vấn đề gì trong trường hợp nó không liên quan tới sai số của mô hình (= chọn mẫu ngoại sinh). Việc chọn mẫu sẽ có vấn đề nếu nó dựa trên biến phụ thuộc hoặc sai số (= chọn mẫu nội sinh). © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 35 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Ví dụ về chọn mẫu ngoại sinh 9.37 Nếu mẫu phi ngẫu nhiên được chọn theo nhóm thu nhập, nhóm tuổi, quy mô gia đình, thì hàm hồi quy không có bất kỳ vấn đề gì bởi vì nó nghiên cứu tiết kiệm cho một tập con của tổng thể được xác định bởi thu nhập, tuổi và quy mô gia đình. Ví dụ về chọn mẫu nội sinh 9.38 Nếu mẫu phi ngẫu nhiên là do các cá nhân từ chối tham gia cuộc khảo sát vì giá trị tài sản của họ (wealth) quá cao hoặc thấp, kết quả ước lượng sẽ bị chệch vì những cá nhân này có sự khác biệt một cách hệ thống với những cá nhân không từ chối tham gia mẫu khảo sát. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 36 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 18 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Quan sát bất thường và quan sát có ảnh hưởng lớn Quan sát có giá trị cách xa hay bất thường là vấn đề đặc trưng của OLS vì phương pháp này dựa trên bình phương phần dư. Nếu quan sát bất thường do sai sót khi nhập liệu, ta chỉ cần bỏ đi các quan sát đó. Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc quyết định giữ lại hay bỏ đi những quan sát này không phải dễ dàng. Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp 9.40 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 37 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp (tiếp tục) Giá trị bất thường này không phải là lỗi nhập liệu: Một trong các công ty trong dữ liệu có quy mô lớn hơn các công ty khác Kết quả ước lượng khi không có quan sát bất thường thì có ý nghĩa hơn. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 38 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 19 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp • Tập tin rdchem.wf1 > # hoi quy OLS > ols <- lm(rdintens ~ sales + profmarg, data = rdchem) > summary(ols) Call: lm(formula = rdintens ~ sales + profmarg, data = rdchem) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.625e+00 5.855e-01 4.484 0.000106 *** sales 5.338e-05 4.407e-05 1.211 0.235638 profmarg 4.462e-02 4.618e-02 0.966 0.341966 --Residual standard error: 1.862 on 29 degrees of freedom Multiple R-squared: 0.07612, Adjusted R-squared: 0.0124 > nobs(ols) [1] 32 39 39 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp > # hoi quy OLS bo gia tri bat thuong > ols_bo <- lm(rdintens ~ sales + profmarg, data = rdchem, sales != 39709) > summary(ols_bo) Call: lm(formula = rdintens ~ sales + profmarg, data = rdchem, subset = sales != 39709) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.2968508 0.5918045 3.881 0.000577 *** sales 0.0001856 0.0000842 2.204 0.035883 * profmarg 0.0478411 0.0444831 1.075 0.291336 --Residual standard error: 1.792 on 28 degrees of freedom Multiple R-squared: 0.1728, Adjusted R-squared: 0.1137 > nobs(ols_bo) [1] 31 40 40 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 20 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu 9.6 Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD) Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách cực tiểu hóa tổng trị tuyệt đối của các phần dư (thay vì tổng bình phương phần dư, OLS) 9.45 Ít nhạy cảm hơn với các giá trị bất thường vì không bình phương phần dư. Phương pháp độ lệch tuyệt đối nhỏ nhất ước lượng các tham số của trung vị có điều kiện (thay vì trung bình có điều kiện như OLS) Các ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt của hồi quy phân vị (ước lượng các tham số của phân vị có điều kiện). © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 41 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • • • • Nhược điểm của LAD: Không thể viết thành các công thức đối với các ước lượng LAD. LAD cần nhiều tính toán hơn so với OLS. Các suy diễn thống kê liên quan tới các ước lượng LAD chỉ đúng khi cỡ mẫu lớn. • LAD luôn luôn ước lượng không vững các tham số xuất hiện trong hàm hồi quy trung bình có điều kiện E(y/x1,…xk). • Để LAD ước lượng vững trung bình có điều kiện E(y/x1,…xk) thì cần thêm 2 giả thiết (ngoài các giả thiết đã biết): – Phân phối của u|x1,…, xk đối xứng qua giá trị 0. – u độc lập với (x1,…, xk). 42 42 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 21 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp > > > > # hoi quy LAD library(quantreg) lad <- rq(rdintens ~ sales + profmarg, tau = 0.5, data = rdchem) summary(lad) Call: rq(formula = rdintens ~ sales + profmarg, tau = 0.5, data = rdchem) tau: [1] 0.5 (Median) Coefficients: coefficients lower bd upper bd (Intercept) 1.62309 1.34386 2.66171 sales 0.00002 -0.00011 0.00055 profmarg 0.11790 -0.00002 0.13495 43 43 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Kiểm tra giả thiết MLR4: Xem Chương 15, mục 15.5 44 44 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 22 Chương 9 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 03.08.2021 Môøi gheù thaêm trang web: 45 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ 45 https://sites.google.com/a/ueh.edu.vn/ph amtricao/ 23