TBP Ch ng 1 MÔ HÌNH HỒI QUY HAI BIẾN TBP 22-Sep-21 TBP 1. Hàm hồi quy t ng thể và mẫu Trong quan h h i quy , m t bi n ph thu c có th đ c gi i thích b i nhi u bi n đ c l p N u ch nghiên c u m t bi n ph thu c b nh h ng b i m t bi n đ c l p => Mô hình h i quy hai biến N u m i quan h gi a hai bi n này là tuy n tính => Mô hình h i quy tuyến tính hai biến TBP 22-Sep-21 TBP 1. Hàm hồi quy t ng thể và mẫu Tuy n tính trong h i quy Mô hình h i quy tuy n tính đ i v i tham s Y = a + bx Y = a + bx2 Y = a + b(1/x) Mô hình h i quy tuy n tính đ i v i bi n s Y =a + bx Y=a2 +bx Y =a + b3x Tuy n tính c a các mô hình h i quy là tuy n tính d a vào tham s , không d a vào bi n s TBP 22-Sep-21 1.1. Hàm hồi quy t ng thể (PRF) TBP • M i liên h gi a bi n ph thu c và bi n gi i thích d a trên s li u đã bi t c a toàn b t ng th . Yi = 1 + 2 X i + Ui Trong đó Y : Bi n ph thu c,Yi: Giá tr c th c a bi n ph thu c X : Bi n đ c l p, Xi : Giá tr c th c a bi n đ c l p Ui : Sai s ng u nhiên ng v i quan sát th i. TBP 22-Sep-21 1.1. Hàm hồi quy t ng thể (PRF) Yi = 1 + 2 TBP X i + Ui Trong đó β1,β2 là các tham s c a mô hình v i ý nghĩa : : Tung đ c a hàm h i quy t ng th (intercept coefficient), là giá tr trung bình c a bi n ph thu c Y khi bi n đ c l p nh n giá tr b ng 0 1 : H s góc c a hàm h i quy (slope coefficient), ph n ánh đ d c c a hàm h i quy t ng th , là l ng thay đ i trung bình c a Y khi X thay đ i 1 đ n v 2 TBP 22-Sep-21 TBP 1.2. Hàm hồi quy mẫu Sample Regression Function (SRF) • Trong th c t r t khó nghiên c u trên t ng th nên thông th ng ng i ta nghiên c u xây d ng hàm h i quy trên m t m u => G i là hàm h i quy m u • Bi u di n m i quan h gi a bi n ph thu c v i bi n đ c l p d a trên giá tr trung bình c a t ng th hay giá tr đã bi t c a m u TBP 22-Sep-21 TBP 1.2. Hàm hồi quy mẫu Sample Regression Function (SRF) ˆ ˆ Yi = 1 + 2 X i + ei Trong đó ˆ Tung đ g c c a hàm h i quy m u, là c l ng 1 đi m c a 1 ˆ d c c a hàm h i quy m u, là c l ng đi m 2 c a 2 ei Sai s ng u nhiên, là cl ng đi m c a Ui TBP 22-Sep-21 TBP 1.2. Hàm hồi quy mẫu Sample Regression Function (SRF) ˆ ˆ Yi = 1 + 2 X i + ei Trong đó Tung đ g c c a hàm h i quy m u, là l ng đi m c a 1 d c c a hàm h i quy m u, là đi m c a 2 Sai s ng u nhiên, là cl c cl ng ng đi m c a Ui TBP 22-Sep-21 TBP 1.2. Hàm hồi quy mẫu Sample Regression Function (SRF) Yi = ˆ1 + ˆ2 X i + ei N u b qua sai s ng u nhiên ei , thì giá tr th c t Yi s tr thành giá tr c l ng Yˆi TBP 22-Sep-21 TBP 2. Phương pháp bình phương bé nhất (OLS-Ordinary Least Square) 2.1. Ư c lư ng các tham số c a mô hình Sai s Tìm ˆ ei = Yi Yˆi = Yi 1 ˆ X 2 i ˆ , ˆ sao cho t ng bình ph 1 2 ng sai s là nh nh t n T c là i =1 ei2 = n i =1 (Y i ˆ 1 ˆ X 2 i ) 2 min TBP 22-Sep-21 1.1. Hàm hồi quy tổng thể TBP Tiêu dùng Y (trieu ong/tháng ) 7 Yi = 6 1 + 2Xi + ui ui ? 5 4 3 Yi 2 1 0 0 1 2 3 4 5 Xi 6 7 8 Thu nhập X (triệu đồng/tháng) TBP 22-Sep-21 TBP 2.1. Ư c lư ng các tham số c a mô hình TBP 22-Sep-21 TBP 2.1. Ư c lư ng các tham số c a mô hình Giải bài toán c c trị hàm hai biến, ta đư c n ˆ = 2 i =1 n (Xi n i =1 ˆ =Y 1 V i X )(Yi (Xi X )2 Y) = i =1 n i =1 Yi X i n. X .Y X i2 n.( X ) 2 ˆ X 2 X= Y = Xi n Yi n là giá tr trung bình c a X là giá tr trung bình c a Y TBP 22-Sep-21 TBP 2.1. Ư c lư ng các tham số c a mô hình Ví d 1: Quan sát v thu nh p (X – tri u đ ng/n m) và chi tiêu (Y – tri u đ ng/n m) c a 10 ng i, ta đ c các s li u sau : Xi 31 50 47 45 39 50 35 40 45 50 Yi 29 42 38 30 29 41 23 36 42 48 Xây d ng hàm h i quy m u Yˆi = ˆ1 + ˆ2 X i TBP 22-Sep-21 TBP Ví d 2: Ng i ta mu n phân tích và đánh gía k t qu và n ng su t lúa do l ng phân bón mang l i c a đ ng b ng song C u Long trong 10 n m, s li u đ c thu th p nh sau: Y 40 44 46 48 52 58 60 68 74 80 X 6 10 12 14 16 18 22 24 26 32 Hãy c l ng hàm h i quy tuy n tính m u. Nêu ý ngh a các h s h i quy. Các giá tr đó có phù h p v i lý thuy t không? TBP 22-Sep-21 TBP 2.2. Các giả thiết c a mô hình Gi thi t 1 : Các giá tr Xi cho tr c và không ng u nhiên Gi thi t 2 : Các sai s Ui là đ i l ng ng u nhiên có giá tr trung bình b ng 0 Gi thi t 3 : Các sai s Ui là đ i l ng ng u nhiên có ph ng sai không thay đ i Gi thi t 4 : Không có s t ng quan gi a các Ui Gi thi t 5 : Không có s t ng quan gi a Ui và Xi Khi các gi thi t này đ c đ m b o thì các c l ng tính đ c b ng ph ng pháp OLS là các c l ng t t nh t và hi u qu nh t c a hàm h i quy t ng th Ta nói, c l ng OLS là Unbias Estimator) cl ng BLUE (Best Linear TBP 22-Sep-21 TBP 3. Hệ số xác định c a mô hình Yˆi Y SRF Yi Yi Yˆi = ei Yi Y Yˆi Y Y Xi X TBP 22-Sep-21 TBP 3. Hệ số xác định c a mô hình Dùng đ đo m c đ phù h p c a hàm h i qui T ng bình phương toàn phần Total Sum of Squares-TSS T ng bình ph ng t t c các sai l ch gi a giá tr th c t c a Y v i giá tr trung bình c a nó. TSS = 2 (Yi Y ) = Yi 2 n(Y ) TBP 2 22-Sep-21 TBP 3. Hệ số xác định c a mô hình T ng bình phương hồi quy Explained Sum of Squares-ESS T ng bình ph đ ng t t c các sai l ch gi a giá tr c a Y c tính theo mô hình v i giá tr trung bình c a nó. ESS = 2 2 ˆ ˆ (Yi Y ) = 2 ( X 2 i 2 nX ) TBP 22-Sep-21 TBP 3. Hệ số xác định c a mô hình T ng bình phương phần dư Residual Sum of Squares-RSS T ng bình ph ng t t c các sai l ch gi a giá tr th c t v i giá tr lý thuy t theo mô hình c a Y. RSS = 2 ˆ (Yi Yi ) = 2 i e TBP 22-Sep-21 TBP 3. Hệ số xác định c a mô hình TSS = ESS + RSS H s xác đ nh ESS R = TSS 2 •0≤ R2 ≤1 •R2 =1 : mô hình hoàn toàn phù h p v i m u nghiên c u •R2=0 : mô hình không phù h p v i m u nghiên c u • Ý nghĩa R2 : mô hình h i quy gi i thích đư c bao nhiêu % s bi n đ ng c a bi n ph thu c Y b i bi n đ c l pX TBP 22-Sep-21 TBP 4. Hệ số tương quan (r) H s t ng quan (r): đo l ng m c đ ch t ch c a quan h tuy n tính gi a 2 đ i l ng X và Y. 𝒓 ∑ 𝑿𝒊 ∑ 𝑿𝒊− 𝑿 𝑿 𝒀𝒊 𝟐∑ 𝒀𝒊 𝒀 𝒀 𝟐 Ch ng minh đ c: Và d u c a r trùng v i d u c a ˆ2 (h s g c trong hàm h i quy) TBP 22-Sep-21 TBP 4. Hệ số tương quan (r) Tính chất c a hệ số tương quan 1. Mi n giá tr c a r: -1 ≤ r ≤ 1 |r| -> 1: X và Y có quan h tuy n tính càng ch t ch 2. r có tính ch t đ i x ng: rXY = rYX 3. N u X, Y đ c l p thì r = 0. i u ng c l i không đúng TBP 22-Sep-21 TBP 5. Phương sai và sai số chuẩn c a a. Phương sai Var ( ˆ ) = 1 2 ˆ 1 var( ˆ2 ) = = X n( 2 ˆ 2 X = 2 i 2 i X 2 2 nX ) n( X 2 i 2 X 2 i 2 nX ) ˆ nX 2 X 2 i 2 i ˆ2 2 nX TBP 2 22-Sep-21 TBP 5. Phương sai và sai số chuẩn c a b. Sai số chuẩn se( ˆ ) = 1 Trong đó: se( ˆ2 ) = 2 ˆ 1 2 ˆ 2 = Var(Ui) Khi đó 2 đ c g i là ph ng sai c a t ng th , r t khó tính đ c nên th ng đ c c l ng b ng ph ng sai m u 2 2 ˆ = 2 ei n 2 = (Yi Yˆi ) n 2 RSS = n 2 TBP 22-Sep-21 TBP 6. Khoảng tin cậy c a các hệ số hồi quy a. Khoảng tin cậy c a β2 Kho ng tin c y c a ˆ 2 v i đ tin c y 1- là se( ˆ2 ); ˆ2 + t t 2 V i t 2 có đ se( ˆ2 ) 2 c khi tra b ng t-Student v i b c t do (n-2), 2 m c ý ngh a /2 TBP 22-Sep-21 TBP 6. Khoảng tin cậy c a các hệ số hồi quy b. Khoảng tin cậy c a β1 Kho ng tin c y c a ˆ 2 V t i 2 v i đ tin c y 1- là se( ˆ1 ); ˆ1 + t t 1 1 có đ se ( ˆ1 ) 2 c khi tra b ng t-Student v i b c t do (n-2), m c ý ngh a /2 TBP 22-Sep-21 TBP Ví d 1 áp d ng T s li u tr c, hãy tính kho ng tin c y c a các h s h i quy và cho bi t ý ngh a c a chúng v i đ tin c y 95% TBP 22-Sep-21 TBP 7. Kiểm định giả thuyết về hệ số hồi quy a. Kiểm định giả thuyết về β2 Ho: H1: 2= 2≠ o o V i đ tin c y là 1-α Cách 1: Phương pháp kho ng tin c y B c 1:L p kho ng tin c y c a B c 2:N u N u 0 thu 2 c kho ng tin c y thì ch p nh n H0. 0 không thu c kho ng tin c y thì bác b H0 TBP 22-Sep-21 TBP 7. Kiểm định giả thuyết về hệ số hồi quy a. Kiểm định giả thuyết về β2 Cách 2: Phương pháp giá tr t i hạn (ki m đ nh t) ˆ B c 1 : tính giá tr t i h n t0 = B B c 2 : tra b ng t-Student v i b c t do (n-2) tìm t /2 c3: N u -t /2 ≤ t0 ≤ t /2 : ch p nh n gi thuy t H0 N u t0 < -t /2 ho c t0 > t /2 : bác b gi thuy t H0 2 0 se( ˆ2 ) TBP 22-Sep-21 7. Kiểm định giả thuyết về hệ số hồi quy TBP a. Kiểm định giả thuyết về β2 Cách 3: Phương pháp p-value ˆ B c 1 : tính giá tr t i h n t0 = B c 2 : Tính p_value = P(|t| > |t0|) (t c là kh n ng gi thuy t H0 b bác b ) c3: N u p_value > : ch p nh n gi thuy t H0 N u p_value ≤ : bác b gi thuy t H0 B 2 0 se( ˆ2 ) TBP 22-Sep-21 7. Kiểm định giả thuyết về hệ số hồi quy TBP b. Kiểm định giả thuyết về β1 Ho: H1: 1= 1≠ o o V i đ tin c y là 1-α T ng t ki m đ nh gi thuy t v t i h n lúc này là t= ˆ 1 2 nh ng giá tr 0 se( ˆ1 ) TBP 22-Sep-21 TBP Ví d áp d ng T s li u đã cho c a ví d tr c , yêu c u ki m đ nh các gi thi t sau Ho: 2 = 0 a) V i đ tin c y là 95% H1: 2 ≠ 0 b) Ho: H1: 1= 0 1≠ 0 V i đ tin c y là 95% TBP 22-Sep-21 TBP 8. Kiểm định s phù h p c a mô hình K m đ nh gi thi t Ho:R2 = 0 V i đ tin c y là 1H1:R2 ≠ 0 Phương pháp ki m đ nh F R 2 ( n 2) F= 1 R2 B c 1 : tính B c 2 : Tra b ng tìm F(1,n-2), m c ý ngh a là α B c 3 : N u F>F(1,n-2) , bác b H0 N u F≤F(1,n-2) , ch p nh n H0 ( ) TBP 22-Sep-21 TBP 9. D báo Cho tr c giá tr X = X0, hãy d báo giá tr trung bình c a Y v i m c ý ngh a hay đ tin c y1- . Yˆi = ˆ1 + ˆ2 X i * D báo điểm Yˆ0 = ˆ1 + ˆ2 X 0 TBP 22-Sep-21 TBP 9. D báo •D báo giá trị trung bình: Kho ng tin c y c a Y0 v i đ tin c y (1- ) là 2 Yˆ0 V i = ˆ2 1 + n se(Yˆ0 ) = Yˆ0 ( X 0 X )2 2 2 X i n( X ) 2 Yˆ0 se(Yˆ0 ); Yˆ0 + t t 2 se(Yˆ0 ) 2 TBP 22-Sep-21 TBP Ví d áp d ng T s li u đã cho c a ví d tr c , yêu c u d báo kho ng giá tr c a Y khi X0 = 60 (tri u đ ng/n m) v i đ tin c y 95% Yˆi = 5,4517 + 0,9549 X i * Dự báo điểm TBP 22-Sep-21 TBP •D báo giá trị trung bình: Kho ng tin c y c a Y0 v i đ tin c y (1- ) là TBP 22-Sep-21 10. TBP i đ n v c a bi n Trong hàm h i quy hai bi n, n u đ n v tính c a X và Y thay đ i => áp d ng công th c đ i đ n v Hàm h i quy theo đ n v c : Yˆi = ˆ1 + ˆ2 X i Hàm h i quy theo đ n v m i: * * * * ˆ ˆ ˆ Yi = 1 + 2 X i * là ký hiệu cho hàm có đơn vị mới Trong đó: * Yi = k1Yi * X i = k2 X i Khi đó: ^ * 1 * ^ 2 = k1 ^ 1 = k1 / k 2 TBP ^ 22-Sep-21 2 10. TBP i đ n v c a bi n 𝜎∗ = 𝑘 𝜎 𝑅 =𝑅 ∗ ∗ Var(𝛽 ∗ ) = 𝑘 Var(𝛽 ) Var(𝛽 ∗ ) = se(𝛽 ∗ ) = 𝑘 se(𝛽 ∗ ) = Var(𝛽 ) se(𝛽 ) se(𝛽 ) TBP 22-Sep-21 10. TBP i đ n v c a bi n Hàm Y (tri u đ/tháng) = 5 + 7X (t n) + ei Tính theo (tri u đ/n m) và (Kg) TBP 22-Sep-21 TBP Bài t p Nghiên c u m c v n huy đ ng đ c (tri u USD/n m) theo lãi su t ti n g i (% n m), ta có b ng s li u sau: Vốn 11,9 9,4 Lãi 7,2 4 su t 7,5 3,1 4,0 1,6 11,3 6,3 4,8 5,1 1. Vi t hàm h i quy m u. các h s h i quy. 2. Tính h s t ng quan 2,2 2,0 10,3 7,6 6,6 4,4 c ý ngh a TBP 22-Sep-21 TBP 3. Tính h s xác đ nh, đ c ý ngh a. 4. Tính kho ng tin c u c a các h s h i quy, m c ý ngh a 10%. 5. T m u s li u trên, có ý ki n cho r ng lãi su t không nh h đ ng gì đ n m c v n huy đ ng c t khách hàng, b n hãy cho bi t nh n xét trên đúng không 6. c ý ngh a. Hãy d m c ý ngh a 5%. báo m c v n huy đ ng đ c trung bình n u lãi su t 5% n m v i đ tin c y 90%. TBP 22-Sep-21 TBP 11. M r ng mô hình h i quy 2 bi n 11.1. H i quy qua g c t a đ Mô hình: PRF: Yi = n V i ˆ = 2 i =1 n Yi X i X i =1 đ X i + Ui Yi = ˆ2 X i + ei SRF: 2 2 c cl và var( ˆ2 ) = 2 ˆ 2 2 = X 2 i ng b ng 2 i 2 i e RSS ˆ = = n 2 n 2 2 TBP 22-Sep-21 TBP 11. M r ng mô hình h i quy 2 bi n 11.1. H i quy qua g c t a đ Lưu ý: R2 có th âm đ i v i mô hình này, nên không dùng R2 mà thay b i R2thô Không th so sánh R2 v i R2thô Th ng ng i ta dùng mô hình có tung đ g c, tr khi có m t th c nghi m c n ph i dùng mô hình qua g c to đ TBP 22-Sep-21 TBP 11.2. Mô hình tuy n tính logarit Mô hình log-log, log kép hay tuy n tính log Được biểu diễn dưới dạng sau: ln Yi = ln 1 + 2 ln X i + U i Mô hình không tuyến tính theo tham số và biến số = ln * 1 Y * i * * 1 = ln Yi X i = ln X i Yi = * 1 + * 2 X i + Ui Ý nghĩa c a hệ số β2: khi X thay đ i 1% thì Y thay đ i β2%. (Đây chính là h s co giãn c a Y đ i v i X) TBP 22-Sep-21 TBP 11.3. Mô hình log-lin Mô hình bán logarit ngh a là ch có m t bi n th hi n d i d ng logarit: Ý nghĩa c a hệ số β2: khi X thay đ i 1 đ n v thì Y thay đ i 100.β2%. ng d ng: Nghiên c u kh o sát t c đ tr t ng ng (gi m sút) c a các bi n s kinh t v mô nh GDP, dân s , lao đ ng, n ng su t. TBP 22-Sep-21 TBP 11.4. Mô hình lin-log Mô hình bán logarit ngh a là ch có m t bi n th hi n d i d ng logarit: Ý nghĩa c a hệ số β2: khi X thay đ i 1% thì Y thay đ i 2 /100 đ n v . ng d ng: Nghiên c u kh o sát m t s quan h : l cung ti n nh h đ ng t i s n l ng ng t i GNP, di n tích tr ng tr t tác ng cây tr ng, di n tích c n nhà tác đ ng t i giá nhà,… TBP 22-Sep-21 TBP 11.4. Mô hình ngh ch đ o ng d ng: Quan h gi a chi phí s n xu t c đ nh trung bình và s n l ng Quan h gi a t l thay đ i ti n l (đ ng và t l th t nghi p ng cong Philips) ng chi tiêu Engel bi u di n m i quan h gi a chi tiêu c a ng i tiêu dùng cho m t lo i hàng hóa v i t ng chi tiêu hay thu nh p c a ng i đó TBP 22-Sep-21 TBP Bài t p V i s li u th ng kê v 2 bi n X và Y nh sau Yi 23 19.5 24 21 Xi 3 2 4 2 25 22 26.5 23.1 25 5 4 7 6 9 28 8 29.5 26 10 8 V i Y là thu nh p (tr đ/n m), X là thâm niên (n m) TBP 22-Sep-21 TBP Chương 2 MÔ HÌNH HỒI QUY BỘI TBP 07-Oct-21 TBP 1. Mô hình hồi quy 3 biến 1.1. Hàm hồi quy tổng thể (PRF) Yi = 1 + 2 X 2i + 3 X 3i + U i Trong ó Y là bi n ph thu c X2,X3 là các bi n cl p X2i, X3i là giá tr th c t c a X2, X3 Ui là các sai s ng u nhiên TBP 07-Oct-21 T B P 1.2. Các giả thiết c a mô hình Giá tr trung bình c a nhiên Ui b ng 0 Ph i l ng sai c a Ui không thay Không có s t Không có s gi a X2 và X3 Không có s t X2,X3 ng ng u i ng quan gi a các Ui t ng quan (c ng tuy n) ng quan gi a các Ui và TBP 07-Oct-21 I. Moâ hình hoài quy tuyeán tính 3 bieán TBP 1.3. Ư c lư ng các tham số Chúng ta s d ng ph nh nh t OLS PRF : Yi = 1 + Hàm h i quy m u t SRF : Yi = Hay: Yi = ng pháp bình ph 2 X 2i + 3 ng X 3i + U i ng ng s là : 1 + 2 X 2i + 3 X 3i + ei 1 + 2 X 2i + 3 X 3i TBP 07-Oct-21 TBP 1.3. Ư c lư ng các tham số ei = Yi Yi = Yi Theo ph 1 , 2 X 2i 3 X 3i ng pháp OLS thì các tham s 2 e = 2 i 1 , c ch n sao cho 3 (Y i 1 2 X 2i 3 X 3i ) 2 min Nh v y , công th c tính c a các tham s nh sau : TBP 07-Oct-21 TBP 1.3. Ư c lư ng các tham số Ký hi u: 2 ( = yi = Yi Y x2 i = X 2 i X2 x3i = X 3i X3 yi x2i )( ( x ( x )( x ) ( ( y x )( x ) ( x = ( x )( x ) ( 2 2i 1 2 3i 2 2i i 3i 3 x32i ) 2 2i =Y 2 X2 )( x2i x3i ) yi x3i ) 2 x 2 i 3i 2 3i 3 x 2 i 3i )( x2i x3i ) yi x2i ) 2 X3 TBP 07-Oct-21 TBP 1.3. Ư c lư ng các tham số x = 2 2i x = 2 3i y = 2 i X 2 2i n( X 2 ) X 2 3i n( X 3 ) Yi 2 2 2 n(Y ) 2 x2i x3i = X 2i X 3i nX 2 X 3 yi x2i = Yi X 2i nY . X 2 yi x3i = Yi X 3i nY . X 3 TBP 07-Oct-21 TBP Ví d B ng d i ây cho các s li u v doanh s bán (Y), chi phí chào hàng (X2) và chi phí qu ng cáo (X3) c a m t công ty Hãy cl ng hàm h i quy tuy n tính c a doanh s bán theo chi phí chào hàng và chi phí qu ng cáo TBP 07-Oct-21 Doanh s bán Yi (tr /n m) 1270 1490 1060 1626 1020 1800 1610 1280 1390 1440 1590 1380 Chi phí chào hàng X2 Chi ph qu ng c o X3 TBP 100 106 60 160 70 170 140 120 116 120 140 150 180 248 190 240 150 260 250 160 170 230 220 150 TBP 07-Oct-21 TBP T s li u trên, ta tính đ c các t ng nh sau : Yi = 16956 X = 188192 X 2i = 1452 X 2i X 3i = 303608 X 3i = 2448 X = 518504 2 2i 2 3i Yi = 24549576 Y = 1413 Yi X 3i = 3542360 X 2 = 121 Yi X 2i = 2128740 X 3 = 204 2 TBP 07-Oct-21 y = 2 i x = 2 2i x = 2 3i Yi 2 X 2 2i X 2 3i n(Y ) = 590748 TBP 2 n(X 2 ) = 12500 2 n(X 3 ) = 19112 2 yi x 2 i = Yi X 2i nY X 2 = 77064 yi x3i = Yi X 3i nY X 3 = 83336 x2i x3i = X 2i X 3i nX 2 X 3 = 7400 TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 1.4. Hệ số xác định c a mô hình TSS = ESS = (Yi Y) = 2 yi x 2 i + 2 RSS = TSS 3 Yi 2 nY 2 yi x3i ESS ESS R = TSS 2 TBP 07-Oct-21 TBP 1.4. Hệ số xác định c a mô hình i v i mô hình h i quy b i, ng R2 có hi u ch nh nh sau : i ta tính n 1 R = 1 (1 R ) n k 2 2 k là s tham s trong mô hình Khi k>1 thì R 2 R 2 1 TBP 07-Oct-21 TBP 1.4. Hệ số xác định c a mô hình Ví d : Tính h s xác nh c a mô hình h i quy theo s li u c a ví d tr c TSS = (Yi Y ) = 2 Yi 2 nY 2 TSS = 590748 ESS = 2 yi x 2 i + 3 yi x3i = ESS = 571662 ,67 RSS = TSS ESS = RSS = 19085 ,33 TBP 07-Oct-21 TBP 1.4. Hệ số xác định c a mô hình TBP 07-Oct-21 TBP 1.5. Phương sai c a hệ số hồi quy Ph ng sai c a các tham s h i quy theo các công th c sau: 2 1 = 2 1 X + n 2 2 x +X se( 1 ) = 2 3i x 2 3 2 2i x 2 3i x 2 2i ( c tính 2X 2 X3 x2i x3i ) x2i x3i 2 2 1 TBP 07-Oct-21 TBP 1.5. Phương sai c a hệ số hồi quy 2 2 = se( 2 3i x 2 x 2 )= 2 2i 2 3i x ( x2i x3i ) 2 2 2 TBP 07-Oct-21 TBP 1.5. Phương sai c a hệ số hồi quy 2 3 se ( V i = 3 x )= 2 x 2 2 2i 2 3i x 2 2i ( x2i x3i ) 2 2 3 RSS = n 3 TBP 07-Oct-21 1.6. Khoảng tin cậy c a các hệ số hồi quy Kho ng tin c y c a 1 t se( V i 1 1 ); 1 2 t 2 se ( 2 se ( 1 ) 2 Kho ng tin c y c a 2 tin c y là 1- +t 2 TBP ); 2 +t se ( 2 ) 2 TBP 07-Oct-21 TBP 1.6. Khoảng tin cậy c a các hệ số hồi quy Kho ng tin c y c a 3 t se( 2 3 3 ); 3 +t se( 3 ) 2 L u ý khi tra b ng T-Student, trong tr ng h p hàm h i quy 3 bi n thì b c t do là (n-3) TBP 07-Oct-21 1.6. Khoảng tin cậy c a các hệ số hồi quy TBP Ví d : Tính kho ng tin c y c a 2 và 3 mô hình h i quy theo s li u c a ví d tr c v i tin c y 95% Gi i: tra b ng T-Student b c t do (n-3)=12-3=9 t0, 025 = 2,262 TBP 07-Oct-21 TBP 1.6. Khoảng tin cậy c a các hệ số hồi quy Kho ng tin c y c a 2 là Kho ng tin c y c a 3 là TBP 07-Oct-21 TBP 1.7. Kiểm định giả thuyết Ki m a) nh gi thuy t v Ho: i= H1: i≠ 1, 2 3 o o - Cách 1: Kho ng tin c B c 1 : L p kho ng tin c y B c2:N u N u 0 không 0 thu c kho ng tin c y thì ch p nh n Ho. thu c kho ng tin c y thì bác b Ho Ví d : (theo s li u tr thi t 2 , 3 V i c), yêu c u ki m nh các gi tin c y 95% TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 1.7. Kiểm định giả thuyết a) Ki m nh gi thuy t v - Cách 2: Giá r ih nt 1, 𝛽 2 3 𝛽0 B c 1 : tính giá tr t i h n 𝑡0 B B c 2 : tra b ng t-Student v i b c t do (n-3) tìm t /2 c3: N u -t /2 t0 t /2 : ch p nh n gi thuy t H0 N u t0 < -t /2 ho c t0 > t /2 : bác b gi thuy t H0 𝑠𝑒 𝛽 TBP 07-Oct-21 N u chi phí CH và chi phí QC b ng không thì doanh s bán trung bình là 300 tri u ng/n m. Nh n nh này úng hay sai, MYN 5%. TBP TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 1.7. Kiểm định giả thuyết a) Ki m nh gi thuy t v 1, 2 3 - Cách 3: P-value 𝛽 𝛽0 B c 1 : tính giá tr t i h n 𝑡0 B c 2 : Tính p_value = P(|t| > |t0|) (t c là kh n ng gi thuy t H0 b bác b ) c3: N u p_value > : ch p nh n gi thuy t H0 N u p_value : bác b gi thuy t H0 B 𝑠𝑒 𝛽 TBP 07-Oct-21 TBP 1.7. Kiểm định giả thuyết b) Ki m nh gi thuy t v R2 Ho:R2= 0 H1:R2≠ 0 N u p_value > : ch p nh n gi thuy t H0 N u p_value : bác b gi thuy t H0 B R 2 ( n 3) c 1 : tính F = 2 21 R B c 2 : Tra b ng tìm F(2,n-3), m c ý ngh a là B c3: ( ) N u F>F(2,n-3) , bác b H0 N u F F(2,n-3) , ch p nh n H0 TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 1.7. Kiểm định giả thuyết b) Ki m nh gi thuy t v R2 Ví d : Yêu c u ki m nh gi thuy t Ho:R2= 0 tin c y là 95% 2 H1:R ≠ 0 Gi i : F = 0,9677 (12 3) = 134,79 2(1 0,9677 ) F ( 2,9) = 4,26 ( = 0,05) Vì F>F(2,9) nên bác b gi thuy t H0 TBP 07-Oct-21 TBP 2. M t số dạng hàm 2.1. Hàm sản xuất Cobb-Douglas Hàm s n xu t Cobb-Douglas c bi u di n nh sau: 3 Ui 2 Yi = Trong ó : Y i X2i X3i Ui 1 X 2 i X 3i e : s n l ng c a doanh nghi p : l ng v n : l ng lao ng : sai s ng u nhiên Hàm s n xu t Cobb-Douglas có th a cv d ng tuy n tính b ng cách l y logarit hai v TBP 07-Oct-21 TBP 2. M t số dạng hàm 2.1. Hàm sản xuất Cobb-Douglas ln Yi = ln t 1 + 2 ln X 2i + 3 ln X 3i + U i Yi = ln Yi * * 1 * 2i * 3i = ln 1 X = ln X 2i X = ln X 3i D ng tuy n tính s là : Yi = * * 1 + 2 X * 2i + 3 X +Ui * 3i TBP 07-Oct-21 TBP ánh giá hi u qu kinh t c a mô hình khi t ng quy mô s n xu t (𝛽2+ 𝛽3)=1, t ng quy mô s không có hi u qu (𝛽2+ 𝛽3)<1, t ng quy mô s d n n kém hi u qu (𝛽2+ 𝛽3)>1, t ng quy mô s có hi u qu TBP 07-Oct-21 TBP 2.2. Hàm hồi quy đa th c bậc 2 Yi = 1 + 2Xi + 2 X 3 i +Ui M c dù ch có m t bi n c l p Xi nh ng nó xu t hi n v i các lu th a khác nhau khi n cho mô hình tr thành h i quy ba bi n TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP Bài t p 1. Vi t hàm h i quy m u. quy 2. Tính h s xác ch nh 3. Tính kho ng tin c y c a b3, 4. V i K CYTKK , N u thu nh p t l ng t ng 1 tri u ng/ tháng thì chi tiêu trung bình t ng 500 ngàn ng/tháng. B n có ng ý không? 5. Mô hình có phù h p không? 6. Vi t mô hình h i quy m u v i ng/n m 7. Biến Thu nhập t lương có thật s tác đ ng nh. c ý ngh a các h s h i c ý ngh a. Tính R2 hi u c ý ngh a n v là tri u TBP 07-Oct-21 TBP 3. HỐI QUY TUYẾN TÍNH K BIẾN 3.1. Hàm hồi quy tổng thể (PRF) Yi = 1 + 2 X 2i + 3 X 3i + ... + k X ki + U i Trong ó Y là bi n ph thu c X2,X3, ,Xk là các bi n c l p Ui là các sai s ng u nhiên 1 :H s t do 2, 3, , k là các h s h i quy riêng TBP 07-Oct-21 TBP 3.1. Hàm hồi quy tổng thể (PRF) K hi u Y= Y1 1 U1 Y2 2 U2 ... Yn = ... k U= ... Un TBP 07-Oct-21 TBP 3.1. Hàm hồi quy tổng thể (PRF) Và X= 1 X 21 X 31 ... X k1 1 X 22 X 32 ... X k 2 ... ... ... ... ... 1 X 2n X 3n ... X kn TBP 07-Oct-21 TBP 3.1. Hàm hồi quy tổng thể (PRF) Khi ó , h th ng các quan sát có th vi t l i d i d ng : c Y = X . +U TBP 07-Oct-21 TBP 3.2. Các giả thiết c a mô hình hồi quy k biến Gi thi t 1 : Các bi n không ng u nhiên c l p X1, X2, ,Xk ã cho và Gi thi t 2 : Các sai s ng u nhiên Ui có giá tr trung bình b ng 0 và có ph ng sai không i Gi thi t 3: Không có s t Gi thi t 4 : Không có hi n t bi n c l p X2, X3, ,Xk ng quan gi a các sai s Ui ng c ng tuy n gi a các Gi thi t 5 : Không có t ng quan gi a các bi n X2,X3, ,Xk v i các sai s ng u nhiên Ui cl p TBP 07-Oct-21 TBP 3.2. Các giả thiết c a mô hình hồi quy k biến Hàm h i quy m u : SRF: Yi = 1 + 2 X 2i + 3 X 3i + ... + k X ki + ei hoặc: Yi = 1 + 2 X 2i + 3 X 3i + ... + k X ki Hay : (Vi t d i d ng ma tr n ) Y=X +e TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Với = 1 e1 2 e2 ... k e= ... en TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số SRF: Yi = hoặc: 1 Yi = + 1 2 + X 2i + 2 X 2i + 3 X 3i + ... + 3 X 3i + ... + k X ki + ei k X ki Khi đó ei = (Yi Yi ) = Yi 1 2 X 2i 3 X 3i ... k TBP X ki 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Theo ph ơng pháp OLS thì các tham s 1 , 2 , e = 2 i = (Y i 3 ,..., (Y Yi i 1 2 đ k X 2i ) c ch n sao cho 2 3 X 3i ... k X ki ) 2 min TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Ta k hi u chuy n v c T c là T T T T X ,Y , , e a X ,Y , , e là các ma tr n Y = (Y1 , Y2 ,..., Yn ) T e = ( e1 , e2 ,..., en ) T T = ( , 1 ,..., 2 k ) TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số X= T 1 1 1 ... 1 X 21 X 22 X 23 ... X 2 n ... ... ... X k1 Xk2 ... ... X k 3 ... X kn TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Khi ó : = (X X ) X Y T 1 T TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Trong ó (XTX) là ma tr n có d ng n X 2i XTX = ... X ki X 2i X 2 2i ... X ki X 2i Yi X Y = T X 3i ... X ki X 2i X 3i ... X 2i X ki ... ... ... X ki X 3i ... X 2 ki 165 Yi X 2i = 1028 Yi X 2i 813 TBP 07-Oct-21 TBP 3.3. Ư c lư ng các tham số Ví d minh hoạ B ng d i ây cho các s li u v l ng hàng bán c c a m t lo i hàng hóa(Y), thu nh p c a ng i tiêu dùng (X2) và giá bán c a lo i hàng này (X3) Tìm hàm h i quy tuy n tính Yi = + 1 X + 2 2i X 3 3i TBP 07-Oct-21 Yi (tấn/tháng) 20 X2 (triệu đồng/năm) 8 X3(ngàn đồng/kg) 2 18 7 3 19 8 4 18 8 4 17 6 5 17 6 5 16 5 6 15 5 7 13 4 8 12 3 8 TBP TBP 07-Oct-21 TBP Gi i T s li u trên, ta tính c các t ng nh sau: Yi = 165 X = 388 X 2i = 60 X 2i X 3i = 282 X 3i = 52 X = 308 2 2i 2 3i Yi = 2781 Y = 16,5 Yi X 3i = 813 X2 = 6 Yi X 2i = 1029 X 3 = 5, 2 2 TBP 07-Oct-21 TBP n X X= T X 2i X 2i X 3i X 2 2i X 3i X 2 i X 3i 10 60 52 X 2i X 3i = 60 388 282 X 2 3i 52 282 308 26.165 -2.497 -2.131 ( X X ) = -2.497 0.246 0.196 T 1 -2.131 0.196 0.183 TBP 07-Oct-21 TBP Yi X Y= 165 Yi X 2i = 1028 T Yi X 2i 813 14.992 = ( X X ) X Y = 0.762 T 1 1 = 14,992 2 = 0,762 3 = 0,589 T -0.589 V y: Yi = 14,992 + 0, 762 X 2i 0,589 X 3i TBP 07-Oct-21 TBP 3.4. Hệ số xác định c a mô hình TSS = Y Y T ESS = T n(Y ) T X Y RSS = TSS 2 n(Y ) 2 ESS ESS R = TSS 2 TBP 07-Oct-21 TBP 3.4. Hệ số xác định c a mô hình Chú ý: Khi t ng s bi n c l p trong mô hình thì R2 c ng t ng cho dù các bi n thêm có nh h c l p t ng ng mô hình hay không. Do ó không th dùng R2 quy t nh có nên thêm bi n vào mô hình hay không mà thay vào ó có th s d ng h s xác nh c hi u ch nh. TBP 07-Oct-21 TBP 3.4. Hệ số xác định c a mô hình i v i m h nh h i qu b i, ng R2 c hi u ch nh nh sau : i ta t nh n 1 R = 1 (1 R ) n k 2 2 k là s tham s trong mô hình Khi k>1 thì R 2 R 2 1 2 R Có th âm, trong tr ng h p âm, ta coi giá tr c a nó b ng 0 TBP 07-Oct-21 TBP 2 R Cách s d ng để quyết định đưa thêm biến vào mô hình Mô hình hai biến Yi = 1 + 2 R2 R1 2 R2 2 R1 X 2i Mô hình ba biến Yi = 1 + 2 X 2 i + 3 X 3i R2 2 R2 2 Thì chọn mô hình (1), t c là không cần đ a thêm biến X3 vào mô hình. Ng c lại, ta chọn mô hình (2) TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP TBP 07-Oct-21 1. 2. 3. 4. 5. 6. 7. 8. TBP Vi t HHQM, c ý ngh a c a b^2, b^3. Gi nguyên l ng lao ng, s n l ng t ng thêm trong kho ng nào n u v n t ng 1%. Gi nguyên l ng lao ng, s n l ng t i a có th t ng thêm bao nhiêu n u v n t ng 1%. Gi nguyên l ng v n, s n l ng t ng thêm trong kho ng nào n u lao ng t ng 1%. Gi nguyên l ng v n, s n l ng t i thi u t ng thêm trong kho ng nào n u lao ng t ng 1%. Gi nguyên l ng v n, lao ng t ng 1% thì s n l ng t ng 0,7% nh n nh này úng hay sai? Mô hình có phù h p không? Trong 4 MH, Ch n mô hình t t nh t, n u ch y mô hình: lnQ = b1 + b2k+b3L +e lnQ = b1 + b2lnk+b3L +e lnQ = b1 + b2lnk +e TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết G i cjj là ph n t n m Khi ó : 2 j se( V i dòng j c t j c a ma tr n (XTX)-1 = 2 ) = j 2 2 .c jj .c jj 2 j RSS = (k là s tham s ) n k TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết Khoảng tin cậy cho m t hệ số hồi quy: đánh giá tác đ ng khi m t biến đ c lập thay đổi ( j t se( 2 (n-k) j ); j + t se( j )) 2 Kho ng tin c y m t phía: Kho ng tin c y ( ∞, 𝛽 𝑡 Kho ng tin c y (𝛽 𝑡 , cl , ng giá tr l n nh t cho HSHQ . 𝑠𝑒 𝛽 cl ng giá tr bé nh t cho HSHQ . 𝑠𝑒 𝛽 , ∞ TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết Khoảng tin cậy cho biểu th c c a hai HSHQ: đánh giá tác đ ng khi hai biến đ c lập thay đổi Gi s X2 và X3 cùng gia t ng (gi m) m t n v , khi ó giá tr trung bình c a Y gia t ng (gi m) (𝛽2 nv. (𝜷𝟐 cl 𝒕𝜶,𝒏 𝟐 𝑠𝑒 𝛽2 (𝜷𝟐 ng m c gia t ng trung bình c a Y, xây d ng KTC cho (𝛽2 𝜷𝟑 𝜷𝟑 𝒕𝜶,𝒏 𝟐 𝒌 . 𝒔𝒆 𝜷𝟐 𝛽3 )= 𝑣𝑎𝑟 𝛽2 𝒌 . 𝒔𝒆 𝛽3 𝜷𝟐 𝑠𝑒 𝛽2 - 𝛽3 )= 𝑣𝑎𝑟 𝛽2 𝛽3 𝜷𝟑 , 𝜷𝟐 𝑣𝑎𝑟 𝛽3 𝜷𝟑 , 𝜷𝟐 𝑣𝑎𝑟 𝛽3 𝜷𝟑 𝒕𝜶,𝒏 𝟐 𝒌 . 𝒔𝒆 𝜷𝟐 𝜷𝟑 2𝑐𝑜𝑣 𝛽2 𝛽3 𝜷𝟑 𝒕𝜶,𝒏 𝟐 𝒌 . 𝒔𝒆 𝜷𝟐 𝜷𝟑 2𝑐𝑜𝑣 𝛽2 𝛽3 TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết Khoảng tin cậy cho biểu th c c a hai HSHQ: đánh giá tác đ ng khi hai biến đ c lập thay đổi (𝑎𝛽2 M t cách t ng quát, v i a và b là các giá tr b t k thì KTC cho m c gia t ng trung bình c a bi n Y khi X2 t ng a n v và X3 t ng b nv c tính b i công th c: 𝑏𝛽3 𝑡 , . 𝑠𝑒 𝑎𝛽2 𝑏𝛽3 , 𝑎𝛽2 𝑏𝛽3 𝑡 , . 𝑠𝑒 𝑎𝛽2 𝑏𝛽3 Sai s chu n: 𝑠𝑒 𝑎𝛽2 + b𝛽3 )= 𝑎2 𝑣𝑎𝑟 𝛽2 𝑏 2 𝑣𝑎𝑟 𝛽3 2𝑎𝑏𝑐𝑜𝑣 𝛽2 𝛽3 TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết Kho ng tin c y c a ( t se( j j j là ); j + t se( 2 )) 2 Ho c tính giá tr t i h n c a t= j * j j se( j ) j là B c t do là (n-k) TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 3.5. Khoảng tin cậy và kiểm định giả thuyết Ki m V i nh gi thuy t v R2 tin c y 1- Ho:R2= 0 H1:R2≠ 0 B R 2 (n k ) c 1 : tính F = (k 1) (1 R 2 ) B c 2 : Tra b ng tìm F(k-1,n-k), m c ý ngh a là B c 3 : N u F>F(k-1,n-k) , bác b H0 N u F F(k-1,n-k) , ch p nh n H0 TBP 07-Oct-21 TBP 3.6. Vấn đề d báo 1 Cho Xo = X 0 2 ... X 0 n Yêu c u d báo giá tr Y0 c a Y TBP 07-Oct-21 TBP 3.6. Vấn đề d báo D báo i m : Y0 = 0 + 2 X + 0 2 3 X + ... + 0 3 k X 0 k D báo kho ng : (Y0 t se(Y0 ); Y0 + t se(Y0 )) 2 2 B c t do là (n-k) TBP 07-Oct-21 TBP 3.6. Vấn đề d báo 2 Y0 = se(Y0 ) = 2 T 0 T 1 X (X X ) X0 2 Y0 TBP 07-Oct-21 TBP TBP 07-Oct-21 1. 2. 3. 4. 5. 6. 7. 8. TBP Vi t HHQM, c ý ngh a c a b^2, b^3. Gi nguyên l ng lao ng, s n l ng t ng thêm trong kho ng nào n u v n t ng 1%. Gi nguyên l ng lao ng, s n l ng t i a có th t ng thêm bao nhiêu n u v n t ng 1%. Gi nguyên l ng v n, s n l ng t ng thêm trong kho ng nào n u lao ng t ng 1%. Gi nguyên l ng v n, s n l ng t i thi u t ng thêm trong kho ng nào n u lao ng t ng 1%. Gi nguyên l ng v n, lao ng t ng 1% thì s n l ng t ng 0,7% nh n nh này úng hay sai? Mô hình có phù h p không? Trong 4 MH, Ch n mô hình t t nh t, n u ch y mô hình: lnQ = b1 + b2k+b3L +e lnQ = b1 + b2lnk+b3L +e lnQ = b1 + b2lnk +e TBP 07-Oct-21 TBP 9. Cho r ng: v i cùng m t t l , t ng quy mô v n em l i hi u qu b ng nh t ng quy mô v lao ng. B n nh n xét th nào v nh n nh này? L nh cov: estat vce 10. Theo b n, vi c t ng quy mô s n xu t c a 30 doanh nghi p trên có th làm t ng hi u qu không? 11. N u các doanh nghi p m r ng quy mô, n u v n t ng 1% và lao ng t ng 5% thì s n l ng thay i trong kho ng nào? TBP 07-Oct-21 TBP TBP 07-Oct-21 TBP 1. 2. 3. 4. 5. 6. 7. Vi t HHQM, c ý ngh a các HSHQ Các bi n có ý ngh a th ng kê không? i n v X2 t tri u ng/tháng sang tri u ng/n m. Có nh n nh cho r ng thu nh p và m c giàu có c a khách hàng có nh h ng nh nhau lên s l ng xe g n máy tiêu th . B n có ng ý? Khi giá bán t ng 1tr /chi c thì l ng xe máy thay i t i a trong kho ng nào? Mô hình trên có phù h p không? B n có xu t gì cho n v kinh doanh xe máy? TBP 07-Oct-21 Bài 2: các y u t nh h ng chi tiêu TBP 1. vi t hàm HQM. c ý ngh a các HSHQ 2. Các HSHQ có ý ngh a th ng kê không? 3. V i k t qu h i quy t m u s li u trên, n u cho r ng: cùng m t m c t ng thu nh p nh nhau, thu nh p ngoài l ng t ng s d n n t ng chi tiêu cao h n so v i thu nh p t l ng t ng. Ý ki n này úng không? 4. Tính KTC các HSHQ 5. Tính h s t 6. Ki m ng quan nh s phù h p c a mô hình. TBP 07-Oct-21 TBP TBP 07-Oct-21 Bài 3: các y u t nh h ng nl ng cam 𝛼 1. Vi t hàm HQM, c ngh a HSHQ. Tính KTC và 2. Giá qu t có nh h 3. Giá qu t gi m 1 ngàn ng/kg thì l Nh n nh này úng hay sai? 4. Ki m 5. Hàm HQM thay 6. Theo b n bi n X2 có nên thêm vào mô hình ban 7. Trong 3 mô hình d ng l TBP 10% c ngh a, r. ng cam bán hay không? ng cam bán t ng 2 t n/tháng. nh s phù h p c a mô hình i th nào n u Y: t /n m, X2: tri u ng/t u không? i, b n ch n mô hình nào? - MH1: Y, X2, X3 - MH2: Y, X2 - MH3: Y, X3 8. Trong 5 mô hình b n ch n mô hình nào? - MH4: Y, X2, LnX3 - MH5: Y, LnX2, LnX3 TBP 07-Oct-21 TBP Ch ng 3 H I QUY V I BIẾN GIẢ TBP 08-Oct-21 TBP 1. Bản chất c a biến giả Các bi n c l p Xi trong các mô hình nghiên c u thông th l ng là nh ng bi n ã nh ng, giá tr quan sát là nh ng con s Ví d : Thu nh p, chi tiêu, chi phí, doanh thu .v.v.. Tuy nhiên có nh ng tr l p này là nh ng bi n ng h p các bi n c nh tính. Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm… TBP 08-Oct-21 TBP 1. Bản chất c a biến giả Bi n nh tính th ng bi u th có hay không có m t tính ch t ho c là các m c khác nhau c a m t tiêu th c thu c tính nào ó Ví d : gi i tính (nam hay n ), tôn giáo, dân t c, n i sinh, hình th c s h u, ngành ngh kinh doanh .v.v… l ng hoá các bi n h i quy ng nh tính, trong phân tích i ta dùng bi n gi (dummy variables) TBP 08-Oct-21 TBP 2. Biến đ c lập là biến đ nh tính 2.1. Các biến đ nh tính ch có hai l a ch n Ví d : - Gi a hai ngôi nhà có cùng các c tr ng, m t có h b i trong khi ngôi nhà còn l i không có. - Gi a hai nhân viên c a m t công ty có cùng tu i, h c v n, kinh nghi m, m t ng i là nam và ng i kia là n … TBP 08-Oct-21 TBP 2.1. Các biến đ nh tính ch có hai l a ch n Ví d : Gi s mu n nghiên c u ti n l ng c a các nhân viên t i m t doanh nghi p có b h ng b i v n nh gi i tính hay không? TBP 08-Oct-21 TBP t: - Y: bi n ph thu c bi u th l ng c a nhân viên và là bi n nh l ng - Z: bi n c l p, bi u th cho gi i tính, là bi n nh tính: Z=0 n Z = 1 nam Mô hình h i quy có d ng: Yi = 1+ 2Zi + Ui M c l ng trung bình c a nhân viên n là E(Y/Z=0) = 1 M c l ng trung bình c a nhân viên nam là E(Y/Z=1) = 1+ 2 ng chênh l ch gi a nam v i n 2 bi u th m c l TBP 08-Oct-21 Lương (tri u/năm) Gi i tính 115 95 Nam N 120 Nam 105 N 125 Nam 110 N 132 Nam 116 N 125 N 140 Nam TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP • Nếu đặt Gi= 1 là n , nam:0 thì có đư c không? • Mô hình thay đ i như thế nào? TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP 2.1. Các biến đ nh tính ch có hai l a ch n Tóm lại: • Bi n gi này là bi n nh nguyên ch nh n giá tr 1 v i nam nhân viên và 0 v i n nhân viên. • Chúng ta s thi t l p và c l ng m t mô hình s d ng bi n gi nh m t bi n gi i thích. D ng n gi n nh t c a mô hình nh sau: TBP 08-Oct-21 TBP 2.1. Các biến đ nh tính ch có hai l a ch n Mô hình h i quy có d ng: Yi = 1+ 2Zi + Ui T m th i b qua sai s Ui i v i nam: Z = 1 nam Y= + 1 iv in : Z=0 Y= 1 n TBP 2 08-Oct-21 TBP 2.1. Các biến đ nh tính ch có hai l a ch n Vậy làm thế nào để xem xét doanh nghiệp này có s khác biệt tiền lương gi a nhân viên nam và n hay không? Ki m nh gi thuy t Ho: 2= 0 H1: 2≠ 0 tin c y 1- TBP 08-Oct-21 TBP 2.2. Các biến đ nh tính có nhi u hơn hai l a ch n S l a ch n có th có c a m t bi n có th nhi u h n hai. nh tính Có 2 cách: • Dùng bi n gi có nhi u giá tr , s giá tr b ng v i s l a ch n • Dùng nhi u bi n gi , m i bi n có giá tr 0 và 1 không r i vào b y bi n gi : S biến giả = s l a ch n - 1 TBP 08-Oct-21 2.2. Các biến đ nh tính có nhi u hơn hai l a ch n L ng (tri u/n m) Ví d : Kh o sát m c l ng c a nhân viên có trình cao ng, i h c, th c s , 105 Có bao nhiêu biến giả đưa vào mô hình? 115 95 120 125 110 132 116 125 140 TBP Trình Cao Cao ng ng ih c Cao ng ih c Cao ng Th c s Cao ng ih c Th c s TBP 08-Oct-21 • Ta dùng hai bi n gi Z1 và Z2 • • Z1= 1 ih c Z1= 0 Trình khác Z2=1 Th c s Z2= 0 Trình khác TBP L ng Trình 115 95 120 105 125 110 132 116 125 140 Cao Cao ng ng ih c Cao ng ih c Cao ng Th c s Cao ng ih c Th c s TBP 08-Oct-21 Nh v y trình c xác TBP c a m t nhân viên nh b ng vi c k t h p hai bi n nói trên: Z1 = 0, Z2 = 0 cao Z1 = 1 , Z2 =0 ih c Z1 = 0 , Z2 =1 ng th c s Lúc này mô hình h i quy có d ng: Yi = β1+β2Z1i + β3Z2i +Ui TBP 08-Oct-21 TBP E (Y / Z1 = 0, Z 2 = 0) = 1 ph n ánh m c l ng trung bình c a nhân viên có trình cao ng. E (Y / Z1 = 1, Z 2 = 0) = 1 + 2 ph n ánh m c l ng trung bình c a nhân viên có trình i h c. E (Y / Z1 = 0, Z 2 = 1) = ph n ánh m c l có trình th c s . 1 + 3 ng trung bình c a nhân viên TBP 08-Oct-21 TBP - Vi t hàm h i quy - Ý ngh a 1, 2, 3 TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP 3. Biến đ c lập là biến đ nh tính lẫn đ nh lư ng 3.1. Trư ng h p có m t biến đ nh tính v i 2 l a ch n L y l i ví d trên kh o sát l ng c a nhân viên theo s thâm niên và gi i tính. • t Yi : là ti n l ng hàng tháng c a nhân viên th i. • G i Xi : là kinh nghi m c a nhân viên th i • V i Zi =1 : nhân viên nam • V i Zi =0 : nhân viên n N u b qua y u t gi i tính, ch xét m i quan h gi a ti n l ng hàng tháng và kinh nghi m, m t mô hình h i quy n cho quan h này là: Yi = 1 + 2 X i + Ui TBP 08-Oct-21 TBP 3.1. Trư ng h p có m t biến đ nh tính v i 2 l a ch n Lúc này, câu h i t ra là :"Gi a hai nhân viên có cùng kinh nghi m, có s khác bi t trong ti n l ng tháng do gi i tính không?" Khi ó, n u tính thành Yi = 1 + n bi n gi , mô hình s tr 2 Xi + 3 Zi + U i TBP 08-Oct-21 TBP 1. Vi t hàm HQM. c ý ngh a HSHQ 2. Mô hình có phù h p không? 3. Có khác bi t ti n l ng gi a các gi i tính không? 4. Kinh nghi m có th t s tác ng n ti n l ng không? 5. Vi t hàm HQM cho nhân viên có gi i tính n . y X Z 115 95 11 9 1 0 120 10 1 105 12 0 125 13 1 110 12 0 132 14 1 116 14 0 125 15 0 140 15 1 TBP 08-Oct-21 TBP 1. Vi t hàm h i quy 2. Ý ngh a c a 1, 2 , 3 là gì? 3. xem xét y u t gi i tính có th c s nh h ng n m c l ng c a nhân viên hay không, chúng ta ph i ki m nh gi thuy t β1 : là tiền lương khởi điểm của nhân viên. β2: mức tiền lương trung bình tăng thêm khi nhân viên có thêm một năm kinh nghiệm β3: Sự chênh lệch tiền lương trung bình của nhân viên nam và nữ. TBP 08-Oct-21 TBP TBP 08-Oct-21 3.2. Trư ng h p có m t biến đ nh tính v i nhi u hơn hai l a ch n Y X TBP Z Z1 Z2 115 95 11 9 1 0 0 0 0 0 120 10 1 1 0 105 12 0 0 0 125 13 1 1 0 Khi ó mô hình h i quy có d ng: 110 12 0 0 0 Y = β1+β2Z1 + β3Z2 + β4X +Ui 132 14 1 0 1 116 14 0 0 0 125 15 0 1 0 140 15 1 0 08-Oct-21 Ví d : kh o sát l ng c a nhân viên theo s thâm niên và T HV TBP 1 TBP TBP 08-Oct-21 TBP 3.3. H i quy m t biến lư ng và hai biến đ nh tính Ví d : Kh o sát v m c l ng c a nhân viên trên, bên c nh y u t v s n m i làm, gi i tính, m c l ng ng còn ch u nh h ng b i trình h cv nc a i nhân viên. Có ba c p b c h c v là cao ng, i h c, th c s . Ta xét mô hình Y= 1 + c xét t i 2 n gi n sau: X+ 3 Z+ Z + 4 1 4 Z2 + U TBP 08-Oct-21 TBP 1. Vi t hàm HQM. c ý ngh a HSHQ 2. Mô hình có phù h p không? 3. Có khác bi t ti n l ng gi a các gi i tính không? 4. Kinh nghi m có th t s tác ng n ti n l ng không? 5. Có s khác bi t ti n l ng gi a trình cao ng v i i h c? 6. Có s khác bi t ti n l ng gi a trình cao ng v i th c s ? 7. Có nên thêm bi n X vào trong mô hình ban u g m có Y và Z 8. Trong hai mô hình: Y, X, Z và Y, X. Nên ch n mô hình nào? 9. V i MYN 10%, mô hình nào t t nh t: - Y, Z - Y, X - Y, x, Z - Y, X, Z, Z1, Z2 10. Tính h s t ng quan c a 2 i l ng Y và X 11. V i MYN 10%, b n g i ý nhân viên công ty nên làm gì c i thi n ti n l ng. TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 4. S d ng biến giả trong phân tích mùa TBP Ví d : Nghiên c u v l ng i n n ng tiêu th theo nhi t b ng cách s d ng mô hình h i quy: Y: là l ng i n n ng tiêu th , X : là nhi t Chúng ta s d ng bi n gi b ng cách quy c: D1 = 1 : mùa ông, D1 = 0: các mùa khác D2 = 1: mùa xuân, D2 = 0: các mùa khác D3 = 1 : mùa h , D3 = 0 : các mùa khác Khi ó hàm h i quy có th vi t d Y= 0 + 1 D1 + 2 D2 + i d ng: 3 D3 + 0 X +U TBP 08-Oct-21 Tuy nhiên, mô hình trên v n ch a ph c vì nhi t s c thuy t và mùa có th có quan h ch t ch v i nhau, và nh h l TBP ng c a nhi t iv i ng i n n ng tiêu th gi a các mùa khác nhau có th c ng khác nhau. Chính vì th chúng ta c n t ng tác: Y= 0 a vào mô hình y u t + 1 D1 + 2 D2 + 3 D3 + ( 0 + 1 D1 + 2 D2 + 3 D3 ) X + U Trong ó 1 , 2 , 3 bi u th s khác bi t nh h nhi t gi a các mùa v i l ng i n tiêu th . ng c a TBP 08-Oct-21 TBP Hàm h i quy c l ng i n n ng tiêu th theo nhi t ng v i t ng mùa: Mùa thu: Y = Mùa ông: Y= Mùa xuân: Mùa h : 0 + X 0 + Y= 0 + 2 + 0 X+ 2 X Y= 0 + 3 + 0 X+ 3 X 1 + 0 0 X+ 1 X TBP 08-Oct-21 TBP 5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô hình h i quy Khi h i quy m t m u s li u theo chu i th i gian, có kh n ng x y ra nh ng thay i v c u trúc trong m i quan h gi a bi n ph thu c và bi n c l p => giá tr tham s h i quy có th b bi n ng. Nguyên nhân: • • • • Tác ng b i môi tr ng bên ngoài Do chính sách c a Nhà n c thay i Thay i t môi tr ng n i b doanh nghi p Giai o n tr c và sau hôn nhân i v i thu nh p và chi tiêu c a cá nhân TBP 08-Oct-21 TBP 5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô hình h i quy Khi t ng th bao g m hai nhóm mang c tính khác nhau nh nam/ n ; thành th / nông thôn;… => các h s h i quy c a hai nhóm có b ng nhau không. N u các h s là b ng nhau, ta nói r ng các h s là n nh. => Có 2 ph ng pháp ki m nh tính n nh TBP 08-Oct-21 TBP 6.1. Kiểm định Chow Các b c ki m nh Chow: n = n1 + n2 Gi thuy t: Ho: C u trúc mô hình không i H1: C u trúc mô hình thay i Bư c 1: c l ng mô hình h i quy v i m u ban u g m n quan sát, ta có RSSR . V i t do n-k; k là s tham s h i quy Bư c 2: c l ng mô hình h i quy n1 quan sát, ta có RSS1. B c t do n1 k Bư c 3: c l ng mô hình h i quy n2 quan sát, ta có RSS2. B c t do n2 k • N u h s h i quy t ng ng c a các mô hình không i qua các giai o n khác nhau thì c u trúc mô hình không i. TBP 08-Oct-21 TBP • N u h s h i quy t ng ng c a các mô hình khác nhau thì th c hi n ti p các b c: B B c 4: Tính RSSu = RSS1 + RSS2, b c t do n1+n2-2k c 5: Tính ( RSS R RSSU ) / k FC = RSSU /( n 2k ) B c 6: tra b ng F (k, n1+n2-2k) B c 7: so sánh: • N u F<F ;(k, n-2k): Ch p nh n gi thi t Ho • N u F>F ;(k, n-2k): Bác b gi thi t Ho TBP 08-Oct-21 TBP KI M Đ NH TÍNH N Đ NH CẤU TRÚC TÁC Đ NG C A XUẤT KHẨU LÊN GDP TRƯ C VÀ SAU KHI VI T NAM GIA NHẬP WTO T ng c c Th ng kê TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 H n ch c a ki m TBP nh Chow N u hai mô hình khác nhau thì ki m này không ch ra nào, c khác nhau nh h s h s ch n, h s góc, hay c hai lo i h s ? Ki m sát nh Chow c ng òi h i r ng s quan m i nhóm ph i trình ki m l n, vì trong quá nh c n th c hi n h i quy cho m i nhóm TBP 08-Oct-21 TBP 5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô hình h i quy 5.2. Kiểm định d a trên việc s d ng biến giả Gi thuy t: Ho: H1: cl Yi = 3 = 4 =0 (C u trúc mô hình không 2+ 2 ≠0 (C u trúc mô hình thay 3 4 i) i) ng h i qui v i d ng hàm nh sau: 1 + 2Xi + 3Di + 4DiXi + ui Trong ó: • D = 1 n u s li u c l y t th i k 1 (b s li u 1, n1 quan sát) • D = 0 n u s li u c l y t th i k 2 (b s li u 2, n2 quan sát) TBP 08-Oct-21 TBP Sau khi c l ng ta thu c t ng bình ph ng các ph n d , ký hi u là RSSU. c l ng mô hình không s d ng bi n gi , mô hình là Yi = 1 + 2Xi + ui và thu c giá tr RSSR. Tr th ng kê ki m nh: ( RSS R RSSU ) / k FC = RSSU /( n 2k ) tra b ng F (k, n1+n2-2k) So sánh: • N u F<F ;(k, n-2k): Ch p nh n gi thi t Ho • N u F>F ;(k, n-2k): Bác b gi thi t Ho TBP 08-Oct-21 TBP Khi nghiên c u SAVINGS là l m t th i o n cho tr ng ti t ki m c a ng c và bi n i dân M trong c l p thu nh p INCOME. Ng i ta th y r ng có hai th i o n trong su t kho ng th i gian 1970-1995, có th gây ra nh ng thay i trong mô hình hành vi ti t ki m. B i vì s liên t c t ng m nh v giá d u l a trên th gi i h i n m 1979 cho nh t n m 1981, t 13,5 ôla/thùng lên 36 ôla/thùng ã gây nên cu c kh ng ho ng n ng l ng tr m tr ng trên th gi i. Tác ng c a nh ng bi n ng m nh m v giá d u l a th gi i cùng s t ng v t v lãi su t cho vay th c t M và trên kh p th gi i ã là m t nhân t quan tr ng gây ra cu c kh ng kinh t th gi i nói chung và cu c kh ng ho ng n 1982 nói riêng. V y hành vi ti t ki m có th có s khác bi t gi a hai th i k là 1970-1981 và th i k 1982-1995. TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP TBP 08-Oct-21 TBP Bài t p KI M NH TÍNH N NH C U TRÚC TÁC NG C A XU T KH U LÊN GDP TR C VÀ SAU KHI VI T NAM GIA NH P WTO: XK , GDP (n2: 2007- 2019, n1:1990-2006) Xem xét m i quan h gi a h c v n và m c l ng gi a lao ng thành th và lao ng nông thôn có khác nhau hay không. (nông thôn=0; thành th =1) n=935 Wage= b1 +b2urban + b3Edu + b4 Urban*edu+e Bài t p 8 file s li u và bài t p stata TBP 08-Oct-21 Wage=2815,83-190,27urban+38,91edu+26,14urban*edu +e TBP c ý ngh a h s h i quy TBP 08-Oct-21 6. H i quy tuyến tính t ng khúc TBP Kh o sát m c chi tr hoa h ng theo doanh thu c a m t doanh nghi p dành cho các i lý bán hàng. M c hoa h ng chi tr tùy theo doanh thu t • N u m c doanh thu v ng X*, m c hoa h ng s thay t ng c. i, gi s t ng tuy n tính theo doanh thu. • S d ng hàm h i quy tuy n tính t ng khúc cho t c ng t ng hoa h ng theo doanh thu ng X*, ngh a là i t i ng d cc a mô t ng v i ng h i quy thay ng X* TBP 08-Oct-21 TBP S d ng biến giả D =0 , n u X ≤X* D = 1 n u X > X* Hàm h i quy tuy n tính t ng khúc có d ng: Y= + 1 X+ 2 (X X )D + U * Trung bình hoa h ng khi doanh thu < X* : + 1 X Trung bình hoa h ng khi doanh thu ≥X* : + 1 X+ 2 (X * X ) TBP 08-Oct21 TBP Trong tr ng h p có hai ng ng doanh thu: X* và X**, chúng ta s d ng hai bi n gi D1 và D2 D1 = 1 n u X> X*, D1 = 0: tr D2 = 1, n u X > X**, D2 = 0, tr ng h p khác ng h p khác Hàm h i quy tuy n tính t ng khúc có d ng: Y = + 1 X + 2 ( X X ) D1 + 3 ( X X ) D2 + U * ** TBP 08-Oct-21 7. Ý ngh a h s h i quy c a bi n gi Kh o sát l ng c a giáo viên (Y) theo trình TBP (D=0: c nhân, D=1: th c s ) và theo s n m gi ng d y (X) 7.1. Mô hình Log – Lin 𝑙𝑛𝑌 = 𝛽1 + 𝛽 𝑋 + 𝛽 𝐷 + 𝑈 100. 𝛽 : 𝛽 Antilog(𝛽1 )= e 1 : 𝛽 Antilog(𝛽 )-1= e -1: TBP 08-Oct-21 7. Ý ngh a h s h i quy c a bi n gi TBP 7.2. Mô hình Lin – Log Gi s nhu c u kh o sát l ng c u c a hai lo i trà Artiso và trà Hoa Cúc theo giá. D=0 trà artiso, D=1 trà hoa cúc 𝑌 = 𝛽1 + 𝛽 𝑙𝑛𝑋 + 𝛽 𝐷 + 𝑈 𝛽 /100 𝛽: TBP 08-Oct-21 TBP Bài t p XK , GDP (n2: 2007-2019, n1: 2006-1990 Xem xét m i quan h gi a h c v n và m c l ng gi a lao ng thành th và lao ng nông thôn có khác nhau hay không. (dùng file dữ liệu wage2.wf1 trong tài liệu KTL để thực hành cho phần lý thuyết 6.) Th c hành bài s 8 trong Bài tập eviews. C n c k t qu , hãy g i ý chính sách. Y c x z z*x TBP 08-Oct-21 TBP Ví d minh ho B ng d i ây là s li u gi thi t v m c l ng giáo s i h c (Y), s n m kinh nghi m gi ng d y (X) và gi i tính (Di=1:nam; Di=0:n ) Yi 23,0 19,5 Xi 11 9 Di 1 0 Yi 25,0 28,0 Xi 15 15 Di 0 1 24,0 21,0 25,0 10 12 13 1 0 1 29,5 26,0 27,5 16 16 17 1 0 0 22,0 26,5 23,1 12 14 14 0 1 0 31,5 29,0 18 18 1 0 TBP 08-Oct-21 TBP Ví d minh ho 1) Tìm hàm h i quy Yi = 1 + 2 X i + 3 Di 2) Gi i tính có nh h ng n m c l ng c a giáo s i h c hay không ? 3) D báo m c l ng c a m t giáo s nam có s n m kinh nghi m gi ng d y là 17 n m v i tin c y 95% 4) D báo m c l ng c a m t giáo s n có s n m kinh nghi m gi ng d y là 19 n m v i tin c y 95% TBP 08-Oct-21 TBP Chương 4 ĐA C NG TUY N TBP 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n Thông thư ng các biến đ c lập không có m i quan hệ tuyến tính. Nếu quy tắc này bị vi phạm thì sẽ có hiện tư ng đa c ng tuyến. Như vậy , “đa c ng tuyến ”là hiện tư ng các biến đ c lập trong mô hình ph thu c lẫn nhau và thể hiện đư c dư i dạng hàm s TBP 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n Xét mô hình h i quy tuyến tính k biến v i hàm PRF : Yi 1 + 2 X 2i + 3 X 3i + ... + k X ki + U i Đa c ng tuy n hoàn hảo xảy ra khi gi a các biến đ c lập có m i quan hệ chính xác theo dạng a 2X 2 + a 3X 3 + ... + ak X k = 0 Đa c ng tuy n không hoàn hảo xảy ra khi gi a các biến đ c lập có m i quan hệ theo dạng a 2X 2 + a 3X 3 + ... + a k X k + V = 0 TBP 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n X2 X3 X4 627 843 650 786 704 3135 4215 3250 3930 3520 3165 4260 3275 3987 3582 TBP 16-Oct-21 1. Gi i thi u đa c ng tuy n Ví d TBP Đa c ng tuyến hoàn hảo: X2 10 X3 50 X4 52 15 18 24 11 75 90 120 55 78 97 129 63 TBP 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n i u gì x y ra khi có a c ng tuy n hoàn h o ? Xét ví d hàm h i quy tuyến tính 3 biến Yi + 1 2 X 2i + 3 X 3i + U i Và giả s có đa c ng tuyến hoàn hảo : X3i=aX2i Ta có : ˆ2 Vì : X3i=aX2i ˆ ( 2 yi x2i )( ( ( ( yi x 2 i ) a 2 ( x 2 2i x )(a 2 2i x22i 2 )( x32i ) 2 3i x ( x ) ( ) (a x x ) (a 2 2i x x 2 i 3i 2i 2i )( x2i x3i ) yi x3i ) 2 )(a x2 i x2 i ) yi x 2 i ) 2 TBP 0 0 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n 0 Tương t : ˆ3 0 Nếu thay X3i=aX2i vào hàm h i quy ta đư c: Yi 1 + Yi 1 +( 2 X 2i + 2 + 3 3 aX 2 i + U i a ) X 2i + U i Như vậy trong trư ng h p đa c ng tuyến hoàn hảo thì không thể ư c lư ng đư c các hệ s trong mô hình mà chỉ có thể ư c lư ng đư c m t t h p tuyến tính c a các hệ s đó. TBP 16-Oct-21 TBP 1. Gi i thi u đa c ng tuy n i u gì x y ra khi có a c ng tuy n không hoàn h o ? Vẫn có thể ư c lư ng các hệ s trong mô hình nhưng sẽ có nh ng hậu quả c a đa c ng tuyến không hoàn hảo. TBP 16-Oct-21 2. Nguyên nhân c a đa c ng tuy n TBP Do phương pháp thu thập d li u: + Các giá trị c a các biến đ c lập ph thu c lẫn nhau trong mẫu, nhưng không ph thu c lẫn nhau trong t ng thể. Ví d : người có thu nhập cao hơn khuynh hướng sẽ có nhiều của cải hơn. Điều này có thể đúng với mẫu mà không đúng với tổng thể . Cụ thể , trong tổng thể sẽ có các quan sát về các cá nhân có thu nhập cao nhưng không có nhiều của cải và ngược lại. TBP 16-Oct-21 TBP 2. Nguyên nhân c a đa c ng tuy n + Các biến đ c lập đư c ch n có quan hệ nhân quả hay có m i quan hệ tương quan cao vì cùng ph thu c vào m t điều kiện khác. Vd: - số giường bệnh và số bác s cùng phụ thuộc vào quy mô của bệnh viện. TBP 16-Oct-21 2. Nguyên nhân c a đa c ng tuy n TBP Kích c mẫu quá nh Dạng hàm mô hình: Ví dụ: hồi qui dạng các biến độc lập được bình phương (dạng hàm) sẽ xảy ra đa cộng tuyến và đặc biệt khi phạm vi giá trị ban đầu của biến độc lập là nhỏ. Các biến đ c lập vĩ mô đư c quan sát theo d liệu chu i th i gian Ví dụ: Nhập khẩu quốc gia phụ thuộc vào GDP và CPI (các chỉ số này được thu thập từ d liệu chuỗi thời gian) TBP 16-Oct-21 3. Hậu quả c a đa c ng tuy n TBP H qu khi có a c ng tuy n không hoàn h o 1. Phương sai c a các ư c lư ng theo OLS l n 2. Sai s chuẩn c a các hệ s h i qui sẽ l n Do đó: oKhoảng tin cậy lớn và việc kiểm định ít có ý nghĩa. oGiả thiết H0 luôn dễ dàng được chấp nhận TBP 16-Oct-21 TBP 3. Hậu quả c a đa c ng tuy n 3. T s t nh Tăng khả năng chấp nhận giả thiết H0 4.Các ư c lư ng và sai s chuẩn c a ư c lư ng rất nhạy cảm v i s thay đ i c a d liệu Chỉ cần m t s thay đ i nh trong mẫu d liệu sẽ kéo theo s thay đ i l n các hệ s ư c lư ng. TBP 16-Oct-21 3. Hậu quả c a đa c ng tuy n TBP 5. Dấu c a các ư c lư ng c a các hệ s h i quy có thể sai 6. Thêm vào hay b t đi các biến c ng tuyến v i các biến khác, mô hình sẽ thay đ i về dấu hoặc thay đ i về đ l n c a các ư c lư ng TBP 16-Oct-21 TBP 4. Nhận bi t đa c ng tuy n R2 cao và th ng kê t thấp. Ví d : Khảo sát 10 c a hàng máy tính, tìm hiểu ảnh hư ng c a doanh s bán hàng và tiền thư ng cho b phận kinh doanh lên l i nhuận sau thuế, đơn vị triệu đ ng TBP 16-Oct-21 TBP Tiền thư ng X2 Doanh s bán X3 L i nhuận Y 1.58 2.686 1.862 1.44 2.145 3.672 1.1242 2.496 4.345 200 340 245 180 275 459 146 320 550 22 35.7 27.685 19.62 30.8 48.654 16.06 36.16 63.25 2.94 490 50.96 TBP 16-Oct-21 Dependent Variable: Y Method: Least Squares Sample: 1 10 Included observations: 10 Variable Coefficient C -0.315065 X2 3.369120 X3 0.084931 R-squared 0.992150 Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) TBP Std. Error t-Statistic Prob. 1.304738 -0.241478 0.8161 1.885534 1.786826 0.1171 0.013845 6.134429 0.0005 Mean dependent var 35.08890 0.989908 S.D. dependent var 1.525907 Akaike info criterion 16.29876 Schwarz criterion -16.63190 442.3846 0.000000 Hannan-Quinn criter. Durbin-Watson stat 15.18914 3.926381 4.017156 3.826800 2.265317 TBP 16-Oct-21 TBP 4. Nhận bi t đa c ng tuy n - Có khả năng hai biến đ c lập là tiền thư ng và doanh s bán hàng có c ng tuyến cao - Quan sát mẫu s liệu trên ta thấy: X2= 0,008X3. Nghĩa là tiền thư ng luôn bằng khoảng 0,8% trên doanh s bán hàng TBP 16-Oct-21 TBP 4. Nhận bi t đa c ng tuy n Tương quan tuyến tính mạnh gi a các biến đ c lập Hệ số tương quan cặp giữa các biến độc lập lớn hơn 0,8 ta có hiện tượng đa cộng tuyến X2 X3 Y X2 1 0.964347 0.974655 X3 0.964347 1 0.994269 Y 0.974655 0.994269 1 TBP 16-Oct-21 TBP H s tương quan (r) 𝒓𝟐𝟑 ∑ 𝑿𝟐𝒊 − 𝑿𝟐 𝑿𝟑𝒊 − 𝑿𝟑 ∑ 𝑿𝟐𝒊− 𝑿𝟐 𝟐∑ 𝑿𝟑𝒊 − 𝑿𝟑 𝟐 TBP 16-Oct-21 TBP 4. Nhận bi t đa c ng tuy n Th c hiện h i qui ph Hồi qui giữa một biến độc lập nào đó theo các biến độc lập còn lại với nhau và quan sát hệ số R2 của các hồi qui phụ Th c hiện kiểm định F - H0: R2 = 0 (không có đa cộng tuyến) - F0 = [R2.(n-k)] /[(1-R2).(k-1)] - k số tham số trong mô hình hồi quy phụ - Nếu F0 > F(k-1,n-k) thì bác bỏ giả thiết H0 - chúng ta có thể kết luận rằng R2 khác không theo ý nghĩa thống kê và điều này có nghĩa là có đa cộng tuyến trong mô hình. TBP 16-Oct-21 TBP Dependent Variable: X2 Method: Least Squares Sample: 1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 0.159584 0.238054 0.670369 0.5215 X3 0.007081 0.000687 10.30674 0.0000 R-squared 0.929965 Mean dependent var 2.429020 Adjusted R-squared 0.921211 S.D. dependent var 1.019332 S.E. of regression 0.286120 Akaike info criterion 0.512049 Sum squared resid 0.654919 Schwarz criterion 0.572566 Hannan-Quinn criter. 0.445662 Durbin-Watson stat 1.874165 Log likelihood -0.560244 F-statistic 106.2288 Prob(F-statistic) 0.000007 TBP 16-Oct-21 TBP 4. Nhận bi t đa c ng tuy n Th a s phóng đại phương sai- VIF VIFj= 1/1-R2j o R2j là hệ s xác định c a hàm h i quy ph o VIFj càng l n, c ng tuyến càng cao. o Kinh nghiệm: VIFj >10 R2j >0,9, c ng tuyến đư c xem là cao TBP 16-Oct-21 5. Kh c ph c đa c ng tuy n TBP B qua ĐCT: Nếu các biến ĐCT không bị sai dấu và không mất ý nghĩa th ng kê Nếu mô hình dùng để d báo ch không để kiểm định Thu thập thêm s liệu hoặc lấy thêm mẫu m i, S d ng thông tin tiền nghiệm S d ng sai phân cấp 1 B biến đ c lập có đa c ng tuyến TBP 16-Oct-21 TBP TBP 16-Oct-21 TBP 1. Ư c lư ng hàm h i quy: LnNK=b1+b2lnGDP +b3lnCPI +e Đ c ý nghĩa hệ s h i quy b^2, b^3. 2. Hãy kiểm tra đa c ng tuyến gi a các biến đ c lập (s d ng cả 4 Phương pháp đã h c). Đề xuất biện pháp khắc ph c. - Câu lệnh: - Tính hệ s tương: corr (tên các bi n) - Th a s phóng đại Phương sai: vif (l nh này th c hi n ngay sau khi th c hi n l nh h i quy TBP 16-Oct-21 TBP Ch ng 5 PHƯƠNG SAI THAY Đ I TBP 16-Oct-21 1. B n ch t c a phương sai thay đ i Khi gi thi t v ph ng sai không thay mô hình h i quy tuy n tính b vi ph m => Hi n t ng ph ng sai thay (heteroskedasticity) TBP ic a i TBP 16-Oct-21 1. B n ch t c a phương sai thay đ i TBP Chúng ta có th quan sát qua hình minh h a sau ây: (Hình 1: Phương sai c a sai số không đổi) TBP 16-Oct-21 1. B n ch t c a phương sai thay đ i TBP (Hình 2: Ph ơng sai của sai số thay đổi) TBP 16-Oct-21 1. B n ch t c a phương sai thay đ i TBP Lý do c a phương sai thay đổi • Do b n ch t c a m i quan h kinh t • Do hành vi c a con ng i trong các ho t ng ngày càng hoàn thi n • Sai s tính toán có xu h ng gi m xu ng, kéo theo ph ng sai gi m • Ph ng sai thay sai d ng mô hình i ôi khi do ta xác nh TBP 16-Oct-21 2. H u qu c a phương sai thay đ i TBP •Các c l ng OLS cho các h s v n là c l ng không ch ch •Các c l ng theo ph ng pháp OLS không còn là c l ng t t nh t • Kho ng tin c y và k t lu n ki m nh v các gi thuy t th ng kê v h s h i quy là không còn giá tr TBP 16-Oct-21 TBP 3. Phát hi n phương sai thay đ i Ph ng pháp ki m Park cho r ng 𝜎 nh Park là m t hàm c a X có d ng: 2 i = 2 i = ln 2 Xi e 2 vi Do ó: ln 2 𝜎 ch a bi t nên Park ã cho 𝜎 + 2 ln X i + vi ngh s d ng ei2 thay TBP 16-Oct-21 Ph ng pháp ki m TBP nh Park c l ng mô hình h i quy g c, thu l y ph n d ei, tính ei2 cl ng mô hình ln e = 2 i 1 + 2 ln X i + vi N u mô hình g c có nhi u bi n c l p thì h i quy lnei2 theo t ng bi n c l p ho c theo 𝑌 Ki m nh H0: 2 =0 N u ch p nh n H0 thì không có hi n t sai thay i. ng ph TBP ng 16-Oct-21 TBP Ph ng pháp ki m nh Park H n ch c a ki m đ nh Park: gi nh các nhi u Vi th a mãn các gi thi t c i n (ph ng sai thu n nh t). N u gi thi t c i n b vi ph m thì các b c ki m nh ti p theo không còn ý ngh a. Y = b1+b2X +e lne2 = b1+b2lnX +v TBP 16-Oct-21 Ví d : Kh o sát m t m u thu nh p – chi tiêu X 8.2 20.2 34.5 18.2 38 28.3 14.1 30.1 16.4 24.1 Y 8 19.8 33.1 17.9 33.5 25 13.1 29.4 14.9 21.5 X 40.3 32.3 10.3 33.6 26.1 12.1 44.7 42.3 6.2 22.4 TBP Y 38.7 31.2 10.3 31.7 25.5 12.1 38.6 40.7 6.1 20 TBP 16-Oct-21 TBP Dependent Variable: Y Method: Least Squares Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 0.707825 0.654510 1.081457 0.2938 X 0.909521 0.023700 38.37704 0.0000 R-squared 0.987926 Mean dependent var 23.55500 Adjusted R-squared 0.987255 S.D. dependent var 10.77328 S.E. of regression 1.216230 Akaike info criterion 3.324028 Sum squared resid 26.62587 Schwarz criterion 3.423601 Hannan-Quinn criter. 3.343466 Durbin-Watson stat 2.038798 Log likelihood -31.24028 F-statistic 1472.797 Prob(F-statistic) 0.000000 TBP 16-Oct-21 TBP Dependent Variable: LOG(RESID^2) Method: Least Squares Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C -7.734754 0.902141 -8.573772 0.0000 LOG(X) 2.337409 0.287290 8.136054 0.0000 R-squared 0.786212 Mean dependent var -0.510473 Adjusted R-squared 0.774334 S.D. dependent var 1.501310 S.E. of regression 0.713187 Akaike info criterion 2.256492 Sum squared resid 9.155433 Schwarz criterion 2.356066 Hannan-Quinn criter. 2.275930 Durbin-Watson stat 1.531328 Log likelihood -20.56492 F-statistic 66.19537 Prob(F-statistic) 0.000000 TBP 16-Oct-21 TBP Wald Test: Equation: Untitled Test Statistic Value df F-statistic 66.19537 (1, 18) Chi-square 66.19537 1 Null Hypothesis Summary: Normalized Restriction (= 0) Value C(2) 2.337409 Restrictions are linear in coefficients. Probability 0.0000 0.0000 Std. Err. 0.287290 TBP 16-Oct-21 Ki m TBP nh glejer T ng t ki m nh Park, tuy nhiên sau khi thu các ph n d t mô hình h i quy g c, Glejser s d ng các d ng hàm sau | Uˆ i |= | Uˆ i |= 1 + 1 + 2 X i + Vi 2 X i + Vi | Uˆ i |= | Uˆ i |= 1 + 1 1 2 + Xi 2 + Vi X i + Vi 2 1 ˆ | U i |= + Vi 1 + 2 X i + Vi 1 + 2 Xi Ki m nh ph ng sai không i t c là ki m nh gi thuy t: =0 | Uˆ i |= 2 TBP 16-Oct-21 H n ch : TBP - Gi i n (ph nh các nhi u Vi th a mãn các gi thi t c ng sai thu n nh t). N u gi thi t c thì các b c ki m i n b vi ph m nh ti p theo không còn ý ngh a. - Hai mô hình cu i không ph i là mô hình tuy n tính nên không th áp d ng ph th ng pháp cl ng OLS thông ng. - Ngo i tr mô hình th nh t, các mô hình còn l i yêu c u v bi n m t toán h c. cl pX u có cho bi u th c có ý ngh a v TBP 16-Oct-21 TBP Dependent Variable: ABS(RESID) Method: Least Squares Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C -0.147107 0.193278 -0.761119 0.4564 X 0.044700 0.006999 6.387045 0.0000 R-squared 0.693848 Mean dependent var 0.975754 Adjusted R-squared 0.676840 S.D. dependent var 0.631788 S.E. of regression 0.359154 Akaike info criterion 0.884508 Sum squared resid 2.321847 Schwarz criterion 0.984081 Hannan-Quinn criter. 0.903946 Durbin-Watson stat 2.016217 Log likelihood -6.845078 F-statistic 40.79434 Prob(F-statistic) 0.000005 TBP 16-Oct-21 TBP Wald Test: Equation: Untitled Test Statistic Value F-statistic 40.79434 Chi-square 40.79434 Null Hypothesis Summary: Normalized Restriction (= 0) C(2) df (1, 18) 1 Value 0.044700 Probability 0.0000 0.0000 Std. Err. 0.006999 TBP 16-Oct-21 TBP Dependent Variable: ABS(RESID) Method: Least Squares Sample: 1 20 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C -1.032092 0.341819 -3.019408 0.0074 SQR(X) 0.413054 0.068200 6.056479 0.0000 R-squared 0.670818 Mean dependent var 0.975754 Adjusted R-squared 0.652530 S.D. dependent var 0.631788 S.E. of regression 0.372418 Akaike info criterion 0.957038 Sum squared resid 2.496510 Schwarz criterion 1.056612 Hannan-Quinn criter. 0.976476 Durbin-Watson stat 1.935231 Log likelihood -7.570384 F-statistic 36.68093 Prob(F-statistic) 0.000010 TBP 16-Oct-21 TBP Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 36.68093 (1, 18) 0.0000 Chi-square 36.68093 1 0.0000 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) 0.413054 0.068200 Restrictions are linear in coefficients. TBP 16-Oct-21 TBP 3. Phát hi n phương sai thay đ i Ph ng pháp ki m nh White Xét hàm h i quy ba bi n : Yi = 1 B c1: tính và t B c2: e = 2 i 1 + + 2 X 2i + 3 X 3i + U i c l ng mô hình h i quy tuy n ó thu c các ph n d ei c l ng mô hình sau + 5 2 X X 2i + 2 3i + 6 3 X 3i + 4 X 2 2i X 2i X 3i + Vi TBP 16-Oct-21 TBP 3. Phát hi n phương sai thay đ i B c 3 : Tính toán tr th ng kê nR2 , trong ó n là c m u và R2 là h s xác nh c a mô hình h i quy ph b c2 B c 4 : Tra b ng phân ph i Chi-bình ph ng , m c ý ngh a và b c t do là k (k là s tham s trong mô hình h i quy ph không k h s t do ). B c 5 : Gi thi t H0: Ph ng sai c a sai s không i. N u bác b gi thi t H0, K t lu n 2 2 có hi n t ng ph ng sai thay i nR (k ) TBP 16-Oct-21 DEMAND INCOME PRICE TEMP DEMAND INCOME PRICE TEMP TBP 0.386 0.374 0.393 0.425 0.406 0.344 0.327 0.288 0.269 0.256 0.286 0.298 0.329 0.318 0.381 78 79 81 80 76 78 82 79 76 79 82 85 86 83 84 0.27 0.282 0.277 0.28 0.272 0.262 0.275 0.267 0.265 0.277 0.282 0.27 0.272 0.287 0.277 41 56 63 68 69 65 61 47 32 24 28 26 32 40 55 0.381 0.47 0.443 0.386 0.342 0.319 0.307 0.284 0.326 0.309 0.359 0.376 0.416 0.437 0.548 82 80 78 84 86 85 87 94 92 95 96 94 96 91 90 0.287 0.28 0.277 0.277 0.277 0.292 0.287 0.277 0.285 0.282 0.265 0.265 0.265 0.268 0.26 63 72 72 67 60 44 40 32 27 28 33 41 52 64 71 TBP 16-Oct-21 Heteroskedasticity Test: White F-statistic Obs*R-squared Scaled explained SS Dependent Variable: RESID^2 Method: Least Squares Included observations: 30 Variable C INCOME INCOME^2 INCOME*PRICE INCOME*TEMP PRICE PRICE^2 PRICE*TEMP TEMP TEMP^2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic TBP 1.659805 12.82684 10.49696 Prob. F(9,20) Prob. Chi-Square(9) Prob. Chi-Square(9) Coefficient Std. Error 0.095560 0.465726 0.000540 0.003320 -1.46E-05 1.20E-05 0.007245 0.008424 -1.01E-06 4.55E-06 -0.958098 2.935590 0.757448 4.874070 -0.003869 0.003290 0.001230 0.001129 -5.55E-07 1.80E-06 0.427561 Mean dependent var 0.169964 S.D. dependent var 0.001608 Akaike info criterion 5.17E-05 Schwarz criterion 156.4914 Hannan-Quinn criter. 1.659805 Durbin-Watson stat 0.1652 0.1706 0.3118 t-Statistic 0.205186 0.162738 -1.214962 0.859972 -0.222206 -0.326373 0.155404 -1.176202 1.089248 -0.307876 TBP Prob. 0.8395 0.8724 0.2385 0.4000 0.8264 0.7475 0.8781 0.2533 0.2890 0.7614 0.001176 0.001765 -9.766091 -9.299025 -9.616672 1.760368 16-Oct-21 3. Phát hi n phương sai thay đ i TBP Ki m nh Goldfeld – Quandt (G-Q) Ki m nh này s d ng trong tr ng h p gi thi t r ng ph ng sai thay i 𝜎 có liên h d ng v i m t trong các bi n gi i thích: 𝜎 = 𝜎 𝑋 . Xét mô hình h i quy n: Yi = 1 + 2 X i + Ui TBP 16-Oct-21 3. Phát hi n phương sai thay đ i TBP Ki m nh Goldfeld – Quandt (G-Q) B c 1: S p x p các quan sát theo th t t ng d n i v i giá tr c a bi n X B c 2: B b t c quan sát gi a, theo kinh nghi m nh sau: c = 4 ho c c = 8, n u n 30 c = 10 ho c c = 16, n u n 60 Chia s quan sát còn l i thành hai nhóm, 𝑛− m i nhóm có quan sát. TBP 16-Oct-21 TBP 3. Phát hi n phương sai thay đ i Ki m B quy nh Goldfeld – Quandt (G-Q) c 3: s d ng OLS i v i nhóm B c c 4: tính F = ng các tham s h i u và nhóm cu i. Thu và RSS2. B c t do là ( s tham s cl cl 𝑛− − k ho c c RSS1 𝑛− − 𝑘 . K là ng k c h s ch n. 𝑅 𝑅 Bác b gi thi t H0 khi F>F( 𝑛− − 𝑘 𝑛− − 𝑘 , ) TBP 16-Oct-21 3. Phát hi n phương sai thay đ i Ki m TBP nh Goldfeld – Quandt (G-Q) H n ch c a ph ng pháp ki m nh G-Q ch không có quy t c rõ r t xác nh s quan sát b lo i b (c) bao nhiêu là h p lý và tin c y c a k t qu ki m nh l thu c vào (c). Ki m nh . nh G-Q thích h p v i nh ng m u H i quy b i, x p h ng các quan sát b i m t trong các bi n c l p c a mô hình. TBP 16-Oct-21 S n lư ng tiêu th (Y) N Chi phí qu ng cáo (X) S n lư ng TBP tiêu th (Y) 11 13.9 9.4 21 21 14.4 6.9 12 14.4 10.7 22 22 15.2 8.9 7.4 13 15 11.3 23 22.5 14 4 9.9 6.4 14 16 11 24 23 13.7 5 10.5 7.4 15 16.5 12.5 25 23.9 14.4 6 11 8 16 18 11.5 26 24.4 17.4 7 11.5 8.4 17 18.4 12.9 27 24.9 18.8 8 12 7.9 18 18.9 13.4 28 26 18 9 12.4 8.9 19 19.9 11.9 29 26.5 17.8 10 12.9 9.7 20 20.5 14 30 27 19.1 N Chi phí qu ng cáo (X) S n lư ng tiêu th (Y) N 1 7.9 5.4 2 8.4 3 Chi phí qu ng cáo (X) TBP 16-Oct-21 TBP Kh o sát 30 c a hàng kinh doanh cùng m t lo i s n ph m tìm m i quan h chi phí qu ng cáo(tri u g/tháng) v i s n l ng tiêu th (t n s n ph m) B 4 quan sát gi a: t 14-17 H i quy nhóm 1 g m 13 quan sát t 01-13 SL= 0,3161+ 0,6973CPQC +e RSS1 = 3,7435 H i quy nhóm 2 g m 13 quan sát t 18-30 SL= -2,8011+ 0,7937CPQC +e RSS2 = 15,3251 TBP 16-Oct-21 TBP 3. Phát hi n phương sai thay đ i Ki m nh Breusch-Pagan (BP) Yi = 1 + 2 X 2i + 3 X 3i + ... + k X ki + U i B c1: c l ng mô hình h i quy tuy n tính và t c các ph n d ei B c2: c l ng mô hình sau và thu R2 B ó thu 𝑒 = 𝛼 + 𝛼 𝑋 + 𝛼 𝑋 + … + 𝛼𝑘 𝑋𝑘 + 𝑉 c 3 : Tính giá tr quan sát c a các th ng kê ki m nh: F0 = [R2.(n-k)] /[(1-R2).(k-1)] Ho c LM = n*R2 N u F0 > F(k-1,n-k) hoặc 𝑛𝑅 > 𝜒𝛼 (𝑘 thì bác b H0 => mô hình có hi n t ng ph ng sai sai s thay i TBP 16-O -21 S d ng 935 quan sát th c hi n h i quy TBP Wage = 1950 + 20,9age + 60,58 edu +e e2 = - 205625 + 18848age + 2822,91edu + v R2 = 0,017 TBP 16-Oct-21 4. Kh c ph c ph ng sai thay i TBP Xem xét v n thi u bi n ho c d ng hàm sai S d ng phép bi n i logarit Chia 2 v c a mô hình g c cho Xi, 𝑋 , 𝑌 ,e. c l ng l i sai s chu n (c m u l n) TBP 16-Oct-21 Ví d : D li u d i ây là bi u hi n quan h c a chi tiêu cho tiêu TBP dùng (Y) và thu nh p (X) hàng tháng c a 20 h gia ình m t vùng nông thôn: Gia đình Chi tiêu (Y) Thu nh p (X) Gia đình Chi tiêu (Y) Thu nh p (X) 1 19.9 2.3 11 8 8.1 2 31.2 32.3 12 33.1 34.5 3 31.8 33.6 13 33.5 38 4 12.1 12.1 14 13.1 14.1 5 40.7 42.3 15 14.8 16.4 6 6.1 6.2 16 21.6 24.1 7 38.6 44.7 17 29.3 30.1 8 25.5 26.1 18 25 28.3 9 10.3 10.3 19 17.9 18.2 10 38.8 40.2 20 19.8 20.1 TBP 16-Oct-21 Ch T T ng 6 NG QUAN 1. B n ch t và nguyên nhân c a t t ng quan Trong mô hình h i quy tuy n tính c i n chúng ta gi nh không có t ng quan gi a các ph n d ui ui t t • Nguyên nhân khách quan: - Chu i có tính ch t quán tính theo chu k - Ví d : t ng s n ph m trong n c theo giá th c t t i VN N m 2000 2001 2002 2003 2004 2005 2006 2007 GDP 75.863 84.852 96.403 113.326 137.087 190.561 190.561 228.795 • Nguyên nhân khách quan: - Hi n t ng m ng nh n: - Ví d : dãy s cung v café n m nay ph thu c vào giá n m tr còn ng u nhiên n a. c => ui không • Nguyên nhân khách quan - Dãy s có tính ch t tr : bi n ph thu c th i k t b th i k tr nh h ng b i bi n ph thu c c - Ví d : tiêu dùng th i k này ch ng nh ng ph thu c vào thu nh p k này mà còn ph thu c vào tiêu dùng c a k tr n a. c Nguyên nhân ch quan - Ch n d ng mô hình sai (th ng x y ra mô hình v i chi phí biên) - a thi u bi n gi i thích vào mô hình - Vi c x lý s li u: (s li u tháng = s li u quý/3) Hi n t ng t t T t ng quan ng quan b c 1 Sai s ng u nhiên ut t ng quan b c 1: ut = c g i là có t 1ut 1 + vt 1<0: mô hình có t t ng quan b c 1 âm 1>0: mô hình có t t ng quan b c 1 d 1=0: mô hình không có t t T t ng ng quan ng quan b c p ut = 1ut-1 + 2ut-2 +…+ put-p + vt 2. H q c at t ng quan N u v n áp d ng OLS khi mô hình có hi n t ng t t ng quan thì s có các h u qu sau: - Các c l ng không ch ch nh ng không còn là các cl ng hi u qu 2. H - Ph cl q c at t ng sai c a các ng quan cl ng là các ng ch ch vì v y các ki m nh t và F không còn hi u qu . - Có kh n ng cl ng quá cao R2 - Các d báo v Y không chính xác 10 3. Cách phát hi n t t ng quan th Chúng ta có th phát hi n hi n t ng t t ng quan b ng cách quan sát th ph n d c a mô hình trên d li u chu i th i gian. et t ph n d phân b m t cách ng u nhiên xung quanh giá tr trung bình c a nó. Ki m nh hi n t ng t t ng quan b c 1 Xét bi u di n c a sai s ng u nhiên d i d ng: ut = 1ut 1 + vt Gi thuy t: H0: 1=0 H1: 1≠0 Ki m nh hi n t ng t t ng quan b c 1 Kiểm định t B c 1: ch y h i g c, thu ph n d ei B c 2: B c 3: s d ng th ng kê t cl nh gi thuy t ng et theo et-1 ki m Ki m nh hi n t ng t t ng quan b c 1 Dùng kiểm định d c a Durbin – Watson Th ng kê d c a Durbin Watson c nh ngh a nh sau: (ei ei 1 ) 2 d= 2 ei Khi n l n thì = ei ei 2 i e 1 d 2(1- ) trong ó: do -1 ≤ ≤ 1, nên khi: = -1 => d = 4: t t ng quan hoàn h o âm = 0 => d = 2: không có t t ng quan = 1 => d = 0: t t ng quan hoàn h o d ng Gi thi t H0 Q t nh N Không có t t ng quan Bác b 0 < d < dL d ng Không có t t ng quan Không quy t dL ≤ d ≤ dU d ng nh Không có t t ng quan âm Bác b 4-dL < d < 4 Không có t t ng quan âm Không quy t 4-dU ≤ d ≤ 4-dL nh Không có t t ng quan âm Không bác b dU < d < 4-du ho c d ng Trong ó dU và dL là các giá tr tra b ng giá tr d. 0 Có t t ng Mi n không quan d ng k t lu n Dl Không có t t ng quan DU 4-DU Mi n không Có t t ng k t lu n quan âm 4-DL 4 N u d thu c vùng ch a quy t s d ng quy t c ki m 1. H0: = 0; H1: nh, chúng ta s nh c i biên nh sau: > 0. N u d < dU thì bác b H0 và ch p nh n H1 (v i m c ý ngh a ), ngh a là có t t 2. H0: ng quan d = 0; H1: ng. < 0. N u d > 4 - dU thì bác b H0 và ch p nh n H1 (v i m c ý ngh a ), ngh a là có t t ng quan âm. 3. H0: = 0; H1: ≠ 0. N u d <dU ho c d > 4 - dU thì bác b H0 và ch p nh n H1 (v i m c ý ngh a 2 ), ngh a là có t t ho c d ng). ng quan (âm * Chú ý: trong th c t khi ti n hành ki m Durbin Watson, ng t c ki m nh i ta th nh ng áp d ng quy n gi n sau: N u 1 < d < 3 thì k t lu n mô hình không có t t ng quan. N u 0 < d < 1 thì k t lu n mô hình có t t quan d ng. N u 3 < d < 4 thì k t lu n mô hình có t t quan âm. ng ng Ví d : Kh o sát m u s li u chu i th i gian sau ây v m i liên h gi a m c tiêu th v i v i thu nh p bình quân Lan g 1923- 1939 u ng i và giá bán t i Hà GIA LUONGVAI NAM THUNHAP 101 99.2 1923 96.7 100.1 99 1924 98.1 100 100 1925 100 90.6 111.6 1926 104.9 86.5 122.2 1927 104.9 89.7 117.6 1928 109.5 90.6 121.1 1929 110.8 82.8 136 1930 112.3 70.1 154.2 1931 109.3 65.4 153.6 1932 105.3 61.3 158.5 1933 101.7 62.5 140.6 1934 95.4 63.6 136.2 1935 96.4 52.6 168 1936 97.6 59.7 154.3 1937 102.4 59.5 149 1938 101.6 61.3 165.5 1939 103.8 21 Dependent Variable: LUONGVAI Method: Least Squares Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C 130.7066 27.09429 4.824137 0.0003 GIA -1.382985 0.083814 -16.50060 0.0000 THUNHAP 1.061710 0.266674 3.981302 0.0014 R-squared 0.951282 Mean dependent var 134.5059 Adjusted R-squared 0.944322 S.E. of regression 5.563356 Sum squared resid 433.3130 S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn -51.64705criter. 136.6831 Durbin-Watson stat 23.57733 6.429065 6.576103 Log likelihood F-statistic 22 6.443681 2.018549 0 Có t t ng Mi n không quan d ng k t lu n Dl Không có t t ng quan DU 4-DU Mi n không Có t t ng k t lu n quan âm 4-DL H0: Không có TTQ H1: Có TTQ D=2,018549 K=2, n=17, dL=1,015, dU=1,536 4-dU=2,464 4-dL=2,985 -> Không có TTQ, MYN 5% 4 Phát hi n t t ng quan b c b t k ki m nh t t ng quan b c p: ut = 1ut-1 + 2ut-2 + … + put-p + vt Gi thuy t: H0: H1: 1= 1 2 2= + 2 … 2+ p=0 …+ p 2≠0 Kiểm định F B c 1: ch y h i g c, thu ph n d ei B c 2: cl + + et = B 1 1et-1 ng h i quy ph 2et-2 +…+ c 3: th c hi n ki m pet-p nh F + t Phát hi n t t ng quan b c b t k Dùng kiểm định Breusch – Godfrey (BG) Xét mô hình: Yt = ut = 1 1ut-1 Ta c n ki m H0: 1 = + 2 2Xt + + ut 2ut-2 +…+ put-p + vt nh gi thi t =…= =0 (có ngh a là không t n t i t t k b c nào trong s t b c 1 ng quan n b c p) b t B c 1: B c 2: Dùng OLS et = t cl 1 + ây ta thu B ng mô hình g c b ng OLS, tìm ph n d et 2Xt 1et-1 + 2et-2 +…+ pet-p + t l n, (n-p)R2 có phân ph i x p x - N u (n-p)R2 > 2 (p): Bác b H0, ngh a là có t t 2(p). ng m t b c nào ó. - N u (n-p)R2 ≤ có t t + ng mô hình c R2. c 3: v i n quan ít nh t cl ng quan. 2 (p): Ch p nh n H0, ngh a là không N m Tiêu dùng Thu nh p Tiêu dùng Thu nh p 2010 2011 2012 2013 2014 873.8 1494.9 1492 2416.2 899.8 1525.7 1538.7 2484.8 919.7 1551.1 1621.8 2608.5 923.9 1539.3 1689.6 2744 979.3 1629.1 1674 2729.3 1005.1 1665.2 1711.9 2695 1025.1 1708.7 1803.7 2826.7 1069 1799.4 1883.7 2958.7 1108.3 1873.3 1960.9 3115.2 1170.6 1973.3 2004.4 3192.3 1236.3 2087.6 2000.4 3187.2 1298.9 2208.4 2024.2 3248.7 1337.7 2271.3 2050.7 3166 Dependent Variable: CHITIEU Method: Least Squares Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C -163.3511 22.11558 -7.386243 0.0000 THUNHAP 0.684817 0.008744 78.31767 0.0000 R-squared 0.995294 Mean dependent var 1511.765 Adjusted R-squared 0.995132 S.D. dependent var 448.7377 S.E. of regression 31.30900 Akaike info criterion 9.788029 Sum squared resid 28427.35 Schwarz criterion 9.880544 Hannan-Quinn criter. 9.818187 Durbin-Watson stat 0.684377 Log likelihood -149.7145 F-statistic 6133.657 Prob(F-statistic) 0.000000 Breusch-Godfrey Serial Correlation LM Test: F-statistic 10.76282 Prob. F(2,27) Obs*R-squared 13.75139 Prob. Chi-Square(2) Test Equation: Dependent Variable: RESID Method: Least Squares Sample: 1 31 Included observations: 31 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic C -0.717441 17.09781 -0.041961 THUNHAP 0.000508 0.006762 0.075075 RESID(-1) 0.790484 0.191934 4.118529 RESID(-2) -0.200133 0.192545 -1.039408 R-squared 0.443593 Mean dependent var Adjusted R-squared 0.381770 S.D. dependent var S.E. of regression 24.20374 Akaike info criterion Sum squared resid 15817.17 Schwarz criterion Log likelihood -140.6275 Hannan-Quinn criter. F-statistic 7.175213 Durbin-Watson stat 0.0004 0.0010 Prob. 0.9668 0.9407 0.0003 0.3078 1.76E-14 30.78276 9.330806 9.515837 9.391121 1.882795 H0: Không có TTQ H1: Có TTQ (n-p)R^2=(31-2).0.4436=12.8644 X^2(0.05;2)=5.991 (n-p)R^2> X^2(0.05;2) -> Bác b H0 Có TTQ MYN 5% 4. Cách kh c ph c bi t TPB Trong th c hành, ng i ta th ng gi s r ng Ut theo mô hình t quy h i quy b c nh t, ngh a là: Ut = Ut-1 + t Trong ó | | < 1 và pháp OLS t th a mãn các gi thi t c a ph xét mô hình hai bi n: Yt = 1 + 2Xt + Ut (1) N u (1) úng v i t thì c ng úng v i t-1 nên: Yt-1 = 1 + 2Xt-1 + Ut-1 (2) Nhân 2 v c a (2) v i ta c: Yt-1 = 1 + 2Xt-1 + Ut-1 (3) ng TPB Tr (1) cho (3) ta đư c : Yt - Yt-1 = 1(1- ) + 2(Xt - Xt-1) + (Ut - Ut-1) = 1(1- ) + 2(Xt - Xt-1) + Vt (4) Khi đó (4) có th vi t lại dư i dạng: Yt = * * t + * 2 X + Vt * t TPB 4. Cách kh c ph c ch a bi t U c lư ng s d ng thống kê Durbin – Watson Chúng ta có th l y: 𝑑 𝜌=1− 2 4. Cách kh c ph c ch a bi t Phương pháp Dubin-Watson 2 bư c cl Ph ng mô hình Yt = + 2Xt + ut ng trình sai phân d ng t ng quát Yt - Yt-1 = Yt = 1 1(1- 1(1- )+ )+ 2Xt - 2(Xt - Xt-1) + (Ut - Ut-1) 2Xt-1 + Yt-1 + ut- ut-1 TPB B c 1: Coi ây là ph ng trình h i quy b i, h i quy Yt theo Xt, Xt-1 và Yt-1, và coi giá tr i v i h s h i quy c a Yt-1(= ) là M c dù là cl c 2: Sau khi có và Yt * = Yt Yt theo các bi n ã ng cl ng c a . ng ch ch nh ng ta có v ng c a . B cl 1 , hãy bi n và cl c bi n i ng ph i trên. cl c ng X = Xt * t ng trình ban Xt u 1 Tiêu dùng Thu nh p Tiêu dùng Thu nh p 873.8 899.8 919.7 923.9 979.3 1005.1 1025.1 1069 1108.3 1170.6 1236.3 1298.9 1337.7 1405.8 1456.6 1494.9 1525.7 1551.1 1539.3 1629.1 1665.2 1708.7 1799.4 1873.3 1973.3 2087.6 2208.4 2271.3 2365.6 2423.3 1492 1538.7 1621.8 1689.6 1674 1711.9 1803.7 1883.7 1960.9 2004.4 2000.4 2024.2 2050.7 2145.9 2239.9 2416.2 2484.8 2608.5 2744 2729.3 2695 2826.7 2958.7 3115.2 3192.3 3187.2 3248.7 3166 3277.6 3492 TPB TPB Dependent Variable: CHITIEU Method: Least Squares Date: 05/02/13 Time: 09:58 Sample: 1 31 Included observations: 31 Variable Coefficient C -163.3511 THUNHAP 0.684817 R-squared 0.995294 Adjusted R-squared 0.995132 S.E. of regression 31.30900 Sum squared resid 28427.35 Log likelihood -149.7145 F-statistic 6133.657 Prob(F-statistic) 0.000000 Std. Error t-Statistic 22.11558 -7.386243 0.008744 78.31767 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat Prob. 0.0000 0.0000 1511.765 448.7377 9.788029 9.880544 9.818187 0.684377 Breusch-Godfrey Serial Correlation LM Test: F-statistic 10.76282 Prob. F(2,27) Obs*R-squared 13.75139 Prob. Chi-Square(2) Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/02/13 Time: 10:00 Sample: 1 31 Included observations: 31 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic C -0.717441 17.09781 -0.041961 THUNHAP 0.000508 0.006762 0.075075 RESID(-1) 0.790484 0.191934 4.118529 RESID(-2) -0.200133 0.192545 -1.039408 R-squared 0.443593 Mean dependent var Adjusted R-squared 0.381770 S.D. dependent var S.E. of regression 24.20374 Akaike info criterion Sum squared resid 15817.17 Schwarz criterion Log likelihood -140.6275 Hannan-Quinn criter. F-statistic 7.175213 Durbin-Watson stat TPB 0.0004 0.0010 Prob. 0.9668 0.9407 0.0003 0.3078 1.76E-14 30.78276 9.330806 9.515837 9.391121 1.882795 TPB Dependent Variable: CHITIEU Method: Least Squares Date: 05/02/13 Time: 10:21 Sample (adjusted): 2 31 Included observations: 30 after adjustments Variable Coefficient Std. Error C THUNHAP THUNHAP(-1) CHITIEU(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) -3.317524 0.370112 -0.340921 0.969955 0.998730 0.998583 16.57074 7139.321 -124.6508 6814.130 0.000000 t-Statistic 22.56438 -0.147025 0.055134 6.712942 0.071267 -4.783732 0.113569 8.540690 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat Prob. 0.8842 0.0000 0.0001 0.0000 1533.030 440.2351 8.576719 8.763546 8.636487 1.759361 TPB Dependent Variable: CHITIEU-RO*CHITIEU(-1) Method: Least Squares Date: 05/02/13 Time: 10:33 Sample (adjusted): 2 31 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic C 31.26391 8.195994 3.814536 THUNHAPRO*THUNHAP(-1) 0.433300 0.052322 8.281434 R-squared 0.710091 Mean dependent var Adjusted R-squared 0.699737 S.D. dependent var S.E. of regression 19.23532 Akaike info criterion Sum squared resid 10359.94 Schwarz criterion Log likelihood -130.2357 Hannan-Quinn criter. F-statistic 68.58215 Durbin-Watson stat Prob(F-statistic) 0.000000 Prob. 0.0007 0.0000 92.59186 35.10338 8.815714 8.909127 8.845598 1.395009 4. Cách kh c ph c ch a bi t Ư c lư ng ph s d ng mô hình h i quy •B c 1: h i quy g c, thu ph n d •B c 2: H i quy ph : Ut = Ut-1 + t.Thu c c l ng c a h s • B c 3: c l ng mô hình v i bi n m i Yt - Yt-1 = 1(1- ) + 2(Xt - Xt-1) + (Ut - Ut-1) 4. Cách kh c ph c Phương pháp lấy sai phân • L y sai phân 2 v c a hình Yt = 2Xt + ut 1 + S d ng sai phân hiệu chỉnh c a Newey và West H ng d n stata Nh n d ng s li u theo th i gian: tsset Ki m nh Durbin-Watson: Sau khi c l ng h i quy, tính giá tr d, câu l nh: estat dwatson; estat durbinalt (p-value) Ki m nh Breusch-Godfrey: estat bgodfrey Ki m nh t t ng quan t b c 1 n 4: estat bgodfrey, lags(1/4) Ki m nh t t ng quan t b c 1 và b c 4: estat bgodfrey, lags(1 4) H ng d n stata X lý T T ng quan Kh c ph c t t ng quan b ng GLS prais BPt BDL , options D a trên h s ro c l ng qua Ph ng pháp OLS: prais BPT B L, rhotype(regress) D a trên h s ro c l ng t t ng quan c a ph n d : prais BPT B L, rhotype(tscorr) D a trên h s ro tính toán qua th ng kê DurbinWatson: prais BPT B L, rhotype(dw) Ma tr n c l ng hi p Ph ng sai Newey West: newey BPT B L, lag( ) reg BPT B L,vce(robust) Ph l c T T NG QUAN B ng ki m nh d c a Durbin Watson B ng ki m nh Bre sch - Goldfrey B cc at t ng quan c k t qu ki m nh c a BG test Kh c ph c t t ng q an T o m t bi n ro = h s t t Nh n vào nút Genr ng quan Nh p giá tr c a bi n ro c n t o H i quy l i , vào Quick\Estimate Equation Ph ng trình h i quy m i d ng sai phân K t qu h i quy m i Chương 7 CH N MÔ HÌNH VÀ KI M Đ NH VI C CH N MÔ HÌNH TBP 1. Các thu c tính c a m t mô hình t t - Đơn giản - Tính đồng nhất - Tính thích h p (R2) - Tính bền v ng về mặt lý thuyết - Khả năng d báo cao 2. Cách chọn l a mô hình tốt B ớc 1: Xác định số biến độc lập có trong mô hình - T đơn giản đến tổng quát - T tổng quát đến đơn giản B ớc 2: Kiểm tra các tr ờng hợp khuyết tật c a mô hình do vi phạm các giả thiết OLS - Kiểm tra các vấn đề: đa cộng tuyến, phương sai thay đổi, t tương quan - Khắc phục các trường hợp vi phạm B ớc 3: Chọn dạng hàm - D a vào cơ sở lý thuyết kinh tế - D a vào kết quả th c nghiệm, so sánh các dạng hàm khác nhau TBP B ớc 4: Các tiêu chuẩn thông d ng để chọn mô hình TBP - R2 hoặc R2 hiệu chỉnh - Giá trị c a hàm hợp lý log-likelihood (L) L= n ln 2 2 n ln(2 2 ) 1 2 U i2 Th c tế log-likelihood (L) đ ợc ớc l ợng: L= n RSS 1 + ln(2 ) + ln( ) 2 n - Tiêu chuẩn AIC (Akaike info criterion) RSS 2 k n AIC = ( )e n AIC = 2 L 2k + n n - Tiêu chuẩn SIC (Schwarz information 2 L k ln(n) Criterion) SIC = ( RSS )n SIC = + k n n n n TBP 3. Các sai lầm khi ch n mô hình 3.1. Bỏ sót biến thích hợp Giả s mô hình đúng là: Yi = 1 + 2 X 2i + 3 X 3i + U i (a) Nhưng ta lại chọn mô hình: Yi = 1 + 2 X 2i + U i (b) TBP Dependent Variable: INPUT Method: Least Squares Date: 05/07/13 Time: 10:12 Sample: 1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 166.4667 19.02142 8.751537 0.0000 OUTPUT 19.93333 3.065580 6.502305 0.0002 R-squared 0.840891 Mean dependent var 276.1000 Adjusted R-squared 0.821002 S.D. dependent var 65.81363 S.E. of regression 27.84451 Akaike info criterion 9.668005 Sum squared resid 6202.533 Schwarz criterion 9.728522 Hannan-Quinn criter. 9.601618 Durbin-Watson stat 0.715725 Log likelihood -46.34003 F-statistic 42.27997 Prob(F-statistic) 0.000188 Dependent Variable: INPUT Method: Least Squares Date: 05/07/13 Time: 10:10 Sample: 1 10 Included observations: 10 Variable Coefficient C 222.3833 OUTPUT -8.025000 OUTPUT^2 2.541667 R-squared 0.928389 Adjusted R-squared 0.907928 S.E. of regression 19.97004 Sum squared resid 2791.617 Log likelihood -42.34834 F-statistic 45.37496 Prob(F-statistic) 0.000098 TBP Std. Error t-Statistic 23.48780 9.468037 9.809494 -0.818085 0.869084 2.924534 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat Prob. 0.0000 0.4403 0.0222 276.1000 65.81363 9.069668 9.160444 8.970088 1.038487 Dependent Variable: INPUT Method: Least Squares Date: 05/07/13 Time: 10:07 Sample: 1 10 Included observations: 10 Variable Coefficient C 141.7667 OUTPUT 63.47766 OUTPUT^2 -12.96154 OUTPUT^3 0.939588 R-squared 0.998339 Adjusted R-squared 0.997509 S.E. of regression 3.284911 Sum squared resid 64.74382 Log likelihood -23.52865 F-statistic 1202.220 Prob(F-statistic) 0.000000 TBP Std. Error t-Statistic 6.375322 22.23678 4.778607 13.28372 0.985665 -13.15005 0.059106 15.89677 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat Prob. 0.0000 0.0000 0.0000 0.0000 276.1000 65.81363 5.505730 5.626764 5.372956 2.700212 TBP Hậu quả bỏ sót biến thích hợp - Các ước lư ng thu đư c là ước lư ng chệch c a các tham số trong mô hình đúng. - Các ước lư ng thu đư c không phải là ước lư ng v ng. - Phương sai c a các ước lư ng trong mô hình sai (b) > trong mô hình đúng (a). - Khoảng tin cậy rộng, các kiểm định không còn tin cậy n a TBP 3.2. Đưa vào mô hình những biến không phù hợp Giả s mô hình đúng là: Yi = 1 + 2 X 2i + U i (a) Nhưng ta lại chọn mô hình có thêm X3: Yi = 1 + 2 X 2i + 3 X 3i + U i (b) Hậu quả đưa vào mô hình những biến không phù hợp - Các ước lư ng thu đư c t mô hình (b) là không hiệu quả vì: - Phương sai c a các ước lư ng trong mô hình (b) > trong mô hình (a). - Khoảng tin cậy rộng, các kiểm định không còn tin cậy n a TBP TBP 3.3. Lựa chọn mô hình không chính xác - Ước lư ng chệch các hệ số hồi quy, thậm chí có thể dẫn đến dấu c a các hệ số hồi quy có thể sai. - Có thể có rất ít hệ số hồi quy có ý nghĩa thống kê. - R2 biểu hiện cho m c độ phù h p c a mô hình hồi quy có thể không cao. - Phần dư c a các quan sát có thể lớn xét về giá trị tuyệt đối và biểu thị s biến thiên có tính chất hệ thống TBP 4. Phát hi n nh ng sai lầm 4.1. Kiểm định biến bị bỏ sót (có số liệu) Xét mô hình: Yi = 1 + 2X2i + 3X3i + 4X4i + Tiến hành kiểm định giả thiết H0: ui 4 = 0. Cách 1: Dùng ki m đ nh t hoặc p-value, kết h p v i h s 𝑹𝟐 TBP 4. Phát hi n nh ng sai lầm 4.1. Kiểm định biến bị bỏ sót (có số liệu) Xét mô hình: Yi = 1 + 2X2i + 3X3i + 4X4i + Tiến hành kiểm định giả thiết H0: ui 4 Cách 2: dùng ki m đ nh Wald. = 0. TBP Ki m đ nh Wald. Xét các mô hình: (U) Yi = + kXki 1 + 2X2i + …+ mXmi + 1 + 2X2i + …+ mXmi + m+1X(m+1)i +… + ui (R) Yi = vi (U) là MH không giới hạn và (R) là mô hình giới hạn. Kiểm định giả thiết H0: m+1 =…= k =0 TBP Bước 1: Ước lư ng (U) và (R), t đó tính đư c RSSU và RSSR thay vào công th c: ( RSS R RSSU ) (k FC = RSSU (n k ) m) 𝑅 − 𝑅 𝐹 = 1−𝑅 𝑅 𝑘−𝑚 𝑛−𝑘 Bước 2: Với m c ý nghĩa , tìm F (k-m,n-k) Bước 3: Nếu FC > F (k-m,n-k): Bác bỏ H0, t c là (U) không th a biến; ® thiếu biến TBP 4.2 Ki m đ nh vi c b sót biến (không có s li u) Để kiểm định các biến bỏ sót, ta dùng kiểm định Reset c a Ramsey, gồm các bước: Bước 1: Dùng OLS để ước lư ng mô hình Yi = 1 + 2X2i + ui T đó ta tính ˆ và R2old Yi Bước 2: dùng OLS để ước lư ng mô hình 2 ˆ Yi = 1 + 2 X 2i + 3Y + Tính R2new Kiểm định giả thiết H0: 3 = 4 3 ˆ 4Y + ... + vi =… = k =0 TBP 2 new 2 new ( R Bước 3: Tính F = (1 R 2 old R ) m ) (n k ) n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào. Bước 4: Nếu F > F (m,n-k): Bác bỏ H0, t c các hệ số 3, 4,… k không đồng th i bằng 0, mô hình cũ đã bỏ sót biến. 4.2. Kiểm định th a biến Kiểm định t & 𝑹𝟐 Kiểm định Wald TBP