Uploaded by hanhanrose123

C1-day du-đã gộp

advertisement
TBP
Ch
ng 1
MÔ HÌNH HỒI QUY
HAI BIẾN
TBP
22-Sep-21
TBP
1. Hàm hồi quy t ng thể và mẫu
Trong quan h h i quy , m t bi n ph thu c có
th đ c gi i thích b i nhi u bi n đ c l p
N u ch nghiên c u m t bi n ph thu c b nh
h ng b i m t bi n đ c l p => Mô hình h i
quy hai biến
N u m i quan h gi a hai bi n này là tuy n
tính => Mô hình h i quy tuyến tính hai biến
TBP
22-Sep-21
TBP
1. Hàm hồi quy t ng thể và mẫu
Tuy n tính trong h i quy
Mô hình h i quy tuy n tính đ i v i tham s
Y = a + bx
Y = a + bx2
Y = a + b(1/x)
Mô hình h i quy tuy n tính đ i v i bi n s
Y =a + bx
Y=a2 +bx
Y =a + b3x
Tuy n tính c a các mô hình h i quy là tuy n
tính d a vào tham s , không d a vào bi n s
TBP
22-Sep-21
1.1. Hàm hồi quy t ng thể (PRF)
TBP
• M i liên h gi a bi n ph thu c và bi n gi i
thích d a trên s li u đã bi t c a toàn b t ng
th .
Yi =
1
+
2
X i + Ui
Trong đó
Y : Bi n ph thu c,Yi: Giá tr c th c a bi n ph thu c
X : Bi n đ c l p, Xi : Giá tr c th c a bi n đ c l p
Ui : Sai s ng u nhiên ng v i quan sát th i.
TBP
22-Sep-21
1.1. Hàm hồi quy t ng thể (PRF)
Yi =
1
+
2
TBP
X i + Ui
Trong đó
β1,β2 là các tham s c a mô hình v i ý nghĩa :
: Tung đ c a hàm h i quy t ng th (intercept
coefficient), là giá tr trung bình c a bi n ph thu c Y
khi bi n đ c l p nh n giá tr b ng 0
1
: H s góc c a hàm h i quy (slope coefficient),
ph n ánh đ d c c a hàm h i quy t ng th , là l ng
thay đ i trung bình c a Y khi X thay đ i 1 đ n v
2
TBP
22-Sep-21
TBP
1.2. Hàm hồi quy mẫu
Sample Regression Function (SRF)
• Trong th c t r t khó nghiên c u trên t ng
th nên thông th ng ng i ta nghiên c u
xây d ng hàm h i quy trên m t m u => G i
là hàm h i quy m u
• Bi u di n m i quan h gi a bi n ph thu c
v i bi n đ c l p d a trên giá tr trung bình
c a t ng th hay giá tr đã bi t c a m u
TBP
22-Sep-21
TBP
1.2. Hàm hồi quy mẫu
Sample Regression Function (SRF)
ˆ
ˆ
Yi = 1 + 2 X i + ei
Trong đó
ˆ Tung đ g c c a hàm h i quy m u, là c l ng
1
đi m c a 1
ˆ
d c c a hàm h i quy m u, là c l ng đi m
2
c a 2
ei
Sai s ng u nhiên, là
cl
ng đi m c a Ui
TBP
22-Sep-21
TBP
1.2. Hàm hồi quy mẫu
Sample Regression Function (SRF)
ˆ
ˆ
Yi = 1 + 2 X i + ei
Trong đó
Tung đ g c c a hàm h i quy m u, là
l ng đi m c a 1
d c c a hàm h i quy m u, là
đi m c a 2
Sai s ng u nhiên, là
cl
c
cl
ng
ng đi m c a Ui
TBP
22-Sep-21
TBP
1.2. Hàm hồi quy mẫu
Sample Regression Function (SRF)
Yi = ˆ1 + ˆ2 X i + ei
N u b qua sai s ng u nhiên ei , thì
giá tr th c t Yi s tr thành giá tr
c
l ng Yˆi
TBP
22-Sep-21
TBP
2. Phương pháp bình phương bé nhất
(OLS-Ordinary Least Square)
2.1. Ư c lư ng các tham số c a mô hình
Sai s
Tìm
ˆ
ei = Yi Yˆi = Yi
1
ˆ X
2 i
ˆ , ˆ sao cho t ng bình ph
1
2
ng sai s là
nh nh t
n
T c là
i =1
ei2 =
n
i =1
(Y
i
ˆ
1
ˆ X
2 i
)
2
min
TBP
22-Sep-21
1.1. Hàm hồi quy tổng thể
TBP
Tiêu dùng Y (trieu ong/tháng )
7
Yi =
6
1
+
2Xi
+ ui
ui
?
5
4
3
Yi
2
1
0
0
1
2
3
4
5
Xi
6
7
8
Thu nhập X (triệu đồng/tháng)
TBP
22-Sep-21
TBP
2.1. Ư c lư ng các tham số c a mô hình
TBP
22-Sep-21
TBP
2.1. Ư c lư ng các tham số c a mô hình
Giải bài toán c c trị hàm hai biến, ta đư c
n
ˆ =
2
i =1
n
(Xi
n
i =1
ˆ =Y
1
V i
X )(Yi
(Xi
X )2
Y)
=
i =1
n
i =1
Yi X i
n. X .Y
X i2
n.( X ) 2
ˆ X
2
X=
Y =
Xi
n
Yi
n
là giá tr trung bình c a X
là giá tr trung bình c a Y
TBP
22-Sep-21
TBP
2.1. Ư c lư ng các tham số c a mô hình
Ví d 1: Quan sát v thu nh p (X – tri u
đ ng/n m) và chi tiêu (Y – tri u đ ng/n m) c a 10
ng i, ta đ c các s li u sau :
Xi 31 50 47 45 39 50 35 40 45 50
Yi 29 42 38 30 29 41 23 36 42 48
Xây d ng hàm h i quy m u Yˆi = ˆ1 + ˆ2 X i
TBP
22-Sep-21
TBP
Ví d 2:
Ng i ta mu n phân tích và đánh gía k t
qu và n ng su t lúa do l ng phân bón
mang l i c a đ ng b ng song C u Long
trong 10 n m, s li u đ c thu th p nh
sau:
Y 40 44 46 48 52 58 60 68 74 80
X
6
10 12 14 16 18 22 24 26 32
Hãy
c l ng hàm h i quy tuy n tính
m u. Nêu ý ngh a các h s h i quy. Các
giá tr đó có phù h p v i lý thuy t không?
TBP
22-Sep-21
TBP
2.2. Các giả thiết c a mô hình
Gi thi t 1 : Các giá tr Xi cho tr
c và không ng u nhiên
Gi thi t 2 : Các sai s Ui là đ i l ng ng u nhiên có giá
tr trung bình b ng 0
Gi thi t 3 : Các sai s Ui là đ i l ng ng u nhiên có
ph ng sai không thay đ i
Gi thi t 4 : Không có s t ng quan gi a các Ui
Gi thi t 5 : Không có s t ng quan gi a Ui và Xi
Khi các gi thi t này đ c đ m b o thì các c l ng
tính đ c b ng ph ng pháp OLS là các c l ng t t
nh t và hi u qu nh t c a hàm h i quy t ng th
Ta nói, c l ng OLS là
Unbias Estimator)
cl
ng BLUE (Best Linear
TBP
22-Sep-21
TBP
3. Hệ số xác định c a mô hình
Yˆi
Y
SRF
Yi
Yi Yˆi = ei
Yi Y
Yˆi Y
Y
Xi
X TBP
22-Sep-21
TBP
3. Hệ số xác định c a mô hình
Dùng đ đo m c đ phù h p c a hàm h i qui
T ng bình phương toàn phần
Total Sum of Squares-TSS
T ng bình ph
ng t t c các sai l ch gi a giá tr th c t
c a Y v i giá tr trung bình c a nó.
TSS =
2
(Yi Y ) =
Yi
2
n(Y )
TBP
2
22-Sep-21
TBP
3. Hệ số xác định c a mô hình
T ng bình phương hồi quy
Explained Sum of Squares-ESS
T ng bình ph
đ
ng t t c các sai l ch gi a giá tr c a Y
c tính theo mô hình v i giá tr trung bình c a nó.
ESS =
2
2
ˆ
ˆ
(Yi Y ) = 2 (
X
2
i
2
nX )
TBP
22-Sep-21
TBP
3. Hệ số xác định c a mô hình
T ng bình phương phần dư
Residual Sum of Squares-RSS
T ng bình ph
ng t t c các sai l ch gi a giá tr
th c t v i giá tr lý thuy t theo mô hình c a Y.
RSS =
2
ˆ
(Yi Yi ) =
2
i
e
TBP
22-Sep-21
TBP
3. Hệ số xác định c a mô hình
TSS = ESS + RSS
H s xác đ nh
ESS
R =
TSS
2
•0≤ R2 ≤1
•R2 =1 : mô hình hoàn toàn phù h p v i m u nghiên c u
•R2=0 : mô hình không phù h p v i m u nghiên c u
• Ý nghĩa R2 : mô hình h i quy gi i thích đư c bao
nhiêu % s bi n đ ng c a bi n ph thu c Y b i bi n đ c
l pX
TBP
22-Sep-21
TBP
4. Hệ số tương quan (r)
H s t ng quan (r): đo l ng m c đ ch t ch
c a quan h tuy n tính gi a 2 đ i l ng X và Y.
𝒓
∑ 𝑿𝒊
∑ 𝑿𝒊− 𝑿
𝑿 𝒀𝒊
𝟐∑
𝒀𝒊
𝒀
𝒀
𝟐
Ch ng minh đ c:
Và d u c a r trùng v i d u c a ˆ2 (h s g c trong
hàm h i quy)
TBP
22-Sep-21
TBP
4. Hệ số tương quan (r)
Tính chất c a hệ số tương quan
1. Mi n giá tr c a r:
-1 ≤ r ≤ 1
|r| -> 1: X và Y có quan h tuy n tính càng
ch t ch
2. r có tính ch t đ i x ng: rXY = rYX
3. N u X, Y đ c l p thì r = 0. i u ng
c l i không
đúng
TBP
22-Sep-21
TBP
5. Phương sai và sai số chuẩn c a
a. Phương sai
Var ( ˆ ) =
1
2
ˆ
1
var( ˆ2 ) =
=
X
n(
2
ˆ
2
X
=
2
i
2
i
X
2
2
nX )
n(
X
2
i
2
X
2
i
2
nX )
ˆ
nX
2
X
2
i
2
i
ˆ2
2
nX
TBP
2
22-Sep-21
TBP
5. Phương sai và sai số chuẩn c a
b. Sai số chuẩn
se( ˆ ) =
1
Trong đó:
se( ˆ2 ) =
2
ˆ
1
2
ˆ
2
= Var(Ui)
Khi đó 2 đ c g i là ph ng sai c a t ng th , r t khó
tính đ c nên th ng đ c c l ng b ng ph ng sai
m u
2
2
ˆ =
2
ei
n 2
=
(Yi Yˆi )
n 2
RSS
=
n 2
TBP
22-Sep-21
TBP
6. Khoảng tin cậy c a các hệ số hồi quy
a. Khoảng tin cậy c a β2
Kho ng tin c y c a
ˆ
2
v i đ tin c y 1- là
se( ˆ2 ); ˆ2 + t
t
2
V i t
2
có đ
se( ˆ2 )
2
c khi tra b ng t-Student v i b c t do (n-2),
2
m c ý ngh a /2
TBP
22-Sep-21
TBP
6. Khoảng tin cậy c a các hệ số hồi quy
b. Khoảng tin cậy c a β1
Kho ng tin c y c a
ˆ
2
V
t
i
2
v i đ tin c y 1- là
se( ˆ1 ); ˆ1 + t
t
1
1
có đ
se ( ˆ1 )
2
c khi tra b ng t-Student v i b c t do
(n-2), m c ý ngh a /2
TBP
22-Sep-21
TBP
Ví d 1 áp d ng
T s li u tr c, hãy tính kho ng tin
c y c a các h s h i quy và cho bi t
ý ngh a c a chúng v i đ tin c y 95%
TBP
22-Sep-21
TBP
7. Kiểm định giả thuyết về hệ số hồi quy
a. Kiểm định giả thuyết về β2
Ho:
H1:
2=
2≠
o
o
V i đ tin c y là 1-α
Cách 1: Phương pháp kho ng tin c y
B
c 1:L p kho ng tin c y c a
B
c 2:N u
N u
0 thu
2
c kho ng tin c y thì ch p nh n H0.
0 không
thu c kho ng tin c y thì bác b H0
TBP
22-Sep-21
TBP
7. Kiểm định giả thuyết về hệ số hồi quy
a. Kiểm định giả thuyết về β2
Cách 2: Phương pháp giá tr t i hạn (ki m đ nh t)
ˆ
B
c 1 : tính giá tr t i h n t0 =
B
B
c 2 : tra b ng t-Student v i b c t do (n-2) tìm t /2
c3:
N u -t /2 ≤ t0 ≤ t /2 : ch p nh n gi thuy t H0
N u t0 < -t /2 ho c t0 > t /2 : bác b gi thuy t H0
2
0
se( ˆ2 )
TBP
22-Sep-21
7. Kiểm định giả thuyết về hệ số hồi quy
TBP
a. Kiểm định giả thuyết về β2
Cách 3: Phương pháp p-value
ˆ
B
c 1 : tính giá tr t i h n t0 =
B
c 2 : Tính p_value = P(|t| > |t0|)
(t c là kh n ng gi thuy t H0 b bác b )
c3:
N u p_value > : ch p nh n gi thuy t H0
N u p_value ≤ : bác b gi thuy t H0
B
2
0
se( ˆ2 )
TBP
22-Sep-21
7. Kiểm định giả thuyết về hệ số hồi quy
TBP
b. Kiểm định giả thuyết về β1
Ho:
H1:
1=
1≠
o
o
V i đ tin c y là 1-α
T ng t ki m đ nh gi thuy t v
t i h n lúc này là
t=
ˆ
1
2
nh ng giá tr
0
se( ˆ1 )
TBP
22-Sep-21
TBP
Ví d áp d ng
T s li u đã cho c a ví d tr c , yêu c u ki m
đ nh các gi thi t sau
Ho: 2 = 0
a)
V i đ tin c y là 95%
H1: 2 ≠ 0
b)
Ho:
H1:
1=
0
1≠ 0
V i đ tin c y là 95%
TBP
22-Sep-21
TBP
8. Kiểm định s phù h p c a mô hình
K m đ nh gi thi t
Ho:R2 = 0 V i đ tin c y là 1H1:R2 ≠ 0
Phương pháp ki m đ nh F
R 2 ( n 2)
F=
1 R2
B
c 1 : tính
B
c 2 : Tra b ng tìm F(1,n-2), m c ý ngh a là α
B
c 3 : N u F>F(1,n-2) , bác b H0
N u F≤F(1,n-2) , ch p nh n H0
(
)
TBP
22-Sep-21
TBP
9. D báo
Cho tr c giá tr X = X0, hãy d báo giá tr
trung bình c a Y v i m c ý ngh a hay đ tin
c y1- .
Yˆi = ˆ1 + ˆ2 X i
* D báo điểm
Yˆ0 = ˆ1 + ˆ2 X 0
TBP
22-Sep-21
TBP
9. D báo
•D báo giá trị trung bình:
Kho ng tin c y c a Y0 v i đ tin c y (1- ) là
2
Yˆ0
V i
= ˆ2
1
+
n
se(Yˆ0 ) =
Yˆ0
( X 0 X )2
2
2
X i n( X )
2
Yˆ0
se(Yˆ0 ); Yˆ0 + t
t
2
se(Yˆ0 )
2
TBP
22-Sep-21
TBP
Ví d áp d ng
T s li u đã cho c a ví d tr c , yêu c u d báo kho ng
giá tr c a Y khi X0 = 60 (tri u đ ng/n m) v i đ tin c y
95%
Yˆi = 5,4517 + 0,9549 X i
* Dự báo điểm
TBP
22-Sep-21
TBP
•D báo giá trị trung bình:
Kho ng tin c y c a Y0 v i đ tin c y (1- ) là
TBP
22-Sep-21
10.
TBP
i đ n v c a bi n
Trong hàm h i quy hai bi n, n u đ n v tính c a X
và Y thay đ i => áp d ng công th c đ i đ n v
Hàm h i quy theo đ n v c :
Yˆi = ˆ1 + ˆ2 X i
Hàm h i quy theo đ n v m i:
*
*
*
*
ˆ
ˆ
ˆ
Yi = 1 + 2 X i
* là ký hiệu cho hàm có đơn vị mới
Trong đó:
*
Yi = k1Yi
*
X i = k2 X i
Khi đó:
^
*
1
*
^
2
= k1
^
1
= k1 / k 2
TBP
^
22-Sep-21
2
10.
TBP
i đ n v c a bi n
𝜎∗ = 𝑘 𝜎
𝑅 =𝑅
∗ ∗
Var(𝛽 ∗ ) = 𝑘 Var(𝛽 )
Var(𝛽 ∗ ) =
se(𝛽 ∗ ) = 𝑘
se(𝛽 ∗ ) =
Var(𝛽 )
se(𝛽 )
se(𝛽 )
TBP
22-Sep-21
10.
TBP
i đ n v c a bi n
Hàm Y (tri u đ/tháng) = 5 + 7X (t n) + ei
Tính theo (tri u đ/n m) và (Kg)
TBP
22-Sep-21
TBP
Bài t p
Nghiên c u m c v n huy đ ng đ c
(tri u USD/n m) theo lãi su t ti n g i
(% n m), ta có b ng s li u sau:
Vốn 11,9 9,4
Lãi 7,2 4
su t
7,5
3,1
4,0
1,6
11,3 6,3
4,8 5,1
1. Vi t hàm h i quy m u.
các h s h i quy.
2. Tính h s t ng quan
2,2
2,0
10,3 7,6
6,6 4,4
c ý ngh a
TBP
22-Sep-21
TBP
3.
Tính h s xác đ nh, đ c ý ngh a.
4.
Tính kho ng tin c u c a các h s h i quy,
m c ý ngh a 10%.
5.
T m u s li u trên, có ý ki n cho r ng lãi su t
không nh h
đ
ng gì đ n m c v n huy đ ng
c t khách hàng, b n hãy cho bi t nh n xét
trên đúng không
6.
c ý ngh a.
Hãy d
m c ý ngh a 5%.
báo m c v n huy đ ng đ
c trung
bình n u lãi su t 5% n m v i đ tin c y 90%.
TBP
22-Sep-21
TBP
11. M r ng mô hình h i quy 2 bi n
11.1. H i quy qua g c t a đ
Mô hình:
PRF:
Yi =
n
V i
ˆ =
2
i =1
n
Yi X i
X
i =1
đ
X i + Ui
Yi = ˆ2 X i + ei
SRF:
2
2
c
cl
và
var( ˆ2 ) =
2
ˆ
2
2
=
X
2
i
ng b ng
2
i
2
i
e
RSS
ˆ =
=
n 2 n 2
2
TBP
22-Sep-21
TBP
11. M r ng mô hình h i quy 2 bi n
11.1. H i quy qua g c t a đ
Lưu ý:
R2 có th âm đ i v i mô hình này, nên không dùng
R2 mà thay b i R2thô
Không th so sánh R2 v i R2thô
Th ng ng i ta dùng mô hình có tung đ g c, tr
khi có m t th c nghi m c n ph i dùng mô hình qua
g c to đ
TBP
22-Sep-21
TBP
11.2. Mô hình tuy n tính logarit
Mô hình log-log, log kép hay tuy n tính log
Được biểu diễn dưới dạng sau:
ln Yi = ln
1
+
2
ln X i + U i
Mô hình không tuyến tính theo tham số và biến số
= ln
*
1
Y
*
i
*
*
1
= ln Yi
X i = ln X i
Yi =
*
1
+
*
2
X i + Ui
Ý nghĩa c a hệ số β2: khi X thay
đ i 1% thì Y thay đ i β2%. (Đây
chính là h s co giãn c a Y đ i
v i X)
TBP
22-Sep-21
TBP
11.3. Mô hình log-lin
Mô hình bán logarit ngh a là ch có m t
bi n th hi n d i d ng logarit:
Ý nghĩa c a hệ số β2: khi X thay đ i 1 đ n v thì
Y thay đ i 100.β2%.
ng d ng: Nghiên c u kh o sát t c đ
tr
t ng
ng (gi m sút) c a các bi n s kinh t v mô
nh GDP, dân s , lao đ ng, n ng su t.
TBP
22-Sep-21
TBP
11.4. Mô hình lin-log
Mô hình bán logarit ngh a là ch có m t
bi n th hi n d i d ng logarit:
Ý nghĩa c a hệ số β2: khi X thay đ i 1% thì Y thay đ i
2
/100 đ n v .
ng d ng: Nghiên c u kh o sát m t s quan h : l
cung ti n nh h
đ ng t i s n l
ng
ng t i GNP, di n tích tr ng tr t tác
ng cây tr ng, di n tích c n nhà tác đ ng
t i giá nhà,…
TBP
22-Sep-21
TBP
11.4. Mô hình ngh ch đ o
ng d ng:
Quan h gi a chi phí s n xu t c đ nh trung bình và s n
l
ng
Quan h gi a t l thay đ i ti n l
(đ
ng và t l th t nghi p
ng cong Philips)
ng chi tiêu Engel bi u di n m i quan h gi a chi tiêu
c a ng
i tiêu dùng cho m t lo i hàng hóa v i t ng chi
tiêu hay thu nh p c a ng
i đó
TBP
22-Sep-21
TBP
Bài t p
V i s li u th ng kê v 2 bi n X và Y nh sau
Yi
23
19.5
24
21
Xi
3
2
4
2
25 22 26.5 23.1 25
5
4
7
6
9
28
8
29.5 26
10
8
V i Y là thu nh p (tr đ/n m), X là thâm niên (n m)
TBP
22-Sep-21
TBP
Chương 2
MÔ HÌNH HỒI QUY BỘI
TBP
07-Oct-21
TBP
1. Mô hình hồi quy 3 biến
1.1. Hàm hồi quy tổng thể (PRF)
Yi =
1
+
2
X 2i +
3
X 3i + U i
Trong ó
Y là bi n ph thu c
X2,X3 là các bi n
cl p
X2i, X3i là giá tr th c t c a X2, X3
Ui là các sai s ng u nhiên
TBP
07-Oct-21
T
B
P
1.2. Các giả thiết c a mô hình
Giá tr trung bình c a
nhiên Ui b ng 0
Ph
i l
ng sai c a Ui không thay
Không có s t
Không có s
gi a X2 và X3
Không có s t
X2,X3
ng ng u
i
ng quan gi a các Ui
t
ng quan (c ng tuy n)
ng quan gi a các Ui và
TBP
07-Oct-21
I. Moâ hình hoài quy tuyeán tính 3 bieán
TBP
1.3. Ư c lư ng các tham số
Chúng ta s d ng ph
nh nh t OLS
PRF : Yi =
1
+
Hàm h i quy m u t
SRF : Yi =
Hay:
Yi =
ng pháp bình ph
2
X 2i +
3
ng
X 3i + U i
ng ng s là :
1
+
2
X 2i +
3
X 3i + ei
1
+
2
X 2i +
3
X 3i
TBP
07-Oct-21
TBP
1.3. Ư c lư ng các tham số
ei = Yi Yi = Yi
Theo ph
1
,
2
X 2i
3
X 3i
ng pháp OLS thì các tham s
2
e =
2
i
1
,
c ch n sao cho
3
(Y
i
1
2
X 2i
3
X 3i
)
2
min
Nh v y , công th c tính c a các tham s nh sau :
TBP
07-Oct-21
TBP
1.3. Ư c lư ng các tham số
Ký hi u:
2
(
=
yi = Yi Y
x2 i = X 2 i
X2
x3i = X 3i
X3
yi x2i )(
( x
( x )( x ) (
(
y x )( x ) ( x
=
( x )( x ) (
2
2i
1
2
3i
2
2i
i 3i
3
x32i )
2
2i
=Y
2
X2
)(
x2i x3i )
yi x3i )
2
x
2 i 3i
2
3i
3
x
2 i 3i
)(
x2i x3i )
yi x2i )
2
X3
TBP
07-Oct-21
TBP
1.3. Ư c lư ng các tham số
x =
2
2i
x =
2
3i
y =
2
i
X
2
2i
n( X 2 )
X
2
3i
n( X 3 )
Yi
2
2
2
n(Y )
2
x2i x3i =
X 2i X 3i
nX 2 X 3
yi x2i =
Yi X 2i
nY . X 2
yi x3i =
Yi X 3i nY . X 3
TBP
07-Oct-21
TBP
Ví d
B ng d
i ây cho các s li u v doanh s bán (Y), chi
phí chào hàng (X2) và chi phí qu ng cáo (X3) c a m t
công ty
Hãy
cl
ng hàm h i quy tuy n tính c a doanh s
bán theo chi phí chào hàng và chi phí qu ng cáo
TBP
07-Oct-21
Doanh s bán Yi
(tr /n m)
1270
1490
1060
1626
1020
1800
1610
1280
1390
1440
1590
1380
Chi phí chào hàng X2 Chi ph qu ng c o
X3
TBP
100
106
60
160
70
170
140
120
116
120
140
150
180
248
190
240
150
260
250
160
170
230
220
150
TBP
07-Oct-21
TBP
T s li u trên, ta tính đ
c các t ng nh sau :
Yi = 16956
X = 188192
X 2i = 1452
X 2i X 3i = 303608
X 3i = 2448
X = 518504
2
2i
2
3i
Yi = 24549576
Y = 1413
Yi X 3i = 3542360
X 2 = 121
Yi X 2i = 2128740
X 3 = 204
2
TBP
07-Oct-21
y =
2
i
x =
2
2i
x =
2
3i
Yi
2
X
2
2i
X
2
3i
n(Y ) = 590748
TBP
2
n(X 2 ) = 12500
2
n(X 3 ) = 19112
2
yi x 2 i =
Yi X 2i nY X 2 = 77064
yi x3i =
Yi X 3i nY X 3 = 83336
x2i x3i =
X 2i X 3i nX 2 X 3 = 7400
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
1.4. Hệ số xác định c a mô hình
TSS =
ESS =
(Yi
Y) =
2
yi x 2 i +
2
RSS = TSS
3
Yi
2
nY
2
yi x3i
ESS
ESS
R =
TSS
2
TBP
07-Oct-21
TBP
1.4. Hệ số xác định c a mô hình
i v i mô hình h i quy b i, ng
R2 có hi u ch nh nh sau :
i ta tính
n 1
R = 1 (1 R )
n k
2
2
k là s tham s trong mô hình
Khi k>1 thì
R
2
R
2
1
TBP
07-Oct-21
TBP
1.4. Hệ số xác định c a mô hình
Ví d : Tính h s xác nh c a mô hình h i quy theo
s li u c a ví d tr c
TSS =
(Yi Y ) =
2
Yi
2
nY
2
TSS = 590748
ESS =
2
yi x 2 i +
3
yi x3i
= ESS = 571662 ,67
RSS = TSS ESS
= RSS = 19085 ,33
TBP
07-Oct-21
TBP
1.4. Hệ số xác định c a mô hình
TBP
07-Oct-21
TBP
1.5. Phương sai c a hệ số hồi quy
Ph ng sai c a các tham s h i quy
theo các công th c sau:
2
1
=
2
1 X
+
n
2
2
x +X
se( 1 ) =
2
3i
x
2
3
2
2i
x
2
3i
x
2
2i
(
c tính
2X 2 X3
x2i x3i )
x2i x3i
2
2
1
TBP
07-Oct-21
TBP
1.5. Phương sai c a hệ số hồi quy
2
2
=
se(
2
3i
x
2
x
2
)=
2
2i
2
3i
x
(
x2i x3i )
2
2
2
TBP
07-Oct-21
TBP
1.5. Phương sai c a hệ số hồi quy
2
3
se (
V i
=
3
x
)=
2
x
2
2
2i
2
3i
x
2
2i
(
x2i x3i )
2
2
3
RSS
=
n 3
TBP
07-Oct-21
1.6. Khoảng tin cậy c a các hệ số hồi quy
Kho ng tin c y c a
1
t
se(
V i
1
1
);
1
2
t
2
se (
2
se (
1
)
2
Kho ng tin c y c a
2
tin c y là 1-
+t
2
TBP
);
2
+t
se (
2
)
2
TBP
07-Oct-21
TBP
1.6. Khoảng tin cậy c a các hệ số hồi quy
Kho ng tin c y c a
3
t
se(
2
3
3
);
3
+t
se(
3
)
2
L u ý khi tra b ng T-Student, trong tr
ng
h p hàm h i quy 3 bi n thì b c t do là (n-3)
TBP
07-Oct-21
1.6. Khoảng tin cậy c a các hệ số hồi quy
TBP
Ví d : Tính kho ng tin c y c a 2 và 3 mô
hình h i quy theo s li u c a ví d tr c v i
tin c y 95%
Gi i: tra b ng T-Student b c t do (n-3)=12-3=9
t0, 025 = 2,262
TBP
07-Oct-21
TBP
1.6. Khoảng tin cậy c a các hệ số hồi quy
Kho ng tin c y c a
2
là
Kho ng tin c y c a
3
là
TBP
07-Oct-21
TBP
1.7. Kiểm định giả thuyết
Ki m
a)
nh gi thuy t v
Ho: i=
H1: i≠
1,
2
3
o
o
- Cách 1: Kho ng tin c
B
c 1 : L p kho ng tin c y
B
c2:N u
N u
0 không
0 thu
c kho ng tin c y thì ch p nh n Ho.
thu c kho ng tin c y thì bác b Ho
Ví d : (theo s li u tr
thi t
2
,
3
V i
c), yêu c u ki m
nh các gi
tin c y 95%
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
1.7. Kiểm định giả thuyết
a)
Ki m
nh gi thuy t v
- Cách 2: Giá r
ih nt
1,
𝛽
2
3
𝛽0
B
c 1 : tính giá tr t i h n 𝑡0
B
B
c 2 : tra b ng t-Student v i b c t do (n-3) tìm t /2
c3:
N u -t /2 t0 t /2 : ch p nh n gi thuy t H0
N u t0 < -t /2 ho c t0 > t /2 : bác b gi thuy t H0
𝑠𝑒 𝛽
TBP
07-Oct-21
N u chi phí CH và chi phí QC b ng không thì doanh s bán
trung bình là 300 tri u ng/n m. Nh n nh này úng hay sai,
MYN 5%.
TBP
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
1.7. Kiểm định giả thuyết
a)
Ki m
nh gi thuy t v
1,
2
3
- Cách 3: P-value
𝛽
𝛽0
B
c 1 : tính giá tr t i h n 𝑡0
B
c 2 : Tính p_value = P(|t| > |t0|)
(t c là kh n ng gi thuy t H0 b bác b )
c3:
N u p_value > : ch p nh n gi thuy t H0
N u p_value
: bác b gi thuy t H0
B
𝑠𝑒 𝛽
TBP
07-Oct-21
TBP
1.7. Kiểm định giả thuyết
b)
Ki m
nh gi thuy t v R2
Ho:R2= 0
H1:R2≠ 0
N u p_value > : ch p nh n gi thuy t H0
N u p_value
: bác b gi thuy t H0
B
R 2 ( n 3)
c 1 : tính F =
2
21 R
B
c 2 : Tra b ng tìm F(2,n-3), m c ý ngh a là
B
c3:
(
)
N u F>F(2,n-3) , bác b H0
N u F F(2,n-3) , ch p nh n H0
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
1.7. Kiểm định giả thuyết
b)
Ki m
nh gi thuy t v R2
Ví d : Yêu c u ki m nh gi thuy t
Ho:R2= 0
tin c y là 95%
2
H1:R ≠ 0
Gi i
: F = 0,9677 (12 3) = 134,79
2(1 0,9677 )
F ( 2,9) = 4,26
( = 0,05)
Vì F>F(2,9) nên bác b gi thuy t H0
TBP
07-Oct-21
TBP
2. M t số dạng hàm
2.1. Hàm sản xuất Cobb-Douglas
Hàm s n xu t Cobb-Douglas
c bi u di n nh
sau:
3 Ui
2
Yi =
Trong ó : Y
i
X2i
X3i
Ui
1
X 2 i X 3i e
: s n l ng c a doanh nghi p
: l ng v n
: l ng lao ng
: sai s ng u nhiên
Hàm s n xu t Cobb-Douglas có th
a
cv
d ng tuy n tính b ng cách l y logarit hai v
TBP
07-Oct-21
TBP
2. M t số dạng hàm
2.1. Hàm sản xuất Cobb-Douglas
ln Yi = ln
t
1
+
2
ln X 2i +
3
ln X 3i + U i
Yi = ln Yi
*
*
1
*
2i
*
3i
= ln
1
X = ln X 2i
X = ln X 3i
D ng tuy n tính s là :
Yi =
*
*
1
+
2
X
*
2i
+
3
X +Ui
*
3i
TBP
07-Oct-21
TBP
ánh giá hi u qu kinh t c a mô hình
khi t ng quy mô s n xu t
(𝛽2+ 𝛽3)=1, t ng quy mô s không có
hi u qu
(𝛽2+ 𝛽3)<1, t ng quy mô s d n
n kém
hi u qu
(𝛽2+ 𝛽3)>1, t ng quy mô s có hi u qu
TBP
07-Oct-21
TBP
2.2. Hàm hồi quy đa th c bậc 2
Yi =
1 +
2Xi +
2
X
3
i +Ui
M c dù ch có m t bi n c l p Xi nh ng nó xu t
hi n v i các lu th a khác nhau khi n cho mô hình
tr thành h i quy ba bi n
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
Bài t p
1.
Vi t hàm h i quy m u.
quy
2.
Tính h s xác
ch nh
3.
Tính kho ng tin c y c a b3,
4.
V i K CYTKK , N u thu nh p t l ng t ng 1
tri u ng/ tháng thì chi tiêu trung bình t ng 500
ngàn ng/tháng. B n có ng ý không?
5.
Mô hình có phù h p không?
6.
Vi t mô hình h i quy m u v i
ng/n m
7.
Biến Thu nhập t lương có thật s tác đ ng
nh.
c ý ngh a các h s h i
c ý ngh a. Tính R2 hi u
c ý ngh a
n v là tri u
TBP
07-Oct-21
TBP
3. HỐI QUY TUYẾN TÍNH K BIẾN
3.1. Hàm hồi quy tổng thể (PRF)
Yi =
1
+
2
X 2i +
3
X 3i + ... +
k
X ki + U i
Trong ó
Y là bi n ph thu c
X2,X3, ,Xk là các bi n c l p
Ui là các sai s ng u nhiên
1 :H s t do
2,
3,
,
k
là các h s h i quy riêng
TBP
07-Oct-21
TBP
3.1. Hàm hồi quy tổng thể (PRF)
K hi u
Y=
Y1
1
U1
Y2
2
U2
...
Yn
=
...
k
U=
...
Un
TBP
07-Oct-21
TBP
3.1. Hàm hồi quy tổng thể (PRF)
Và
X=
1
X 21
X 31 ...
X k1
1
X 22
X 32
... X k 2
...
...
...
...
...
1
X 2n
X 3n ...
X kn
TBP
07-Oct-21
TBP
3.1. Hàm hồi quy tổng thể (PRF)
Khi ó , h th ng các quan sát có th
vi t l i d i d ng :
c
Y = X . +U
TBP
07-Oct-21
TBP
3.2. Các giả thiết c a mô hình hồi quy k biến
Gi thi t 1 : Các bi n
không ng u nhiên
c l p X1, X2,
,Xk ã cho và
Gi thi t 2 : Các sai s ng u nhiên Ui có giá tr trung
bình b ng 0 và có ph ng sai không i
Gi thi t 3: Không có s t
Gi thi t 4 : Không có hi n t
bi n c l p X2, X3, ,Xk
ng quan gi a các sai s Ui
ng c ng tuy n gi a các
Gi thi t 5 : Không có t ng quan gi a các bi n
X2,X3, ,Xk v i các sai s ng u nhiên Ui
cl p
TBP
07-Oct-21
TBP
3.2. Các giả thiết c a mô hình hồi quy k biến
Hàm h i quy m u :
SRF:
Yi =
1
+
2
X 2i +
3
X 3i + ... +
k
X ki + ei
hoặc:
Yi =
1
+
2
X 2i +
3
X 3i + ... +
k
X ki
Hay : (Vi t d
i d ng ma tr n )
Y=X
+e
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Với
=
1
e1
2
e2
...
k
e=
...
en
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
SRF:
Yi =
hoặc:
1
Yi =
+
1
2
+
X 2i +
2
X 2i +
3
X 3i + ... +
3
X 3i + ... +
k
X ki + ei
k
X ki
Khi đó
ei = (Yi Yi )
= Yi
1
2
X 2i
3
X 3i ...
k
TBP
X ki
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Theo ph ơng pháp OLS thì các tham s
1
,
2
,
e =
2
i
=
(Y
i
3
,...,
(Y
Yi
i
1
2
đ
k
X 2i
)
c ch n sao cho
2
3
X 3i
...
k
X ki
)
2
min
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Ta k hi u
chuy n v c
T c là
T
T
T
T
X ,Y , , e
a
X ,Y , , e
là các ma tr n
Y = (Y1 , Y2 ,..., Yn )
T
e = ( e1 , e2 ,..., en )
T
T
=
(
,
1
,...,
2
k
)
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
X=
T
1
1
1
...
1
X 21
X 22
X 23 ... X 2 n
...
...
...
X k1
Xk2
...
...
X k 3 ...
X kn
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Khi ó :
= (X X ) X Y
T
1
T
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Trong ó (XTX) là ma tr n có d ng
n
X 2i
XTX =
...
X ki
X 2i
X
2
2i
...
X ki X 2i
Yi
X Y =
T
X 3i
...
X ki
X 2i X 3i ...
X 2i X ki
...
...
...
X ki X 3i ...
X
2
ki
165
Yi X 2i
= 1028
Yi X 2i
813
TBP
07-Oct-21
TBP
3.3. Ư c lư ng các tham số
Ví d minh hoạ
B ng d i ây cho các s li u v l ng hàng bán
c c a m t lo i hàng hóa(Y), thu nh p c a ng i
tiêu dùng (X2) và giá bán c a lo i hàng này (X3)
Tìm hàm h i quy tuy n tính
Yi =
+
1
X
+
2
2i
X
3
3i
TBP
07-Oct-21
Yi (tấn/tháng)
20
X2 (triệu
đồng/năm)
8
X3(ngàn
đồng/kg)
2
18
7
3
19
8
4
18
8
4
17
6
5
17
6
5
16
5
6
15
5
7
13
4
8
12
3
8
TBP
TBP
07-Oct-21
TBP
Gi i T s li u trên, ta tính
c các t ng nh sau:
Yi = 165
X = 388
X 2i = 60
X 2i X 3i = 282
X 3i = 52
X = 308
2
2i
2
3i
Yi = 2781
Y = 16,5
Yi X 3i = 813
X2 = 6
Yi X 2i = 1029
X 3 = 5, 2
2
TBP
07-Oct-21
TBP
n
X X=
T
X 2i
X 2i
X 3i
X
2
2i
X 3i X 2 i
X 3i
10 60
52
X 2i X 3i = 60 388 282
X
2
3i
52 282 308
26.165 -2.497 -2.131
( X X ) = -2.497 0.246 0.196
T
1
-2.131 0.196 0.183
TBP
07-Oct-21
TBP
Yi
X Y=
165
Yi X 2i = 1028
T
Yi X 2i
813
14.992
= ( X X ) X Y = 0.762
T
1
1
= 14,992
2
= 0,762
3
= 0,589
T
-0.589
V y:
Yi = 14,992 + 0, 762 X 2i 0,589 X 3i
TBP
07-Oct-21
TBP
3.4. Hệ số xác định c a mô hình
TSS = Y Y
T
ESS =
T
n(Y )
T
X Y
RSS = TSS
2
n(Y )
2
ESS
ESS
R =
TSS
2
TBP
07-Oct-21
TBP
3.4. Hệ số xác định c a mô hình
Chú ý: Khi t ng s bi n
c l p trong mô hình
thì R2 c ng t ng cho dù các bi n
thêm có nh h
c l p t ng
ng mô hình hay không. Do ó
không th dùng R2
quy t
nh có nên thêm
bi n vào mô hình hay không mà thay vào ó
có th s d ng h s xác
nh
c hi u ch nh.
TBP
07-Oct-21
TBP
3.4. Hệ số xác định c a mô hình
i v i m h nh h i qu b i, ng
R2 c hi u ch nh nh sau :
i ta t nh
n 1
R = 1 (1 R )
n k
2
2
k là s tham s trong mô hình
Khi k>1 thì
R
2
R
2
1
2
R Có th âm, trong tr ng h p âm, ta coi giá tr
c a nó b ng 0
TBP
07-Oct-21
TBP
2
R
Cách s d ng để quyết định đưa thêm biến
vào mô hình
Mô hình hai biến
Yi =
1
+
2
R2
R1
2
R2
2
R1
X 2i
Mô hình ba biến
Yi =
1
+
2
X 2 i + 3 X 3i
R2
2
R2
2
Thì chọn mô hình (1), t c là không
cần đ a thêm biến X3 vào mô hình.
Ng c lại, ta chọn mô hình (2)
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
TBP
07-Oct-21
1.
2.
3.
4.
5.
6.
7.
8.
TBP
Vi t HHQM, c ý ngh a c a b^2, b^3.
Gi nguyên l ng lao ng, s n l ng t ng thêm trong
kho ng nào n u v n t ng 1%.
Gi nguyên l ng lao ng, s n l ng t i a có th t ng
thêm bao nhiêu n u v n t ng 1%.
Gi nguyên l ng v n, s n l ng t ng thêm trong
kho ng nào n u lao ng t ng 1%.
Gi nguyên l ng v n, s n l ng t i thi u t ng thêm
trong kho ng nào n u lao ng t ng 1%.
Gi nguyên l ng v n, lao ng t ng 1% thì s n l ng
t ng 0,7% nh n nh này úng hay sai?
Mô hình có phù h p không?
Trong 4 MH, Ch n mô hình t t nh t, n u ch y mô hình:
lnQ = b1 + b2k+b3L +e
lnQ = b1 + b2lnk+b3L +e
lnQ = b1 + b2lnk +e
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
G i cjj là ph n t n m
Khi ó :
2
j
se(
V i
dòng j c t j c a ma tr n (XTX)-1
=
2
)
=
j
2
2
.c jj
.c jj
2
j
RSS
=
(k là s tham s )
n k
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
Khoảng tin cậy cho m t hệ số hồi quy: đánh
giá tác đ ng khi m t biến đ c lập thay đổi
(
j
t se(
2
(n-k)
j
);
j
+ t se(
j
))
2
Kho ng tin c y m t phía:
Kho ng tin c y
( ∞, 𝛽
𝑡
Kho ng tin c y
(𝛽
𝑡
,
cl
,
ng giá tr l n nh t cho HSHQ
. 𝑠𝑒 𝛽
cl
ng giá tr bé nh t cho HSHQ
. 𝑠𝑒 𝛽 , ∞
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
Khoảng tin cậy cho biểu th c c a hai HSHQ: đánh
giá tác đ ng khi hai biến đ c lập thay đổi
Gi s X2 và X3 cùng gia t ng (gi m) m t n v , khi
ó giá tr trung bình c a Y gia t ng (gi m) (𝛽2
nv.
(𝜷𝟐
cl
𝒕𝜶,𝒏
𝟐
𝑠𝑒 𝛽2
(𝜷𝟐
ng m c gia t ng trung bình c a Y,
xây d ng KTC cho (𝛽2
𝜷𝟑
𝜷𝟑
𝒕𝜶,𝒏
𝟐
𝒌 . 𝒔𝒆
𝜷𝟐
𝛽3 )= 𝑣𝑎𝑟 𝛽2
𝒌 . 𝒔𝒆
𝛽3
𝜷𝟐
𝑠𝑒 𝛽2 - 𝛽3 )= 𝑣𝑎𝑟 𝛽2
𝛽3
𝜷𝟑 , 𝜷𝟐
𝑣𝑎𝑟 𝛽3
𝜷𝟑 , 𝜷𝟐
𝑣𝑎𝑟 𝛽3
𝜷𝟑
𝒕𝜶,𝒏
𝟐
𝒌 . 𝒔𝒆
𝜷𝟐
𝜷𝟑
2𝑐𝑜𝑣 𝛽2 𝛽3
𝜷𝟑
𝒕𝜶,𝒏
𝟐
𝒌 . 𝒔𝒆
𝜷𝟐
𝜷𝟑
2𝑐𝑜𝑣 𝛽2 𝛽3
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
Khoảng tin cậy cho biểu th c c a hai HSHQ: đánh
giá tác đ ng khi hai biến đ c lập thay đổi
(𝑎𝛽2
M t cách t ng quát, v i a và b là các giá tr b t k thì
KTC cho m c gia t ng trung bình c a bi n Y khi X2
t ng a
n v và X3 t ng b
nv
c tính b i công
th c:
𝑏𝛽3
𝑡
,
. 𝑠𝑒 𝑎𝛽2
𝑏𝛽3 , 𝑎𝛽2
𝑏𝛽3
𝑡
,
. 𝑠𝑒 𝑎𝛽2
𝑏𝛽3
Sai s chu n:
𝑠𝑒 𝑎𝛽2 + b𝛽3 )= 𝑎2 𝑣𝑎𝑟 𝛽2
𝑏 2 𝑣𝑎𝑟 𝛽3
2𝑎𝑏𝑐𝑜𝑣 𝛽2 𝛽3
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
Kho ng tin c y c a
(
t se(
j
j
j
là
);
j
+ t se(
2
))
2
Ho c tính giá tr t i h n c a
t=
j
*
j
j
se(
j
)
j
là
B c t do là (n-k)
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
3.5. Khoảng tin cậy và kiểm định giả thuyết
Ki m
V i
nh gi thuy t v R2
tin c y 1-
Ho:R2= 0
H1:R2≠ 0
B
R 2 (n k )
c 1 : tính F =
(k 1) (1 R 2 )
B
c 2 : Tra b ng tìm F(k-1,n-k), m c ý ngh a là
B
c 3 : N u F>F(k-1,n-k) , bác b H0
N u F F(k-1,n-k) , ch p nh n H0
TBP
07-Oct-21
TBP
3.6. Vấn đề d báo
1
Cho
Xo =
X
0
2
...
X
0
n
Yêu c u d báo giá tr Y0 c a Y
TBP
07-Oct-21
TBP
3.6. Vấn đề d báo
D báo i m :
Y0 =
0
+
2
X +
0
2
3
X + ... +
0
3
k
X
0
k
D báo kho ng :
(Y0
t se(Y0 ); Y0 + t se(Y0 ))
2
2
B c t do là (n-k)
TBP
07-Oct-21
TBP
3.6. Vấn đề d báo
2
Y0
=
se(Y0 ) =
2
T
0
T
1
X (X X ) X0
2
Y0
TBP
07-Oct-21
TBP
TBP
07-Oct-21
1.
2.
3.
4.
5.
6.
7.
8.
TBP
Vi t HHQM, c ý ngh a c a b^2, b^3.
Gi nguyên l ng lao ng, s n l ng t ng thêm trong
kho ng nào n u v n t ng 1%.
Gi nguyên l ng lao ng, s n l ng t i a có th t ng
thêm bao nhiêu n u v n t ng 1%.
Gi nguyên l ng v n, s n l ng t ng thêm trong
kho ng nào n u lao ng t ng 1%.
Gi nguyên l ng v n, s n l ng t i thi u t ng thêm
trong kho ng nào n u lao ng t ng 1%.
Gi nguyên l ng v n, lao ng t ng 1% thì s n l ng
t ng 0,7% nh n nh này úng hay sai?
Mô hình có phù h p không?
Trong 4 MH, Ch n mô hình t t nh t, n u ch y mô hình:
lnQ = b1 + b2k+b3L +e
lnQ = b1 + b2lnk+b3L +e
lnQ = b1 + b2lnk +e
TBP
07-Oct-21
TBP
9. Cho r ng: v i cùng m t t l , t ng quy
mô v n em l i hi u qu b ng nh t ng quy
mô v lao ng. B n nh n xét th nào v
nh n nh này?
L nh cov: estat vce
10. Theo b n, vi c t ng quy mô s n xu t
c a 30 doanh nghi p trên có th làm t ng
hi u qu không?
11. N u các doanh nghi p m r ng quy mô,
n u v n t ng 1% và lao ng t ng 5% thì
s n l ng thay i trong kho ng nào?
TBP
07-Oct-21
TBP
TBP
07-Oct-21
TBP
1.
2.
3.
4.
5.
6.
7.
Vi t HHQM, c ý ngh a các HSHQ
Các bi n có ý ngh a th ng kê không?
i n v X2 t tri u ng/tháng sang tri u
ng/n m.
Có nh n nh cho r ng thu nh p và m c giàu có
c a khách hàng có nh h ng nh nhau lên s
l ng xe g n máy tiêu th . B n có ng ý?
Khi giá bán t ng 1tr /chi c thì l ng xe máy
thay i t i a trong kho ng nào?
Mô hình trên có phù h p không?
B n có xu t gì cho n v kinh doanh xe
máy?
TBP
07-Oct-21
Bài 2: các y u t
nh h
ng chi tiêu
TBP
1.
vi t hàm HQM.
c ý ngh a các HSHQ
2.
Các HSHQ có ý ngh a th ng kê không?
3.
V i k t qu h i quy t m u s li u trên, n u
cho r ng: cùng m t m c t ng thu nh p nh
nhau, thu nh p ngoài l ng t ng s d n n
t ng chi tiêu cao h n so v i thu nh p t
l ng t ng. Ý ki n này úng không?
4.
Tính KTC các HSHQ
5.
Tính h s t
6.
Ki m
ng quan
nh s phù h p c a mô hình.
TBP
07-Oct-21
TBP
TBP
07-Oct-21
Bài 3: các y u t
nh h
ng
nl
ng cam 𝛼
1.
Vi t hàm HQM,
c ngh a HSHQ. Tính KTC và
2.
Giá qu t có nh h
3.
Giá qu t gi m 1 ngàn ng/kg thì l
Nh n nh này úng hay sai?
4.
Ki m
5.
Hàm HQM thay
6.
Theo b n bi n X2 có nên thêm vào mô hình ban
7.
Trong 3 mô hình d
ng l
TBP
10%
c ngh a, r.
ng cam bán hay không?
ng cam bán t ng 2 t n/tháng.
nh s phù h p c a mô hình
i th nào n u Y: t /n m, X2: tri u
ng/t
u không?
i, b n ch n mô hình nào?
- MH1: Y, X2, X3
- MH2: Y, X2
- MH3: Y, X3
8. Trong 5 mô hình b n ch n mô hình nào?
- MH4: Y, X2, LnX3
- MH5: Y, LnX2, LnX3
TBP
07-Oct-21
TBP
Ch
ng 3
H I QUY V I BIẾN GIẢ
TBP
08-Oct-21
TBP
1. Bản chất c a biến giả
Các bi n
c l p Xi trong các mô hình
nghiên c u thông th
l
ng là nh ng bi n
ã
nh
ng, giá tr quan sát là nh ng con s
Ví d : Thu nh p, chi tiêu, chi phí, doanh thu .v.v..
Tuy nhiên có nh ng tr
l p này là nh ng bi n
ng h p các bi n
c
nh tính.
Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm…
TBP
08-Oct-21
TBP
1. Bản chất c a biến giả
Bi n
nh tính th
ng bi u th có hay không có
m t tính ch t ho c là các m c
khác nhau c a
m t tiêu th c thu c tính nào ó
Ví d : gi i tính (nam hay n ), tôn giáo, dân t c, n i
sinh, hình th c s h u, ngành ngh kinh doanh .v.v…
l
ng hoá các bi n
h i quy ng
nh tính, trong phân tích
i ta dùng bi n gi (dummy variables)
TBP
08-Oct-21
TBP
2. Biến đ c lập là biến đ nh tính
2.1. Các biến đ nh tính ch có hai l a ch n
Ví d :
- Gi a hai ngôi nhà có cùng các c tr ng, m t
có h b i trong khi ngôi nhà còn l i không có.
- Gi a hai nhân viên c a m t công ty có cùng
tu i, h c v n, kinh nghi m, m t ng i là nam
và ng i kia là n …
TBP
08-Oct-21
TBP
2.1. Các biến đ nh tính ch có hai l a ch n
Ví d :
Gi s mu n nghiên c u ti n l
ng c a các
nhân viên t i m t doanh nghi p có b
h
ng b i v n
nh
gi i tính hay không?
TBP
08-Oct-21
TBP
t:
- Y: bi n ph thu c bi u th l ng c a nhân viên và
là bi n nh l ng
- Z: bi n c l p, bi u th cho gi i tính, là bi n nh
tính:
Z=0 n
Z = 1 nam
Mô hình h i quy có d ng:
Yi = 1+ 2Zi + Ui
M c l ng trung bình c a nhân viên n là
E(Y/Z=0) = 1
M c l ng trung bình c a nhân viên nam là
E(Y/Z=1) = 1+ 2
ng chênh l ch gi a nam v i n
2 bi u th m c l
TBP
08-Oct-21
Lương (tri u/năm)
Gi i tính
115
95
Nam
N
120
Nam
105
N
125
Nam
110
N
132
Nam
116
N
125
N
140
Nam
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
• Nếu đặt Gi= 1 là n , nam:0 thì có đư c
không?
• Mô hình thay đ i như thế nào?
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
2.1. Các biến đ nh tính ch có hai l a
ch n
Tóm lại:
• Bi n gi này là bi n nh nguyên ch nh n
giá tr 1 v i nam nhân viên và 0 v i n
nhân viên.
• Chúng ta s thi t l p và c l ng m t mô
hình s d ng bi n gi nh m t bi n gi i
thích. D ng
n gi n nh t c a mô hình
nh sau:
TBP
08-Oct-21
TBP
2.1. Các biến đ nh tính ch có hai l a ch n
Mô hình h i quy có d ng:
Yi =
1+
2Zi
+ Ui
T m th i b qua sai s Ui
i v i nam: Z = 1 nam
Y=
+
1
iv in : Z=0
Y=
1
n
TBP
2
08-Oct-21
TBP
2.1. Các biến đ nh tính ch có hai l a ch n
Vậy làm thế nào để xem xét doanh nghiệp
này có s khác biệt tiền lương gi a nhân
viên nam và n hay không?
Ki m
nh gi thuy t
Ho: 2= 0
H1: 2≠ 0
tin c y 1-
TBP
08-Oct-21
TBP
2.2. Các biến đ nh tính có nhi u hơn hai
l a ch n
S l a ch n có th có c a m t bi n
có th nhi u h n hai.
nh tính
Có 2 cách:
• Dùng bi n gi có nhi u giá tr , s giá tr
b ng v i s l a ch n
• Dùng nhi u bi n gi , m i bi n có giá tr 0 và
1
không r i vào b y bi n gi :
S biến giả = s l a ch n - 1
TBP
08-Oct-21
2.2. Các biến
đ nh tính có
nhi u hơn hai
l a ch n
L ng
(tri u/n m)
Ví d : Kh o sát m c
l ng c a nhân viên
có trình
cao ng,
i h c, th c s ,
105
Có bao nhiêu biến
giả đưa vào mô
hình?
115
95
120
125
110
132
116
125
140
TBP
Trình
Cao
Cao
ng
ng
ih c
Cao
ng
ih c
Cao
ng
Th c s
Cao
ng
ih c
Th c s
TBP
08-Oct-21
• Ta dùng hai bi n gi
Z1 và Z2
•
•
Z1= 1
ih c
Z1= 0 Trình
khác
Z2=1 Th c s
Z2= 0 Trình
khác
TBP
L
ng Trình
115
95
120
105
125
110
132
116
125
140
Cao
Cao
ng
ng
ih c
Cao
ng
ih c
Cao
ng
Th c s
Cao
ng
ih c
Th c s
TBP
08-Oct-21
Nh
v y trình
c xác
TBP
c a m t nhân viên
nh b ng vi c k t h p hai
bi n nói trên:
Z1 = 0, Z2 = 0
cao
Z1 = 1 , Z2 =0
ih c
Z1 = 0 , Z2 =1
ng
th c s
Lúc này mô hình h i quy có d ng:
Yi = β1+β2Z1i + β3Z2i +Ui
TBP
08-Oct-21
TBP
E (Y / Z1 = 0, Z 2 = 0) =
1
ph n ánh m c l ng trung bình c a nhân viên
có trình cao ng.
E (Y / Z1 = 1, Z 2 = 0) =
1
+
2
ph n ánh m c l ng trung bình c a nhân
viên có trình
i h c.
E (Y / Z1 = 0, Z 2 = 1) =
ph n ánh m c l
có trình th c s .
1
+
3
ng trung bình c a nhân viên
TBP
08-Oct-21
TBP
- Vi t hàm h i quy
- Ý ngh a 1, 2, 3
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
3. Biến đ c lập là biến đ nh tính lẫn đ nh lư ng
3.1. Trư ng h p có m t biến đ nh tính v i 2 l a ch n
L y l i ví d trên kh o sát l ng c a nhân viên theo s
thâm niên và gi i tính.
•
t Yi : là ti n l ng hàng tháng c a nhân viên th i.
• G i Xi : là kinh nghi m c a nhân viên th i
• V i Zi =1 : nhân viên nam
• V i Zi =0 : nhân viên n
N u b qua y u t gi i tính, ch xét m i quan h gi a
ti n l ng hàng tháng và kinh nghi m, m t mô hình h i
quy n cho quan h này là:
Yi =
1
+
2
X i + Ui
TBP
08-Oct-21
TBP
3.1. Trư ng h p có m t biến đ nh tính v i 2 l a
ch n
Lúc này, câu h i t ra là :"Gi a hai nhân viên
có cùng kinh nghi m, có s khác bi t trong ti n
l ng tháng do gi i tính không?"
Khi ó, n u tính
thành
Yi =
1
+
n bi n gi , mô hình s tr
2
Xi +
3
Zi + U i
TBP
08-Oct-21
TBP
1. Vi t hàm HQM. c ý ngh a
HSHQ
2. Mô hình có phù h p không?
3. Có khác bi t ti n l ng gi a các
gi i tính không?
4. Kinh nghi m có th t s tác ng
n ti n l ng không?
5. Vi t hàm HQM cho nhân viên có
gi i tính n .
y
X
Z
115
95
11
9
1
0
120
10
1
105
12
0
125
13
1
110
12
0
132
14
1
116
14
0
125
15
0
140
15
1
TBP
08-Oct-21
TBP
1. Vi t hàm h i quy
2. Ý ngh a c a 1, 2 , 3 là gì?
3.
xem xét y u t gi i tính có th c s nh
h ng
n m c l ng c a nhân viên hay
không, chúng ta ph i ki m nh gi thuy t
β1 : là tiền lương khởi điểm của nhân viên.
β2: mức tiền lương trung bình tăng thêm khi nhân
viên có thêm một năm kinh nghiệm
β3: Sự chênh lệch tiền lương trung bình của nhân viên
nam và nữ.
TBP
08-Oct-21
TBP
TBP
08-Oct-21
3.2. Trư ng h p có m t
biến đ nh tính v i nhi u
hơn hai l a ch n
Y
X
TBP
Z
Z1 Z2
115
95
11
9
1
0
0
0
0
0
120
10
1
1
0
105
12
0
0
0
125
13
1
1
0
Khi ó mô hình h i quy có d ng:
110
12
0
0
0
Y = β1+β2Z1 + β3Z2 + β4X +Ui
132
14
1
0
1
116
14
0
0
0
125
15
0
1
0
140
15
1
0
08-Oct-21
Ví d : kh o sát l ng c a
nhân viên theo s thâm
niên và T HV
TBP
1
TBP
TBP
08-Oct-21
TBP
3.3. H i quy m t biến lư ng và hai biến đ nh tính
Ví d : Kh o sát v m c l
ng c a nhân viên trên,
bên c nh y u t v s n m i làm, gi i tính, m c
l
ng
ng còn ch u nh h
ng b i trình
h cv nc a
i nhân viên. Có ba c p b c h c v
là cao
ng,
i h c, th c s .
Ta xét mô hình
Y=
1
+
c xét t i
2
n gi n sau:
X+
3
Z+
Z +
4 1
4
Z2 + U
TBP
08-Oct-21
TBP
1. Vi t hàm HQM. c ý ngh a HSHQ
2. Mô hình có phù h p không?
3. Có khác bi t ti n l ng gi a các gi i tính không?
4. Kinh nghi m có th t s tác ng n ti n l ng không?
5. Có s khác bi t ti n l ng gi a trình cao ng v i i h c?
6. Có s khác bi t ti n l ng gi a trình cao ng v i th c s ?
7. Có nên thêm bi n X vào trong mô hình ban u g m có Y và Z
8. Trong hai mô hình: Y, X, Z và Y, X. Nên ch n mô hình nào?
9. V i MYN 10%, mô hình nào t t nh t:
- Y, Z
- Y, X
- Y, x, Z
- Y, X, Z, Z1, Z2
10. Tính h s t ng quan c a 2 i l ng Y và X
11. V i MYN 10%, b n g i ý nhân viên công ty nên làm gì c i
thi n ti n l ng.
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
4. S d ng biến giả trong phân tích mùa
TBP
Ví d : Nghiên c u v l ng i n n ng tiêu th
theo nhi t
b ng cách s d ng mô hình h i quy:
Y: là l ng i n n ng tiêu th , X : là nhi t
Chúng ta s d ng bi n gi b ng cách quy c:
D1 = 1 : mùa ông, D1 = 0: các mùa khác
D2 = 1: mùa xuân, D2 = 0: các mùa khác
D3 = 1 : mùa h , D3 = 0 : các mùa khác
Khi ó hàm h i quy có th vi t d
Y=
0
+
1
D1 +
2
D2 +
i d ng:
3
D3 +
0
X +U
TBP
08-Oct-21
Tuy nhiên, mô hình trên v n ch a
ph c vì nhi t
s c thuy t
và mùa có th có quan h ch t
ch v i nhau, và nh h
l
TBP
ng c a nhi t
iv i
ng i n n ng tiêu th gi a các mùa khác nhau
có th c ng khác nhau.
Chính vì th chúng ta c n
t ng tác:
Y=
0
a vào mô hình y u t
+ 1 D1 + 2 D2 + 3 D3 + ( 0 + 1 D1 + 2 D2 + 3 D3 ) X + U
Trong ó 1 , 2 , 3 bi u th s khác bi t nh h
nhi t gi a các mùa v i l ng i n tiêu th .
ng c a
TBP
08-Oct-21
TBP
Hàm h i quy
c l ng i n n ng tiêu th theo
nhi t
ng v i t ng mùa:
Mùa thu:
Y =
Mùa ông:
Y=
Mùa xuân:
Mùa h :
0
+
X
0
+
Y=
0
+
2
+
0
X+
2
X
Y=
0
+
3
+
0
X+
3
X
1
+
0
0
X+
1
X
TBP
08-Oct-21
TBP
5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô
hình h i quy
Khi h i quy m t m u s li u theo chu i th i
gian, có kh n ng x y ra nh ng thay i v c u
trúc trong m i quan h gi a bi n ph thu c và
bi n c l p => giá tr tham s h i quy có th b
bi n ng. Nguyên nhân:
•
•
•
•
Tác ng b i môi tr ng bên ngoài
Do chính sách c a Nhà n c thay i
Thay i t môi tr ng n i b doanh nghi p
Giai o n tr c và sau hôn nhân i v i thu nh p
và chi tiêu c a cá nhân
TBP
08-Oct-21
TBP
5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô
hình h i quy
Khi t ng th bao g m hai nhóm mang c tính
khác nhau nh nam/ n ; thành th / nông thôn;…
=> các h s h i quy c a hai nhóm có b ng nhau
không. N u các h s là b ng nhau, ta nói r ng
các h s là n nh.
=> Có 2 ph
ng pháp ki m
nh tính n
nh
TBP
08-Oct-21
TBP
6.1. Kiểm định Chow
Các b c ki m nh Chow:
n = n1 + n2
Gi thuy t:
Ho: C u trúc mô hình không i
H1: C u trúc mô hình thay i
Bư c 1: c l ng mô hình h i quy v i m u ban u g m
n quan sát, ta có RSSR . V i
t do n-k; k là s tham s
h i quy
Bư c 2:
c l ng mô hình h i quy n1 quan sát, ta có
RSS1. B c t do n1 k
Bư c 3:
c l ng mô hình h i quy n2 quan sát, ta có
RSS2. B c t do n2 k
• N u h s h i quy t ng ng c a các mô hình không i
qua các giai o n khác nhau thì c u trúc mô hình không
i.
TBP
08-Oct-21
TBP
• N u h s h i quy t ng ng c a các mô hình khác
nhau thì th c hi n ti p các b c:
B
B
c 4: Tính RSSu = RSS1 + RSS2,
b c t do n1+n2-2k
c 5: Tính
( RSS R RSSU ) / k
FC =
RSSU /( n 2k )
B
c 6: tra b ng F (k, n1+n2-2k)
B c 7: so sánh:
• N u F<F ;(k, n-2k): Ch p nh n gi thi t Ho
• N u F>F ;(k, n-2k): Bác b gi thi t Ho
TBP
08-Oct-21
TBP
KI M Đ NH TÍNH N Đ NH CẤU TRÚC TÁC Đ NG C A XUẤT KHẨU LÊN
GDP TRƯ C VÀ SAU KHI VI T NAM GIA NHẬP WTO
T ng c c Th ng kê
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
H n ch c a ki m
TBP
nh Chow
N u hai mô hình khác nhau thì ki m
này không ch ra
nào,
c khác nhau
nh
h s
h s ch n, h s góc, hay c hai lo i
h s ?
Ki m
sát
nh Chow c ng òi h i r ng s quan
m i nhóm ph i
trình ki m
l n, vì trong quá
nh c n th c hi n h i quy cho
m i nhóm
TBP
08-Oct-21
TBP
5. Ki m đ nh cấu trúc hoặc tính n đ nh c a mô
hình h i quy
5.2. Kiểm định d a trên việc s d ng biến giả
Gi thuy t: Ho:
H1:
cl
Yi =
3 = 4 =0 (C u trúc mô hình không
2+
2 ≠0 (C u trúc mô hình thay
3
4
i)
i)
ng h i qui v i d ng hàm nh sau:
1
+
2Xi
+
3Di
+
4DiXi
+ ui
Trong ó:
• D = 1 n u s li u
c l y t th i k 1 (b
s li u 1, n1 quan sát)
• D = 0 n u s li u
c l y t th i k 2 (b
s li u 2, n2 quan sát)
TBP
08-Oct-21
TBP
Sau khi
c l ng ta thu
c t ng bình
ph ng các ph n d , ký hi u là RSSU.
c l ng mô hình không s d ng bi n gi ,
mô hình là Yi = 1 + 2Xi + ui và thu
c giá
tr RSSR.
Tr th ng kê ki m
nh:
( RSS R RSSU ) / k
FC =
RSSU /( n 2k )
tra b ng F (k, n1+n2-2k)
So sánh:
• N u F<F
;(k, n-2k):
Ch p nh n gi thi t Ho
• N u F>F
;(k, n-2k):
Bác b gi thi t Ho
TBP
08-Oct-21
TBP
Khi nghiên c u SAVINGS là l
m t th i o n cho tr
ng ti t ki m c a ng
c và bi n
i dân M trong
c l p thu nh p INCOME. Ng
i ta
th y r ng có hai th i o n trong su t kho ng th i gian 1970-1995, có
th gây ra nh ng thay
i trong mô hình hành vi ti t ki m. B i vì s
liên t c t ng m nh v giá d u l a trên th gi i h i n m 1979 cho
nh t
n m 1981, t 13,5 ôla/thùng lên 36 ôla/thùng ã gây nên cu c kh ng
ho ng n ng l
ng tr m tr ng trên th gi i. Tác
ng c a nh ng bi n
ng m nh m v giá d u l a th gi i cùng s t ng v t v lãi su t cho
vay th c t
M và trên kh p th gi i ã là m t nhân t quan tr ng gây
ra cu c kh ng kinh t th gi i nói chung và cu c kh ng ho ng n 1982
nói riêng. V y hành vi ti t ki m có th có s khác bi t gi a hai th i k
là 1970-1981 và th i k 1982-1995.
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
TBP
08-Oct-21
TBP
Bài t p
KI M NH TÍNH N NH C U TRÚC TÁC
NG
C A XU T KH U LÊN GDP TR
C VÀ SAU KHI
VI T NAM GIA NH P WTO: XK , GDP (n2: 2007-
2019, n1:1990-2006)
Xem xét m i quan h gi a h c v n và m c
l ng gi a lao ng thành th và lao ng nông
thôn có khác nhau hay không. (nông thôn=0;
thành th =1)
n=935
Wage= b1 +b2urban + b3Edu + b4 Urban*edu+e
Bài t p 8 file s li u và bài t p stata
TBP
08-Oct-21
Wage=2815,83-190,27urban+38,91edu+26,14urban*edu +e
TBP
c ý ngh a h s h i quy
TBP
08-Oct-21
6. H i quy tuyến tính t ng khúc
TBP
Kh o sát m c chi tr hoa h ng theo doanh thu c a m t
doanh nghi p dành cho các
i lý bán hàng. M c hoa
h ng chi tr tùy theo doanh thu
t
• N u m c doanh thu v
ng X*, m c hoa h ng
s thay
t ng
c.
i, gi s t ng tuy n tính theo doanh thu.
• S d ng hàm h i quy tuy n tính t ng khúc
cho t c
ng
t ng hoa h ng theo doanh thu
ng X*, ngh a là
i t i ng
d cc a
mô t
ng v i
ng h i quy thay
ng X*
TBP
08-Oct-21
TBP
S d ng biến giả
D =0 , n u X ≤X*
D = 1 n u X > X*
Hàm h i quy tuy n tính t ng khúc có d ng:
Y=
+
1
X+
2
(X
X )D + U
*
Trung bình hoa h ng khi doanh thu < X* :
+
1
X
Trung bình hoa h ng khi doanh thu ≥X* :
+
1
X+
2
(X
*
X )
TBP
08-Oct21
TBP
Trong tr
ng h p có hai ng
ng doanh thu: X*
và X**, chúng ta s d ng hai bi n gi D1 và D2
D1 = 1 n u X> X*, D1 = 0: tr
D2 = 1, n u X > X**, D2 = 0, tr
ng h p khác
ng h p khác
Hàm h i quy tuy n tính t ng khúc có d ng:
Y = + 1 X + 2 ( X X ) D1 + 3 ( X X ) D2 + U
*
**
TBP
08-Oct-21
7. Ý ngh a h s h i quy c a bi n gi
Kh o sát l
ng c a giáo viên (Y) theo trình
TBP
(D=0: c nhân,
D=1: th c s ) và theo s n m gi ng d y (X)
7.1. Mô hình Log – Lin
𝑙𝑛𝑌 = 𝛽1 + 𝛽 𝑋 + 𝛽 𝐷 + 𝑈
100. 𝛽 :
𝛽
Antilog(𝛽1 )= e 1 :
𝛽
Antilog(𝛽 )-1= e -1:
TBP
08-Oct-21
7. Ý ngh a h s h i quy c a bi n gi
TBP
7.2. Mô hình Lin – Log
Gi s nhu c u kh o sát l
ng c u c a hai lo i trà Artiso và
trà Hoa Cúc theo giá. D=0 trà artiso, D=1 trà hoa cúc
𝑌 = 𝛽1 + 𝛽 𝑙𝑛𝑋 + 𝛽 𝐷 + 𝑈
𝛽 /100
𝛽:
TBP
08-Oct-21
TBP
Bài t p
XK , GDP (n2: 2007-2019, n1: 2006-1990
Xem xét m i quan h gi a h c v n và
m c l ng gi a lao ng thành th và lao
ng nông thôn có khác nhau hay không.
(dùng file dữ liệu wage2.wf1 trong tài liệu
KTL để thực hành cho phần lý thuyết 6.)
Th c hành bài s 8 trong Bài tập eviews.
C n c k t qu , hãy g i ý chính sách.
Y c x z z*x
TBP
08-Oct-21
TBP
Ví d minh ho
B ng d i ây là s li u gi thi t v m c l ng giáo s
i h c (Y), s n m kinh nghi m gi ng d y (X) và gi i
tính (Di=1:nam; Di=0:n )
Yi
23,0
19,5
Xi
11
9
Di
1
0
Yi
25,0
28,0
Xi
15
15
Di
0
1
24,0
21,0
25,0
10
12
13
1
0
1
29,5
26,0
27,5
16
16
17
1
0
0
22,0
26,5
23,1
12
14
14
0
1
0
31,5
29,0
18
18
1
0
TBP
08-Oct-21
TBP
Ví d minh ho
1) Tìm hàm h i quy Yi = 1 + 2 X i + 3 Di
2) Gi i tính có nh h ng n m c l ng c a giáo
s
i h c hay không ?
3) D báo m c l ng c a m t giáo s nam có s n m
kinh nghi m gi ng d y là 17 n m v i
tin c y
95%
4) D báo m c l ng c a m t giáo s n có s n m
kinh nghi m gi ng d y là 19 n m v i
tin c y
95%
TBP
08-Oct-21
TBP
Chương 4
ĐA C NG TUY N
TBP
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
Thông thư ng các biến đ c lập không có m i
quan hệ tuyến tính.
Nếu quy tắc này bị vi phạm thì sẽ có hiện tư ng
đa c ng tuyến.
Như vậy , “đa c ng tuyến ”là hiện tư ng các biến
đ c lập trong mô hình ph thu c lẫn nhau và thể
hiện đư c dư i dạng hàm s
TBP
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
Xét mô hình h i quy tuyến tính k biến v i hàm PRF :
Yi
1
+
2
X 2i + 3 X 3i + ... +
k
X ki + U i
Đa c ng tuy n hoàn hảo xảy ra khi gi a các
biến đ c lập có m i quan hệ chính xác theo
dạng
a 2X 2 + a 3X 3 + ... + ak X k = 0
Đa c ng tuy n không hoàn hảo xảy ra khi gi a
các biến đ c lập có m i quan hệ theo dạng
a 2X 2 + a 3X 3 + ... + a k X k + V = 0
TBP
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
X2
X3
X4
627
843
650
786
704
3135
4215
3250
3930
3520
3165
4260
3275
3987
3582
TBP
16-Oct-21
1. Gi i thi u đa c ng tuy n
Ví d
TBP
Đa c ng tuyến hoàn hảo:
X2
10
X3
50
X4
52
15
18
24
11
75
90
120
55
78
97
129
63
TBP
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
i u gì x y ra khi có a c ng tuy n hoàn h o ?
Xét ví d hàm h i quy tuyến tính 3 biến
Yi
+
1
2
X 2i +
3
X 3i + U i
Và giả s có đa c ng tuyến hoàn hảo : X3i=aX2i
Ta có : ˆ2
Vì : X3i=aX2i
ˆ
(
2
yi x2i )(
(
(
(
yi x 2 i ) a 2
(
x
2
2i
x
)(a
2
2i
x22i
2
)(
x32i )
2
3i
x
( x
) (
) (a x
x ) (a
2
2i
x
x
2 i 3i
2i 2i
)(
x2i x3i )
yi x3i )
2
)(a
x2 i x2 i )
yi x 2 i
)
2
TBP
0
0
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
0
Tương t : ˆ3
0
Nếu thay X3i=aX2i vào hàm h i quy ta đư c:
Yi
1
+
Yi
1
+(
2
X 2i +
2
+
3
3
aX 2 i + U i
a ) X 2i + U i
Như vậy trong trư ng h p đa c ng tuyến hoàn
hảo thì không thể ư c lư ng đư c các hệ s
trong mô hình mà chỉ có thể ư c lư ng đư c
m t t h p tuyến tính c a các hệ s đó.
TBP
16-Oct-21
TBP
1. Gi i thi u đa c ng tuy n
i u gì x y ra khi có a c ng tuy n không
hoàn h o ?
Vẫn có thể ư c lư ng các hệ s trong mô
hình nhưng sẽ có nh ng hậu quả c a đa
c ng tuyến không hoàn hảo.
TBP
16-Oct-21
2. Nguyên nhân c a đa c ng tuy n
TBP
Do phương pháp thu thập d li u:
+ Các giá trị c a các biến đ c lập ph
thu c lẫn nhau trong mẫu, nhưng không
ph thu c lẫn nhau trong t ng thể.
Ví d : người có thu nhập cao hơn khuynh
hướng sẽ có nhiều của cải hơn. Điều này có thể
đúng với mẫu mà không đúng với tổng thể . Cụ
thể , trong tổng thể sẽ có các quan sát về các cá
nhân có thu nhập cao nhưng không có nhiều
của cải và ngược lại.
TBP
16-Oct-21
TBP
2. Nguyên nhân c a đa c ng tuy n
+ Các biến đ c lập đư c ch n có quan hệ
nhân quả hay có m i quan hệ tương quan
cao vì cùng ph thu c vào m t điều kiện
khác.
Vd: - số giường bệnh và số bác s cùng
phụ thuộc vào quy mô của bệnh viện.
TBP
16-Oct-21
2. Nguyên nhân c a đa c ng tuy n
TBP
Kích c mẫu quá nh
Dạng hàm mô hình:
Ví dụ: hồi qui dạng các biến độc lập được bình
phương (dạng hàm) sẽ xảy ra đa cộng tuyến và
đặc biệt khi phạm vi giá trị ban đầu của biến độc
lập là nhỏ.
Các biến đ c lập vĩ mô đư c quan sát theo
d liệu chu i th i gian
Ví dụ: Nhập khẩu quốc gia phụ thuộc vào GDP và
CPI (các chỉ số này được thu thập từ d liệu chuỗi
thời gian)
TBP
16-Oct-21
3. Hậu quả c a đa c ng tuy n
TBP
H qu khi có a c ng tuy n không hoàn h o
1. Phương sai c a các ư c lư ng theo OLS l n
2. Sai s chuẩn c a các hệ s h i qui sẽ l n
Do đó:
oKhoảng tin cậy lớn và việc kiểm định ít có ý nghĩa.
oGiả thiết H0 luôn dễ dàng được chấp nhận
TBP
16-Oct-21
TBP
3. Hậu quả c a đa c ng tuy n
3. T s t nh
Tăng khả năng chấp nhận giả thiết H0
4.Các ư c lư ng và sai s chuẩn c a ư c
lư ng rất nhạy cảm v i s thay đ i c a d
liệu
Chỉ cần m t s thay đ i nh trong mẫu d
liệu sẽ kéo theo s thay đ i l n các hệ s
ư c lư ng.
TBP
16-Oct-21
3. Hậu quả c a đa c ng tuy n
TBP
5. Dấu c a các ư c lư ng c a các hệ s h i
quy có thể sai
6. Thêm vào hay b t đi các biến c ng tuyến
v i các biến khác, mô hình sẽ thay đ i về
dấu hoặc thay đ i về đ l n c a các ư c
lư ng
TBP
16-Oct-21
TBP
4. Nhận bi t đa c ng tuy n
R2 cao và th ng kê t thấp.
Ví d :
Khảo sát 10 c a hàng máy tính, tìm hiểu ảnh
hư ng c a doanh s bán hàng và tiền thư ng
cho b phận kinh doanh lên l i nhuận sau
thuế, đơn vị triệu đ ng
TBP
16-Oct-21
TBP
Tiền thư ng
X2
Doanh s bán
X3
L i nhuận
Y
1.58
2.686
1.862
1.44
2.145
3.672
1.1242
2.496
4.345
200
340
245
180
275
459
146
320
550
22
35.7
27.685
19.62
30.8
48.654
16.06
36.16
63.25
2.94
490
50.96
TBP
16-Oct-21
Dependent Variable: Y
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable
Coefficient
C
-0.315065
X2
3.369120
X3
0.084931
R-squared
0.992150
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
TBP
Std. Error
t-Statistic
Prob.
1.304738 -0.241478
0.8161
1.885534
1.786826
0.1171
0.013845
6.134429
0.0005
Mean dependent var
35.08890
0.989908 S.D. dependent var
1.525907 Akaike info criterion
16.29876 Schwarz criterion
-16.63190
442.3846
0.000000
Hannan-Quinn criter.
Durbin-Watson stat
15.18914
3.926381
4.017156
3.826800
2.265317
TBP
16-Oct-21
TBP
4. Nhận bi t đa c ng tuy n
- Có khả năng hai biến đ c lập là tiền thư ng và
doanh s bán hàng có c ng tuyến cao
- Quan sát mẫu s liệu trên ta thấy: X2= 0,008X3.
Nghĩa là tiền thư ng luôn bằng khoảng 0,8%
trên doanh s bán hàng
TBP
16-Oct-21
TBP
4. Nhận bi t đa c ng tuy n
Tương quan tuyến tính mạnh gi a các
biến đ c lập
Hệ số tương quan cặp giữa các biến độc lập lớn
hơn 0,8 ta có hiện tượng đa cộng tuyến
X2
X3
Y
X2
1
0.964347
0.974655
X3
0.964347
1
0.994269
Y
0.974655
0.994269
1
TBP
16-Oct-21
TBP
H s tương quan (r)
𝒓𝟐𝟑
∑ 𝑿𝟐𝒊 − 𝑿𝟐 𝑿𝟑𝒊 − 𝑿𝟑
∑ 𝑿𝟐𝒊− 𝑿𝟐
𝟐∑
𝑿𝟑𝒊 − 𝑿𝟑
𝟐
TBP
16-Oct-21
TBP
4. Nhận bi t đa c ng tuy n
Th c hiện h i qui ph
Hồi qui giữa một biến độc lập nào đó theo các biến
độc lập còn lại với nhau và quan sát hệ số R2 của các
hồi qui phụ
Th c hiện kiểm định F
- H0: R2 = 0 (không có đa cộng tuyến)
- F0 = [R2.(n-k)] /[(1-R2).(k-1)]
- k số tham số trong mô hình hồi quy phụ
- Nếu F0 > F(k-1,n-k) thì bác bỏ giả thiết H0
- chúng ta có thể kết luận rằng R2 khác không
theo ý nghĩa thống kê và điều này có nghĩa
là có đa cộng tuyến trong mô hình.
TBP
16-Oct-21
TBP
Dependent Variable: X2
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.159584
0.238054
0.670369
0.5215
X3
0.007081
0.000687
10.30674
0.0000
R-squared
0.929965
Mean dependent var
2.429020
Adjusted R-squared
0.921211
S.D. dependent var
1.019332
S.E. of regression
0.286120 Akaike info criterion
0.512049
Sum squared resid
0.654919
Schwarz criterion
0.572566
Hannan-Quinn criter.
0.445662
Durbin-Watson stat
1.874165
Log likelihood
-0.560244
F-statistic
106.2288
Prob(F-statistic)
0.000007
TBP
16-Oct-21
TBP
4. Nhận bi t đa c ng tuy n
Th a s phóng đại phương sai- VIF
VIFj= 1/1-R2j
o R2j là hệ s xác định c a hàm h i quy ph
o VIFj càng l n, c ng tuyến càng cao.
o Kinh nghiệm: VIFj >10
R2j >0,9, c ng
tuyến đư c xem là cao
TBP
16-Oct-21
5. Kh c ph c đa c ng tuy n
TBP
B qua ĐCT:
Nếu các biến ĐCT không bị sai dấu và không
mất ý nghĩa th ng kê
Nếu mô hình dùng để d báo ch không để
kiểm định
Thu thập thêm s liệu hoặc lấy thêm mẫu m i,
S d ng thông tin tiền nghiệm
S d ng sai phân cấp 1
B biến đ c lập có đa c ng tuyến
TBP
16-Oct-21
TBP
TBP
16-Oct-21
TBP
1. Ư c lư ng hàm h i quy:
LnNK=b1+b2lnGDP +b3lnCPI +e
Đ c ý nghĩa hệ s h i quy b^2, b^3.
2. Hãy kiểm tra đa c ng tuyến gi a các biến đ c
lập (s d ng cả 4 Phương pháp đã h c). Đề xuất
biện pháp khắc ph c.
- Câu lệnh:
- Tính hệ s tương: corr (tên các bi n)
- Th a s phóng đại Phương sai: vif (l nh này
th c hi n ngay sau khi th c hi n l nh h i quy
TBP
16-Oct-21
TBP
Ch
ng 5
PHƯƠNG SAI THAY Đ I
TBP
16-Oct-21
1. B n ch t c a phương sai thay đ i
Khi gi thi t v ph ng sai không thay
mô hình h i quy tuy n tính b vi ph m
=> Hi n t ng ph ng sai thay
(heteroskedasticity)
TBP
ic a
i
TBP
16-Oct-21
1. B n ch t c a phương sai thay đ i
TBP
Chúng ta có th quan sát qua hình minh h a sau ây:
(Hình 1: Phương sai c a sai số không đổi)
TBP
16-Oct-21
1. B n ch t c a phương sai thay đ i
TBP
(Hình 2: Ph ơng sai của sai số thay đổi)
TBP
16-Oct-21
1. B n ch t c a phương sai thay đ i
TBP
Lý do c a phương sai thay đổi
• Do b n ch t c a m i quan h kinh t
• Do hành vi c a con ng i trong các ho t
ng ngày càng hoàn thi n
• Sai s tính toán có xu h ng gi m xu ng,
kéo theo ph ng sai gi m
• Ph ng sai thay
sai d ng mô hình
i ôi khi do ta xác
nh
TBP
16-Oct-21
2. H u qu c a phương sai thay đ i
TBP
•Các c l ng OLS cho các h s v n
là c l ng không ch ch
•Các
c l ng theo ph ng pháp OLS
không còn là c l ng t t nh t
• Kho ng tin c y và k t lu n ki m nh
v các gi thuy t th ng kê v h s h i
quy là không còn giá tr
TBP
16-Oct-21
TBP
3. Phát hi n phương sai thay đ i
Ph
ng pháp ki m
Park cho r ng 𝜎
nh Park
là m t hàm c a X có d ng:
2
i
=
2
i
= ln
2
Xi e
2
vi
Do ó:
ln
2
𝜎 ch a bi t nên Park ã
cho 𝜎
+
2
ln X i + vi
ngh s d ng ei2 thay
TBP
16-Oct-21
Ph
ng pháp ki m
TBP
nh Park
c l ng mô hình h i quy g c, thu l y ph n d ei,
tính ei2
cl
ng mô hình
ln e =
2
i
1
+
2
ln X i + vi
N u mô hình g c có nhi u bi n c l p thì h i quy
lnei2 theo t ng bi n c l p ho c theo 𝑌
Ki m
nh H0:
2
=0
N u ch p nh n H0 thì không có hi n t
sai thay i.
ng ph
TBP
ng
16-Oct-21
TBP
Ph
ng pháp ki m
nh Park
H n ch c a ki m đ nh Park: gi
nh các
nhi u Vi th a mãn các gi thi t c
i n
(ph ng sai thu n nh t). N u gi thi t c
i n b vi ph m thì các b c ki m nh ti p
theo không còn ý ngh a.
Y = b1+b2X +e
lne2 = b1+b2lnX +v
TBP
16-Oct-21
Ví d : Kh o sát m t
m u thu nh p – chi
tiêu
X
8.2
20.2
34.5
18.2
38
28.3
14.1
30.1
16.4
24.1
Y
8
19.8
33.1
17.9
33.5
25
13.1
29.4
14.9
21.5
X
40.3
32.3
10.3
33.6
26.1
12.1
44.7
42.3
6.2
22.4
TBP
Y
38.7
31.2
10.3
31.7
25.5
12.1
38.6
40.7
6.1
20
TBP
16-Oct-21
TBP
Dependent Variable: Y
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.707825
0.654510
1.081457
0.2938
X
0.909521
0.023700
38.37704
0.0000
R-squared
0.987926
Mean dependent var
23.55500
Adjusted R-squared
0.987255
S.D. dependent var
10.77328
S.E. of regression
1.216230 Akaike info criterion
3.324028
Sum squared resid
26.62587
Schwarz criterion
3.423601
Hannan-Quinn criter.
3.343466
Durbin-Watson stat
2.038798
Log likelihood
-31.24028
F-statistic
1472.797
Prob(F-statistic)
0.000000
TBP
16-Oct-21
TBP
Dependent Variable: LOG(RESID^2)
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-7.734754
0.902141
-8.573772
0.0000
LOG(X)
2.337409
0.287290
8.136054
0.0000
R-squared
0.786212
Mean dependent var
-0.510473
Adjusted R-squared
0.774334
S.D. dependent var
1.501310
S.E. of regression
0.713187 Akaike info criterion
2.256492
Sum squared resid
9.155433
Schwarz criterion
2.356066
Hannan-Quinn criter.
2.275930
Durbin-Watson stat
1.531328
Log likelihood
-20.56492
F-statistic
66.19537
Prob(F-statistic)
0.000000
TBP
16-Oct-21
TBP
Wald Test:
Equation: Untitled
Test Statistic
Value
df
F-statistic
66.19537
(1, 18)
Chi-square
66.19537
1
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
C(2)
2.337409
Restrictions are linear in coefficients.
Probability
0.0000
0.0000
Std. Err.
0.287290
TBP
16-Oct-21
Ki m
TBP
nh glejer
T ng t ki m nh Park, tuy nhiên sau khi thu các
ph n d t mô hình h i quy g c, Glejser s d ng các
d ng hàm sau
| Uˆ i |=
| Uˆ i |=
1 +
1 +
2 X i + Vi
2
X i + Vi
| Uˆ i |=
| Uˆ i |=
1
+
1
1
2
+
Xi
2
+ Vi
X i + Vi
2
1
ˆ
| U i |=
+ Vi
1 +
2 X i + Vi
1 +
2
Xi
Ki m nh ph ng sai không i t c là ki m nh
gi thuy t:
=0
| Uˆ i |=
2
TBP
16-Oct-21
H n ch :
TBP
- Gi
i n
(ph
nh các nhi u Vi th a mãn các gi thi t c
ng sai thu n nh t). N u gi thi t c
thì các b
c ki m
i n b vi ph m
nh ti p theo không còn ý ngh a.
- Hai mô hình cu i không ph i là mô hình tuy n tính nên
không th áp d ng ph
th
ng pháp
cl
ng OLS thông
ng.
- Ngo i tr mô hình th nh t, các mô hình còn l i
yêu c u v bi n
m t toán h c.
cl pX
u có
cho bi u th c có ý ngh a v
TBP
16-Oct-21
TBP
Dependent Variable: ABS(RESID)
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.147107
0.193278
-0.761119
0.4564
X
0.044700
0.006999
6.387045
0.0000
R-squared
0.693848
Mean dependent var
0.975754
Adjusted R-squared
0.676840
S.D. dependent var
0.631788
S.E. of regression
0.359154 Akaike info criterion
0.884508
Sum squared resid
2.321847
Schwarz criterion
0.984081
Hannan-Quinn criter.
0.903946
Durbin-Watson stat
2.016217
Log likelihood
-6.845078
F-statistic
40.79434
Prob(F-statistic)
0.000005
TBP
16-Oct-21
TBP
Wald Test:
Equation: Untitled
Test Statistic
Value
F-statistic
40.79434
Chi-square
40.79434
Null Hypothesis Summary:
Normalized Restriction (= 0)
C(2)
df
(1, 18)
1
Value
0.044700
Probability
0.0000
0.0000
Std. Err.
0.006999
TBP
16-Oct-21
TBP
Dependent Variable: ABS(RESID)
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.032092
0.341819
-3.019408
0.0074
SQR(X)
0.413054
0.068200
6.056479
0.0000
R-squared
0.670818
Mean dependent var
0.975754
Adjusted R-squared
0.652530
S.D. dependent var
0.631788
S.E. of regression
0.372418 Akaike info criterion
0.957038
Sum squared resid
2.496510
Schwarz criterion
1.056612
Hannan-Quinn criter.
0.976476
Durbin-Watson stat
1.935231
Log likelihood
-7.570384
F-statistic
36.68093
Prob(F-statistic)
0.000010
TBP
16-Oct-21
TBP
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
36.68093
(1, 18)
0.0000
Chi-square
36.68093
1
0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(2)
0.413054 0.068200
Restrictions are linear in coefficients.
TBP
16-Oct-21
TBP
3. Phát hi n phương sai thay đ i
Ph
ng pháp ki m
nh White
Xét hàm h i quy ba bi n :
Yi =
1
B c1:
tính và t
B c2:
e =
2
i
1
+
+
2
X 2i +
3
X 3i + U i
c l ng mô hình h i quy tuy n
ó thu
c các ph n d ei
c l ng mô hình sau
+
5
2
X
X 2i +
2
3i
+
6
3
X 3i +
4
X
2
2i
X 2i X 3i + Vi
TBP
16-Oct-21
TBP
3. Phát hi n phương sai thay đ i
B c 3 : Tính toán tr th ng kê nR2 , trong ó n là c
m u và R2 là h s xác nh c a mô hình h i quy ph
b c2
B c 4 : Tra b ng phân ph i Chi-bình ph ng , m c ý
ngh a và b c t do là k (k là s tham s trong mô
hình h i quy ph không k h s t do ).
B c 5 : Gi thi t H0: Ph ng sai c a sai s không i.
N u
bác b gi thi t H0, K t lu n
2
2
có hi n t ng ph ng sai
thay i
nR
(k )
TBP
16-Oct-21
DEMAND
INCOME
PRICE
TEMP
DEMAND
INCOME
PRICE
TEMP
TBP
0.386
0.374
0.393
0.425
0.406
0.344
0.327
0.288
0.269
0.256
0.286
0.298
0.329
0.318
0.381
78
79
81
80
76
78
82
79
76
79
82
85
86
83
84
0.27
0.282
0.277
0.28
0.272
0.262
0.275
0.267
0.265
0.277
0.282
0.27
0.272
0.287
0.277
41
56
63
68
69
65
61
47
32
24
28
26
32
40
55
0.381
0.47
0.443
0.386
0.342
0.319
0.307
0.284
0.326
0.309
0.359
0.376
0.416
0.437
0.548
82
80
78
84
86
85
87
94
92
95
96
94
96
91
90
0.287
0.28
0.277
0.277
0.277
0.292
0.287
0.277
0.285
0.282
0.265
0.265
0.265
0.268
0.26
63
72
72
67
60
44
40
32
27
28
33
41
52
64
71
TBP
16-Oct-21
Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS
Dependent Variable: RESID^2
Method: Least Squares
Included observations: 30
Variable
C
INCOME
INCOME^2
INCOME*PRICE
INCOME*TEMP
PRICE
PRICE^2
PRICE*TEMP
TEMP
TEMP^2
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
TBP
1.659805
12.82684
10.49696
Prob. F(9,20)
Prob. Chi-Square(9)
Prob. Chi-Square(9)
Coefficient
Std. Error
0.095560
0.465726
0.000540
0.003320
-1.46E-05
1.20E-05
0.007245
0.008424
-1.01E-06
4.55E-06
-0.958098
2.935590
0.757448
4.874070
-0.003869
0.003290
0.001230
0.001129
-5.55E-07
1.80E-06
0.427561 Mean dependent var
0.169964 S.D. dependent var
0.001608 Akaike info criterion
5.17E-05 Schwarz criterion
156.4914 Hannan-Quinn criter.
1.659805 Durbin-Watson stat
0.1652
0.1706
0.3118
t-Statistic
0.205186
0.162738
-1.214962
0.859972
-0.222206
-0.326373
0.155404
-1.176202
1.089248
-0.307876
TBP
Prob.
0.8395
0.8724
0.2385
0.4000
0.8264
0.7475
0.8781
0.2533
0.2890
0.7614
0.001176
0.001765
-9.766091
-9.299025
-9.616672
1.760368
16-Oct-21
3. Phát hi n phương sai thay đ i
TBP
Ki m nh Goldfeld – Quandt (G-Q)
Ki m nh này s d ng trong tr ng
h p gi thi t r ng ph ng sai thay i
𝜎 có liên h d ng v i m t trong các
bi n gi i thích: 𝜎 = 𝜎 𝑋 .
Xét mô hình h i quy n:
Yi =
1
+
2
X i + Ui
TBP
16-Oct-21
3. Phát hi n phương sai thay đ i
TBP
Ki m nh Goldfeld – Quandt (G-Q)
B c 1: S p x p các quan sát theo th
t t ng d n i v i giá tr c a bi n X
B c 2: B b t c quan sát gi a, theo
kinh nghi m nh sau:
c = 4 ho c c = 8, n u n 30
c = 10 ho c c = 16, n u n 60
Chia s quan sát còn l i thành hai nhóm,
𝑛−
m i nhóm có
quan sát.
TBP
16-Oct-21
TBP
3. Phát hi n phương sai thay đ i
Ki m
B
quy
nh Goldfeld – Quandt (G-Q)
c 3: s d ng OLS
i v i nhóm
B
c
c 4: tính F =
ng các tham s h i
u và nhóm cu i. Thu
và RSS2. B c t do là (
s tham s
cl
cl
𝑛−
− k ho c
c RSS1
𝑛− − 𝑘
. K là
ng k c h s ch n.
𝑅
𝑅
Bác b gi thi t H0 khi F>F(
𝑛− − 𝑘 𝑛− − 𝑘
,
)
TBP
16-Oct-21
3. Phát hi n phương sai thay đ i
Ki m
TBP
nh Goldfeld – Quandt (G-Q)
H n ch c a ph ng pháp ki m nh G-Q
ch không có quy t c rõ r t
xác nh
s quan sát b lo i b (c) bao nhiêu là h p
lý và
tin c y c a k t qu ki m nh l
thu c vào (c).
Ki m
nh .
nh G-Q thích h p v i nh ng m u
H i quy b i, x p h ng các quan sát b i
m t trong các bi n c l p c a mô hình.
TBP
16-Oct-21
S n lư ng
tiêu th
(Y)
N
Chi phí
qu ng
cáo (X)
S n lư ng
TBP
tiêu th (Y)
11 13.9
9.4
21
21
14.4
6.9
12 14.4
10.7
22
22
15.2
8.9
7.4
13 15
11.3
23
22.5
14
4
9.9
6.4
14 16
11
24
23
13.7
5
10.5
7.4
15 16.5
12.5
25
23.9
14.4
6
11
8
16 18
11.5
26
24.4
17.4
7
11.5
8.4
17 18.4
12.9
27
24.9
18.8
8
12
7.9
18 18.9
13.4
28
26
18
9
12.4
8.9
19 19.9
11.9
29
26.5
17.8
10 12.9
9.7
20 20.5
14
30
27
19.1
N
Chi phí
qu ng
cáo (X)
S n lư ng
tiêu th
(Y)
N
1
7.9
5.4
2
8.4
3
Chi phí
qu ng
cáo (X)
TBP
16-Oct-21
TBP
Kh o sát 30 c a hàng kinh doanh cùng m t lo i s n
ph m
tìm m i quan h chi phí qu ng cáo(tri u
g/tháng) v i s n l ng tiêu th (t n s n ph m)
B 4 quan sát gi a: t 14-17
H i quy nhóm 1 g m 13 quan sát t 01-13
SL= 0,3161+ 0,6973CPQC +e
RSS1 = 3,7435
H i quy nhóm 2 g m 13 quan sát t 18-30
SL= -2,8011+ 0,7937CPQC +e
RSS2 = 15,3251
TBP
16-Oct-21
TBP
3. Phát hi n phương sai thay đ i
Ki m nh Breusch-Pagan (BP)
Yi = 1 + 2 X 2i + 3 X 3i + ... + k X ki + U i
B
c1:
c l ng mô hình h i quy tuy n tính và t
c các ph n d ei
B c2:
c l ng mô hình sau và thu R2
B
ó thu
𝑒 = 𝛼 + 𝛼 𝑋 + 𝛼 𝑋 + … + 𝛼𝑘 𝑋𝑘 + 𝑉
c 3 : Tính giá tr quan sát c a các th ng kê ki m nh:
F0 = [R2.(n-k)] /[(1-R2).(k-1)]
Ho c LM = n*R2
N u
F0 > F(k-1,n-k)
hoặc 𝑛𝑅 > 𝜒𝛼 (𝑘
thì bác b H0 => mô hình có hi n t ng ph ng sai sai s thay
i
TBP
16-O -21
S d ng 935 quan sát th c hi n h i quy
TBP
Wage = 1950 + 20,9age + 60,58 edu +e
e2 = - 205625 + 18848age + 2822,91edu + v
R2 = 0,017
TBP
16-Oct-21
4. Kh c ph c ph
ng sai thay
i
TBP
Xem xét v n thi u bi n ho c
d ng hàm sai
S d ng phép bi n i logarit
Chia 2 v c a mô hình g c cho
Xi, 𝑋 , 𝑌 ,e.
c l ng l i sai s chu n (c
m u l n)
TBP
16-Oct-21
Ví d : D li u d i ây là bi u hi n quan h c a chi tiêu cho tiêu
TBP
dùng (Y) và thu nh p (X) hàng tháng c a 20 h gia ình m t vùng
nông thôn:
Gia đình
Chi tiêu (Y)
Thu nh p (X)
Gia đình
Chi tiêu (Y)
Thu nh p (X)
1
19.9
2.3
11
8
8.1
2
31.2
32.3
12
33.1
34.5
3
31.8
33.6
13
33.5
38
4
12.1
12.1
14
13.1
14.1
5
40.7
42.3
15
14.8
16.4
6
6.1
6.2
16
21.6
24.1
7
38.6
44.7
17
29.3
30.1
8
25.5
26.1
18
25
28.3
9
10.3
10.3
19
17.9
18.2
10
38.8
40.2
20
19.8
20.1
TBP
16-Oct-21
Ch
T
T
ng 6
NG QUAN
1. B n ch t và nguyên nhân c a t t
ng quan
Trong mô hình h i quy tuy n tính c i n
chúng ta gi
nh không có t ng quan gi a các
ph n d
ui
ui
t
t
• Nguyên nhân khách quan:
- Chu i có tính ch t quán tính theo chu k
- Ví d : t ng s n ph m trong n
c theo giá th c t
t i VN
N m
2000
2001
2002
2003
2004
2005
2006
2007
GDP
75.863
84.852
96.403
113.326
137.087
190.561
190.561
228.795
• Nguyên nhân khách quan:
- Hi n t
ng m ng nh n:
- Ví d : dãy s cung v café n m nay ph
thu c vào giá n m tr
còn ng u nhiên n a.
c => ui không
• Nguyên nhân khách quan
- Dãy s có tính ch t tr : bi n ph thu c
th i k t b
th i k tr
nh h
ng b i bi n ph thu c
c
- Ví d : tiêu dùng
th i k
này ch ng
nh ng ph thu c vào thu nh p k này mà
còn ph thu c vào tiêu dùng c a k tr
n a.
c
Nguyên nhân ch quan
- Ch n d ng mô hình sai (th
ng x y ra
mô hình v i chi phí biên)
-
a thi u bi n gi i thích vào mô hình
- Vi c x lý s li u: (s li u tháng = s
li u quý/3)
Hi n t
ng t t
T t
ng quan
ng quan b c 1
Sai s ng u nhiên ut
t ng quan b c 1:
ut =
c g i là có t
1ut 1 + vt
1<0:
mô hình có t t
ng quan b c 1 âm
1>0:
mô hình có t t
ng quan b c 1 d
1=0:
mô hình không có t t
T t
ng
ng quan
ng quan b c p
ut =
1ut-1
+
2ut-2
+…+
put-p
+ vt
2. H
q
c at t
ng quan
N u v n áp d ng OLS khi mô hình có
hi n t
ng t t
ng quan thì s có các
h u qu sau:
- Các
c l
ng không ch ch nh ng
không còn là các
cl
ng hi u qu
2. H
- Ph
cl
q
c at t
ng sai c a các
ng quan
cl
ng là các
ng ch ch vì v y các ki m
nh
t và F không còn hi u qu .
- Có kh n ng
cl
ng quá cao R2
- Các d báo v Y không chính xác
10
3. Cách phát hi n t t ng quan
th
Chúng ta có th phát hi n hi n t ng t t ng quan
b ng cách quan sát th ph n d c a mô hình trên
d li u chu i th i gian.
et
t
ph n d phân b m t cách ng u nhiên xung quanh
giá tr trung bình c a nó.
Ki m
nh hi n t
ng t t
ng quan b c 1
Xét bi u di n c a sai s ng u nhiên
d i d ng:
ut =
1ut 1 + vt
Gi thuy t: H0:
1=0
H1:
1≠0
Ki m
nh hi n t
ng t t
ng quan b c 1
Kiểm định t
B
c 1: ch y h i g c, thu ph n d ei
B
c 2:
B
c 3: s d ng th ng kê t
cl
nh gi thuy t
ng et theo et-1
ki m
Ki m nh hi n t ng t t ng quan b c 1
Dùng kiểm định d c a Durbin – Watson
Th ng kê d c a Durbin Watson
c nh
ngh a nh sau:
(ei ei 1 ) 2
d=
2
ei
Khi n
l n thì
=
ei ei
2
i
e
1
d
2(1- )
trong ó:
do -1 ≤ ≤ 1, nên khi:
= -1 => d = 4: t t ng quan hoàn h o âm
= 0 => d = 2: không có t t ng quan
= 1 => d = 0: t t ng quan hoàn h o d ng
Gi thi t H0
Q
t nh
N
Không có t t ng quan
Bác b
0 < d < dL
d ng
Không có t t ng quan Không quy t
dL ≤ d ≤ dU
d ng
nh
Không có t t ng quan âm
Bác b
4-dL < d < 4
Không có t t ng quan âm Không quy t 4-dU ≤ d ≤ 4-dL
nh
Không có t t ng quan âm Không bác b
dU < d < 4-du
ho c d ng
Trong ó dU và dL là các giá tr tra b ng giá tr d.
0
Có t
t ng
Mi n
không
quan
d ng
k t lu n
Dl
Không
có t
t ng
quan
DU
4-DU
Mi n
không
Có t
t ng
k t lu n
quan âm
4-DL
4
N u d thu c vùng ch a quy t
s d ng quy t c ki m
1. H0:
= 0; H1:
nh, chúng ta s
nh c i biên nh sau:
> 0. N u d < dU thì bác b H0
và ch p nh n H1 (v i m c ý ngh a ), ngh a là có
t t
2. H0:
ng quan d
= 0; H1:
ng.
< 0. N u d > 4 - dU thì bác b
H0 và ch p nh n H1 (v i m c ý ngh a ), ngh a
là có t t
ng quan âm.
3. H0:
= 0; H1:
≠ 0. N u d <dU ho c d > 4
- dU thì bác b H0 và ch p nh n H1 (v i m c
ý ngh a 2 ), ngh a là có t t
ho c d
ng).
ng quan (âm
* Chú ý: trong th c t khi ti n hành ki m
Durbin Watson, ng
t c ki m
nh
i ta th
nh
ng áp d ng quy
n gi n sau:
N u 1 < d < 3 thì k t lu n mô hình không có t
t
ng quan.
N u 0 < d < 1 thì k t lu n mô hình có t t
quan d
ng.
N u 3 < d < 4 thì k t lu n mô hình có t t
quan âm.
ng
ng
Ví d :
Kh o sát m u s li u chu i th i gian sau ây
v m i liên h gi a m c tiêu th v i v i thu
nh p bình quân
Lan g 1923- 1939
u ng
i và giá bán t i Hà
GIA
LUONGVAI
NAM
THUNHAP
101
99.2
1923
96.7
100.1
99
1924
98.1
100
100
1925
100
90.6
111.6
1926
104.9
86.5
122.2
1927
104.9
89.7
117.6
1928
109.5
90.6
121.1
1929
110.8
82.8
136
1930
112.3
70.1
154.2
1931
109.3
65.4
153.6
1932
105.3
61.3
158.5
1933
101.7
62.5
140.6
1934
95.4
63.6
136.2
1935
96.4
52.6
168
1936
97.6
59.7
154.3
1937
102.4
59.5
149
1938
101.6
61.3
165.5
1939
103.8
21
Dependent Variable: LUONGVAI
Method: Least Squares
Sample: 1 17
Included observations: 17
Variable
Coefficient Std. Error t-Statistic
Prob.
C
130.7066 27.09429 4.824137
0.0003
GIA
-1.382985 0.083814 -16.50060
0.0000
THUNHAP
1.061710 0.266674 3.981302
0.0014
R-squared
0.951282 Mean dependent var 134.5059
Adjusted R-squared 0.944322
S.E. of regression
5.563356
Sum squared resid 433.3130
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn
-51.64705criter.
136.6831 Durbin-Watson stat
23.57733
6.429065
6.576103
Log likelihood
F-statistic
22
6.443681
2.018549
0
Có t
t ng
Mi n
không
quan
d ng
k t lu n
Dl
Không
có t
t ng
quan
DU
4-DU
Mi n
không
Có t
t ng
k t lu n
quan âm
4-DL
H0: Không có TTQ
H1: Có TTQ
D=2,018549
K=2, n=17,
dL=1,015, dU=1,536
4-dU=2,464
4-dL=2,985 -> Không có TTQ, MYN 5%
4
Phát hi n t t
ng quan b c b t k
ki m nh t t ng quan b c p:
ut = 1ut-1 + 2ut-2 + … + put-p + vt
Gi thuy t: H0:
H1:
1=
1
2
2=
+
2
…
2+
p=0
…+
p
2≠0
Kiểm định F
B
c 1: ch y h i g c, thu ph n d ei
B
c 2:
cl
+
+
et =
B
1
1et-1
ng h i quy ph
2et-2
+…+
c 3: th c hi n ki m
pet-p
nh F
+
t
Phát hi n t t
ng quan b c b t k
Dùng kiểm định Breusch – Godfrey (BG)
Xét mô hình:
Yt =
ut =
1
1ut-1
Ta c n ki m
H0:
1
=
+
2
2Xt
+
+ ut
2ut-2
+…+
put-p
+ vt
nh gi thi t
=…=
=0
(có ngh a là không t n t i t t
k b c nào trong s t b c 1
ng quan
n b c p)
b t
B
c 1:
B
c 2: Dùng OLS
et =
t
cl
1
+
ây ta thu
B
ng mô hình g c b ng OLS, tìm ph n d et
2Xt
1et-1
+
2et-2
+…+
pet-p
+
t
l n, (n-p)R2 có phân ph i x p x
- N u (n-p)R2 >
2
(p): Bác b H0, ngh a là có t t
2(p).
ng
m t b c nào ó.
- N u (n-p)R2 ≤
có t t
+
ng mô hình
c R2.
c 3: v i n
quan ít nh t
cl
ng quan.
2
(p): Ch p nh n H0, ngh a là không
N m
Tiêu dùng
Thu nh p Tiêu dùng
Thu nh p
2010
2011
2012
2013
2014
873.8
1494.9
1492
2416.2
899.8
1525.7 1538.7
2484.8
919.7
1551.1 1621.8
2608.5
923.9
1539.3 1689.6
2744
979.3
1629.1
1674
2729.3
1005.1
1665.2 1711.9
2695
1025.1
1708.7 1803.7
2826.7
1069
1799.4 1883.7
2958.7
1108.3
1873.3 1960.9
3115.2
1170.6
1973.3 2004.4
3192.3
1236.3
2087.6 2000.4
3187.2
1298.9
2208.4 2024.2
3248.7
1337.7
2271.3 2050.7
3166
Dependent Variable: CHITIEU
Method: Least Squares
Sample: 1 31
Included observations: 31
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-163.3511
22.11558
-7.386243
0.0000
THUNHAP
0.684817
0.008744
78.31767
0.0000
R-squared
0.995294
Mean dependent var
1511.765
Adjusted R-squared
0.995132
S.D. dependent var
448.7377
S.E. of regression
31.30900
Akaike info criterion
9.788029
Sum squared resid
28427.35
Schwarz criterion
9.880544
Hannan-Quinn criter.
9.818187
Durbin-Watson stat
0.684377
Log likelihood
-149.7145
F-statistic
6133.657
Prob(F-statistic)
0.000000
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
10.76282 Prob. F(2,27)
Obs*R-squared
13.75139 Prob. Chi-Square(2)
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Sample: 1 31
Included observations: 31
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
C
-0.717441
17.09781
-0.041961
THUNHAP
0.000508
0.006762
0.075075
RESID(-1)
0.790484
0.191934
4.118529
RESID(-2)
-0.200133
0.192545
-1.039408
R-squared
0.443593 Mean dependent var
Adjusted R-squared
0.381770 S.D. dependent var
S.E. of regression
24.20374 Akaike info criterion
Sum squared resid
15817.17 Schwarz criterion
Log likelihood
-140.6275 Hannan-Quinn criter.
F-statistic
7.175213 Durbin-Watson stat
0.0004
0.0010
Prob.
0.9668
0.9407
0.0003
0.3078
1.76E-14
30.78276
9.330806
9.515837
9.391121
1.882795
H0: Không có TTQ
H1: Có TTQ
(n-p)R^2=(31-2).0.4436=12.8644
X^2(0.05;2)=5.991
(n-p)R^2> X^2(0.05;2) -> Bác b H0
Có TTQ MYN 5%
4. Cách kh c ph c
bi t
TPB
Trong th c hành, ng i ta th ng gi s r ng Ut theo mô
hình t quy h i quy b c nh t, ngh a là:
Ut = Ut-1 + t
Trong ó | | < 1 và
pháp OLS
t
th a mãn các gi thi t c a ph
xét mô hình hai bi n:
Yt = 1 + 2Xt + Ut
(1)
N u (1) úng v i t thì c ng úng v i t-1 nên:
Yt-1 = 1 + 2Xt-1 + Ut-1 (2)
Nhân 2 v c a (2) v i ta
c:
Yt-1 = 1 + 2Xt-1 + Ut-1
(3)
ng
TPB
Tr (1) cho (3) ta đư c :
Yt - Yt-1 = 1(1- ) + 2(Xt - Xt-1) + (Ut - Ut-1)
= 1(1- ) + 2(Xt - Xt-1) + Vt
(4)
Khi đó (4) có th vi t lại dư i dạng:
Yt =
*
*
t
+
*
2
X + Vt
*
t
TPB
4. Cách kh c ph c
ch a bi t
U c lư ng
s d ng thống kê Durbin –
Watson
Chúng ta có th l y:
𝑑
𝜌=1−
2
4. Cách kh c ph c
ch a bi t
Phương pháp Dubin-Watson 2 bư c
cl
Ph
ng mô hình Yt =
+
2Xt
+ ut
ng trình sai phân d ng t ng quát
Yt - Yt-1 =
Yt =
1
1(1-
1(1-
)+
)+
2Xt
-
2(Xt
- Xt-1) + (Ut - Ut-1)
2Xt-1
+ Yt-1 + ut- ut-1
TPB
B
c 1: Coi ây là ph
ng trình h i quy b i, h i quy
Yt theo Xt, Xt-1 và Yt-1, và coi giá tr
i v i h s h i quy c a Yt-1(= ) là
M c dù là
cl
c 2: Sau khi có
và Yt * = Yt
Yt
theo các bi n ã
ng
cl
ng c a .
ng ch ch nh ng ta có
v ng c a .
B
cl
1
, hãy bi n
và
cl
c bi n
i
ng ph
i
trên.
cl
c
ng
X = Xt
*
t
ng trình ban
Xt
u
1
Tiêu dùng
Thu nh p
Tiêu dùng
Thu nh p
873.8
899.8
919.7
923.9
979.3
1005.1
1025.1
1069
1108.3
1170.6
1236.3
1298.9
1337.7
1405.8
1456.6
1494.9
1525.7
1551.1
1539.3
1629.1
1665.2
1708.7
1799.4
1873.3
1973.3
2087.6
2208.4
2271.3
2365.6
2423.3
1492
1538.7
1621.8
1689.6
1674
1711.9
1803.7
1883.7
1960.9
2004.4
2000.4
2024.2
2050.7
2145.9
2239.9
2416.2
2484.8
2608.5
2744
2729.3
2695
2826.7
2958.7
3115.2
3192.3
3187.2
3248.7
3166
3277.6
3492
TPB
TPB
Dependent Variable: CHITIEU
Method: Least Squares
Date: 05/02/13 Time: 09:58
Sample: 1 31
Included observations: 31
Variable
Coefficient
C
-163.3511
THUNHAP
0.684817
R-squared
0.995294
Adjusted R-squared
0.995132
S.E. of regression
31.30900
Sum squared resid
28427.35
Log likelihood
-149.7145
F-statistic
6133.657
Prob(F-statistic)
0.000000
Std. Error
t-Statistic
22.11558
-7.386243
0.008744
78.31767
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.0000
0.0000
1511.765
448.7377
9.788029
9.880544
9.818187
0.684377
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
10.76282 Prob. F(2,27)
Obs*R-squared
13.75139 Prob. Chi-Square(2)
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/02/13 Time: 10:00
Sample: 1 31
Included observations: 31
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
C
-0.717441
17.09781
-0.041961
THUNHAP
0.000508
0.006762
0.075075
RESID(-1)
0.790484
0.191934
4.118529
RESID(-2)
-0.200133
0.192545
-1.039408
R-squared
0.443593 Mean dependent var
Adjusted R-squared
0.381770 S.D. dependent var
S.E. of regression
24.20374 Akaike info criterion
Sum squared resid
15817.17 Schwarz criterion
Log likelihood
-140.6275 Hannan-Quinn criter.
F-statistic
7.175213 Durbin-Watson stat
TPB
0.0004
0.0010
Prob.
0.9668
0.9407
0.0003
0.3078
1.76E-14
30.78276
9.330806
9.515837
9.391121
1.882795
TPB
Dependent Variable: CHITIEU
Method: Least Squares
Date: 05/02/13 Time: 10:21
Sample (adjusted): 2 31
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
C
THUNHAP
THUNHAP(-1)
CHITIEU(-1)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
-3.317524
0.370112
-0.340921
0.969955
0.998730
0.998583
16.57074
7139.321
-124.6508
6814.130
0.000000
t-Statistic
22.56438
-0.147025
0.055134
6.712942
0.071267
-4.783732
0.113569
8.540690
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.8842
0.0000
0.0001
0.0000
1533.030
440.2351
8.576719
8.763546
8.636487
1.759361
TPB
Dependent Variable: CHITIEU-RO*CHITIEU(-1)
Method: Least Squares
Date: 05/02/13 Time: 10:33
Sample (adjusted): 2 31
Included observations: 30 after adjustments
Variable
Coefficient Std. Error t-Statistic
C
31.26391
8.195994
3.814536
THUNHAPRO*THUNHAP(-1)
0.433300
0.052322
8.281434
R-squared
0.710091 Mean dependent var
Adjusted R-squared
0.699737 S.D. dependent var
S.E. of regression
19.23532 Akaike info criterion
Sum squared resid
10359.94 Schwarz criterion
Log likelihood
-130.2357 Hannan-Quinn criter.
F-statistic
68.58215 Durbin-Watson stat
Prob(F-statistic)
0.000000
Prob.
0.0007
0.0000
92.59186
35.10338
8.815714
8.909127
8.845598
1.395009
4. Cách kh c ph c
ch a bi t
Ư c lư ng
ph
s d ng mô hình h i quy
•B
c 1: h i quy g c, thu ph n d
•B
c 2: H i quy ph : Ut = Ut-1 + t.Thu
c c l ng c a h s
• B c 3: c l ng mô hình v i bi n m i
Yt - Yt-1 = 1(1- ) + 2(Xt - Xt-1) + (Ut - Ut-1)
4. Cách kh c ph c
Phương pháp lấy sai phân
• L y sai phân 2 v c a hình Yt =
2Xt + ut
1
+
S d ng sai phân hiệu chỉnh c a
Newey và West
H
ng d n stata
Nh n d ng s li u theo th i gian: tsset
Ki m nh Durbin-Watson: Sau khi c
l ng h i quy, tính giá tr d, câu l nh: estat
dwatson; estat durbinalt (p-value)
Ki m nh Breusch-Godfrey: estat
bgodfrey
Ki m nh t t ng quan t b c 1 n 4:
estat bgodfrey, lags(1/4)
Ki m nh t t ng quan t b c 1 và b c 4:
estat bgodfrey, lags(1 4)
H
ng d n stata
X lý T T ng quan
Kh c ph c t t ng quan b ng GLS
prais BPt BDL , options
D a trên h s ro c l ng qua Ph ng pháp
OLS: prais BPT B L, rhotype(regress)
D a trên h s ro c l ng t t ng quan c a
ph n d : prais BPT B L, rhotype(tscorr)
D a trên h s ro tính toán qua th ng kê DurbinWatson: prais BPT B L, rhotype(dw)
Ma tr n c l ng hi p Ph ng sai Newey
West: newey BPT B L, lag( )
reg BPT B L,vce(robust)
Ph l c
T
T
NG QUAN
B ng ki m
nh d c a Durbin Watson
B ng ki m
nh Bre sch - Goldfrey
B cc at t
ng quan
c k t qu ki m
nh c a BG test
Kh c ph c t t
ng q an
T o m t bi n ro = h s t t
Nh n vào nút Genr
ng quan
Nh p giá tr c a bi n ro c n t o
H i quy l i , vào Quick\Estimate Equation
Ph
ng trình h i quy m i d ng sai phân
K t qu h i quy m i
Chương 7
CH N MÔ HÌNH VÀ KI M Đ NH
VI C CH N MÔ HÌNH
TBP
1. Các thu c tính c a m t mô hình t t
- Đơn giản
- Tính đồng nhất
- Tính thích h p (R2)
- Tính bền v ng về mặt lý thuyết
- Khả năng d báo cao
2. Cách chọn l a mô hình tốt
B ớc 1: Xác định số biến độc lập có trong mô
hình
- T đơn giản đến tổng quát
- T tổng quát đến đơn giản
B ớc 2: Kiểm tra các tr ờng hợp khuyết tật c a
mô hình do vi phạm các giả thiết OLS
- Kiểm tra các vấn đề: đa cộng tuyến, phương
sai thay đổi, t tương quan
- Khắc phục các trường hợp vi phạm
B ớc 3: Chọn dạng hàm
- D a vào cơ sở lý thuyết kinh tế
- D a vào kết quả th c nghiệm, so sánh các
dạng hàm khác nhau
TBP
B ớc 4: Các tiêu chuẩn thông d ng để
chọn mô hình
TBP
- R2 hoặc R2 hiệu chỉnh
- Giá trị c a hàm hợp lý log-likelihood (L)
L=
n
ln
2
2
n
ln(2
2
)
1
2
U i2
Th c tế log-likelihood (L) đ ợc ớc l ợng:
L=
n
RSS
1 + ln(2 ) + ln(
)
2
n
- Tiêu chuẩn AIC (Akaike info criterion)
RSS 2 k n
AIC = (
)e
n
AIC =
2 L 2k
+
n
n
- Tiêu chuẩn SIC (Schwarz information
2 L k ln(n)
Criterion) SIC = ( RSS )n
SIC =
+
k
n
n
n
n
TBP
3. Các sai lầm khi ch n mô hình
3.1. Bỏ sót biến thích hợp
Giả s mô hình đúng là:
Yi =
1
+
2
X 2i +
3
X 3i + U i
(a)
Nhưng ta lại chọn mô hình:
Yi =
1 +
2 X 2i + U i
(b)
TBP
Dependent Variable: INPUT
Method: Least Squares
Date: 05/07/13 Time: 10:12
Sample: 1 10
Included observations: 10
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
166.4667
19.02142
8.751537
0.0000
OUTPUT
19.93333
3.065580
6.502305
0.0002
R-squared
0.840891
Mean dependent var
276.1000
Adjusted R-squared
0.821002
S.D. dependent var
65.81363
S.E. of regression
27.84451
Akaike info criterion
9.668005
Sum squared resid
6202.533
Schwarz criterion
9.728522
Hannan-Quinn criter.
9.601618
Durbin-Watson stat
0.715725
Log likelihood
-46.34003
F-statistic
42.27997
Prob(F-statistic)
0.000188
Dependent Variable: INPUT
Method: Least Squares
Date: 05/07/13 Time: 10:10
Sample: 1 10
Included observations: 10
Variable
Coefficient
C
222.3833
OUTPUT
-8.025000
OUTPUT^2
2.541667
R-squared
0.928389
Adjusted R-squared
0.907928
S.E. of regression
19.97004
Sum squared resid
2791.617
Log likelihood
-42.34834
F-statistic
45.37496
Prob(F-statistic)
0.000098
TBP
Std. Error
t-Statistic
23.48780
9.468037
9.809494
-0.818085
0.869084
2.924534
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.0000
0.4403
0.0222
276.1000
65.81363
9.069668
9.160444
8.970088
1.038487
Dependent Variable: INPUT
Method: Least Squares
Date: 05/07/13 Time: 10:07
Sample: 1 10
Included observations: 10
Variable
Coefficient
C
141.7667
OUTPUT
63.47766
OUTPUT^2
-12.96154
OUTPUT^3
0.939588
R-squared
0.998339
Adjusted R-squared
0.997509
S.E. of regression
3.284911
Sum squared resid
64.74382
Log likelihood
-23.52865
F-statistic
1202.220
Prob(F-statistic)
0.000000
TBP
Std. Error
t-Statistic
6.375322
22.23678
4.778607
13.28372
0.985665
-13.15005
0.059106
15.89677
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.0000
0.0000
0.0000
0.0000
276.1000
65.81363
5.505730
5.626764
5.372956
2.700212
TBP
Hậu quả bỏ sót biến thích hợp
- Các ước lư ng thu đư c là ước lư ng chệch
c a các tham số trong mô hình đúng.
- Các ước lư ng thu đư c không phải là ước
lư ng v ng.
- Phương sai c a các ước lư ng trong mô hình
sai (b) > trong mô hình đúng (a).
- Khoảng tin cậy rộng, các kiểm định không
còn tin cậy n a
TBP
3.2. Đưa vào mô hình những biến không
phù hợp
Giả s mô hình đúng là:
Yi =
1 +
2 X 2i + U i
(a)
Nhưng ta lại chọn mô hình có thêm X3:
Yi =
1 +
2 X 2i +
3 X 3i + U i
(b)
Hậu quả đưa vào mô hình những biến
không phù hợp
- Các ước lư ng thu đư c t mô hình (b) là
không hiệu quả vì:
- Phương sai c a các ước lư ng trong mô hình
(b) > trong mô hình (a).
- Khoảng tin cậy rộng, các kiểm định không
còn tin cậy n a
TBP
TBP
3.3. Lựa chọn mô hình không chính xác
- Ước lư ng chệch các hệ số hồi quy, thậm chí có
thể dẫn đến dấu c a các hệ số hồi quy có thể sai.
- Có thể có rất ít hệ số hồi quy có ý nghĩa thống kê.
- R2 biểu hiện cho m c độ phù h p c a mô hình hồi
quy có thể không cao.
- Phần dư c a các quan sát có thể lớn xét về giá trị
tuyệt đối và biểu thị s biến thiên có tính chất hệ
thống
TBP
4. Phát hi n nh ng sai lầm
4.1. Kiểm định biến bị bỏ sót (có số liệu)
Xét mô hình:
Yi =
1
+
2X2i
+
3X3i +
4X4i +
Tiến hành kiểm định giả thiết H0:
ui
4
= 0.
Cách 1: Dùng ki m đ nh t hoặc p-value, kết
h p v i h s 𝑹𝟐
TBP
4. Phát hi n nh ng sai lầm
4.1. Kiểm định biến bị bỏ sót (có số liệu)
Xét mô hình:
Yi =
1
+
2X2i
+
3X3i +
4X4i +
Tiến hành kiểm định giả thiết H0:
ui
4
Cách 2: dùng ki m đ nh Wald.
= 0.
TBP
Ki m đ nh Wald.
Xét các mô hình:
(U) Yi =
+
kXki
1
+
2X2i
+ …+
mXmi +
1
+
2X2i
+ …+
mXmi +
m+1X(m+1)i
+…
+ ui
(R) Yi =
vi
(U) là MH không giới hạn và (R) là mô hình giới hạn.
Kiểm định giả thiết H0:
m+1
=…=
k
=0
TBP
Bước 1: Ước lư ng (U) và (R), t đó tính đư c
RSSU và RSSR thay vào công th c:
( RSS R RSSU ) (k
FC =
RSSU (n k )
m)
𝑅 − 𝑅
𝐹 =
1−𝑅
𝑅
𝑘−𝑚
𝑛−𝑘
Bước 2: Với m c ý nghĩa , tìm F (k-m,n-k)
Bước 3: Nếu FC > F (k-m,n-k): Bác bỏ H0, t c
là (U) không th a biến;
® thiếu biến
TBP
4.2 Ki m đ nh vi c b sót biến (không có s li u)
Để kiểm định các biến bỏ sót, ta dùng kiểm định
Reset c a Ramsey, gồm các bước:
Bước 1: Dùng OLS để ước lư ng mô hình
Yi = 1 + 2X2i + ui
T đó ta tính ˆ và R2old
Yi
Bước 2: dùng OLS để ước lư ng mô hình
2
ˆ
Yi = 1 + 2 X 2i + 3Y +
Tính R2new
Kiểm định giả thiết H0:
3
=
4
3
ˆ
4Y + ... + vi
=… =
k
=0
TBP
2
new
2
new
(
R
Bước 3: Tính F =
(1 R
2
old
R ) m
) (n k )
n: số quan sát, k: số tham số trong mô hình mới; m:
số biến đưa thêm vào.
Bước 4: Nếu F > F (m,n-k): Bác bỏ H0, t c các hệ
số 3, 4,… k không đồng th i bằng 0, mô hình cũ
đã bỏ sót biến.
4.2. Kiểm định th a biến
Kiểm định t & 𝑹𝟐
Kiểm định Wald
TBP
Download