Uploaded by Vhuy8961

Bài giảng PP Định Lượng TCNH

advertisement
PHƯƠNG PHÁP ĐỊNH LƯỢNG
TRONG TÀI CHÍNH NGÂN HÀNG
FIN 139
Ngành: Tài chính Ngân hàng
Khoa: Tài chính – Thương mại
L/O/G/O
http://dichvudanhvanban.com
http://dichvudanhvanban.com
www.hutech.edu.vn
THÔNG TIN GIẢNG VIÊN
Họ và tên: TS. LÊ ĐỨC THẮNG
Email: ld.thang@hutech.edu.vn
Địa chỉ: 475A Điện Biên Phủ - P25 –
Quận Bình Thạnh – TP.HCM
Mobil: 0936128833
http://dichvudanhvanban.com
www.hutech.edu.vn
PHƯƠNG PHÁP ĐÁNH GIÁ
 Quá trình học và kiểm tra giữa kỳ: 50%
- Bài kiểm tra số 1
- Bài kiểm tra số 2
- Điểm danh chuyên cần
 Thi hết học phần: 50%, hình thức thi: tự luận, thời lượng
thi: 90 phút. Sinh viên không được tham khảo tài liệu
(Lưu ý: Điểm thi cuối kỳ phải lớn hơn 1 mới đạt yêu cầu)
http://dichvudanhvanban.com
www.hutech.edu.vn
MỤC TIÊU HỌC PHẦN
- Kiến thức: Phân tích và ứng dụng được những kiến thức cơ bản về kỹ
thuật hồi quy tuyến tính với phương pháp bình phương nhỏ nhất OLS
(Ordinary Least Squared) cùng các kiểm định liên quan. Giúp người học
tham khảo và vận dụng trong công tác phân tích định lượng trong lĩnh vực
kinh tế, tài chính ngân hàng.
- Kỹ năng: Tổ chức và vận dụng kiến thức để đánh giá và phân tích định
lượng vấn đề kinh tế và đưa ra khuyến nghị về đầu tư kinh doanh cho doanh
nghiệp.
- Năng lực tự chủ và trách nhiệm: Có ý thức tự giác trong việc chuẩn bị
bài học cho riêng mình. Có trách nhiệm trong việc phối hợp cùng giảng viên
và sinh viên trong lớp để hoàn thành bài học với hiệu quả cao nhất.
http://dichvudanhvanban.com
www.hutech.edu.vn
MÔ TẢ HỌC PHẦN
Phương pháp định lượng trong Tài chính Ngân hàng là học
phần thuộc khối kiến thức chuyên ngành trong chương trình khung
đào tạo ngành Tài chính ngân hàng, cung cấp cho sinh viên những
kiến thức chuyên sâu về dữ liệu tài chính, các kỹ thuật và phương
pháp định lượng ứng dụng trong lĩnh vực tài chính – ngân hàng.
Giúp sinh viên có được những kiến thức nền tảng về định lượng
trong lĩnh vực tài chính – ngân hàng. Bên cạnh đó, môn học này
còn góp phần giúp sinh viên phát triển khả năng tư duy, giải quyết
vấn đề và giúp cho sinh viên có khả năng tính toán, đo lường được
rủi ro trong đầu tư trên thị trường tài chính.
http://dichvudanhvanban.com
www.hutech.edu.vn
CONTENT-Nội dung học phần
1 CẤU TRÚC DỮ LIỆU TCNH – Data structure
2 HỒI QUY TUYẾN TÍNH – Linear Regression
3 ỨNG DỤNG KỸ THUẬT HỒI QUY TUYẾN TÍNH
4 MÔ HÌNH ĐỊNH GIÁ TÀI SẢN VỐN - CAPM
5 TÍNH KHÔNG CHÊNH LỆCH CỦA OLS
http://dichvudanhvanban.com
www.hutech.edu.vn
-
Phương pháp định lượng trong tài chính ngân hàng,
HUTECH, 2019.
-
Đinh Phi Hổ, Võ Văn Nhị & Trần Phước, (2018). Nghiên cứu
định lượng trong kế toán – kiểm toán.
-
Đinh Phi Hổ (2012), Phương pháp nghiên cứu định lượng &
những nghiên cứu thực tiễn trong phát triển kinh tế - Nông
nghiệp, Nxb. Phương Đông.
-
Nguyễn Quang Dong & Nguyễn Thị Minh, (2013). Giáo trình
Kinh tế lượng. NXB Đại học Kinh tế Quốc Dân.
-
Nguyễn Văn Tùng (2014). Thực hành kinh tế lượng cơ bản
với Eviews. NXB Kinh tế TP. HCM.
-
Nguyễn Đình Thọ (2013). Phương pháp nghiên cứu khoa
học trong kinh doanh. NBX Tài Chính.
http://dichvudanhvanban.com
BÀI 1 – CẤU TRÚC DỮ LIỆU
Quantitative analysis & data structure in BF
Mục tiêu:
• Xác định các dạng dữ liệu trong tài chính –
ngân hàng
• Sắp xếp dữ liệu và đưa dữ liệu thực tế về
đúng định dạng để phân tích
• Phân biệt ưu điểm của từng loại dữ liệu
http://dichvudanhvanban.com
www.hutech.edu.vn
1.1 PHÂN LOẠI
Tính chất
Loại biến
1. ĐẶC ĐIỂM 1.1 Định tính
Ý nghĩa
Sử dụng cho biến định tính (giới tính,
trình độ học vấn, nghề nghiệp)
1.2 Định lượng Sử dụng cho biến định lượng thông qua
quá trình cân đo đong đếm (tuổi, vv.)
2. NGUỒN
GỐC
2.1 DL sơ cấp
Do bản thân người NC thu thập chưa
qua xử lý (DL được DN công bố do
chính DN/nhà NC thu thập)
2.2 DL thứ cấp Được tổng hợp từ các nguồn DL sơ cấp
hoặc DL đã có sẵn
3. HÌNH
THỨC
TRÌNH
BÀY
http://dichvudanhvanban.com
3.1. DL chéo
3.2. DL chuỗi thời gian
3.3. DL bảng
Phân loại dữ liệu
Đặc điểm
dữ liệu
Dữ liệu định tính sử dụng cho biến
định tính thể hiện tính chất của
đơn vị hoặc phần tử khảo sát.
Ví dụ: giới tính, trình độ học vấn,
nghề nghiệp.
Dữ liệu định lượng sử dụng cho biến định
lượng thể hiện bằng con số cụ thể thông
qua quá trình cân đo đong đếm.
Ví dụ: trọng lượng hay tuổi.
http://dichvudanhvanban.com
Phân loại dữ liệu
Nguồn
gốc dữ
liệu
http://dichvudanhvanban.com
Dữ liệu sơ cấp là dữ liệu do bản
thân người nghiên cứu thu thập
chưa qua xử lý hoặc đã xử lý
nhưng vẫn ở trạng thái gốc của
dữ liệu.
Dữ liệu thứ cấp là dữ liệu được tổng hợp
từ các nguồn dữ liệu sơ cấp hoặc dữ liệu
đã sẵn có.
PHÂN LOẠI
Định lượng
DỮ LIỆU CHÉO
Biến phụ thuộc
Biến độc lập
Định lượng
DL CHUỖI THỜI GIAN
Dữ liệu bảng
DỮ LIỆU BẢNG
Định tính
Biến phụ thuộc
Biến độc lập
http://dichvudanhvanban.com
Định tính
Biến độc lập
Biến phụ thuộc
Định lượng
Định tính
www.hutech.edu.vn
a. DỮ LIỆU CHÉO (cross-sectional data)
Thể hiện thông tin về nhiều đối tượng vào
một thời điểm nhất định nên rất phù hợp với
đề tài nghiên cứu khảo sát
Loại dữ liệu này cho chúng ta thấy rõ sự khác
biệt giữa các chủ thể nghiên cứu
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 1.1 Thống kê giá trị SX CN&TM các
TP lớn năm 2019 (dữ liệu chéo)
Thành phố
Giá trị sản xuất
thương mại
Giá trị sản xuất
công nghiệp
Hà Nội
1244
2345
Hồ Chí Minh
1242
2436
Đà Nẵng
1222
3454
Hải Phòng
1111
2333
Công Thành & Đức Thắng (2019)
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 1.2 Số liệu DN niêm yết trên sàn
GDCKVN năm 2019 (dữ liệu chéo)
Số TT
Mã CK
1
AAA
1000
10
1000
2
BBB
1100
20
2000
3
CCC
2100
30
1400
http://dichvudanhvanban.com
Doanh thu Lợi nhuận
www.hutech.edu.vn
Quy mô
DỮ LIỆU CHÉO
Ưu điểm
Phù hợp vấn đề nghiên
cứu quy mô lớn
DỮ LIỆU
Liên quan đến cá
nhân, doanh nghiệp,
tỉnh thành, quốc gia
CHÉO
Có thể thực hiện
nhanh chóng, ít tốn
kém
http://dichvudanhvanban.com
www.hutech.edu.vn
DỮ LIỆU CHÉO
Khuyết điểm
Thiếu phân tích chi tiết
như DL chuỗi thời gian
DỮ LIỆU
CHÉO
http://dichvudanhvanban.com
Không so sánh quá
khứ với tương lai nên
thường giảm hiệu lực
của kết quả nghiên
cứu
www.hutech.edu.vn
1.3 DỮ LIỆU CHUỖI THỜI GIAN
(times series data)
Là chuỗi các điểm dữ liệu bao gồm các phép đo
liên tiếp được thực hiện từ cùng 1 nguồn trong một
khoảng thời gian nhất định, 1 chủ thể nhất định;
Mục đích để nhận dạng và tập hợp các yếu tố,
những biến đổi theo thời gian mà có ảnh hưởng
đến giá trị của biến quan sát;
Là thông tin của một hay nhiều biến được thu thập
ở các thời điểm khác nhau (năm, quý, tháng, tuần,
ngày, giờ, phút giây)
Có 2 loại time series data (regular time serie & event)
• Chuỗi thời gian thông thường -> số liệu
• Chuỗi thời gian bất thường -> sự kiện
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 1.3 Dữ liệu CPI & lãi suất Việt Nam
theo tháng trong năm 2019
Tháng
http://dichvudanhvanban.com
1
CPI
(index)
111.0
Lãi suất
(%)
6.5
2
113.4
7.2
3
113.1
7.0
4
113.7
7.5
5
114.5
8
www.hutech.edu.vn
Bảng 1.4 Thống kê số liệu vĩ mô của
Newzealand từ năm 2017-2019
Năm
Quốc gia
GDP
Lạm phát
Dân số
2017
Newzealand
100
0.1
1000
2018
Newzealand
110
0.2
2000
2019
Newzealand
120
0.3
3000
http://dichvudanhvanban.com
www.hutech.edu.vn
DỮ LIỆU CHUỖI THỜI GIAN
(times series data)
Ưu điểm
DỮ LIỆU
CHUỖI THỜI
GIAN
http://dichvudanhvanban.com
Tùy đối tượng nghiên
cứu (quốc gia, thành
phố, doanh nghiệp, cá
nhân)
Có thể xác định được số
liệu thống kê thu thập từ
cơ quan, bộ phận, hay
cá nhân
www.hutech.edu.vn
ỨNG DỤNG DỮ LIỆU CHUỖI THỜI GIAN
Time series data có tính khả dụng cao trong lưu trữ dữ liệu, truy
vấn liên tục, tổng hợp thời gian trong các ứng dụng sau:
• Theo dõi hoạt động kinh doanh (e-commerce)
• Hệ thống giao dịch tài chính (chứng khoán, tiền điện tử)
• Công cụ kinh doanh thông minh (theo dõi các số liệu
quan trọng và sức khỏe của doanh nghiệp)
• Giám sát dịch vụ ngân hàng, vv
• Theo dõi phần mềm chấm công, vv
http://dichvudanhvanban.com
www.hutech.edu.vn
c.DỮ LIỆU BẢNG (panel data)
Là kết hợp của dữ liệu chéo và chuỗi thời gian; thí dụ
DL chéo 3 nước VN, TL, MA trong chuỗi thời gian 4
năm (2017-20) vậy bảng có 3 x 4 = 12 dòng quan sát
Vậy dự liệu bảng có qui mô về thời gian lẫn không
gian; có liên quan đến doanh nghiệp, tỉnh thành,
quốc gia -> kỹ thuật ước lượng
Khi NC quan sát lập đi lập lại của các đơn vị chéo,
DLB phù hợp với các NCKH sự động thái thay đổi
theo thời gian của các đơn vị chéo này
Có thể phát hiện và đo lường tốt hơn các tác động
mà NCV không thể quan sát được trong DL chuỗi
thời gian hay DL chéo
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 1.5 tổng hợp GDP- dân số 2016-2019
STT
Năm
Quốc gia
GDP
Dân số
1
2016
Vietnam
70
90
2
2017
Vietnam
80
92
3
2018
Vietnam
76
93
4
2019
Vietnam
75
95
5
2016
Thailand
91
170
6
2017
Thailand
85
175
7
2018
Thailand
90
180
8
2019
Thailand
95
185
9
2016
Malaysia
85
200
10
2017
Malaysia
87
208
11
2018
Malaysia
82
215
12
2019
Malaysia
88
250
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 1.6 Thống kê số liệu DN niêm yết
trên sàn GDCK từ năm 2017-2019
Mã CK
Năm
Doanh thu
AAA
2017
1000
300
500
AAA
2018
1500
500
700
AAA
2019
2100
600
1000
BBB
2017
1800
200
1000
BBB
2018
2500
700
1500
BBB
2019
1900
-600
1000
http://dichvudanhvanban.com
www.hutech.edu.vn
Lợi nhuận Quy mô
Kỹ thuật ước lượng dữ liệu bảng
Ưu điểm
Kết hợp
DL CHUỖI
THỜI GIAN &
DL CHÉO
http://dichvudanhvanban.com
Xem xét tính dị biệt
(không đồng nhất) qua
đánh giá các biến số theo
đặc thù của từng cá nhân
Có thể kết hợp DLCTG ->
nhiều thông tin đa dạng
hơn, ít có hiện tượng đa
cộng tuyến giữa các biến
số, nhiều bậc tự do và
hiệu quả hơn
www.hutech.edu.vn
BÀI TẬP
Hãy nêu rõ mỗi biến sau đây là định tính hay định
lượng và cho biết thang đo của từng biến
a. Doanh số hàng năm
b. Lợi nhuận trên cổ phần
c. Phương thức thanh toán tiền mặt
d. Tuổi của bạn
e. Bạn là nam hay nữ
f. Bạn học ngành này được bao lâu rồi?
http://dichvudanhvanban.com
www.hutech.edu.vn
CÂU HỎI ÔN TẬP – BÀI 1
1. Thế nào là dữ liệu định tính và dữ liệu định lượng?
Phân biệt hai loại dữ liệu trên? Nêu ví dụ.
2. Thế nào là dữ liệu sơ cấp và thứ cấp? Phân loại hai
loại dữ liệu trên? Nêu ví dụ.
3. Định nghĩa dữ liệu chéo? Ưu điểm của dữ liệu
chéo? Cho ví dụ minh họa.
4. Định nghĩa dữ liệu chuỗi thời gian? Ưu điểm của
dữ liệu chuỗi thời gian? Cho ví dụ minh họa.
5. Định nghĩa dữ liệu bảng? Ưu điểm của dữ liệu
bảng? Cho ví dụ minh họa.
http://dichvudanhvanban.com
www.hutech.edu.vn
PHẦN THỰC HÀNH
1. Thảo luận nhóm để đưa ra các đề tài có liên quan đến
chủ đề lớp “LÀM THẾ NÀO ĐỂ PHÁT TRIỂN
NGÀNH TÀI CHÍNH NGÂN HÀNG’
2. Chọn chủ đề nhóm, Xác định phương pháp thu thập
dữ liệu và loại dữ liệu cần thu thập, lên kế hoạch thu
thập dữ liệu;
3. Xây dựng mô hình nghiên cứu định lượng;
4. Thiết kế bảng câu hỏi;
5. Hoàn chỉnh bảng câu hỏi;
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁCH CHỌN CHỦ ĐỀ NHÓM
1. Chủ đề lớp “LÀM THẾ NÀO ĐỂ PHÁT TRIỂN
NGÀNH TÀI CHÍNH NGÂN HÀNG’
2. Mỗi nhóm viên đưa ra 1+ vấn đề có liên quan đến
chủ đề lớp
3. Sau đó chọn ra 1 chủ đề nhóm có thể thu thập dữ liệu
tốt nhất và thích làm nhất,
4. Xác định phương pháp thu thập dữ liệu và loại dữ
liệu cần thu thập, lên kế hoạch thu thập dữ liệu;
5. Thiết kế bảng câu hỏi;
http://dichvudanhvanban.com
www.hutech.edu.vn
LÀM THẾ NÀO ĐỂ PHÁT TRIỂN NGÀNH TCNH
1. Nghiên cứu & khảo sát nhu cầu ít sử dụng dịch vụ “TÍN
DỤNG” của (100) sinh viên Hutech
2. Sự không hài lòng của khách hàng trong lãi suất tiền gửi
của Vietinbank
3. Ngân hàng VCM chưa đẩy mạnh dịch vụ thanh toán
không dùng tiền mặt
4. Khách hàng của khối NHTPCP tại TPHCM chưa được
khuyến khích sử dụng ibanking một cách rộng rãi
5. Sự hài lòng về việc phục vụ của khách hàng đối với nhân
viên giao dịch của Techcombank
http://dichvudanhvanban.com
www.hutech.edu.vn
PHƯƠNG PHÁP THU THẬP DỮ LIỆU
Có 2 phương pháp thu thập dữ liệu:
• phương pháp bàn giấy và
• phương pháp hiện trường
1. Các dữ liệu sơ cấp, thứ cấp có sẵn mà người NC tiếp
cận gián tiếp với đối tượng cần NC để thu thập qua
web, email, điện thoại, máy ghi hình nối mạng, vv.
2. Phương pháp hiện trường bao gồm nhiều hình thức
khác nhau để thu thập dữ liệu sơ cấp. Đó là các
phương pháp:
http://dichvudanhvanban.com
www.hutech.edu.vn
PHƯƠNG PHÁP THU THẬP DỮ LIỆU
• Phương pháp quan sát
• Phương pháp phỏng vấn
•
•
•
•
•
Phỏng vấn trực tiếp cá nhân (personal interview)
Phỏng vấn tại nơi công cộng (public interview)
Phỏng vấn nhóm tập trung (focus-group-interview)
Phỏng vấn qua điện thoại (telephone interview)
Phỏng vấn qua thư (mailing interview-questionnaire)
• Phương pháp thực nghiệm
• Khám phá mối liên hệ nhân quả giữa 2 đại lượng
• Kiểm chứng một giả thiết nào đó
• Thử nghiệp sản phẩm mới
• Thử nghiệm các chiến lược marketing
http://dichvudanhvanban.com
www.hutech.edu.vn
HƯỚNG DẪN KHẢO SÁT
Phỏng vấn trực tiếp
Điều tra bảng hỏi
http://dichvudanhvanban.com
Phương
pháp
khảo sát
www.hutech.edu.vn
Quan sát
THIẾT KẾ BẢNG CÂU HỎI
• Questionaire là một tập
hợp câu hỏi được thiết kế
để khai thác thông tin, sẽ
được cung cấp bởi các đối
tượng tham gia khảo sát.
• Bảng hỏi có thể được thu
thập qua phỏng vấn trực
tiếp hay qua bảng hỏi dạng
viết
• Là công cụ nghiên cứu,
điều tra phổ biến nhất
http://dichvudanhvanban.com
www.hutech.edu.vn
TIÊU CHÍ BẢNG CÂU HỎI TỐT
• Ngôn ngữ rõ ràng (phù hợp với khả năng, trình độ
của người tham gia khảo sát)
• Sự đơn nhất trong mục tiêu (mỗi câu hỏi NÊN có
một câu trả lời)
• Tập hợp các câu hỏi phải đáp ứng được mục tiêu của
cuộc điều tra
• Đúng câu chữ, ngữ pháp, cấu trúc
http://dichvudanhvanban.com
www.hutech.edu.vn
LOẠI CÂU HỎI ĐÓNG
• Câu hỏi thang đo xếp hạng : Câu hỏi yêu cầu người trả
lời lựa chọn mức độ của một thuộc tính nhất định.
• Thang đo phổ biến nhất là thang Likert (1-5 hoặc 1-7)
• VD: Bạn đánh giá mức độ hài lòng sau khi sử dụng dịch
vụ của chúng tôi như thế nào?
1
2
3
Hoàn toàn
không hài
lòng
http://dichvudanhvanban.com
4
5
Hoàn toàn
hài lòng
www.hutech.edu.vn
CÔNG CỤ XÂY DỰNG BẢNG HỎI
http://dichvudanhvanban.com
www.hutech.edu.vn
MẪU KHÔNG CÓ TIÊU ĐỀ
Tên bài khảo sát
Câu hỏi mở - câu trả
lời yêu cầu diễn giải
nhiều hơn
Mô tả, giới thiệu
ngắn gọn người
khảo sát, và mục
đích của cuộc
khảo sát
Câu hỏi một lựa chọn
Đặt câu hỏi
Tạo lưới để
người trả lời
chọn đáp án
Lựa chọn câu trả
lời phù hợp
http://dichvudanhvanban.com
Câu hỏi mở - yêu cầu
trả lời ngắn với những
cụm từ, keywords
www.hutech.edu.vn
Câu hỏi nhiều lựa
chọn, có thể thêm câu
trả lời khác
Có thể chọn 1 hay
nhiều lựa chọn, dựa
trên câu trả lời, có thể
di chuyển đến các
section khác của biểu
mẫu
Có thể chọn câu trả lời
theo thang đo (0-10)
Có thể đặt tiêu đề cho
mỗi mức đo
THỐNG KÊ TRONG KINH TẾ
Là hệ thống các phương pháp dùng để
• Thu thập, xử lý và phân tích các con số (mặt lượng)
của hiện tượng kinh tế – xã hội, tài chính-ngân hàng
• Để tìm hiểu bản chất và tính quy luật của số liệu
(mặt chất) trong điều kiện thời gian và không gian
cụ thể
Ngô Thị Thuận (2006)
http://dichvudanhvanban.com
www.hutech.edu.vn
THỐNG KÊ MÔ TẢ & SUY DIỄN
Có 2 loại thống kê: MÔ TẢ VÀ SUY DIỄN
• Thống kê mô tả là việc thu thập, sắp xếp dữ liệu và
tính toán số liệu một cách khoa học nhằm mô tả đặc
trưng của đối tượng nghiên cứu qua bảng biểu, đồ
thị
• Thống kê suy diễn là việc dùng những phương pháp
luận để phân tích, đưa ra nhận xét, đánh giá sâu sắc
về đối tượng nghiên cứu.
http://dichvudanhvanban.com
www.hutech.edu.vn
THỐNG KÊ MÔ TẢ
Độ tuổi của đối tượng khảo sát
Tuổi
Tần số (người)
Tần suất (%)
Từ 18 đến 20 tuổi
71
14.2
Từ 21 đến 30 tuổi
145
29
Từ 31 đến 40 tuổi
99
19.8
Từ 41 đến 50 tuổi
43
8.6
Từ 51 đến 60 tuổi
103
20.6
Trên 60 tuổi
39
7.8
Tổng
500
100
http://dichvudanhvanban.com
www.hutech.edu.vn
ĐỒ THỊ THỐNG KÊ MÔ TẢ
Thống kê mô tả được trình bày dưới dạng đồ thị
http://dichvudanhvanban.com
www.hutech.edu.vn
THỐNG KÊ SUY DIỄN
• Nhóm lớn các phần tử trong một nghiên cứu được gọi là tổng
thể và nhóm nhỏ được gọi là mẫu;
• TỔNG THỂ là tổng hợp tất cả các phần tử được quan tâm trong
một nghiên cứu
• MẪU là tập hợp con của tổng thể
• Quá trình tiến hành khảo sát để thu thập dữ liệu trên toàn bộ
tổng thể gọi là ĐIỀU TRA TỔNG THỂ
• quá trình tiến hành khảo sát để thu thập dữ liệu trên một mẫu
được gọi là điều tra mẫu
• Thống kê SUY DIỄN sử dụng dữ liệu từ một MẪU ƯỚC
LƯỢNG và kiểm định giả thiết về các đặc tính của một tổng thể
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI 2 – HỒI QUY TUYẾN TÍNH
Bằng phương pháp bình phương nhỏ nhất
Mục tiêu:
• Nắm vững kỹ thuật hồi quy tuyến tính sao cho tổng bình
phương sai số phải nhỏ nhất;
• Vận dụng kỹ thuật HQ-OLS để xác định các mối quan hệ
trong kinh tế-tài chính;
• Dự báo, ước lượng các biến số trong kinh tế-tài chính để
giúp nhà đầu tư ra quyết định.
• Xác định nguyên nhân thay đổi của biến số trong kinh tế-tài
chính; kiểm định giả thiết của bên thứ ba
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI 2 – NỘI DUNG




Mô hình hồi quy & phương trình hồi quy
Phương trình hồi quy ước lượng
Phương pháp bình phương nhỏ nhất
Thước đo độ phù hợp của phương trình
hồi quy
 Kiểm định ý nghĩa của mô hình HQTT
đơn giản
http://dichvudanhvanban.com
www.hutech.edu.vn
2.1MÔ HÌNH HỒI QUY & PHƯƠNG TRÌNH HỒI QUY
CoffeeHouse là chuỗi coffee shops thường đặt trong các
khu vực sầm uất như gần các trường đại học. Các nhà quản
lý cho rằng
• Doanh số bán hàng quý của các cửa hàng (ký hiệu y tức
biến phụ thuộc) có liên hệ thuận đến số lượng sinh viên
(ký hiệu x tức biến độc lập)
• => CH ở vị trí gần khu vực có số lượng SV lớn mang lại
lợi nhuận cao và ngược lại
• Sử dụng mô hình hồi quy để xây phương trình hồi quy
cho thấy biến phụ thuộc Y liên quan đến biến độc lập X
http://dichvudanhvanban.com
www.hutech.edu.vn
MÔ HÌNH HỒI QUY & PHƯƠNG TRÌNH HỒI QUY
MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN GIẢN
Y = β0 + β1x + ε
(1)
ß0 và ß1 : là tham số của mô hình
ε : tức epsilon là một biến ngẫu nhiên hay là sai số; sai số thể hiện
biến thiên của y
PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH ĐƠN GIẢN
E(y) = β0 + β1x
(2)
Đồ thị của phương trình HQTT là một đường thẳng
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC DẠNG ĐƯỜNG HỒI QUY
A-Liên hệ tuyến tính đồng biến
E(y)
Tung
độ gốc
ß0
http://dichvudanhvanban.com
B-Liên hệ tuyến tính nghịch biến
Tung E(y)
độ gốc
ß0
Hệ số góc
độ dốc ß1>0
Hệ số góc
độ dốc
ß1<0
C-không có liên hệ tuyến tính
E(y)
Tung
độ gốc
ß0
www.hutech.edu.vn
Hệ số góc độ dốc ß1=0
Đường hồi quy
2.2 PHƯƠNG TRÌNH HỒI QUY ƯỚC LƯỢNG
MÔ HÌNH HQ TUYẾN TÍNH ĐƠN GIẢN ƯỚC LƯỢNG
ŷ = b0 + b1x
(3)
Đồ thị của phương trình HQTT đơn giản ước lượng gọi đường hồi quy
ước lượng
b0 : là tung độ gốc
b1 : là độ dốc
ŷ : là ước lượng điểm cho E(y)
Trị số b0 và b1 được tính toán bỡi phương pháp bình phương nhỏ nhất
http://dichvudanhvanban.com
QUÁ TRÌNH ƯỚC LƯỢNG TRONG HỒI QUY TUYẾN TÍNH ĐƠN GIẢN
Mô hình HQ
Y = ß0 + ß1x + ε
PTHQ
E(y) = ß0 + ß1x
Các tham số chưa biết
ß0 , ß1x
b0 và b1
Ước lượng cho
ß0 , ß1x
http://dichvudanhvanban.com
Dữ liệu mẫu
x
y
x1
y1
xn
yn
PTHQ ước
lượng
ŷ = b0 + b1x
Các tham số
mẫu
b0 , b1
GHI CHÚ
1. Phân tích hồi quy không là thủ tục cho việc xây dựng mối
liên hệ nhân quả giữa các biến
•
Nó chỉ có thể cho biết các biến liên hệ với nhau như thế nào
hay ở mức độ nào
•
Bất kỳ kết luận nào về tác động nhân quả đều phải dựa
trên sự xem xét của những người hiểu biết nhiều về NC
2. Phương trình hồi quy tuyến tính đơn giản là
E(y) = β0 + β1x
hay
E(y\x) = β0 + β1x
Nhằm mục đích nhấn mạnh PTHQ sẽ cung cấp giá trị trung
bình của y ứng với một trị số x cho trước.
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.1 Phân tích HQTT trong SPSS
1. Nhập số liệu tuổi và cân nặng của 30 trẻ từ 1-6 tuổi vào
SPSS. Cột 1: tuổi; cột 2: cân nặng
• Vào menu Analyze > Regression > Linear > Statistics
• Chọn biến độc lập (IV) và biến phụ thuộc (DV)
• Chạy hồi quy
2. Tương tự, chạy HQ cho tập dữ liệu Tỷ lệ lạm phát và thất
nghiệp của Việt Nam từ 2012-2019
http://dichvudanhvanban.com
www.hutech.edu.vn
2.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT
1. Thủ tục dùng dữ liệu mẫu để ước lượng phương trình
hồi quy (trong HQTT mỗi quan sát bao gồm 2 trị số,
một của biến độc lập và một của biến phụ thuộc)
2. Giả sử dữ liệu thu thập được từ 10 cửa hàng
CoffeeHouse đặt gần các trường đại học (bảng 1.1)
3. Mô hình HQTT mô tả thể hiện mối quan hệ giữa
doanh số bán hàng quý (yi) và số lượng sinh viên (xi)
từ quan sát CH thứ i trong mẫu; các trị số sau:
Nhà hàng 1
Nhà hàng 2
……
http://dichvudanhvanban.com
x1 = 2 và y1 = 58
x2 = 6 và y2 = 105
www.hutech.edu.vn
PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT
Bảng 1.1
http://dichvudanhvanban.com
CoffeeHouse
Số lượng sinh
viên (ngàn người)
Doanh số bán
theo quý
(triệu đồng)
i
Xi
Yi
1
2
58
2
6
105
3
8
88
4
8
118
5
12
117
6
16
137
7
20
157
8
20
169
9
22
149
10
26
202
www.hutech.edu.vn
http://dichvudanhvanban.com
www.hutech.edu.vn
Sử dụng dữ liệu trong bảng 1.1 để xác định các giá trị b0 và
b1 trong phương trình HQTT ĐGUL
ŷ = b0 + b1xi
(4)
Với
ŷi = doanh số bán theo quý được ước lượng ($1,000) của CH thứ i
b0 = tung độ gốc của đường hồi quy ước lượng
b1 = độ dốc của đường hồi quy ước lượng
xi = số lượng sinh viên (1,000 người) ứng với nhà hàng i
Tất cả nhà hàng trong mẫu sẽ có một trị số quan sát yi và trị
số doanh số ước lượng ŷi
Để đường HQUL phù hợp nhất với dữ liệu, sự khác biệt
giữa các trị số quan sát yi trị số ước lượng ŷi phải nhỏ nhất.
http://dichvudanhvanban.com
www.hutech.edu.vn
TIÊU CHUẨN BÌNH PHƯƠNG NHỎ NHẤT
MinƩ(yi –ŷ)2
(5)
Với
yi = trị số thực tế của biến phụ thuộc ứng với quan sát thứ i
ŷi = trị số ước lượng của biến phụ thuộc ứng với quan sát thứ i
Dùng phép tính vi phân cho thấy các trị số b0 và b1 nhằm
thỏa mãn có thể được tìm thấy bằng cách sử dụng phương
trình (6) & (7) dưới đây.
http://dichvudanhvanban.com
www.hutech.edu.vn
ĐỘ DỐC & TUNG ĐỘ GỐC CỦA PHƯƠNG TRÌNH HQUL
b1 =
Ʃ (xi - x)(yi – ӯ)
(6)
Ʃ (xi - x)2
b0 = ӯ – b1x
(7)
Với
xi = trị số thực tế của biến độc lập ứng với quan sát thứ i
yi = trị số thực tế của biến phụ thuộc ứng với quan sát thứ i
xi = trị số trung bình của biến độc lập
ӯi = trị số trung bình của biến phụ thuộc
n = số quan sát (=10)
http://dichvudanhvanban.com
www.hutech.edu.vn
Xây dựng phương trình HQ cho CoffeeHouse để tính x và ȳ
theo bảng 1.2
Ʃ xi 140
x = n = 10 = 14
Ʃ yi 1300
ȳ = n = 10 = 130
http://dichvudanhvanban.com
www.hutech.edu.vn
XÁC ĐỊNH CÁC CHỈ SỐ CẦN THIẾT
Bảng 1.2
Nhà hàng
thứ i
xi
yi
xi-x
yi- y
(xi-x)(yi- y)
(xi-x)2
1
2
58
-12
-72
864
144
2
6
105
-8
-25
200
64
3
8
88
-6
-42
252
36
4
8
118
-6
-12
72
36
5
12
117
-2
-13
26
4
6
16
137
2
7
14
4
7
20
157
6
27
162
36
8
20
169
6
39
234
36
9
22
149
8
19
152
64
10
26
202
12
72
864
144
Tổng cộng
140
1300
2840
568
http://dichvudanhvanban.com
www.hutech.edu.vn
Sử dụng phương trình (6) & (7) để tính b1 và b0
Ʃ (xi - x)(yi – ӯ) 2840
b1 =
= 586 = 5
Ʃ (x - x)2
i
b0 = ӯ – b1x = 130 – 5(14) = 60
Vậy phương trình HQUL
ŷ = b0 + b1x = 60 + 5x
http://dichvudanhvanban.com
www.hutech.edu.vn
Độ dốc b1 = 5
Tung độ gốc
b0 = 60
http://dichvudanhvanban.com
www.hutech.edu.vn
• Độ dốc của phương trình HQUL b1=5 là số >0 nên khi số
lượng sinh viên tăng thì doanh số cũng tăng đồng biến;
• Dựa trên doanh số bán tính bằng $1000 và số sinh viên tính
bằng 1000 người nên kỳ vọng số sinh viên tăng 1 đơn vị là kỳ
vọng doanh số tăng $5,000 => $5/sinh viên.
• Phương trình HQ mô tả mối quan hệ giữa x và y cũng được
dùng để dự đoán giá trị y ứng với một giá trị x cho trước.
Vậy, để doanh số bán theo quý của cửa hàng được đặt gần
một trường ĐH với 16,000 sinh viên được dự đoán
= 60 + 5(16) = 140 tức $140,000/quý
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.2 - PHƯƠNG TRÌNH HQUL
Cho 5 năm quan sát của 2 biến x và y như sau
xi
1
2
3
4
5
yi
3
7
5
11
14
a. Hãy xây dựng một đồ thị phân tán cho những dữ liệu này.
b. Đồ thị phân tán trong phần (a) cho thấy điều gì về mối quan hệ giữa hai
biến.
c. Hãy thử vẻ một đường thẳng mô tả một cách đơn gần đúng mối quan hệ
giữa x và y trên cùng một biểu đồ với dữ liệu gốc.
d. Hãy xây dựng phương bình hồi quy ước lượng bằng cách tính toán các
giá trị b0 và b1dùng các phương trình (6) và (7).
e. Hãy sử dụng phương trình hồi quy ước lượng để tính toán các giá trị của
y khi x=4.
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.3
Người bán
hàng
Số năm
kinh
nghiệm
Doanh
thu/năm
(1000 USD)
1
1
80
2
3
97
b. Hãy xây dựng phương trình hồi
quy ước lượng có thể dùng để dự
đoán doanh thu hàng năm với số
năm kinh nghiệm cho trước.
3
4
92
4
4
102
5
6
103
6
8
111
c. Hãy dùng phương trình hồi quy
để dự báo doanh thu hàng năm
cho một người bán hàng có 9
năm kinh nghiệm
7
10
119
8
10
123
9
11
117
10
13
136
a. Hãy xây dựng một đồ thị phân
tán cho những dữ liệu này với số
năm kinh nghiệm là biến độc
lập.
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.4
Chuyến bay
đến trễ (%)
Chuyến bay
đi trễ (%)
Atlanta
24
22
b. Đồ thị phân tán trong phần (a) cho
thấy điều gì về mối quan hệ giữa
các chuyến bay đến là đi trễ
Charlotte
20
20
Chicago
30
29
Cincinnati
20
19
c. Hãy dùng phương bình phương nhỏ
nhất để xây dựng phương trình hồi
quy ước lượng.
Dallas
20
22
Denver
23
23
Detroit
18
19
Houston
20
16
Minneapolis
18
18
Phoenix
21
22
Pittburgh
25
22
Salt Lake City
18
17
16
16
a. Hãy xây dựng một đồ thị phân tán
cho những dữ liệu này với tỷ lệ
chuyến bay đến trễ là biến độc lập.
d. Hãy giải thích độ dốc của phương
trình hồi quy.
e. Giả định tỷ lệ các chuyến bay đến
trễ ở sân bay Philadelphia trong
tháng 8 là 22%. tính
http://dichvudanhvanban.com
Sân bay
St.Louis
www.hutech.edu.vn
2.4 CÔNG THỨC ĐO ĐỘ PHÙ HỢP PTHQ
TỔNG BÌNH PHƯƠNG SAI SỐ
(8)
SSE = Ʃ(yi – ŷi)2
TỔNG BÌNH PHƯƠNG TOÀN BỘ
(9)
SST = Ʃ(yi – y)2
TỔNG BÌNH PHƯƠNG DO HỒI QUY
(10)
SSR = Ʃ(ŷi –y)2
QUAN HỆ GIỮA SST, SSR, và SSE
(11)
SST = SSR + SSE
với
SST= Tổng bình phương toàn bộ
http://dichvudanhvanban.com
SSR= Tổng bình phương hồi quy
SSE = Tổng bình
phương sai số
www.hutech.edu.vn
HỆ SỐ XÁC ĐỊNH
HỆ SỐ XÁC ĐỊNH
r2 =
SSR
SST
(12)
Hệ số tương quan
HỆ SỐ TƯƠNG QUAN MẪU
rxy = (dấu của b1) r2
http://dichvudanhvanban.com
www.hutech.edu.vn
(13)
Ứng dụng thước đo độ phù hợp PTHQ
• Ở cửa hàng 1, ta có x1=2 và y1=58, và ŷ1= 60+5(2) = 70 =>
Sai số trong việc sử dụng ŷ1 để ước tính y1 cho CH1 là y1-ŷ =
58-70=-12, vậy sai số bình phương (-12)2 = 144, hay
SSECH1 = Ʃ(y1 – ŷ1)2 = (58-70)2 = (-12)2 = 144 (bảng 1.3)
• Với Ʃyi = 1300 và giá trị trung bình của doanh số bán hàng
theo quý cho mẫu gồm 10 cửa hàng CoffeeHouse là
ȳ=Ʃyi/n=130 (bảng 1.2).
Vậy yi-ȳ đo sai số trong việc sử dụng y để ước lượng doanh số
bán hàng; tổng bình phương toàn bộ
SST = Ʃ(yi – y)2 = 15730
http://dichvudanhvanban.com
(bảng 1.5)
www.hutech.edu.vn
TÍNH TOÁN SSE CỦA 10 COFFEEHOUSE
Bảng 1.3
Nhà hàng
Số lượng
sinh viên
Doanh số
quý
Doanh số
dự đoán
Chênh lệch
Chênh lệch
bình phương
xi
yi
ŷi
yi- ŷi
(yi-ŷ)2
1
2
58
70
-12
144
2
6
105
90
15
225
3
8
88
100
-12
144
4
8
118
100
18
324
5
12
117
120
-3
9
6
16
137
140
-3
9
7
20
157
160
-3
9
8
20
169
160
9
81
9
22
149
170
-21
441
10
26
202
190
12
144
SSE = 1530
http://dichvudanhvanban.com
www.hutech.edu.vn
Tính toán tổng bình phương TOÀN BỘ
Bảng 1.4
Nhà hàng
Số lượng
sinh viên
Doanh số
quý
Chênh lệch
Chênh lệch
bình phương
xi
yi
yi- ȳi
(yi-ȳ)2
1
2
58
-72
5148
2
6
105
-25
625
3
8
88
-42
1764
4
8
118
-12
144
5
12
117
-13
169
6
16
137
7
49
7
20
157
27
729
8
20
169
39
1521
9
22
149
19
361
10
26
202
72
5184
http://dichvudanhvanban.com
www.hutech.edu.vn
SST = 15730
• Hình 3 cho thấy đường HQUL ŷ = 60 +5x và đường ȳ = 130
• Để ý rằng đồ thị phân tán các điểm tập trung quanh đường HQ
hơn là đường ȳ=130
• Ví dụ, đối với CH10 cho thấy sai số > so với ȳ=130
Thí dụ ȳ10= 60+5(26) = 190 > 130
• Vậy SST là thước đo các quan sát tập trung chặt chẻ quanh
đường ȳ còn SSE là thước đo các quan sát tập trung chặt chẻ
quanh đường ŷ1
http://dichvudanhvanban.com
www.hutech.edu.vn
Hình 3 – ĐƯỜNG HỒI QUY & ĐƯỜNG Y=Ȳ
KHÁC BIỆT GIỮA ĐƯỜNG HỔI QUY & ĐƯỜNG Y=Ȳ
y10-ȳ
y10-ȳ
y=ȳ=130
http://dichvudanhvanban.com
www.hutech.edu.vn
y10-ȳ
MỐI LIÊN QUAN 3 TỔNG CÁC BÌNH PHƯƠNG
•
Để đo lường các giá trị trên đường HQ khác biệt giá trị ȳ thế
nào thì tổng bình phương do hồi quy SSR được sử dụng
RSS = Ʃ(ŷi –y)2 = 15730
•
Từ các thảo luận trên có thể rút ra rằng 3 tổng các bình
phương SST, SSR, và SSE có liên quan với nhau;
phương trình (11) TSS = RSS + ESS cho thấy TBP toàn bộ
gồm 2 thành phần
(a) tổng bình phương do hồi quy
(b) tổng bình phương do sai số
Tức RSS = TSS – ESS = 15730 – 1530 = 14200
http://dichvudanhvanban.com
www.hutech.edu.vn
ĐỘ PHÙ HỢP
• Phương trình HQUL sẽ hoàn toàn phù hợp nếu tất cả các giá
trị của biến phụ thuộc nằm trên đường hồi quy;
Trường hợp này, yi-ŷi=0 cho mỗi quan sát => ESS = 0
• Để có sự phù hợp hoàn hảo thì trong phương trình (11) bắt
buộc RSS = TSS => tỷ lệ RSS/TSS = 1
• Sự phù hợp kém sẽ dẫn đến SSE lớn hơn.
Thí dụ ȳ10= 60+5(26) = 190 > 130
• Từ phương trình (11) ESS = TSS-RSS => giá trị lớn nhất của
ESS xãy ra khi RSS=0 và ESS=TSS (sự phù hợp kém nhất)
• Tỷ lệ RSS/TSS có giá trị giữa 0-1, được sử dụng để đánh giá
độ phù hợp của PTHQ, còn gọi là hệ số xác định ký hiệu r2
http://dichvudanhvanban.com
www.hutech.edu.vn
HỆ SỐ XÁC ĐỊNH R2
Khi r2 trình bày dưới hình thức tỷ lệ % được hiểu là tỷ lệ
trong tổng bình phương toàn bộ
r2 =
14200
RSS
=
0.9027
tức
90.27%
=
15300
TSS
Điều này có nghĩa là 90.27% thay đổi trong DSBH do mối
quan hệ tuyến tính giữa số lượng SV & DSBH
Hệ số tương quan
HỆ SỐ TƯƠNG QUAN MẪU
rxy = (dấu của b1) r2
http://dichvudanhvanban.com
www.hutech.edu.vn
HỆ SỐ TƯƠNG QUAN
• Hệ số tương quan là thước đo mô tả độ mạnh của mối liên
hệ tuyến tính giữa 2 biến x và y
• Giá trị của HSTQ luôn nằm trong khoảng -1 đến +1
• Trị số +1 chỉ ra 2 biến x và y liên hệ thuận hoàn hảo => các
điểm dữ liệu đều nằm trên 1 đường thẳng có độ dốc dương
• Trị số -1 cho thấy x và y liên hệ nghịch 1 cách hoàn hảo với
tất cả các điểm nằm trên đường thẳng có độ dốc âm.
• Giá trị các hệ số tương quan gần = 0 cho thấy x và y không
có liên quan tuyến tính
HỆ SỐ TƯƠNG QUAN MẪU
rxy = (dấu của b1) r2
http://dichvudanhvanban.com
www.hutech.edu.vn
HỆ SỐ TƯƠNG QUAN MẪU
• Hệ số tương quan mẫu >0 nếu PTUL có độ dốc b1>0
• Trong thí dụ Highlands Coffee, trị số của hệ số xác định
tương ứng với PTHQUL ŷ= 60+5x là 0.9027 bỡi vì b1>0
=> +√0.9027 = +0.9501 là hệ số tương quan mẫu
• Với HSTQM = +0.9501 có thể kết luận tồn tại một mối liên
hệ tuyến tính dương chặc chẻ giữa x và y.
• Cần phân biệt hệ số xác định đo giữa 0 và 1 trong khi
HSTQM đo giữa -1 và +1
• Tuy nhiên hệ số xác định có phạm vi ứng dụng rộng hơn vì
co thể đo cả cho mối liên hệ phi tuyến tính và các mối liên
hệ với 2 hay 2+ biến độc lập
http://dichvudanhvanban.com
www.hutech.edu.vn
PHƯƠNG PHÁP NGHIÊN CỨU ĐỊNH LƯỢNG
• Nghiên cứu định lượng (quantitative research) có ứng dụng
rộng rãi trong kinh doanh và kinh tế, đặc biệt trong Tài
chính ngân hàng;
• Thường được gắn liền với việc KIỂM ĐỊNH lý thuyết dựa
vào phương pháp suy diễn. Thí dụ kiểm định t, kiểm định F
• Nghiên cứu và sử dụng các phương pháp khác nhau để
lượng hóa, đo lường, phản ánh và diễn giải các mối quan
hệ giữa các nhân tố (các BIẾN) với nhau.
http://dichvudanhvanban.com
www.hutech.edu.vn
DỮ LIỆU TRONG NGHIÊN CỨU ĐỊNH LƯỢNG
Dữ liệu
Là những sự kiện và con số thu được thu
thập, phân tích và tổng hợp để trình bày và
giải thích.
Tập dữ liệu
Tất cả các con số thu thập trong một
nghiên cứu cụ thể.
Thống kê mô tả
Dữ liệu được trình bày dưới dạng bảng, đồ
thị, số, đồ họa cho người đọc dễ hiểu.
Thống kê suy diễn Mẫu được sử dụng để ước lượng một đặc
tính tổng thể quan tâm để đưa ra một tuyên
bố về chất lượng, độ chính xác, liên quan
đến ước lượng.
http://dichvudanhvanban.com
www.hutech.edu.vn
ĐẶC TRƯNG CỦA NGHIÊN CỨU ĐỊNH LƯỢNG
• Liên quan đến lượng và số trong khi định tính liên quan
đến chất và mô tả;
• Mục đích của NCĐL là đo lường, kiểm tra sự liên quan
giữa các biến số dưới dạng số đo và thống kê;
• Việc sử dụng mô hình kinh tế lượng và mô hình toán là bắt
buộc khi sử dụng phương pháp nghiên cứu này;
• Được dùng để tổng quát hóa kết quả nghiên cứu thông qua
phân phối ngẫu nhiên và lấy mẫu đại diện;
• Đối với các biến số có bản chất định tính (không đo lường
được) thì việc lượng hóa biến số là yêu cầu bắt buộc để
thực hiện NC định lượng.
www.hutech.edu.vn
http://dichvudanhvanban.com
ĐẶC TRƯNG CỦA NC ĐỊNH LƯỢNG (tt)
Ví dụ: Khi khảo sát mức độ hài lòng của khách hàng về
chất lượng dịch vụ ngân hàng. Câu trả lời thường nhận
được là định tính như “rất không hài lòng”, “tương đối hài
lòng”, “rất hài lòng”, vv.
Để thực hiện nghiên cứu định lượng, người NC cần lượng
hóa các dữ liệu định tính này dưới dạng số như
1.
2.
3.
4.
5.
Tương ứng với “rất không hài lòng”
….
….
….
Tương ứng với “rất hài lòng”
http://dichvudanhvanban.com
www.hutech.edu.vn
THU THẬP DỮ LIỆU TRONG NC ĐỊNH LƯỢNG
• Các phương pháp thu thập dữ liệu như cân, đo, sử dụng
bảng câu hỏi có cấu trúc để khảo sát/phỏng vấn, quan sát
và ghi chép dữ liệu là thống kê dữ liệu để phân tích và cho
ra kết quả có liên quan tới các biến.
• Biến định tính là biến với các dữ liệu định tính; Biến định
lượng là biến với các dữ liệu định lượng;
• Phân tích thống kê phù hợp cho một biến cụ thể phụ thuộc
vào biến định tính hay định lượng, biến độc lập hay phụ
thuộc;
• Có nhiều cách phân tích thống kê đối với dữ liệu định
lượng.
http://dichvudanhvanban.com
www.hutech.edu.vn
ĐẶC TRƯNG CỦA NGHIÊN CỨU ĐỊNH TÍNH
• Là hướng tiếp cận nhằm thăm dò, mô tả và giải thích dựa
vào các phương tiện khảo sát kinh nghiệm, nhận thức, động
cơ thúc đẩy, dự định, hành vi, thái độ;
• Dữ liệu định tính thường ở dạng chữ, phản ánh tính chất,
đặc điểm hay sự hơn kém và không dùng mô hình kinh tế
lượng cũng như mô hình toán nên không tính được trị trung
bình của dữ liệu định tính;
• Ví dụ dữ liệu định tính như: Giới tính là nam hay nữ; kết
quả học tập của sinh viên là giỏi, khá, trung bình, hay yếu.
• NC định tính phù hợp để trả lời các câu hỏi mà NC định
lượng chưa thực hiện được nhằm mở ra hướng NC mới.
http://dichvudanhvanban.com
www.hutech.edu.vn
SO SÁNH PP ĐỊNH LƯỢNG & ĐỊNH TÍNH
Phương pháp định lượng
Phương pháp định tính
• Nhấn mạnh kiểm tra bằng chứng
• Tập trung vào cơ sở lập luận hoặc
các nguyên nhân của các sự kiện
• Cách tiếp cận logic và phê phán
• Cách nhìn khách quan của người
ngoài cuộc, cách xa số liệu
• Tập trung kiểm tra giả thiết
• Kết quả được định hướng
• Tiềm ẩn nhiều sai biệt thống kê, tốn
nhiều thời gian nếu gặp vấn đề về
dữ liệu
• Khó kiểm soát chất lượng dữ liệu
điều tra
o Nhấn mạnh vào sự hiểu biết
o Tập trung vào sự hiểu biết từ quan
điểm của người cung cấp thông tin
o Cách tiếp cận qua lý lẽ giải thích
o Cách nhìn chủ quan của người trong
cuộc và gần gủi với số liệu
o Định hướng thăm dò, giải thích
o Quá trình được định hướng
o Khó tiếp cận chuyên gia để phỏng
vấn
o Khó viết phần phân tích và báo cáo
http://dichvudanhvanban.com
www.hutech.edu.vn
THUẬT NGỮ
Phần tử
Là các thực thể mà từ đó dữ liệu thu thập được
Biến
Biến là đặc tính quan tâm của phần từ, thí dụ
• Thị trường chứng khoán: nơi cổ phiếu được giao dịch
• Mã cổ phiếu: tên tắt dùng để phân biệt các cổ phiếu
được niêm yết
• VN30: các công ty được xếp hạng từ 1-30
• Giá cổ phiếu: giá vào thời điểm đóng cửa
• Lợi nhuận trên cổ phiếu: là lợi nhuận trên 1 cổ phần
trong 12 tháng gần nhất
Quan sát
Các
Thang đo
Thu thập dữ liệu đòi hỏi phải có một trong các thang đo
như tỉ lệ, thứ bậc, khoảng và danh nghĩa.
Thang đo quyết định lượng thông tin chứa trong các dữ
liệu, cách
tóm tắt dữ liệu, và phân tích thống kê phù hợp.
www.hutech.edu.vn
http://dichvudanhvanban.com
số đo lường thu thập trên mỗi biến đối với từng phần
tử trong một nghiên cứu sẽ cung cấp dữ liệu. Tập hợp các
số đo được của một phần tử được gọi là quan sát.
THUẬT NGỮ - 4 loại thang đo (TĐ)
TĐ danh nghĩa
TĐ thứ bậc
TĐ Khoảng
TĐ tỷ lệ
TĐ dùng cho dữ liệu
thuộc tính mà các
biểu hiện của dữ liệu
không có sự hơn
kém, khác biệt về thứ
bậc. Các con số
không có mối quan
hệ hơn kém, không
thực hiện các phép
tính đại số. Các con
số chỉ mang tính chất
mã hóa. Ví dụ: tiêu
thức giới tính ta có
thể đánh số 1 là nam,
số 2 nữ.
Là loại thang đo
dùng cho các dữ liệu
thuộc tính. Tuy
nhiên, trường hợp
này biểu hiện của dữ
liệu có sự so sánh. Ví
dụ: trình độ thành
thạo của công nhân
được phân chia ra
bậc thợ từ 1 đến 7.
Phân loại giảng viên
trong các trường đại
học: Giáo sư, Phó
giáo sư, Giảng viên
chính, Giảng viên.
Thang đo này
cũng không thực
hiện được các phép
tính đại số.
Là loại thang đo cho
các dữ liệu số lượng
và có thể dùng để
xếp hạng các đối
tượng NC ở khoảng
cách bằng nhau trên
thang đo đại diện cho
khoảng cách bằng
nhau của đối tượng.
Với thang đo này ta
có thể thực hiện các
phép tính đại số (trừ
phép chia không có ý
nghĩa). Ví dụ như
điểm môn học của
sinh viên (SV). SVA
có điểm thi là 8, SVB
có điểm 4 thì không
thể nói rằng SVA giỏi
Là loại thang đo cũng
có thể dùng dữ liệu
số lượng. Trong các
loại thang đo thì đây
là thang đo cao nhất.
Ngoài đặc tính của
thang đo khoảng,
phép chia có thể thực
hiện được. Ví dụ: thu
nhập trung bình một
tháng của ông A là 2
triệu đồng và thu
nhập của bà B là 4
triệu đồng thì ta có
thể nói rằng thu nhập
trung bình trong một
tháng của bà B gấp 2
lần thu nhập của ông
A.
http://dichvudanhvanban.com
PP PHÂN TÍCH THỐNG KÊ & THANG ĐO
Loại thang đo
Đo lường Đo lường Đo lường
độ tập
độ phân tính tương
trung
tán
quan
Kiểm định
TĐ danh nghĩaNominal scale
Mode
Không có
Hệ số ngẫu
nhiên
Kiểm định X2
Thang đo thứ
bậc – Ordinal
scale
Trung vị
%
Dãy tương
quan
Kiểm định
dấu
TĐ khoảng
Interval scale
Trung bình
Độ lệch
chuẩn
Hệ số tương
quan
Kiểm định t,
F
Thang đo tỷ lệ
(ratio scale)
Trung bình
tỷ lệ
Hệ số biến
thiên
Tất cả các
Sử dụng tất
phép tính trên cả các phép
trên
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.5
Monkey Survey khảo sát với mẫu toàn quốc được chọn
ngẫu nhiên gồm 1,005 người lớn (18 tuổi trở lên). Câu hỏi
khảo sát là “Bạn mô tả sức khỏe thể chất của bạn thế nào
vào lúc này”. Thang đo cho loại trả lời là xuất sắc; tốt; chỉ
vừa phải, tệ và không ý kiến.
a. Cỡ mẫu của KS này là bao nhiêu?
b. Dữ liệu này là định tính hay định lượng?
c. Dùng trung bình hay tỷ lệ % sẽ có ý nghĩa hơn để tóm
tắt dữ liệu này?
d. Trong số những người trả lời có 29% nói rằng sức khỏe
cá nhân họ là “xuất sắc”. Có bao nhiêu người trả lời như
vậy?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.6
Thời báo Kinh tế Sài Gòn khảo sát người đăng ký báo đã
hỏi 46 câu về đặc điểm và quan tâm của người đăng ký.
Hãy cho biết mỗi câu hỏi sau đây cung cấp dữ liệu phân
loại hoặc định lượng và cho biết thang đo của từng câu hỏi:
a. Tuổi của bạn?
b. Giới tính của bạn?
c. Bạn bắt đầu đọc TBKT lần đầu tiên khi nào (TH, ĐH,
khi bắt đầu làm việc, khi đang xây dựng sự nghiệp, cuối
sự nghiệp hoặc nghỉ hưu?
d. Bạn đã làm công việc ở vị trí hiện tại được bao lâu?
e. Loại xe bạn xem xét mua (9 loại)?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.7
CSM Worldwide dự báo sản lượng toàn cầu của tất cả các nhà
sản xuất ô tô trên thế giới từ 2014-2017. ĐVT = triệu xe.
Nhà sản xuất
2014
2015
2016
2017
General Motor
8.9
9.0
8.9
8.8
Ford
7.8
7.7
7.8
7.9
DamlerChrysler
4.1
4.2
4.3
4.6
Toyota
7.8
8.3
9.1
9.6
a. Lập đồ thị chuỗi thời gian 2014-17 biểu diễn số lượng xe sản
xuất bỡi từng nhà SX?
b. Biễu diễn các chuỗi thời gian của 4 hãng SX trên cùng 1 biểu
đồ?
c. Hãy lập đồ thị thanh diễn tả số lượng xe được sản xuất bỡi
nhà SX ô tô năm 2017. Đồ thị này dựa trên dữ liệu thời
điểm hay chuỗi thời gian?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP
Bài 2.8 Theo dữ liệu sau
xi
1
2
3
4
5
yi
3
7
5
11
14
Phương trình HQUL ŷ= 0.20 +2.6x
a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10)
b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH
c. Hãy tính hệ số tương quan mẫu
Bài 2.9 Theo dữ liệu sau
xi
3
12
6
10
14
yi
55
40
55
10
15
Phương trình HQUL ŷ= 68 - 3x
a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10)
b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH
c. Hãy tính hệ số tương quan mẫu
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP 2.10
Theo dữ liệu sau
Điểm trung bình 2.6
3.4
3.6
3.2
3.5
2.9
Lương tháng US$ 3300 3600 4000 3500 3900 3600
Phương trình HQUL ŷ= 1790 + 581.1x
a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10)
b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH
c. Hãy tính hệ số tương quan mẫu
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC ĐẲNG THỨC ĐÃ HỌC
(1)
(2)
(3)
(4)
(5)
Y = β0 + β1 x + ε
E(y) = β0 + β1x
ŷ = b0 + b1x
ŷ = b0 + b1xi (4)
MinƩ(yi –ŷ)2
(6) b1 =
Ʃ (xi - x)(yi – ӯ)
Ʃ (xi - x)2
(7) b0 = ӯ – b1x
(8) SSE = Ʃ(yi – ŷi)2
(9) SST = Ʃ(yi – ӯ)2
(10) SSR = Ʃ(ŷi –ӯ)2
(11) SST = SSR + SSE
RSS
(12) r2 =
TSS
(13) rxy = (dấu của b1) r2
http://dichvudanhvanban.com
Mô hình hồi quy tuyến tính (HQTT) đơn giản
Phương trình HQTT đơn giản
Mô hình HQTT đơn giản ước lượng
Phương trình HQTT đơn giản ước lượng
Tiêu chuẩn bình phương nhỏ nhất
Độ dốc
Tung độ gốc của phương trình HQ ước lượng
Tổng bình phương sai số
Tổng bình Phuong toàn bộ
Tổng bình phương do hồi quy
Quan hệ giữa SST, SSR, và SSE
Hệ số xác định
Hệ số tương quan mẫu
www.hutech.edu.vn
2.5 Kiểm định ý nghĩa
của mô hình hồi quy
tuyến tính đơn giản
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC GIẢ THIẾT của MÔ HÌNH HỒI QUY Y = β0 + β1x + Ɛ
Giả thiết về sai số ε trong mô hình hồi quy
1. Sai số ε là một biến ngẫu nhiên có trung bình/giá trị kỳ vọng bằng 0:
E(ε) = 0
Hàm ý: β0 và β1 là hằng số, do đó E(β0) = β0 và E(β1) = β1; như vậy,
với một giá trị x cụ thể, giá trị kỳ vọng của y là (14) E(y) = β0 + β1x
(Phương trình hồi quy)
2. Phương sai σ2 của ε là như nhau cho tất cả các giá trị x.
Hàm ý: phương sai của y về đường hồi quy bằng σ2 và là như nhau
cho tất cả các giá trị x.
3. Giá trị của ε là độc lập với nhau.
Hàm ý: giá trị ε ứng với giá trị x cụ thể không liên quan giá trị ε ứng
với giá trị x khác => giá trị y ứng với giá trị x cụ thể không liên quan
giá trị y ứng với bất kỳ giá trị nào khác của x.
4. Sai số ε là biến ngẫu nhiên có phân phối chuẩn.
Hàm ý: vì y là một hàm tuyến tính của ε, nên y cũng là một biến ngẫu
nhiên có phân phối chuẩn.
http://dichvudanhvanban.com
www.hutech.edu.vn
KIỂM ĐỊNH Ý NGHĨA của MÔ HÌNH HỒI QUY
Trong phương trình tuyến tính E(y) = β0 + β1x:
(a) Nếu β1=0, E(y) = β0 + 0x = β0 tức giá trị trung bình của y không
phụ thuộc vào giá trị của x => x và y không liên quan tuyến
tính.
(b) Nếu β1≠ 0, hai biến x và y có liên quan
Một số kiểm định sau được áp dụng:
1.
2.
3.
4.
http://dichvudanhvanban.com
Ước lượng σ2
Kiểm định t
Khoảng tin cậy cho β1
Kiểm định F
www.hutech.edu.vn
ƯỚC LƯỢNG σ2
Với ŷi = b0+b1xi, SSE = Ʃ(yi-ŷi)2=Ʃ(yi-b0-b1xi)2 vậy trung bình của
bình phương SSE = SSE/n-2 bậc tự do là b0-b1 cung cấp một ước
lượng không chênh lệch cho σ2.
Bỡi vì MSE cung cấp một ước lượng không lệch cho σ2, ký hiệu s2
cũng được sử dụng:
SAI SỐ BÌNH PHƯƠNG TRUNG BÌNH (ước lượng của σ2)
ESS
s2 = MSE=
n-2
(15)
Trong ví dụ CoffeeHouse, SSE=1530, nên
1530
1530
2
= 191,25 là một ước lượng không
s = MSE=
=
10 - 2
8
chênh lệch cho σ2
http://dichvudanhvanban.com
www.hutech.edu.vn
Để ước lượng σ2 ta lấy căn bậc hai của s2.
Giá trị s nhận được được gọi là sai số chuẩn của ước lượng.
SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG
s = 𝑀𝑆𝐸 =
http://dichvudanhvanban.com
𝐸𝑆𝑆
=
𝑛−2
191,25
= 13.829
𝑛−2
www.hutech.edu.vn
(16)
KIẾM ĐỊNH t
Mô hình HQTTĐG là Y = β0 + β1x + ε.
Nếu x và y có liên hệ tuyến tính, phải có β1≠ 0 nên mục đích của kiểm định
t là chứng minh β1≠ 0 theo 2 giả thiết H0: β1= 0 và Ha: β1≠ 0
PHÂN PHỐI MẪU CỦA b1
Giá trị kỳ vọng E(b1) = β1
Độ lệch chuẩn
σb1 =
σ
dạng phân phối chuẩn
Ʃ 𝑥𝑖 − 𝑥
2
(17)
Lưu ý: (a) giá trị kỳ vọng của b1 = β1 vì vậy b1 là một ước lượng không chệch của β1
(b) bỡi vì không biết giá trị của σ nên dùng ước lượng σb1 ký hiệu sb1, bằng
cách dùng s trong (17)
SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG
σ
sb1 =
Ʃ 𝑥𝑖 − 𝑥
http://dichvudanhvanban.com
2
www.hutech.edu.vn
(18)
KIẾM ĐỊNH t
SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG trong ví dụ Highlands Coffee
13829
σ
=
= 0.5803 là độ lệch chuẩn của b1
sb1 =
568
Ʃ 𝑥𝑖 − 𝑥 2
Để kiểm định t về ý nghĩa của mối quan hệ dựa trên thống kê kiểm định
b1 – β1 có phân phối t với n-2 bậc tự do. Nếu H0 đúng thì β1= 0 và
t=b1/sb1.
sb1
Trở lại ví dụ Highlands Coffee để kiểm định t ở mức ý nghĩa α = 0.01
b1
5
=
= 8.62
t=
0.5806
sb1
Bảng phân phối t cho thấy khi n-2= 10-2=8 bậc tự do thì t=3.355 với diện
tích 0.005 ở đuôi phải. Vậy ứng với t=8.62 <α=0.005 trong kiểm định 2
đuôi. Nên p ứng với t=8.62 < 2(0.005) = 0.01
http://dichvudanhvanban.com
www.hutech.edu.vn
KIẾM ĐỊNH t
• Bảng phân phối t cho thấy khi n-2= 10-2=8 bậc tự
do thì t=3.355 với diện tích 0.005 ở đuôi phải.
• Vậy ứng với t=8.62 <α=0.005 trong kiểm định 2
đuôi. Nên p ứng với t=8.62 < 2(0.005) = 0.01 <
α=0.01
• Do p = 0.000 < α=0.01 nên bác bỏ H0 vì β0≠0
• Vậy có thể kết luận tồn tại một mối liên hệ có ý
nghĩa giữa số lượng sinh viên và doanh số bán hàng
theo quý”
http://dichvudanhvanban.com
www.hutech.edu.vn
KIẾM ĐỊNH t về ý nghĩa mối quan hệ
trong mô hình HQTT đơn giản
• Đặt giả thiết H0: β1=0 và Ha: β1≠0
• Giá trị thống kê kiểm định t =
• Qui tắc bác bỏ
b1
sb1
(19)
Dựa vào giá trị p: bác bỏ H0 nếu giá trị p≤ α
Dựa vào giá trị tới hạn : bác bỏ H0 t≤ −𝑡α/2
nếu giá trị t ≥ 𝑡α/2
Với 𝑡α/2 dựa trên phân phối t với n-2 bậc tự do
http://dichvudanhvanban.com
www.hutech.edu.vn
KHOẢNG TIN CẬY CHO β1
Dạng khoảng tin cậy cho β1 như sau:
• b1 ∓t ≥ 𝑡α/2Sb1: ước lượng điểm β1 sai số 𝑡α/2Sb1
Độ tin cậy 1-α và 𝑡α/2là giá trị t ứng với diện tích α/2 ở
đuôi bên phải của phân phối t với n-2 bậc tự do.
• Trong ví dụ CoffeeHouse, khoảng tin cậy 99% cho β1
Tra bảng 2-PLB cho thấy giá trị t≈ α=0.01 và n-2 =
10-2=8 bậc tự do là t0.005= 3.355.
• Vậy ước lượng khoảng tin cậy 99% cho β1 là
b1 ∓t = 5 ∓ 3.355 (0.5803) = 5 ∓ 1.95
hoặc từ 3.05 đến 6.95
http://dichvudanhvanban.com
www.hutech.edu.vn
KHOẢNG TIN CẬY CHO β1
Trong kiểm định t về ý nghĩa mối quan hệ, các giả thiết
H0: β1=0 và Ha: β1≠0
• Ở mức ý nghĩa α=0.01 thì sử dụng khoảng tin cậy
99%, bỡi vì 0 (trị số giả định của β1) không nằm trong
khoảng tin cậy (3.05-6.95) nên bác bỏ H0 và kết luận
tồn tại một mối liên hệ có ý nghĩa thống kê giữa số
lượng sinh viên và doanh số bán hàng theo quý.
• Nói chung, khoảng tin cậy có thể sử dụng để kiểm định
giả thiết hai phía về β1.
• Nếu trị số giả định của β1 nằm trong khoảng tin cậy
(3.05-6.95) thì không thể bác bỏ H0 và ngược lại.
http://dichvudanhvanban.com
www.hutech.edu.vn
KIỂM ĐỊNH F
Kiểm định F dựa trên bảng phân phối xác suất F, có thể dùng để
kiểm tra ý nghĩa trong hồi quy.
• Với 1 biến độc lập, kết luận của KĐF sẽ dẫn đến cùng 1 kết
luận như KĐt.
• Có nghĩa là nếu KĐt chỉ ra β1≠0 và do đó tồn tại một mối quan
hệ có ý nghĩa thống kê thì KĐF cũng sẽ cho thấy một mối quan
hệ có ý nghĩa xét một cách tổng quát.
• Logic làm nền tảng cho KĐF có hay không mối liên hệ hồi quy
dựa trên sự hình thành của hai ước lượng độc lập cho σ2.
• Nếu H0: β1=0 là đúng, tổng bình phương do hồi quy SSE chia
cho bậc tự do tương ứng cung cấp một ước lượng độc lập khác
cho σ2.
http://dichvudanhvanban.com
www.hutech.edu.vn
KIỂM ĐỊNH F (tt)
•
Ước lượng này gọi là phương sai do hồi quy, hay đơn giản là
phương sai hồi quy ký hiệu MSR công thức:
MSR = RSS/bậc tự do của hồi quy
•
Các mô hình đang xem xét, bậc tự do tương ứng với hồi quy
luôn luôn bằng số lượng biến độc lập trong mô hình:
MSR = RSS/số lượng biến độc lập
(20)
•
Do thí dụ CoffeeHouse chỉ xét 1 biến độc lập nên
MSR = RSS/1 = RSS = 14200
•
Bỡi vì MSR và MSE là hai ước lượng độc lập cho σ2 và phân
phối mẫu của MSR/MSE tuân theo phân phối F với tử số = 1
và bậc tự do của mẫu số = n-2
•
Vậy khi β1=0, trị số củawww.hutech.edu.vn
MSE ≈ 1
http://dichvudanhvanban.com
KIỂM ĐỊNH F (tt)
•
Nếu H0 là sai tức β1≠0, ước lượng MSR sẽ quá cao cho σ2 và trị
số MSR/MSE sẽ lớn dẫn đến bác bỏ H0 => mối quan hệ giữa x
và y là có ý nghĩa thống kê.
•
Tiến hành KĐF cho ví dụ CoffeeHouse, trị số kiểm định là
MSR
14200
=
= 74.25
F=
MSE
191.25
(21)
•
Bảng phân phối F cho thấy với một bậc tự do ở tử số và n2=10-2=8 bậc tự do ở mẫu số thì F=11.26 có diện tích 0.01 ở
đuôi phía bên phải.
•
Vậy diện tích ở đuôi phải của phân phối F tương ứng với trị số
kiểm định F=74.25 <0.01 => giá trị p<0.01.
http://dichvudanhvanban.com
www.hutech.edu.vn
KIỂM ĐỊNH F – TÓM TẮT
KIỂM ĐỊNH F TRONG MÔ HÌNH HQTT ĐƠN GIẢN
H0: β1=0
Ha: β1≠0
TRỊ SỐ KIỂM ĐỊNH
MSR
F=
MSE
QUI TẮC BÁC BỎ
Dựa vào giá trị p:
bác bỏ H0 nếu p-value ≤σ
Dựa vào giá trị tới hạn bác bỏ H0 F ≥ 𝐹α
Với 𝐹α dựa trên phân phối F với bậc
tự do ở tử số và n-2 bậc tự do ở mẫu
số.
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC CÔNG THỨC QUAN TRỌNG (tt)
(1) Y = β0 + β1x + ε
(2) E(y) = β0 + β1x
(3) ŷ = b0 + b1x
(4) ŷ = b0 + b1xi (4)
(5) MinƩ(yi –ŷ)2
Ʃ (xi - x)(yi – ӯ)
(6) b1 =
Ʃ (xi - x)2
Mô hình hồi quy tuyến tính (HQTT) đơn giản
Phương trình HQTT đơn giản
Mô hình HQTT đơn giản ước lượng
Phương trình HQTT đơn giản ước lượng
Tiêu chuẩn bình phương nhỏ nhất
(7) b0 = ӯ – b1x
(8) SSE = Ʃ(yi – ŷi)2
(9) SST = Ʃ(yi – y)2
(10) SSR = Ʃ(ŷi –y)2
(11) SST = SSR + SSE
SSR
(12) r2 = SST
Tung độ gốc của phương trình HQ ước lượng
Tổng bình phương sai số
Tổng bình Phuong toàn bộ
Tổng bình phương do hồi quy
Quan hệ giữa SST, SSR, và SSE
Độ dốc
Hệ số xác định
(13) rxy = (dấu của b1) r2 Hệ số tương quan mẫu
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC CÔNG THỨC QUAN TRỌNG (tt)
(14) E(y) = β0 + β1x
SSE
2
(15) s = MSE= n - 2
(16) s =
𝑀𝑆𝐸 =
Sai số bình phương trung bình UL của σ2
𝑆𝑆𝐸
𝑛−2
Sai số chuẩn của ước lượng
σ
(17) σb1 =
(18) sb1 =
(19) t =
Giá trị kỳ vọng của y
b1
Ʃ 𝑥𝑖 − 𝑥
s
2
Ʃ 𝑥𝑖 − 𝑥
2
sb1
(20) MSR = SSR/số lượng
Độ lệch chuẩn – phân phối mẫu của b1
Sai số chuẩn của ước lượng của b1
Giá trị thống kê kiểm định t
Phương sai hồi quy
biến độc lập
MSR
(21) F =
MSE
http://dichvudanhvanban.com
Trị số kiểm định F
BÀI TẬP 2.11 XÁC ĐỊNH HÀM HỒI QUY PHÙ HỢP
Trường phái kinh tế học dựa trên tổng
cầu lý luận rằng
Năm
% Lạm
phát
% Thất
nghiệp
Khi thất nghiệp trong nền kinh tế giảm
thì khi đó nền kinh tế sẽ dần đạt được
trạng thái toàn dụng. Tại thời điểm này
nền kinh tế được kích cầu do người dân
tiêu dùng nhiều hơn dẫn đến giá cả tăng
do quy luật cung cầu gây ra lạm phát.
2012
10
8
2013
8
10
2014
6
11
2015
10
9
Để kiểm chứng lập luận trên có phù hợp
với Việt Nam không, mẫu quan sát về %
lạm phát và % thất nghiệp cuả nước này
trong giai đoạn 2012-2019
2016
11
7
2017
12
6
2018
7
10
2019
9
10
http://dichvudanhvanban.com
www.hutech.edu.vn
a. Vẻ đồ thị phân tán (Scatter dots) giữa tỷ lệ thất
nghiệp và tỷ lệ lạm phát giai đoạn 2012-2019;
b. Xây dựng phương trình HQUL theo dữ liệu đã cho;
c. Hãy tính SSE, SST, SSR;
d. Hãy tính hệ số xác định r2 và nhận xét/lập luận về độ
phù hợp của mô hình;
e. Hãy tính hệ số tương quan mẫu cho thấy sự tồn tại
mối quan hệ tuyến tính giữa 2 biến X và Y là >0, <0
hay =0?
Lưu ý: phương trình hồi quy E(y) = β0 + β1x
Với β0 gọi là hệ số chặn và β1 gọi là hệ số góc
http://dichvudanhvanban.com
www.hutech.edu.vn
CÂU HỎI ÔN TẬP – BÀI 2
1. Cho biết những điều kiện cần thiết để xác định hàm hồi quy phù hợp.
Nếu có mâu thuẫn thì cần xử lý ra sao?
2. Nêu cách tính hệ số xác định R2 và hệ số xác định R2 hiệu chỉnh?
Giải thích ý nghĩa việc sử dụng hai hệ số này trong thực tế?
3. Tại sao cần xác định sự phù hợp của các hệ số ước lượng được? việc
xác định này căn cứ vào quy luật phân phối xác suất nào trong toán
thống kê?
4. Tại sao cần phải xác định khoảng tin cậy cho các hệ số ước lượng?
Khi xác định khoảng tin cậy, điều gì cần phải biết trước?
5. Vì sao cần phải kiểm định sự phù hợp của mô hình trong khi đã kiểm
định sự phù hợp của hệ số ước lượng và xác định khoảng tin cậy cho
hệ số ước lượng rồi?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI 3 – BÀI TẬP ỨNG DỤNG
HỒI QUY TUYẾN TÍNH TRONG TCNH
Mục tiêu:
• Kết hợp kỹ thuật hồi quy tuyến tính OLS với từng loại dữ
liệu thường xuyên gặp phải trong kinh tế-tài chính;
• Tăng cường khả năng nhận diện dữ liệu chéo, dữ liệu chuỗi
thời gian và dữ liệu bảng thông qua các ví dụ thực tế bằng
dữ liệu mô phỏng.
http://dichvudanhvanban.com
www.hutech.edu.vn
3.1 – BÀI TẬP ỨNG DỤNG DỮ LIỆU CHÉO
Bài 3.1.1: 10 hộ gia đình với 2 biến là BH nhân thọ và thu nhập.
Bài 3.1.2: 10 doanh nghiệp với 2 biến là thuế TNDN và lợi nhuận.
Bài 3.1.3: 10 quốc gia gồm Trung Quốc, Mỹ, Anh, Pháp, Đức, Tây
Ban Nha, Nhật, Canada, Ý và Nga với 2 biến là lao động
và GDP.
Bài 3.1.4: 7 tỉnh thành gồm Hà Nội, Vĩnh Phúc, Bắc Ninh, Hải
Dương, Hải Phòng, Hưng Yên và Thái Bình với 2 biến là
diện tích và năng suất lúa.
Bài 3.1.5: 10 nhân viên công ty Bút bi Bến Nghé với 2 biến là mức
lương và thâm niên.
http://dichvudanhvanban.com
www.hutech.edu.vn
3.2 – BÀI TẬP ỨNG DỤNG DỮ LIỆU CHUỖI THỜI GIAN
Bài 3.2.1: Ảnh hưởng của diện tích lên giá nhà từ 2009-2018.
Bài 3.2.2: Chi phí R&D của Apple cho phát minh từ 2010 đến 2019.
Bài 3.2.3: Suất sinh lợi của thị trường và cổ phiếu của Hoàng Anh
Gia Lai trong 8 tháng.
Bài 3.2.4: Doanh thu và thu nhập bình quân đầu người của FPT từ
2012-2019.
Bài 3.2.5: Tỷ lệ bỏ việc trên 100 người làm viêc và tỷ lệ thất nghiệp ở
Việt Nam từ 2010-2018.
Bài 3.2.6: Giá vàng thế giới và CPI Mỹ từ 2012 đến 2019.
Bài 3.2.7: Mối quan hệ giữa tỷ giá hối đoái USD/VND và nhập khẩu
trong 12 tháng của năm 2018.
Bài 3.2.8: Đánh giá tác động của sự thay đổi của tỷ giá đến biến động
của nhập khẩu tại TQ và Thái lan trong năm 2018.
http://dichvudanhvanban.com
www.hutech.edu.vn
3.3 – BÀI TẬP ỨNG DỤNG DỮ LIỆU BẢNG
Bài 3.3.1: Lạm phát và lãi suất của Việt Nam, Lào và Cambodia từ
2017-2019.
Bài 3.3.2: Chi tiêu dùng và lãi suất của Viêtnam, Trung quốc, và Mỹ
từ 2016-2018.
Bài 3.3.3: Lãi suất và cung tín dụng của BIDV, VCB, và MB Bank từ
2017-2019.
Bài 3.3.4: Mối quan hệ giữa tỷ lệ nợ và chi trả cổ tức của HAGL,
Vinamilk, và FPT từ 2017-2019.
Bài 3.3.5: Mối quan hệ giữa tỷ lệ nợ và ROA của Bibica, Phát Đạt,
và Vinalines từ 2016-2018.
Bài 3.3.6: Mối quan hệ giữa ROA và tỷ lệ đầu tư của Bibica, Phát
Đạt, và Vinalines từ 2017-2019.
http://dichvudanhvanban.com
www.hutech.edu.vn
CÂU HỎI ÔN TẬP
Sau khi đã làm qua tất cả các bài tập mô phỏng tình
huống với 3 dạng dữ liệu chéo, chuỗi thời gian và bảng
bằng phương pháp OLS, hãy cho biết:
(a) Có sự khác biệt trong định lượng giữa 3 loại dữ liệu
hay không?
(b) Giải thích vì sao có sự khác biệt này?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI 4 – Mô hình định giá tài sản VỐN CAPM
Mục tiêu phục vụ ra quyết định đầu tư, qua:
• Cách xác định hệ số βeta - hệ số đo lường rủi
ro hệ thống của các loại cổ phiếu dựa vào lãi
suất phi rủi ro;
• Cách ứng dụng các kỹ thuật kiểm định trong
thống kê và kỹ thuật HQTT OLS để kiểm
định sự phù hợp và kiểm định khoảng tin cậy
đối với hệ số βeta ước lượng;
http://dichvudanhvanban.com
www.hutech.edu.vn
4.1 ƯỚC LƯỢNG β trong CAPM
Mô hình định giá tài sản vốn CAPM
Ri-Rf = β x (Rm-Rf)
Trong đó
= tỷ suất sinh lợi của cổ phiếu (stock i rate of return)
= lãi suất phi rủi ro (risk-free-rate)
= hệ số βeta, độ nhạy của lợi suất cổ phiếu so với lợi suất thị
trường đo lường rủi ro hệ thống của cổ phiếu I so với thị
trường
Rm
= tỷ suất sinh lợi suất thị trường (market rate of return)
Rm-Rf = phần bù thị trường, chênh lệch giữa lợi suất thị trường và
lãi suất phi rủi ro (market premium)
Ri-Rf = phần bù rủi ro của cổ phiếu i, chênh lệch giữa lợi suất cổ
phiếu và lãi suất phi rủi ro (stock premium)
Ri
Rf
β
http://dichvudanhvanban.com
www.hutech.edu.vn
4.1 ƯỚC LƯỢNG β trong CAPM
Tính chất của hệ số βeta:
• Dùng để đánh giá rủi ro hệ thống của một số cổ phiếu
hay toàn bộ danh mục đầu tư;
• Cho thấy mức độ tương quan của biến động của cổ
phiếu hay danh mục đầu tư với biến động chung của thị
trường.
Tính hệ số βeta cổ phiếu của VNM (Cty CP Sữa Vinamilk)
từ 2 chỉ số:
1. Giá cổ phiếu VNM đã được điều chỉnh (adjusted stock price)
2. Chỉ số VN-Index đóng cửa (Index Price-close).
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 4.1
Ngày
04/11/2019
28/10/2019
21/10/2019
14/10/2019
07/10/2019
30/09/2019
23/09/2019
16/02/2019
09/09/2019
03/09/2019
26/08/2019
19/08/2019
12/08/2019
http://dichvudanhvanban.com
Pi
131.30
133.80
133.60
128.60
129.10
129.70
124.50
147.37
128.83
118.70
111.28
112.82
112.34
www.hutech.edu.vn
Pm
1,022.43
996.48
983.56
993.57
983.09
996.56
985.75
994.43
951.59
921.03
916.06
918.12
925.53
CÁC CHỈ SỐ CẦN XÁC ĐỊNH
Dựa theo mô hình CAPM, tính:
1. Tỷ suất sinh lợi cổ phiếu: Ri = [(Pit-Pit-1) : Pit-1] x 100%
2. Tỷ suất sinh lợi thị trường: Rm = [(Pmt-Pmt-1) : Pmt-1] x 100%
3. Rm – Rf: Phần bù thị trường (tức chênh lệch lợi suất thị
trường và lãi suất phi rủi ro)
4. Ri – Rf: Phần bù rủi ro cổ phiếu (tức chênh lệch giữa lợi
suất cổ phiếu i và lãi suất phi rủi ro)
Biết lãi suất phi rủi ro hiện tại là Rf = 5%
http://dichvudanhvanban.com
www.hutech.edu.vn
Bảng 4.2
Ngày
Ri
Rm
Rf
Ri-Rf
Rm-Rf
04/11/2019
-1.87
2.6
5
-6.87
-2.4
28/10/2019
0.15
1.31
5
-4.85
-3.69
21/10/2019
3.89
-1.01
5
-1.11
-6.01
14/10/2019
-0.39
1.07
5
-5.39
-3.93
07/10/2019
-0.46
-1.35
5
-5.46
-6.35
30/09/2019
-4.18
1.1
5
-0.82
-3.9
23/09/2019
2.47
-0.42
5
-2.53
-5.42
16/09/2019
-0.78
1.62
5
-5.78
-3.38
09/09/2019
0.41
-0.54
5
-4.59
-5.54
03/09/2019
2.9
-0.36
5
-2.1
-5.36
26/08/2019
-3.52
0.19
5
-8.52
-4.81
19/08/2019
3.57
0.59
5
-1.43
-4.41
12/08/2019
-1.15
0.22
5
-6.15
-4.78
http://dichvudanhvanban.com
www.hutech.edu.vn
CÁC CHỈ SỐ CẦN XÁC ĐỊNH
Mô hình CAPM sẽ được chuyển thành phương trình HQ sau:
Y = β0 + β1X + ê (1)
Y = -0.538 + 1.856X + ê (1)
Rm – Rf: Phần bù thị trường là biến độc lập
Ri – Rf: Phần bù rủi ro cổ phiếu là biến phụ thuộc
β:
hệ số beta rủi ro của cổ phiếu
α:
hệ số chặn của mô hình
e:
sai số ngẫu nhiên của mô hình
Hàm hồi quy tuyến tính để xác định hệ số góc beta có dạng:
Y = α +βX + e
http://dichvudanhvanban.com
www.hutech.edu.vn
XÁC ĐỊNH HÀM HQTT
Ta có: X = -4.697; Ῡ = -4.558; Ʃx2 = Ʃ(xi-X)2 = 178.343
Ʃxiyi = Ʃ(xi-X) x (Yi-Ȳ) = 152.634
β = Ʃxiyi / Ʃx2 = Y = 152.634 / 178.343 = 0.856
Ῡ = α +βX => α = Ῡ- βX= -4.588-[0.856x(-4.697)]=-0.538
Hàm hồi quy tuyến tính Y = -0.538 + 0.856X + ê
Ý nghĩa của các hệ số ước lượng:
• Hệ số beta: nếu phần bù rủi ro của thị trường tang 1% thì phần bù rủi
ro cổ phiếu tăng thêm 0.856%
• Nếu phần bù rủi ro của thị trường = 0 thì cổ phiếu trung bình ở mức 0.538%
http://dichvudanhvanban.com
www.hutech.edu.vn
Ý nghĩa các giá trị HỆ SỐ XÁC ĐỊNH
Các giá trị hệ số xác định:
ESS = (Ŷ-Ῡ)2 = 130.631
RSS = Ʃê2 = 364.767
TSS = Ʃyi2 = 496.4
Hệ số xác định R2 = ESS/TSS = 130.631/496.4 = 0.263
Giải thích
Phần bù rủi ro do thị trường về trung bình giải thích được
26.3% sư thay đổi của phần bù rủi ro cổ phiếu VNM, 73.7%
được giải thích bỡi các yếu tố khác ngoài mô hình CAPM
http://dichvudanhvanban.com
www.hutech.edu.vn
Ý NGHĨA CÁC HỆ SỐ HỒI QUY
Hàm hồi quy thuyến tính:
Y = -0.538 + 0.856X + ê
Ý nghĩa của các hệ số ước lượng
• Hệ số βeta: nếu phần bù rủi ro thị trường tăng thêm 1% cổ
phiếu trung bình sẽ tăng 0.856%
• Nếu phần bù rủi ro thị trường bằng 0 thì phần bù rủi ro cổ
phiếu trung bình ở mức -0.538%
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI TẬP MÔ HÌNH CAPM
Ngày
5/4/21
2/4/21
1/4/21
31/3/21
30/3/21
29/3/21
26/3/21
25/3/21
24/3/21
23/3/21
22/3/21
19/3/21
18/3/21
17/3/21
http://dichvudanhvanban.com
Giá VNM
102.60
102.70
101.00
98.40
99.20
99.00
97.40
98.50
98.70
100.20
100.80
101.70
102.50
100.50
Chỉ số VN-Index
1236.05
1224.45
1216.10
1191.44
1186.36
1175.68
1162.21
1163.10
1161.81
1190.05
1194.05
1200.94
1186.09
1179.90
www.hutech.edu.vn
4.2 KIỂM ĐỊNH SỰ PHÙ HỢP
KĐ sự phù hợp của Hệ số ước lượng với mức ý nghĩa 5%
- Ta có:
2
𝜎 =
𝜎2
𝛴 𝒆𝟐
𝑛−𝑘
𝜎2
= 𝛴x𝟐
Se (
𝛽 )
364.767
7.295
52−2
7.295
= 0.041
178.343
=
=
=
= 0.041= 0.202
= 𝜎2
Se(^𝛼 ) =
𝛽2
X2
*
𝑛
Se(
𝛽
=
)
1325.52
*0.202
52
- Kiểm định hệ số góc H0: 𝛽 = 𝛽* = 0
𝑡=
𝛽− 𝛽∗
0.856−0
=
Se
0.202
= 4.232
(𝛽)
52−2
Ta có: 𝑡 > 𝑡𝑎𝑛−𝑘 = 𝑡0.025
2
http://dichvudanhvanban.com
www.hutech.edu.vn
= 1.021
Do: 4.232 > 2.009 -> Nằm trong vùng bác bỏ -> bác bỏ giả thiết H0: 𝛽 = 0
- Kiểm định hệ số chặn H0: ∝ = ∝ ∗ = 0
𝑡=
∝− ∝∗
0.538−0
=
Se
1.021
= -0.5271
(∝)
Ta có: 𝑡 > 𝑡𝑎𝑛−𝑘 = 𝒕52−2
0.025
2
Do: 0.5271 < 2.009 -> Nằm ngoài vùng bác bỏ -> không có cơ sở để
bác bỏ giả thiết H0: 𝛽 = 0
Do đó, ∝ không có ý nghĩa thống kê với mức ý nghĩa 5%
http://dichvudanhvanban.com
www.hutech.edu.vn
4.2 KIỂM ĐỊNH SỰ PHÙ HỢP
Ước lượng khoảng tin cậy cho HS góc và HS chặn với MYN 5% (t= ±2.009)
- Hệ số góc:
𝛽− 𝛽∗
=
Se
2.009
𝛽− 𝛽∗
=
Se
−2.009
(𝛽)
0.856− 𝛽∗
0.202
0.856− 𝛽∗
0.202
= 2.009
= −2.009
𝛽∗ = 0.45
𝛽∗ = 1.26
(𝛽)
Với độ tin cậy 95% (mức ý nghĩa 5% hay xác suất mắc sai lầm 5%)
thì hệ số 𝛽∗ có thể dao động trong khoảng từ 0.45 đến 1.26
- Hệ số chặn
∝− ∝ ∗
=
Se
2.009
∝− ∝ ∗
=
Se
−2.009
(𝛽)
(𝛽)
0.538− 𝛽∗
1.021
0.538− 𝛽∗
1.021
= 2.009
∝ ∗ = -2.59
∝ ∗ = 1.51
= −2.009
Với độ tin cậy 95% (mức ý nghĩa 5% hay xác suất mắc sai lầm 5%)
thì hệ số ∝ ∗ có thể dao động trong khoảng từ -2.59 đến 1.51
http://dichvudanhvanban.com
www.hutech.edu.vn
4.2 KIỂM ĐỊNH SỰ PHÙ HỢP
KĐ sự phù hợp của mô hình với xác suất mắc sai lầm 5%
- Kiểm định H0 : R2 = 0; H1 : R2 > 0
F=
R2
0.263 x 52 - 2
x n-k =
1-R2
1-0.263
k-1
2-1
F = 17.843
1,50
Ta có: F > F0.05
Do: 17.843 > 4.034 -> Nằm trong vùng bác bỏ ->
bác bỏ giả thiết H0: R2= 0
Do đó, mô hình phù hợp với dữ liệu nghiên cứu với mức ý nghĩa
5%
http://dichvudanhvanban.com
www.hutech.edu.vn
CÂU HỎI ÔN TẬP – Bài 4
1. Trình bày mô hình định giá tài sàn vốn CAPM?
2. Phân biệt phần bù rủi ro thị trường và phần bù rủi ro cổ phiếu?
3. Nêu ý nghĩa của hệ số beta trong mô hình định giá tài sản
vốn?
4. Trình bày cách xác định lợi tức cổ phiếu và lợi tức thị trường
trong mô hình định giá tài sản vốn?
5. Trên thực tế để xác định mô hình định giá tài sản vốn cần phải
xác định các yếu tố nào?
http://dichvudanhvanban.com
www.hutech.edu.vn
BÀI 5 – TÍNH KHÔNG CHỆCH CỦA OLS
Mục tiêu:
• Nắm vững tình huống, điều kiện nào để ứng
dụng một cách hiệu quả kết quả của kỹ thuật hồi
quy tuyến tính OLS với kết quả ước lượng trong
những trường hợp nào;
• Từ đó, các kết quả dự báo, ước lượng tác động
của một yếu tố lên một yếu tố khác trong lĩnh
vực kinh tế nói chung, tài chính ngân hàng nói
riêng đạt độ tin cậy cao hơn và thuyết phục hơn;
http://dichvudanhvanban.com
CÂU HỎI ÔN TẬP – Bài 5
1. Tại sao phải có giả định về sự tuyến tính trong kỹ thuật hồi
quy OLS?
2. Tại sao tồn tại giả định về sự ngẫu nhiên trong phép chọn
mẫu?
3. Tại sao phải đặt giả định biến giải thích phải có biến động?
4. Tại sao cần phải thoả mãn giả định trung bình phần dư = 0?
5. Tại sao có giả định phương sai sai số không được thay đổi
theo thời gian hay theo đối tượng nghiên cứu hay theo cả thời
gian và cả đối tượng nghiên cứu?
http://dichvudanhvanban.com
www.hutech.edu.vn
Download