PHƯƠNG PHÁP ĐỊNH LƯỢNG TRONG TÀI CHÍNH NGÂN HÀNG FIN 139 Ngành: Tài chính Ngân hàng Khoa: Tài chính – Thương mại L/O/G/O http://dichvudanhvanban.com http://dichvudanhvanban.com www.hutech.edu.vn THÔNG TIN GIẢNG VIÊN Họ và tên: TS. LÊ ĐỨC THẮNG Email: ld.thang@hutech.edu.vn Địa chỉ: 475A Điện Biên Phủ - P25 – Quận Bình Thạnh – TP.HCM Mobil: 0936128833 http://dichvudanhvanban.com www.hutech.edu.vn PHƯƠNG PHÁP ĐÁNH GIÁ Quá trình học và kiểm tra giữa kỳ: 50% - Bài kiểm tra số 1 - Bài kiểm tra số 2 - Điểm danh chuyên cần Thi hết học phần: 50%, hình thức thi: tự luận, thời lượng thi: 90 phút. Sinh viên không được tham khảo tài liệu (Lưu ý: Điểm thi cuối kỳ phải lớn hơn 1 mới đạt yêu cầu) http://dichvudanhvanban.com www.hutech.edu.vn MỤC TIÊU HỌC PHẦN - Kiến thức: Phân tích và ứng dụng được những kiến thức cơ bản về kỹ thuật hồi quy tuyến tính với phương pháp bình phương nhỏ nhất OLS (Ordinary Least Squared) cùng các kiểm định liên quan. Giúp người học tham khảo và vận dụng trong công tác phân tích định lượng trong lĩnh vực kinh tế, tài chính ngân hàng. - Kỹ năng: Tổ chức và vận dụng kiến thức để đánh giá và phân tích định lượng vấn đề kinh tế và đưa ra khuyến nghị về đầu tư kinh doanh cho doanh nghiệp. - Năng lực tự chủ và trách nhiệm: Có ý thức tự giác trong việc chuẩn bị bài học cho riêng mình. Có trách nhiệm trong việc phối hợp cùng giảng viên và sinh viên trong lớp để hoàn thành bài học với hiệu quả cao nhất. http://dichvudanhvanban.com www.hutech.edu.vn MÔ TẢ HỌC PHẦN Phương pháp định lượng trong Tài chính Ngân hàng là học phần thuộc khối kiến thức chuyên ngành trong chương trình khung đào tạo ngành Tài chính ngân hàng, cung cấp cho sinh viên những kiến thức chuyên sâu về dữ liệu tài chính, các kỹ thuật và phương pháp định lượng ứng dụng trong lĩnh vực tài chính – ngân hàng. Giúp sinh viên có được những kiến thức nền tảng về định lượng trong lĩnh vực tài chính – ngân hàng. Bên cạnh đó, môn học này còn góp phần giúp sinh viên phát triển khả năng tư duy, giải quyết vấn đề và giúp cho sinh viên có khả năng tính toán, đo lường được rủi ro trong đầu tư trên thị trường tài chính. http://dichvudanhvanban.com www.hutech.edu.vn CONTENT-Nội dung học phần 1 CẤU TRÚC DỮ LIỆU TCNH – Data structure 2 HỒI QUY TUYẾN TÍNH – Linear Regression 3 ỨNG DỤNG KỸ THUẬT HỒI QUY TUYẾN TÍNH 4 MÔ HÌNH ĐỊNH GIÁ TÀI SẢN VỐN - CAPM 5 TÍNH KHÔNG CHÊNH LỆCH CỦA OLS http://dichvudanhvanban.com www.hutech.edu.vn - Phương pháp định lượng trong tài chính ngân hàng, HUTECH, 2019. - Đinh Phi Hổ, Võ Văn Nhị & Trần Phước, (2018). Nghiên cứu định lượng trong kế toán – kiểm toán. - Đinh Phi Hổ (2012), Phương pháp nghiên cứu định lượng & những nghiên cứu thực tiễn trong phát triển kinh tế - Nông nghiệp, Nxb. Phương Đông. - Nguyễn Quang Dong & Nguyễn Thị Minh, (2013). Giáo trình Kinh tế lượng. NXB Đại học Kinh tế Quốc Dân. - Nguyễn Văn Tùng (2014). Thực hành kinh tế lượng cơ bản với Eviews. NXB Kinh tế TP. HCM. - Nguyễn Đình Thọ (2013). Phương pháp nghiên cứu khoa học trong kinh doanh. NBX Tài Chính. http://dichvudanhvanban.com BÀI 1 – CẤU TRÚC DỮ LIỆU Quantitative analysis & data structure in BF Mục tiêu: • Xác định các dạng dữ liệu trong tài chính – ngân hàng • Sắp xếp dữ liệu và đưa dữ liệu thực tế về đúng định dạng để phân tích • Phân biệt ưu điểm của từng loại dữ liệu http://dichvudanhvanban.com www.hutech.edu.vn 1.1 PHÂN LOẠI Tính chất Loại biến 1. ĐẶC ĐIỂM 1.1 Định tính Ý nghĩa Sử dụng cho biến định tính (giới tính, trình độ học vấn, nghề nghiệp) 1.2 Định lượng Sử dụng cho biến định lượng thông qua quá trình cân đo đong đếm (tuổi, vv.) 2. NGUỒN GỐC 2.1 DL sơ cấp Do bản thân người NC thu thập chưa qua xử lý (DL được DN công bố do chính DN/nhà NC thu thập) 2.2 DL thứ cấp Được tổng hợp từ các nguồn DL sơ cấp hoặc DL đã có sẵn 3. HÌNH THỨC TRÌNH BÀY http://dichvudanhvanban.com 3.1. DL chéo 3.2. DL chuỗi thời gian 3.3. DL bảng Phân loại dữ liệu Đặc điểm dữ liệu Dữ liệu định tính sử dụng cho biến định tính thể hiện tính chất của đơn vị hoặc phần tử khảo sát. Ví dụ: giới tính, trình độ học vấn, nghề nghiệp. Dữ liệu định lượng sử dụng cho biến định lượng thể hiện bằng con số cụ thể thông qua quá trình cân đo đong đếm. Ví dụ: trọng lượng hay tuổi. http://dichvudanhvanban.com Phân loại dữ liệu Nguồn gốc dữ liệu http://dichvudanhvanban.com Dữ liệu sơ cấp là dữ liệu do bản thân người nghiên cứu thu thập chưa qua xử lý hoặc đã xử lý nhưng vẫn ở trạng thái gốc của dữ liệu. Dữ liệu thứ cấp là dữ liệu được tổng hợp từ các nguồn dữ liệu sơ cấp hoặc dữ liệu đã sẵn có. PHÂN LOẠI Định lượng DỮ LIỆU CHÉO Biến phụ thuộc Biến độc lập Định lượng DL CHUỖI THỜI GIAN Dữ liệu bảng DỮ LIỆU BẢNG Định tính Biến phụ thuộc Biến độc lập http://dichvudanhvanban.com Định tính Biến độc lập Biến phụ thuộc Định lượng Định tính www.hutech.edu.vn a. DỮ LIỆU CHÉO (cross-sectional data) Thể hiện thông tin về nhiều đối tượng vào một thời điểm nhất định nên rất phù hợp với đề tài nghiên cứu khảo sát Loại dữ liệu này cho chúng ta thấy rõ sự khác biệt giữa các chủ thể nghiên cứu http://dichvudanhvanban.com www.hutech.edu.vn Bảng 1.1 Thống kê giá trị SX CN&TM các TP lớn năm 2019 (dữ liệu chéo) Thành phố Giá trị sản xuất thương mại Giá trị sản xuất công nghiệp Hà Nội 1244 2345 Hồ Chí Minh 1242 2436 Đà Nẵng 1222 3454 Hải Phòng 1111 2333 Công Thành & Đức Thắng (2019) http://dichvudanhvanban.com www.hutech.edu.vn Bảng 1.2 Số liệu DN niêm yết trên sàn GDCKVN năm 2019 (dữ liệu chéo) Số TT Mã CK 1 AAA 1000 10 1000 2 BBB 1100 20 2000 3 CCC 2100 30 1400 http://dichvudanhvanban.com Doanh thu Lợi nhuận www.hutech.edu.vn Quy mô DỮ LIỆU CHÉO Ưu điểm Phù hợp vấn đề nghiên cứu quy mô lớn DỮ LIỆU Liên quan đến cá nhân, doanh nghiệp, tỉnh thành, quốc gia CHÉO Có thể thực hiện nhanh chóng, ít tốn kém http://dichvudanhvanban.com www.hutech.edu.vn DỮ LIỆU CHÉO Khuyết điểm Thiếu phân tích chi tiết như DL chuỗi thời gian DỮ LIỆU CHÉO http://dichvudanhvanban.com Không so sánh quá khứ với tương lai nên thường giảm hiệu lực của kết quả nghiên cứu www.hutech.edu.vn 1.3 DỮ LIỆU CHUỖI THỜI GIAN (times series data) Là chuỗi các điểm dữ liệu bao gồm các phép đo liên tiếp được thực hiện từ cùng 1 nguồn trong một khoảng thời gian nhất định, 1 chủ thể nhất định; Mục đích để nhận dạng và tập hợp các yếu tố, những biến đổi theo thời gian mà có ảnh hưởng đến giá trị của biến quan sát; Là thông tin của một hay nhiều biến được thu thập ở các thời điểm khác nhau (năm, quý, tháng, tuần, ngày, giờ, phút giây) Có 2 loại time series data (regular time serie & event) • Chuỗi thời gian thông thường -> số liệu • Chuỗi thời gian bất thường -> sự kiện http://dichvudanhvanban.com www.hutech.edu.vn Bảng 1.3 Dữ liệu CPI & lãi suất Việt Nam theo tháng trong năm 2019 Tháng http://dichvudanhvanban.com 1 CPI (index) 111.0 Lãi suất (%) 6.5 2 113.4 7.2 3 113.1 7.0 4 113.7 7.5 5 114.5 8 www.hutech.edu.vn Bảng 1.4 Thống kê số liệu vĩ mô của Newzealand từ năm 2017-2019 Năm Quốc gia GDP Lạm phát Dân số 2017 Newzealand 100 0.1 1000 2018 Newzealand 110 0.2 2000 2019 Newzealand 120 0.3 3000 http://dichvudanhvanban.com www.hutech.edu.vn DỮ LIỆU CHUỖI THỜI GIAN (times series data) Ưu điểm DỮ LIỆU CHUỖI THỜI GIAN http://dichvudanhvanban.com Tùy đối tượng nghiên cứu (quốc gia, thành phố, doanh nghiệp, cá nhân) Có thể xác định được số liệu thống kê thu thập từ cơ quan, bộ phận, hay cá nhân www.hutech.edu.vn ỨNG DỤNG DỮ LIỆU CHUỖI THỜI GIAN Time series data có tính khả dụng cao trong lưu trữ dữ liệu, truy vấn liên tục, tổng hợp thời gian trong các ứng dụng sau: • Theo dõi hoạt động kinh doanh (e-commerce) • Hệ thống giao dịch tài chính (chứng khoán, tiền điện tử) • Công cụ kinh doanh thông minh (theo dõi các số liệu quan trọng và sức khỏe của doanh nghiệp) • Giám sát dịch vụ ngân hàng, vv • Theo dõi phần mềm chấm công, vv http://dichvudanhvanban.com www.hutech.edu.vn c.DỮ LIỆU BẢNG (panel data) Là kết hợp của dữ liệu chéo và chuỗi thời gian; thí dụ DL chéo 3 nước VN, TL, MA trong chuỗi thời gian 4 năm (2017-20) vậy bảng có 3 x 4 = 12 dòng quan sát Vậy dự liệu bảng có qui mô về thời gian lẫn không gian; có liên quan đến doanh nghiệp, tỉnh thành, quốc gia -> kỹ thuật ước lượng Khi NC quan sát lập đi lập lại của các đơn vị chéo, DLB phù hợp với các NCKH sự động thái thay đổi theo thời gian của các đơn vị chéo này Có thể phát hiện và đo lường tốt hơn các tác động mà NCV không thể quan sát được trong DL chuỗi thời gian hay DL chéo http://dichvudanhvanban.com www.hutech.edu.vn Bảng 1.5 tổng hợp GDP- dân số 2016-2019 STT Năm Quốc gia GDP Dân số 1 2016 Vietnam 70 90 2 2017 Vietnam 80 92 3 2018 Vietnam 76 93 4 2019 Vietnam 75 95 5 2016 Thailand 91 170 6 2017 Thailand 85 175 7 2018 Thailand 90 180 8 2019 Thailand 95 185 9 2016 Malaysia 85 200 10 2017 Malaysia 87 208 11 2018 Malaysia 82 215 12 2019 Malaysia 88 250 http://dichvudanhvanban.com www.hutech.edu.vn Bảng 1.6 Thống kê số liệu DN niêm yết trên sàn GDCK từ năm 2017-2019 Mã CK Năm Doanh thu AAA 2017 1000 300 500 AAA 2018 1500 500 700 AAA 2019 2100 600 1000 BBB 2017 1800 200 1000 BBB 2018 2500 700 1500 BBB 2019 1900 -600 1000 http://dichvudanhvanban.com www.hutech.edu.vn Lợi nhuận Quy mô Kỹ thuật ước lượng dữ liệu bảng Ưu điểm Kết hợp DL CHUỖI THỜI GIAN & DL CHÉO http://dichvudanhvanban.com Xem xét tính dị biệt (không đồng nhất) qua đánh giá các biến số theo đặc thù của từng cá nhân Có thể kết hợp DLCTG -> nhiều thông tin đa dạng hơn, ít có hiện tượng đa cộng tuyến giữa các biến số, nhiều bậc tự do và hiệu quả hơn www.hutech.edu.vn BÀI TẬP Hãy nêu rõ mỗi biến sau đây là định tính hay định lượng và cho biết thang đo của từng biến a. Doanh số hàng năm b. Lợi nhuận trên cổ phần c. Phương thức thanh toán tiền mặt d. Tuổi của bạn e. Bạn là nam hay nữ f. Bạn học ngành này được bao lâu rồi? http://dichvudanhvanban.com www.hutech.edu.vn CÂU HỎI ÔN TẬP – BÀI 1 1. Thế nào là dữ liệu định tính và dữ liệu định lượng? Phân biệt hai loại dữ liệu trên? Nêu ví dụ. 2. Thế nào là dữ liệu sơ cấp và thứ cấp? Phân loại hai loại dữ liệu trên? Nêu ví dụ. 3. Định nghĩa dữ liệu chéo? Ưu điểm của dữ liệu chéo? Cho ví dụ minh họa. 4. Định nghĩa dữ liệu chuỗi thời gian? Ưu điểm của dữ liệu chuỗi thời gian? Cho ví dụ minh họa. 5. Định nghĩa dữ liệu bảng? Ưu điểm của dữ liệu bảng? Cho ví dụ minh họa. http://dichvudanhvanban.com www.hutech.edu.vn PHẦN THỰC HÀNH 1. Thảo luận nhóm để đưa ra các đề tài có liên quan đến chủ đề lớp “LÀM THẾ NÀO ĐỂ PHÁT TRIỂN NGÀNH TÀI CHÍNH NGÂN HÀNG’ 2. Chọn chủ đề nhóm, Xác định phương pháp thu thập dữ liệu và loại dữ liệu cần thu thập, lên kế hoạch thu thập dữ liệu; 3. Xây dựng mô hình nghiên cứu định lượng; 4. Thiết kế bảng câu hỏi; 5. Hoàn chỉnh bảng câu hỏi; http://dichvudanhvanban.com www.hutech.edu.vn CÁCH CHỌN CHỦ ĐỀ NHÓM 1. Chủ đề lớp “LÀM THẾ NÀO ĐỂ PHÁT TRIỂN NGÀNH TÀI CHÍNH NGÂN HÀNG’ 2. Mỗi nhóm viên đưa ra 1+ vấn đề có liên quan đến chủ đề lớp 3. Sau đó chọn ra 1 chủ đề nhóm có thể thu thập dữ liệu tốt nhất và thích làm nhất, 4. Xác định phương pháp thu thập dữ liệu và loại dữ liệu cần thu thập, lên kế hoạch thu thập dữ liệu; 5. Thiết kế bảng câu hỏi; http://dichvudanhvanban.com www.hutech.edu.vn LÀM THẾ NÀO ĐỂ PHÁT TRIỂN NGÀNH TCNH 1. Nghiên cứu & khảo sát nhu cầu ít sử dụng dịch vụ “TÍN DỤNG” của (100) sinh viên Hutech 2. Sự không hài lòng của khách hàng trong lãi suất tiền gửi của Vietinbank 3. Ngân hàng VCM chưa đẩy mạnh dịch vụ thanh toán không dùng tiền mặt 4. Khách hàng của khối NHTPCP tại TPHCM chưa được khuyến khích sử dụng ibanking một cách rộng rãi 5. Sự hài lòng về việc phục vụ của khách hàng đối với nhân viên giao dịch của Techcombank http://dichvudanhvanban.com www.hutech.edu.vn PHƯƠNG PHÁP THU THẬP DỮ LIỆU Có 2 phương pháp thu thập dữ liệu: • phương pháp bàn giấy và • phương pháp hiện trường 1. Các dữ liệu sơ cấp, thứ cấp có sẵn mà người NC tiếp cận gián tiếp với đối tượng cần NC để thu thập qua web, email, điện thoại, máy ghi hình nối mạng, vv. 2. Phương pháp hiện trường bao gồm nhiều hình thức khác nhau để thu thập dữ liệu sơ cấp. Đó là các phương pháp: http://dichvudanhvanban.com www.hutech.edu.vn PHƯƠNG PHÁP THU THẬP DỮ LIỆU • Phương pháp quan sát • Phương pháp phỏng vấn • • • • • Phỏng vấn trực tiếp cá nhân (personal interview) Phỏng vấn tại nơi công cộng (public interview) Phỏng vấn nhóm tập trung (focus-group-interview) Phỏng vấn qua điện thoại (telephone interview) Phỏng vấn qua thư (mailing interview-questionnaire) • Phương pháp thực nghiệm • Khám phá mối liên hệ nhân quả giữa 2 đại lượng • Kiểm chứng một giả thiết nào đó • Thử nghiệp sản phẩm mới • Thử nghiệm các chiến lược marketing http://dichvudanhvanban.com www.hutech.edu.vn HƯỚNG DẪN KHẢO SÁT Phỏng vấn trực tiếp Điều tra bảng hỏi http://dichvudanhvanban.com Phương pháp khảo sát www.hutech.edu.vn Quan sát THIẾT KẾ BẢNG CÂU HỎI • Questionaire là một tập hợp câu hỏi được thiết kế để khai thác thông tin, sẽ được cung cấp bởi các đối tượng tham gia khảo sát. • Bảng hỏi có thể được thu thập qua phỏng vấn trực tiếp hay qua bảng hỏi dạng viết • Là công cụ nghiên cứu, điều tra phổ biến nhất http://dichvudanhvanban.com www.hutech.edu.vn TIÊU CHÍ BẢNG CÂU HỎI TỐT • Ngôn ngữ rõ ràng (phù hợp với khả năng, trình độ của người tham gia khảo sát) • Sự đơn nhất trong mục tiêu (mỗi câu hỏi NÊN có một câu trả lời) • Tập hợp các câu hỏi phải đáp ứng được mục tiêu của cuộc điều tra • Đúng câu chữ, ngữ pháp, cấu trúc http://dichvudanhvanban.com www.hutech.edu.vn LOẠI CÂU HỎI ĐÓNG • Câu hỏi thang đo xếp hạng : Câu hỏi yêu cầu người trả lời lựa chọn mức độ của một thuộc tính nhất định. • Thang đo phổ biến nhất là thang Likert (1-5 hoặc 1-7) • VD: Bạn đánh giá mức độ hài lòng sau khi sử dụng dịch vụ của chúng tôi như thế nào? 1 2 3 Hoàn toàn không hài lòng http://dichvudanhvanban.com 4 5 Hoàn toàn hài lòng www.hutech.edu.vn CÔNG CỤ XÂY DỰNG BẢNG HỎI http://dichvudanhvanban.com www.hutech.edu.vn MẪU KHÔNG CÓ TIÊU ĐỀ Tên bài khảo sát Câu hỏi mở - câu trả lời yêu cầu diễn giải nhiều hơn Mô tả, giới thiệu ngắn gọn người khảo sát, và mục đích của cuộc khảo sát Câu hỏi một lựa chọn Đặt câu hỏi Tạo lưới để người trả lời chọn đáp án Lựa chọn câu trả lời phù hợp http://dichvudanhvanban.com Câu hỏi mở - yêu cầu trả lời ngắn với những cụm từ, keywords www.hutech.edu.vn Câu hỏi nhiều lựa chọn, có thể thêm câu trả lời khác Có thể chọn 1 hay nhiều lựa chọn, dựa trên câu trả lời, có thể di chuyển đến các section khác của biểu mẫu Có thể chọn câu trả lời theo thang đo (0-10) Có thể đặt tiêu đề cho mỗi mức đo THỐNG KÊ TRONG KINH TẾ Là hệ thống các phương pháp dùng để • Thu thập, xử lý và phân tích các con số (mặt lượng) của hiện tượng kinh tế – xã hội, tài chính-ngân hàng • Để tìm hiểu bản chất và tính quy luật của số liệu (mặt chất) trong điều kiện thời gian và không gian cụ thể Ngô Thị Thuận (2006) http://dichvudanhvanban.com www.hutech.edu.vn THỐNG KÊ MÔ TẢ & SUY DIỄN Có 2 loại thống kê: MÔ TẢ VÀ SUY DIỄN • Thống kê mô tả là việc thu thập, sắp xếp dữ liệu và tính toán số liệu một cách khoa học nhằm mô tả đặc trưng của đối tượng nghiên cứu qua bảng biểu, đồ thị • Thống kê suy diễn là việc dùng những phương pháp luận để phân tích, đưa ra nhận xét, đánh giá sâu sắc về đối tượng nghiên cứu. http://dichvudanhvanban.com www.hutech.edu.vn THỐNG KÊ MÔ TẢ Độ tuổi của đối tượng khảo sát Tuổi Tần số (người) Tần suất (%) Từ 18 đến 20 tuổi 71 14.2 Từ 21 đến 30 tuổi 145 29 Từ 31 đến 40 tuổi 99 19.8 Từ 41 đến 50 tuổi 43 8.6 Từ 51 đến 60 tuổi 103 20.6 Trên 60 tuổi 39 7.8 Tổng 500 100 http://dichvudanhvanban.com www.hutech.edu.vn ĐỒ THỊ THỐNG KÊ MÔ TẢ Thống kê mô tả được trình bày dưới dạng đồ thị http://dichvudanhvanban.com www.hutech.edu.vn THỐNG KÊ SUY DIỄN • Nhóm lớn các phần tử trong một nghiên cứu được gọi là tổng thể và nhóm nhỏ được gọi là mẫu; • TỔNG THỂ là tổng hợp tất cả các phần tử được quan tâm trong một nghiên cứu • MẪU là tập hợp con của tổng thể • Quá trình tiến hành khảo sát để thu thập dữ liệu trên toàn bộ tổng thể gọi là ĐIỀU TRA TỔNG THỂ • quá trình tiến hành khảo sát để thu thập dữ liệu trên một mẫu được gọi là điều tra mẫu • Thống kê SUY DIỄN sử dụng dữ liệu từ một MẪU ƯỚC LƯỢNG và kiểm định giả thiết về các đặc tính của một tổng thể http://dichvudanhvanban.com www.hutech.edu.vn BÀI 2 – HỒI QUY TUYẾN TÍNH Bằng phương pháp bình phương nhỏ nhất Mục tiêu: • Nắm vững kỹ thuật hồi quy tuyến tính sao cho tổng bình phương sai số phải nhỏ nhất; • Vận dụng kỹ thuật HQ-OLS để xác định các mối quan hệ trong kinh tế-tài chính; • Dự báo, ước lượng các biến số trong kinh tế-tài chính để giúp nhà đầu tư ra quyết định. • Xác định nguyên nhân thay đổi của biến số trong kinh tế-tài chính; kiểm định giả thiết của bên thứ ba http://dichvudanhvanban.com www.hutech.edu.vn BÀI 2 – NỘI DUNG Mô hình hồi quy & phương trình hồi quy Phương trình hồi quy ước lượng Phương pháp bình phương nhỏ nhất Thước đo độ phù hợp của phương trình hồi quy Kiểm định ý nghĩa của mô hình HQTT đơn giản http://dichvudanhvanban.com www.hutech.edu.vn 2.1MÔ HÌNH HỒI QUY & PHƯƠNG TRÌNH HỒI QUY CoffeeHouse là chuỗi coffee shops thường đặt trong các khu vực sầm uất như gần các trường đại học. Các nhà quản lý cho rằng • Doanh số bán hàng quý của các cửa hàng (ký hiệu y tức biến phụ thuộc) có liên hệ thuận đến số lượng sinh viên (ký hiệu x tức biến độc lập) • => CH ở vị trí gần khu vực có số lượng SV lớn mang lại lợi nhuận cao và ngược lại • Sử dụng mô hình hồi quy để xây phương trình hồi quy cho thấy biến phụ thuộc Y liên quan đến biến độc lập X http://dichvudanhvanban.com www.hutech.edu.vn MÔ HÌNH HỒI QUY & PHƯƠNG TRÌNH HỒI QUY MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN GIẢN Y = β0 + β1x + ε (1) ß0 và ß1 : là tham số của mô hình ε : tức epsilon là một biến ngẫu nhiên hay là sai số; sai số thể hiện biến thiên của y PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH ĐƠN GIẢN E(y) = β0 + β1x (2) Đồ thị của phương trình HQTT là một đường thẳng http://dichvudanhvanban.com www.hutech.edu.vn CÁC DẠNG ĐƯỜNG HỒI QUY A-Liên hệ tuyến tính đồng biến E(y) Tung độ gốc ß0 http://dichvudanhvanban.com B-Liên hệ tuyến tính nghịch biến Tung E(y) độ gốc ß0 Hệ số góc độ dốc ß1>0 Hệ số góc độ dốc ß1<0 C-không có liên hệ tuyến tính E(y) Tung độ gốc ß0 www.hutech.edu.vn Hệ số góc độ dốc ß1=0 Đường hồi quy 2.2 PHƯƠNG TRÌNH HỒI QUY ƯỚC LƯỢNG MÔ HÌNH HQ TUYẾN TÍNH ĐƠN GIẢN ƯỚC LƯỢNG ŷ = b0 + b1x (3) Đồ thị của phương trình HQTT đơn giản ước lượng gọi đường hồi quy ước lượng b0 : là tung độ gốc b1 : là độ dốc ŷ : là ước lượng điểm cho E(y) Trị số b0 và b1 được tính toán bỡi phương pháp bình phương nhỏ nhất http://dichvudanhvanban.com QUÁ TRÌNH ƯỚC LƯỢNG TRONG HỒI QUY TUYẾN TÍNH ĐƠN GIẢN Mô hình HQ Y = ß0 + ß1x + ε PTHQ E(y) = ß0 + ß1x Các tham số chưa biết ß0 , ß1x b0 và b1 Ước lượng cho ß0 , ß1x http://dichvudanhvanban.com Dữ liệu mẫu x y x1 y1 xn yn PTHQ ước lượng ŷ = b0 + b1x Các tham số mẫu b0 , b1 GHI CHÚ 1. Phân tích hồi quy không là thủ tục cho việc xây dựng mối liên hệ nhân quả giữa các biến • Nó chỉ có thể cho biết các biến liên hệ với nhau như thế nào hay ở mức độ nào • Bất kỳ kết luận nào về tác động nhân quả đều phải dựa trên sự xem xét của những người hiểu biết nhiều về NC 2. Phương trình hồi quy tuyến tính đơn giản là E(y) = β0 + β1x hay E(y\x) = β0 + β1x Nhằm mục đích nhấn mạnh PTHQ sẽ cung cấp giá trị trung bình của y ứng với một trị số x cho trước. http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.1 Phân tích HQTT trong SPSS 1. Nhập số liệu tuổi và cân nặng của 30 trẻ từ 1-6 tuổi vào SPSS. Cột 1: tuổi; cột 2: cân nặng • Vào menu Analyze > Regression > Linear > Statistics • Chọn biến độc lập (IV) và biến phụ thuộc (DV) • Chạy hồi quy 2. Tương tự, chạy HQ cho tập dữ liệu Tỷ lệ lạm phát và thất nghiệp của Việt Nam từ 2012-2019 http://dichvudanhvanban.com www.hutech.edu.vn 2.3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT 1. Thủ tục dùng dữ liệu mẫu để ước lượng phương trình hồi quy (trong HQTT mỗi quan sát bao gồm 2 trị số, một của biến độc lập và một của biến phụ thuộc) 2. Giả sử dữ liệu thu thập được từ 10 cửa hàng CoffeeHouse đặt gần các trường đại học (bảng 1.1) 3. Mô hình HQTT mô tả thể hiện mối quan hệ giữa doanh số bán hàng quý (yi) và số lượng sinh viên (xi) từ quan sát CH thứ i trong mẫu; các trị số sau: Nhà hàng 1 Nhà hàng 2 …… http://dichvudanhvanban.com x1 = 2 và y1 = 58 x2 = 6 và y2 = 105 www.hutech.edu.vn PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT Bảng 1.1 http://dichvudanhvanban.com CoffeeHouse Số lượng sinh viên (ngàn người) Doanh số bán theo quý (triệu đồng) i Xi Yi 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 www.hutech.edu.vn http://dichvudanhvanban.com www.hutech.edu.vn Sử dụng dữ liệu trong bảng 1.1 để xác định các giá trị b0 và b1 trong phương trình HQTT ĐGUL ŷ = b0 + b1xi (4) Với ŷi = doanh số bán theo quý được ước lượng ($1,000) của CH thứ i b0 = tung độ gốc của đường hồi quy ước lượng b1 = độ dốc của đường hồi quy ước lượng xi = số lượng sinh viên (1,000 người) ứng với nhà hàng i Tất cả nhà hàng trong mẫu sẽ có một trị số quan sát yi và trị số doanh số ước lượng ŷi Để đường HQUL phù hợp nhất với dữ liệu, sự khác biệt giữa các trị số quan sát yi trị số ước lượng ŷi phải nhỏ nhất. http://dichvudanhvanban.com www.hutech.edu.vn TIÊU CHUẨN BÌNH PHƯƠNG NHỎ NHẤT MinƩ(yi –ŷ)2 (5) Với yi = trị số thực tế của biến phụ thuộc ứng với quan sát thứ i ŷi = trị số ước lượng của biến phụ thuộc ứng với quan sát thứ i Dùng phép tính vi phân cho thấy các trị số b0 và b1 nhằm thỏa mãn có thể được tìm thấy bằng cách sử dụng phương trình (6) & (7) dưới đây. http://dichvudanhvanban.com www.hutech.edu.vn ĐỘ DỐC & TUNG ĐỘ GỐC CỦA PHƯƠNG TRÌNH HQUL b1 = Ʃ (xi - x)(yi – ӯ) (6) Ʃ (xi - x)2 b0 = ӯ – b1x (7) Với xi = trị số thực tế của biến độc lập ứng với quan sát thứ i yi = trị số thực tế của biến phụ thuộc ứng với quan sát thứ i xi = trị số trung bình của biến độc lập ӯi = trị số trung bình của biến phụ thuộc n = số quan sát (=10) http://dichvudanhvanban.com www.hutech.edu.vn Xây dựng phương trình HQ cho CoffeeHouse để tính x và ȳ theo bảng 1.2 Ʃ xi 140 x = n = 10 = 14 Ʃ yi 1300 ȳ = n = 10 = 130 http://dichvudanhvanban.com www.hutech.edu.vn XÁC ĐỊNH CÁC CHỈ SỐ CẦN THIẾT Bảng 1.2 Nhà hàng thứ i xi yi xi-x yi- y (xi-x)(yi- y) (xi-x)2 1 2 58 -12 -72 864 144 2 6 105 -8 -25 200 64 3 8 88 -6 -42 252 36 4 8 118 -6 -12 72 36 5 12 117 -2 -13 26 4 6 16 137 2 7 14 4 7 20 157 6 27 162 36 8 20 169 6 39 234 36 9 22 149 8 19 152 64 10 26 202 12 72 864 144 Tổng cộng 140 1300 2840 568 http://dichvudanhvanban.com www.hutech.edu.vn Sử dụng phương trình (6) & (7) để tính b1 và b0 Ʃ (xi - x)(yi – ӯ) 2840 b1 = = 586 = 5 Ʃ (x - x)2 i b0 = ӯ – b1x = 130 – 5(14) = 60 Vậy phương trình HQUL ŷ = b0 + b1x = 60 + 5x http://dichvudanhvanban.com www.hutech.edu.vn Độ dốc b1 = 5 Tung độ gốc b0 = 60 http://dichvudanhvanban.com www.hutech.edu.vn • Độ dốc của phương trình HQUL b1=5 là số >0 nên khi số lượng sinh viên tăng thì doanh số cũng tăng đồng biến; • Dựa trên doanh số bán tính bằng $1000 và số sinh viên tính bằng 1000 người nên kỳ vọng số sinh viên tăng 1 đơn vị là kỳ vọng doanh số tăng $5,000 => $5/sinh viên. • Phương trình HQ mô tả mối quan hệ giữa x và y cũng được dùng để dự đoán giá trị y ứng với một giá trị x cho trước. Vậy, để doanh số bán theo quý của cửa hàng được đặt gần một trường ĐH với 16,000 sinh viên được dự đoán = 60 + 5(16) = 140 tức $140,000/quý http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.2 - PHƯƠNG TRÌNH HQUL Cho 5 năm quan sát của 2 biến x và y như sau xi 1 2 3 4 5 yi 3 7 5 11 14 a. Hãy xây dựng một đồ thị phân tán cho những dữ liệu này. b. Đồ thị phân tán trong phần (a) cho thấy điều gì về mối quan hệ giữa hai biến. c. Hãy thử vẻ một đường thẳng mô tả một cách đơn gần đúng mối quan hệ giữa x và y trên cùng một biểu đồ với dữ liệu gốc. d. Hãy xây dựng phương bình hồi quy ước lượng bằng cách tính toán các giá trị b0 và b1dùng các phương trình (6) và (7). e. Hãy sử dụng phương trình hồi quy ước lượng để tính toán các giá trị của y khi x=4. http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.3 Người bán hàng Số năm kinh nghiệm Doanh thu/năm (1000 USD) 1 1 80 2 3 97 b. Hãy xây dựng phương trình hồi quy ước lượng có thể dùng để dự đoán doanh thu hàng năm với số năm kinh nghiệm cho trước. 3 4 92 4 4 102 5 6 103 6 8 111 c. Hãy dùng phương trình hồi quy để dự báo doanh thu hàng năm cho một người bán hàng có 9 năm kinh nghiệm 7 10 119 8 10 123 9 11 117 10 13 136 a. Hãy xây dựng một đồ thị phân tán cho những dữ liệu này với số năm kinh nghiệm là biến độc lập. http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.4 Chuyến bay đến trễ (%) Chuyến bay đi trễ (%) Atlanta 24 22 b. Đồ thị phân tán trong phần (a) cho thấy điều gì về mối quan hệ giữa các chuyến bay đến là đi trễ Charlotte 20 20 Chicago 30 29 Cincinnati 20 19 c. Hãy dùng phương bình phương nhỏ nhất để xây dựng phương trình hồi quy ước lượng. Dallas 20 22 Denver 23 23 Detroit 18 19 Houston 20 16 Minneapolis 18 18 Phoenix 21 22 Pittburgh 25 22 Salt Lake City 18 17 16 16 a. Hãy xây dựng một đồ thị phân tán cho những dữ liệu này với tỷ lệ chuyến bay đến trễ là biến độc lập. d. Hãy giải thích độ dốc của phương trình hồi quy. e. Giả định tỷ lệ các chuyến bay đến trễ ở sân bay Philadelphia trong tháng 8 là 22%. tính http://dichvudanhvanban.com Sân bay St.Louis www.hutech.edu.vn 2.4 CÔNG THỨC ĐO ĐỘ PHÙ HỢP PTHQ TỔNG BÌNH PHƯƠNG SAI SỐ (8) SSE = Ʃ(yi – ŷi)2 TỔNG BÌNH PHƯƠNG TOÀN BỘ (9) SST = Ʃ(yi – y)2 TỔNG BÌNH PHƯƠNG DO HỒI QUY (10) SSR = Ʃ(ŷi –y)2 QUAN HỆ GIỮA SST, SSR, và SSE (11) SST = SSR + SSE với SST= Tổng bình phương toàn bộ http://dichvudanhvanban.com SSR= Tổng bình phương hồi quy SSE = Tổng bình phương sai số www.hutech.edu.vn HỆ SỐ XÁC ĐỊNH HỆ SỐ XÁC ĐỊNH r2 = SSR SST (12) Hệ số tương quan HỆ SỐ TƯƠNG QUAN MẪU rxy = (dấu của b1) r2 http://dichvudanhvanban.com www.hutech.edu.vn (13) Ứng dụng thước đo độ phù hợp PTHQ • Ở cửa hàng 1, ta có x1=2 và y1=58, và ŷ1= 60+5(2) = 70 => Sai số trong việc sử dụng ŷ1 để ước tính y1 cho CH1 là y1-ŷ = 58-70=-12, vậy sai số bình phương (-12)2 = 144, hay SSECH1 = Ʃ(y1 – ŷ1)2 = (58-70)2 = (-12)2 = 144 (bảng 1.3) • Với Ʃyi = 1300 và giá trị trung bình của doanh số bán hàng theo quý cho mẫu gồm 10 cửa hàng CoffeeHouse là ȳ=Ʃyi/n=130 (bảng 1.2). Vậy yi-ȳ đo sai số trong việc sử dụng y để ước lượng doanh số bán hàng; tổng bình phương toàn bộ SST = Ʃ(yi – y)2 = 15730 http://dichvudanhvanban.com (bảng 1.5) www.hutech.edu.vn TÍNH TOÁN SSE CỦA 10 COFFEEHOUSE Bảng 1.3 Nhà hàng Số lượng sinh viên Doanh số quý Doanh số dự đoán Chênh lệch Chênh lệch bình phương xi yi ŷi yi- ŷi (yi-ŷ)2 1 2 58 70 -12 144 2 6 105 90 15 225 3 8 88 100 -12 144 4 8 118 100 18 324 5 12 117 120 -3 9 6 16 137 140 -3 9 7 20 157 160 -3 9 8 20 169 160 9 81 9 22 149 170 -21 441 10 26 202 190 12 144 SSE = 1530 http://dichvudanhvanban.com www.hutech.edu.vn Tính toán tổng bình phương TOÀN BỘ Bảng 1.4 Nhà hàng Số lượng sinh viên Doanh số quý Chênh lệch Chênh lệch bình phương xi yi yi- ȳi (yi-ȳ)2 1 2 58 -72 5148 2 6 105 -25 625 3 8 88 -42 1764 4 8 118 -12 144 5 12 117 -13 169 6 16 137 7 49 7 20 157 27 729 8 20 169 39 1521 9 22 149 19 361 10 26 202 72 5184 http://dichvudanhvanban.com www.hutech.edu.vn SST = 15730 • Hình 3 cho thấy đường HQUL ŷ = 60 +5x và đường ȳ = 130 • Để ý rằng đồ thị phân tán các điểm tập trung quanh đường HQ hơn là đường ȳ=130 • Ví dụ, đối với CH10 cho thấy sai số > so với ȳ=130 Thí dụ ȳ10= 60+5(26) = 190 > 130 • Vậy SST là thước đo các quan sát tập trung chặt chẻ quanh đường ȳ còn SSE là thước đo các quan sát tập trung chặt chẻ quanh đường ŷ1 http://dichvudanhvanban.com www.hutech.edu.vn Hình 3 – ĐƯỜNG HỒI QUY & ĐƯỜNG Y=Ȳ KHÁC BIỆT GIỮA ĐƯỜNG HỔI QUY & ĐƯỜNG Y=Ȳ y10-ȳ y10-ȳ y=ȳ=130 http://dichvudanhvanban.com www.hutech.edu.vn y10-ȳ MỐI LIÊN QUAN 3 TỔNG CÁC BÌNH PHƯƠNG • Để đo lường các giá trị trên đường HQ khác biệt giá trị ȳ thế nào thì tổng bình phương do hồi quy SSR được sử dụng RSS = Ʃ(ŷi –y)2 = 15730 • Từ các thảo luận trên có thể rút ra rằng 3 tổng các bình phương SST, SSR, và SSE có liên quan với nhau; phương trình (11) TSS = RSS + ESS cho thấy TBP toàn bộ gồm 2 thành phần (a) tổng bình phương do hồi quy (b) tổng bình phương do sai số Tức RSS = TSS – ESS = 15730 – 1530 = 14200 http://dichvudanhvanban.com www.hutech.edu.vn ĐỘ PHÙ HỢP • Phương trình HQUL sẽ hoàn toàn phù hợp nếu tất cả các giá trị của biến phụ thuộc nằm trên đường hồi quy; Trường hợp này, yi-ŷi=0 cho mỗi quan sát => ESS = 0 • Để có sự phù hợp hoàn hảo thì trong phương trình (11) bắt buộc RSS = TSS => tỷ lệ RSS/TSS = 1 • Sự phù hợp kém sẽ dẫn đến SSE lớn hơn. Thí dụ ȳ10= 60+5(26) = 190 > 130 • Từ phương trình (11) ESS = TSS-RSS => giá trị lớn nhất của ESS xãy ra khi RSS=0 và ESS=TSS (sự phù hợp kém nhất) • Tỷ lệ RSS/TSS có giá trị giữa 0-1, được sử dụng để đánh giá độ phù hợp của PTHQ, còn gọi là hệ số xác định ký hiệu r2 http://dichvudanhvanban.com www.hutech.edu.vn HỆ SỐ XÁC ĐỊNH R2 Khi r2 trình bày dưới hình thức tỷ lệ % được hiểu là tỷ lệ trong tổng bình phương toàn bộ r2 = 14200 RSS = 0.9027 tức 90.27% = 15300 TSS Điều này có nghĩa là 90.27% thay đổi trong DSBH do mối quan hệ tuyến tính giữa số lượng SV & DSBH Hệ số tương quan HỆ SỐ TƯƠNG QUAN MẪU rxy = (dấu của b1) r2 http://dichvudanhvanban.com www.hutech.edu.vn HỆ SỐ TƯƠNG QUAN • Hệ số tương quan là thước đo mô tả độ mạnh của mối liên hệ tuyến tính giữa 2 biến x và y • Giá trị của HSTQ luôn nằm trong khoảng -1 đến +1 • Trị số +1 chỉ ra 2 biến x và y liên hệ thuận hoàn hảo => các điểm dữ liệu đều nằm trên 1 đường thẳng có độ dốc dương • Trị số -1 cho thấy x và y liên hệ nghịch 1 cách hoàn hảo với tất cả các điểm nằm trên đường thẳng có độ dốc âm. • Giá trị các hệ số tương quan gần = 0 cho thấy x và y không có liên quan tuyến tính HỆ SỐ TƯƠNG QUAN MẪU rxy = (dấu của b1) r2 http://dichvudanhvanban.com www.hutech.edu.vn HỆ SỐ TƯƠNG QUAN MẪU • Hệ số tương quan mẫu >0 nếu PTUL có độ dốc b1>0 • Trong thí dụ Highlands Coffee, trị số của hệ số xác định tương ứng với PTHQUL ŷ= 60+5x là 0.9027 bỡi vì b1>0 => +√0.9027 = +0.9501 là hệ số tương quan mẫu • Với HSTQM = +0.9501 có thể kết luận tồn tại một mối liên hệ tuyến tính dương chặc chẻ giữa x và y. • Cần phân biệt hệ số xác định đo giữa 0 và 1 trong khi HSTQM đo giữa -1 và +1 • Tuy nhiên hệ số xác định có phạm vi ứng dụng rộng hơn vì co thể đo cả cho mối liên hệ phi tuyến tính và các mối liên hệ với 2 hay 2+ biến độc lập http://dichvudanhvanban.com www.hutech.edu.vn PHƯƠNG PHÁP NGHIÊN CỨU ĐỊNH LƯỢNG • Nghiên cứu định lượng (quantitative research) có ứng dụng rộng rãi trong kinh doanh và kinh tế, đặc biệt trong Tài chính ngân hàng; • Thường được gắn liền với việc KIỂM ĐỊNH lý thuyết dựa vào phương pháp suy diễn. Thí dụ kiểm định t, kiểm định F • Nghiên cứu và sử dụng các phương pháp khác nhau để lượng hóa, đo lường, phản ánh và diễn giải các mối quan hệ giữa các nhân tố (các BIẾN) với nhau. http://dichvudanhvanban.com www.hutech.edu.vn DỮ LIỆU TRONG NGHIÊN CỨU ĐỊNH LƯỢNG Dữ liệu Là những sự kiện và con số thu được thu thập, phân tích và tổng hợp để trình bày và giải thích. Tập dữ liệu Tất cả các con số thu thập trong một nghiên cứu cụ thể. Thống kê mô tả Dữ liệu được trình bày dưới dạng bảng, đồ thị, số, đồ họa cho người đọc dễ hiểu. Thống kê suy diễn Mẫu được sử dụng để ước lượng một đặc tính tổng thể quan tâm để đưa ra một tuyên bố về chất lượng, độ chính xác, liên quan đến ước lượng. http://dichvudanhvanban.com www.hutech.edu.vn ĐẶC TRƯNG CỦA NGHIÊN CỨU ĐỊNH LƯỢNG • Liên quan đến lượng và số trong khi định tính liên quan đến chất và mô tả; • Mục đích của NCĐL là đo lường, kiểm tra sự liên quan giữa các biến số dưới dạng số đo và thống kê; • Việc sử dụng mô hình kinh tế lượng và mô hình toán là bắt buộc khi sử dụng phương pháp nghiên cứu này; • Được dùng để tổng quát hóa kết quả nghiên cứu thông qua phân phối ngẫu nhiên và lấy mẫu đại diện; • Đối với các biến số có bản chất định tính (không đo lường được) thì việc lượng hóa biến số là yêu cầu bắt buộc để thực hiện NC định lượng. www.hutech.edu.vn http://dichvudanhvanban.com ĐẶC TRƯNG CỦA NC ĐỊNH LƯỢNG (tt) Ví dụ: Khi khảo sát mức độ hài lòng của khách hàng về chất lượng dịch vụ ngân hàng. Câu trả lời thường nhận được là định tính như “rất không hài lòng”, “tương đối hài lòng”, “rất hài lòng”, vv. Để thực hiện nghiên cứu định lượng, người NC cần lượng hóa các dữ liệu định tính này dưới dạng số như 1. 2. 3. 4. 5. Tương ứng với “rất không hài lòng” …. …. …. Tương ứng với “rất hài lòng” http://dichvudanhvanban.com www.hutech.edu.vn THU THẬP DỮ LIỆU TRONG NC ĐỊNH LƯỢNG • Các phương pháp thu thập dữ liệu như cân, đo, sử dụng bảng câu hỏi có cấu trúc để khảo sát/phỏng vấn, quan sát và ghi chép dữ liệu là thống kê dữ liệu để phân tích và cho ra kết quả có liên quan tới các biến. • Biến định tính là biến với các dữ liệu định tính; Biến định lượng là biến với các dữ liệu định lượng; • Phân tích thống kê phù hợp cho một biến cụ thể phụ thuộc vào biến định tính hay định lượng, biến độc lập hay phụ thuộc; • Có nhiều cách phân tích thống kê đối với dữ liệu định lượng. http://dichvudanhvanban.com www.hutech.edu.vn ĐẶC TRƯNG CỦA NGHIÊN CỨU ĐỊNH TÍNH • Là hướng tiếp cận nhằm thăm dò, mô tả và giải thích dựa vào các phương tiện khảo sát kinh nghiệm, nhận thức, động cơ thúc đẩy, dự định, hành vi, thái độ; • Dữ liệu định tính thường ở dạng chữ, phản ánh tính chất, đặc điểm hay sự hơn kém và không dùng mô hình kinh tế lượng cũng như mô hình toán nên không tính được trị trung bình của dữ liệu định tính; • Ví dụ dữ liệu định tính như: Giới tính là nam hay nữ; kết quả học tập của sinh viên là giỏi, khá, trung bình, hay yếu. • NC định tính phù hợp để trả lời các câu hỏi mà NC định lượng chưa thực hiện được nhằm mở ra hướng NC mới. http://dichvudanhvanban.com www.hutech.edu.vn SO SÁNH PP ĐỊNH LƯỢNG & ĐỊNH TÍNH Phương pháp định lượng Phương pháp định tính • Nhấn mạnh kiểm tra bằng chứng • Tập trung vào cơ sở lập luận hoặc các nguyên nhân của các sự kiện • Cách tiếp cận logic và phê phán • Cách nhìn khách quan của người ngoài cuộc, cách xa số liệu • Tập trung kiểm tra giả thiết • Kết quả được định hướng • Tiềm ẩn nhiều sai biệt thống kê, tốn nhiều thời gian nếu gặp vấn đề về dữ liệu • Khó kiểm soát chất lượng dữ liệu điều tra o Nhấn mạnh vào sự hiểu biết o Tập trung vào sự hiểu biết từ quan điểm của người cung cấp thông tin o Cách tiếp cận qua lý lẽ giải thích o Cách nhìn chủ quan của người trong cuộc và gần gủi với số liệu o Định hướng thăm dò, giải thích o Quá trình được định hướng o Khó tiếp cận chuyên gia để phỏng vấn o Khó viết phần phân tích và báo cáo http://dichvudanhvanban.com www.hutech.edu.vn THUẬT NGỮ Phần tử Là các thực thể mà từ đó dữ liệu thu thập được Biến Biến là đặc tính quan tâm của phần từ, thí dụ • Thị trường chứng khoán: nơi cổ phiếu được giao dịch • Mã cổ phiếu: tên tắt dùng để phân biệt các cổ phiếu được niêm yết • VN30: các công ty được xếp hạng từ 1-30 • Giá cổ phiếu: giá vào thời điểm đóng cửa • Lợi nhuận trên cổ phiếu: là lợi nhuận trên 1 cổ phần trong 12 tháng gần nhất Quan sát Các Thang đo Thu thập dữ liệu đòi hỏi phải có một trong các thang đo như tỉ lệ, thứ bậc, khoảng và danh nghĩa. Thang đo quyết định lượng thông tin chứa trong các dữ liệu, cách tóm tắt dữ liệu, và phân tích thống kê phù hợp. www.hutech.edu.vn http://dichvudanhvanban.com số đo lường thu thập trên mỗi biến đối với từng phần tử trong một nghiên cứu sẽ cung cấp dữ liệu. Tập hợp các số đo được của một phần tử được gọi là quan sát. THUẬT NGỮ - 4 loại thang đo (TĐ) TĐ danh nghĩa TĐ thứ bậc TĐ Khoảng TĐ tỷ lệ TĐ dùng cho dữ liệu thuộc tính mà các biểu hiện của dữ liệu không có sự hơn kém, khác biệt về thứ bậc. Các con số không có mối quan hệ hơn kém, không thực hiện các phép tính đại số. Các con số chỉ mang tính chất mã hóa. Ví dụ: tiêu thức giới tính ta có thể đánh số 1 là nam, số 2 nữ. Là loại thang đo dùng cho các dữ liệu thuộc tính. Tuy nhiên, trường hợp này biểu hiện của dữ liệu có sự so sánh. Ví dụ: trình độ thành thạo của công nhân được phân chia ra bậc thợ từ 1 đến 7. Phân loại giảng viên trong các trường đại học: Giáo sư, Phó giáo sư, Giảng viên chính, Giảng viên. Thang đo này cũng không thực hiện được các phép tính đại số. Là loại thang đo cho các dữ liệu số lượng và có thể dùng để xếp hạng các đối tượng NC ở khoảng cách bằng nhau trên thang đo đại diện cho khoảng cách bằng nhau của đối tượng. Với thang đo này ta có thể thực hiện các phép tính đại số (trừ phép chia không có ý nghĩa). Ví dụ như điểm môn học của sinh viên (SV). SVA có điểm thi là 8, SVB có điểm 4 thì không thể nói rằng SVA giỏi Là loại thang đo cũng có thể dùng dữ liệu số lượng. Trong các loại thang đo thì đây là thang đo cao nhất. Ngoài đặc tính của thang đo khoảng, phép chia có thể thực hiện được. Ví dụ: thu nhập trung bình một tháng của ông A là 2 triệu đồng và thu nhập của bà B là 4 triệu đồng thì ta có thể nói rằng thu nhập trung bình trong một tháng của bà B gấp 2 lần thu nhập của ông A. http://dichvudanhvanban.com PP PHÂN TÍCH THỐNG KÊ & THANG ĐO Loại thang đo Đo lường Đo lường Đo lường độ tập độ phân tính tương trung tán quan Kiểm định TĐ danh nghĩaNominal scale Mode Không có Hệ số ngẫu nhiên Kiểm định X2 Thang đo thứ bậc – Ordinal scale Trung vị % Dãy tương quan Kiểm định dấu TĐ khoảng Interval scale Trung bình Độ lệch chuẩn Hệ số tương quan Kiểm định t, F Thang đo tỷ lệ (ratio scale) Trung bình tỷ lệ Hệ số biến thiên Tất cả các Sử dụng tất phép tính trên cả các phép trên http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.5 Monkey Survey khảo sát với mẫu toàn quốc được chọn ngẫu nhiên gồm 1,005 người lớn (18 tuổi trở lên). Câu hỏi khảo sát là “Bạn mô tả sức khỏe thể chất của bạn thế nào vào lúc này”. Thang đo cho loại trả lời là xuất sắc; tốt; chỉ vừa phải, tệ và không ý kiến. a. Cỡ mẫu của KS này là bao nhiêu? b. Dữ liệu này là định tính hay định lượng? c. Dùng trung bình hay tỷ lệ % sẽ có ý nghĩa hơn để tóm tắt dữ liệu này? d. Trong số những người trả lời có 29% nói rằng sức khỏe cá nhân họ là “xuất sắc”. Có bao nhiêu người trả lời như vậy? http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.6 Thời báo Kinh tế Sài Gòn khảo sát người đăng ký báo đã hỏi 46 câu về đặc điểm và quan tâm của người đăng ký. Hãy cho biết mỗi câu hỏi sau đây cung cấp dữ liệu phân loại hoặc định lượng và cho biết thang đo của từng câu hỏi: a. Tuổi của bạn? b. Giới tính của bạn? c. Bạn bắt đầu đọc TBKT lần đầu tiên khi nào (TH, ĐH, khi bắt đầu làm việc, khi đang xây dựng sự nghiệp, cuối sự nghiệp hoặc nghỉ hưu? d. Bạn đã làm công việc ở vị trí hiện tại được bao lâu? e. Loại xe bạn xem xét mua (9 loại)? http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.7 CSM Worldwide dự báo sản lượng toàn cầu của tất cả các nhà sản xuất ô tô trên thế giới từ 2014-2017. ĐVT = triệu xe. Nhà sản xuất 2014 2015 2016 2017 General Motor 8.9 9.0 8.9 8.8 Ford 7.8 7.7 7.8 7.9 DamlerChrysler 4.1 4.2 4.3 4.6 Toyota 7.8 8.3 9.1 9.6 a. Lập đồ thị chuỗi thời gian 2014-17 biểu diễn số lượng xe sản xuất bỡi từng nhà SX? b. Biễu diễn các chuỗi thời gian của 4 hãng SX trên cùng 1 biểu đồ? c. Hãy lập đồ thị thanh diễn tả số lượng xe được sản xuất bỡi nhà SX ô tô năm 2017. Đồ thị này dựa trên dữ liệu thời điểm hay chuỗi thời gian? http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP Bài 2.8 Theo dữ liệu sau xi 1 2 3 4 5 yi 3 7 5 11 14 Phương trình HQUL ŷ= 0.20 +2.6x a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10) b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH c. Hãy tính hệ số tương quan mẫu Bài 2.9 Theo dữ liệu sau xi 3 12 6 10 14 yi 55 40 55 10 15 Phương trình HQUL ŷ= 68 - 3x a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10) b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH c. Hãy tính hệ số tương quan mẫu http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP 2.10 Theo dữ liệu sau Điểm trung bình 2.6 3.4 3.6 3.2 3.5 2.9 Lương tháng US$ 3300 3600 4000 3500 3900 3600 Phương trình HQUL ŷ= 1790 + 581.1x a. Hãy tính ESS, TSS, RSS sử dụng các phương trình (8,9,10) b. Hãy tính hệ số xác định r2 và nhận xét về độ phù hợp của MH c. Hãy tính hệ số tương quan mẫu http://dichvudanhvanban.com www.hutech.edu.vn CÁC ĐẲNG THỨC ĐÃ HỌC (1) (2) (3) (4) (5) Y = β0 + β1 x + ε E(y) = β0 + β1x ŷ = b0 + b1x ŷ = b0 + b1xi (4) MinƩ(yi –ŷ)2 (6) b1 = Ʃ (xi - x)(yi – ӯ) Ʃ (xi - x)2 (7) b0 = ӯ – b1x (8) SSE = Ʃ(yi – ŷi)2 (9) SST = Ʃ(yi – ӯ)2 (10) SSR = Ʃ(ŷi –ӯ)2 (11) SST = SSR + SSE RSS (12) r2 = TSS (13) rxy = (dấu của b1) r2 http://dichvudanhvanban.com Mô hình hồi quy tuyến tính (HQTT) đơn giản Phương trình HQTT đơn giản Mô hình HQTT đơn giản ước lượng Phương trình HQTT đơn giản ước lượng Tiêu chuẩn bình phương nhỏ nhất Độ dốc Tung độ gốc của phương trình HQ ước lượng Tổng bình phương sai số Tổng bình Phuong toàn bộ Tổng bình phương do hồi quy Quan hệ giữa SST, SSR, và SSE Hệ số xác định Hệ số tương quan mẫu www.hutech.edu.vn 2.5 Kiểm định ý nghĩa của mô hình hồi quy tuyến tính đơn giản http://dichvudanhvanban.com www.hutech.edu.vn CÁC GIẢ THIẾT của MÔ HÌNH HỒI QUY Y = β0 + β1x + Ɛ Giả thiết về sai số ε trong mô hình hồi quy 1. Sai số ε là một biến ngẫu nhiên có trung bình/giá trị kỳ vọng bằng 0: E(ε) = 0 Hàm ý: β0 và β1 là hằng số, do đó E(β0) = β0 và E(β1) = β1; như vậy, với một giá trị x cụ thể, giá trị kỳ vọng của y là (14) E(y) = β0 + β1x (Phương trình hồi quy) 2. Phương sai σ2 của ε là như nhau cho tất cả các giá trị x. Hàm ý: phương sai của y về đường hồi quy bằng σ2 và là như nhau cho tất cả các giá trị x. 3. Giá trị của ε là độc lập với nhau. Hàm ý: giá trị ε ứng với giá trị x cụ thể không liên quan giá trị ε ứng với giá trị x khác => giá trị y ứng với giá trị x cụ thể không liên quan giá trị y ứng với bất kỳ giá trị nào khác của x. 4. Sai số ε là biến ngẫu nhiên có phân phối chuẩn. Hàm ý: vì y là một hàm tuyến tính của ε, nên y cũng là một biến ngẫu nhiên có phân phối chuẩn. http://dichvudanhvanban.com www.hutech.edu.vn KIỂM ĐỊNH Ý NGHĨA của MÔ HÌNH HỒI QUY Trong phương trình tuyến tính E(y) = β0 + β1x: (a) Nếu β1=0, E(y) = β0 + 0x = β0 tức giá trị trung bình của y không phụ thuộc vào giá trị của x => x và y không liên quan tuyến tính. (b) Nếu β1≠ 0, hai biến x và y có liên quan Một số kiểm định sau được áp dụng: 1. 2. 3. 4. http://dichvudanhvanban.com Ước lượng σ2 Kiểm định t Khoảng tin cậy cho β1 Kiểm định F www.hutech.edu.vn ƯỚC LƯỢNG σ2 Với ŷi = b0+b1xi, SSE = Ʃ(yi-ŷi)2=Ʃ(yi-b0-b1xi)2 vậy trung bình của bình phương SSE = SSE/n-2 bậc tự do là b0-b1 cung cấp một ước lượng không chênh lệch cho σ2. Bỡi vì MSE cung cấp một ước lượng không lệch cho σ2, ký hiệu s2 cũng được sử dụng: SAI SỐ BÌNH PHƯƠNG TRUNG BÌNH (ước lượng của σ2) ESS s2 = MSE= n-2 (15) Trong ví dụ CoffeeHouse, SSE=1530, nên 1530 1530 2 = 191,25 là một ước lượng không s = MSE= = 10 - 2 8 chênh lệch cho σ2 http://dichvudanhvanban.com www.hutech.edu.vn Để ước lượng σ2 ta lấy căn bậc hai của s2. Giá trị s nhận được được gọi là sai số chuẩn của ước lượng. SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG s = 𝑀𝑆𝐸 = http://dichvudanhvanban.com 𝐸𝑆𝑆 = 𝑛−2 191,25 = 13.829 𝑛−2 www.hutech.edu.vn (16) KIẾM ĐỊNH t Mô hình HQTTĐG là Y = β0 + β1x + ε. Nếu x và y có liên hệ tuyến tính, phải có β1≠ 0 nên mục đích của kiểm định t là chứng minh β1≠ 0 theo 2 giả thiết H0: β1= 0 và Ha: β1≠ 0 PHÂN PHỐI MẪU CỦA b1 Giá trị kỳ vọng E(b1) = β1 Độ lệch chuẩn σb1 = σ dạng phân phối chuẩn Ʃ 𝑥𝑖 − 𝑥 2 (17) Lưu ý: (a) giá trị kỳ vọng của b1 = β1 vì vậy b1 là một ước lượng không chệch của β1 (b) bỡi vì không biết giá trị của σ nên dùng ước lượng σb1 ký hiệu sb1, bằng cách dùng s trong (17) SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG σ sb1 = Ʃ 𝑥𝑖 − 𝑥 http://dichvudanhvanban.com 2 www.hutech.edu.vn (18) KIẾM ĐỊNH t SAI SỐ CHUẨN CỦA ƯỚC LƯỢNG trong ví dụ Highlands Coffee 13829 σ = = 0.5803 là độ lệch chuẩn của b1 sb1 = 568 Ʃ 𝑥𝑖 − 𝑥 2 Để kiểm định t về ý nghĩa của mối quan hệ dựa trên thống kê kiểm định b1 – β1 có phân phối t với n-2 bậc tự do. Nếu H0 đúng thì β1= 0 và t=b1/sb1. sb1 Trở lại ví dụ Highlands Coffee để kiểm định t ở mức ý nghĩa α = 0.01 b1 5 = = 8.62 t= 0.5806 sb1 Bảng phân phối t cho thấy khi n-2= 10-2=8 bậc tự do thì t=3.355 với diện tích 0.005 ở đuôi phải. Vậy ứng với t=8.62 <α=0.005 trong kiểm định 2 đuôi. Nên p ứng với t=8.62 < 2(0.005) = 0.01 http://dichvudanhvanban.com www.hutech.edu.vn KIẾM ĐỊNH t • Bảng phân phối t cho thấy khi n-2= 10-2=8 bậc tự do thì t=3.355 với diện tích 0.005 ở đuôi phải. • Vậy ứng với t=8.62 <α=0.005 trong kiểm định 2 đuôi. Nên p ứng với t=8.62 < 2(0.005) = 0.01 < α=0.01 • Do p = 0.000 < α=0.01 nên bác bỏ H0 vì β0≠0 • Vậy có thể kết luận tồn tại một mối liên hệ có ý nghĩa giữa số lượng sinh viên và doanh số bán hàng theo quý” http://dichvudanhvanban.com www.hutech.edu.vn KIẾM ĐỊNH t về ý nghĩa mối quan hệ trong mô hình HQTT đơn giản • Đặt giả thiết H0: β1=0 và Ha: β1≠0 • Giá trị thống kê kiểm định t = • Qui tắc bác bỏ b1 sb1 (19) Dựa vào giá trị p: bác bỏ H0 nếu giá trị p≤ α Dựa vào giá trị tới hạn : bác bỏ H0 t≤ −𝑡α/2 nếu giá trị t ≥ 𝑡α/2 Với 𝑡α/2 dựa trên phân phối t với n-2 bậc tự do http://dichvudanhvanban.com www.hutech.edu.vn KHOẢNG TIN CẬY CHO β1 Dạng khoảng tin cậy cho β1 như sau: • b1 ∓t ≥ 𝑡α/2Sb1: ước lượng điểm β1 sai số 𝑡α/2Sb1 Độ tin cậy 1-α và 𝑡α/2là giá trị t ứng với diện tích α/2 ở đuôi bên phải của phân phối t với n-2 bậc tự do. • Trong ví dụ CoffeeHouse, khoảng tin cậy 99% cho β1 Tra bảng 2-PLB cho thấy giá trị t≈ α=0.01 và n-2 = 10-2=8 bậc tự do là t0.005= 3.355. • Vậy ước lượng khoảng tin cậy 99% cho β1 là b1 ∓t = 5 ∓ 3.355 (0.5803) = 5 ∓ 1.95 hoặc từ 3.05 đến 6.95 http://dichvudanhvanban.com www.hutech.edu.vn KHOẢNG TIN CẬY CHO β1 Trong kiểm định t về ý nghĩa mối quan hệ, các giả thiết H0: β1=0 và Ha: β1≠0 • Ở mức ý nghĩa α=0.01 thì sử dụng khoảng tin cậy 99%, bỡi vì 0 (trị số giả định của β1) không nằm trong khoảng tin cậy (3.05-6.95) nên bác bỏ H0 và kết luận tồn tại một mối liên hệ có ý nghĩa thống kê giữa số lượng sinh viên và doanh số bán hàng theo quý. • Nói chung, khoảng tin cậy có thể sử dụng để kiểm định giả thiết hai phía về β1. • Nếu trị số giả định của β1 nằm trong khoảng tin cậy (3.05-6.95) thì không thể bác bỏ H0 và ngược lại. http://dichvudanhvanban.com www.hutech.edu.vn KIỂM ĐỊNH F Kiểm định F dựa trên bảng phân phối xác suất F, có thể dùng để kiểm tra ý nghĩa trong hồi quy. • Với 1 biến độc lập, kết luận của KĐF sẽ dẫn đến cùng 1 kết luận như KĐt. • Có nghĩa là nếu KĐt chỉ ra β1≠0 và do đó tồn tại một mối quan hệ có ý nghĩa thống kê thì KĐF cũng sẽ cho thấy một mối quan hệ có ý nghĩa xét một cách tổng quát. • Logic làm nền tảng cho KĐF có hay không mối liên hệ hồi quy dựa trên sự hình thành của hai ước lượng độc lập cho σ2. • Nếu H0: β1=0 là đúng, tổng bình phương do hồi quy SSE chia cho bậc tự do tương ứng cung cấp một ước lượng độc lập khác cho σ2. http://dichvudanhvanban.com www.hutech.edu.vn KIỂM ĐỊNH F (tt) • Ước lượng này gọi là phương sai do hồi quy, hay đơn giản là phương sai hồi quy ký hiệu MSR công thức: MSR = RSS/bậc tự do của hồi quy • Các mô hình đang xem xét, bậc tự do tương ứng với hồi quy luôn luôn bằng số lượng biến độc lập trong mô hình: MSR = RSS/số lượng biến độc lập (20) • Do thí dụ CoffeeHouse chỉ xét 1 biến độc lập nên MSR = RSS/1 = RSS = 14200 • Bỡi vì MSR và MSE là hai ước lượng độc lập cho σ2 và phân phối mẫu của MSR/MSE tuân theo phân phối F với tử số = 1 và bậc tự do của mẫu số = n-2 • Vậy khi β1=0, trị số củawww.hutech.edu.vn MSE ≈ 1 http://dichvudanhvanban.com KIỂM ĐỊNH F (tt) • Nếu H0 là sai tức β1≠0, ước lượng MSR sẽ quá cao cho σ2 và trị số MSR/MSE sẽ lớn dẫn đến bác bỏ H0 => mối quan hệ giữa x và y là có ý nghĩa thống kê. • Tiến hành KĐF cho ví dụ CoffeeHouse, trị số kiểm định là MSR 14200 = = 74.25 F= MSE 191.25 (21) • Bảng phân phối F cho thấy với một bậc tự do ở tử số và n2=10-2=8 bậc tự do ở mẫu số thì F=11.26 có diện tích 0.01 ở đuôi phía bên phải. • Vậy diện tích ở đuôi phải của phân phối F tương ứng với trị số kiểm định F=74.25 <0.01 => giá trị p<0.01. http://dichvudanhvanban.com www.hutech.edu.vn KIỂM ĐỊNH F – TÓM TẮT KIỂM ĐỊNH F TRONG MÔ HÌNH HQTT ĐƠN GIẢN H0: β1=0 Ha: β1≠0 TRỊ SỐ KIỂM ĐỊNH MSR F= MSE QUI TẮC BÁC BỎ Dựa vào giá trị p: bác bỏ H0 nếu p-value ≤σ Dựa vào giá trị tới hạn bác bỏ H0 F ≥ 𝐹α Với 𝐹α dựa trên phân phối F với bậc tự do ở tử số và n-2 bậc tự do ở mẫu số. http://dichvudanhvanban.com www.hutech.edu.vn CÁC CÔNG THỨC QUAN TRỌNG (tt) (1) Y = β0 + β1x + ε (2) E(y) = β0 + β1x (3) ŷ = b0 + b1x (4) ŷ = b0 + b1xi (4) (5) MinƩ(yi –ŷ)2 Ʃ (xi - x)(yi – ӯ) (6) b1 = Ʃ (xi - x)2 Mô hình hồi quy tuyến tính (HQTT) đơn giản Phương trình HQTT đơn giản Mô hình HQTT đơn giản ước lượng Phương trình HQTT đơn giản ước lượng Tiêu chuẩn bình phương nhỏ nhất (7) b0 = ӯ – b1x (8) SSE = Ʃ(yi – ŷi)2 (9) SST = Ʃ(yi – y)2 (10) SSR = Ʃ(ŷi –y)2 (11) SST = SSR + SSE SSR (12) r2 = SST Tung độ gốc của phương trình HQ ước lượng Tổng bình phương sai số Tổng bình Phuong toàn bộ Tổng bình phương do hồi quy Quan hệ giữa SST, SSR, và SSE Độ dốc Hệ số xác định (13) rxy = (dấu của b1) r2 Hệ số tương quan mẫu http://dichvudanhvanban.com www.hutech.edu.vn CÁC CÔNG THỨC QUAN TRỌNG (tt) (14) E(y) = β0 + β1x SSE 2 (15) s = MSE= n - 2 (16) s = 𝑀𝑆𝐸 = Sai số bình phương trung bình UL của σ2 𝑆𝑆𝐸 𝑛−2 Sai số chuẩn của ước lượng σ (17) σb1 = (18) sb1 = (19) t = Giá trị kỳ vọng của y b1 Ʃ 𝑥𝑖 − 𝑥 s 2 Ʃ 𝑥𝑖 − 𝑥 2 sb1 (20) MSR = SSR/số lượng Độ lệch chuẩn – phân phối mẫu của b1 Sai số chuẩn của ước lượng của b1 Giá trị thống kê kiểm định t Phương sai hồi quy biến độc lập MSR (21) F = MSE http://dichvudanhvanban.com Trị số kiểm định F BÀI TẬP 2.11 XÁC ĐỊNH HÀM HỒI QUY PHÙ HỢP Trường phái kinh tế học dựa trên tổng cầu lý luận rằng Năm % Lạm phát % Thất nghiệp Khi thất nghiệp trong nền kinh tế giảm thì khi đó nền kinh tế sẽ dần đạt được trạng thái toàn dụng. Tại thời điểm này nền kinh tế được kích cầu do người dân tiêu dùng nhiều hơn dẫn đến giá cả tăng do quy luật cung cầu gây ra lạm phát. 2012 10 8 2013 8 10 2014 6 11 2015 10 9 Để kiểm chứng lập luận trên có phù hợp với Việt Nam không, mẫu quan sát về % lạm phát và % thất nghiệp cuả nước này trong giai đoạn 2012-2019 2016 11 7 2017 12 6 2018 7 10 2019 9 10 http://dichvudanhvanban.com www.hutech.edu.vn a. Vẻ đồ thị phân tán (Scatter dots) giữa tỷ lệ thất nghiệp và tỷ lệ lạm phát giai đoạn 2012-2019; b. Xây dựng phương trình HQUL theo dữ liệu đã cho; c. Hãy tính SSE, SST, SSR; d. Hãy tính hệ số xác định r2 và nhận xét/lập luận về độ phù hợp của mô hình; e. Hãy tính hệ số tương quan mẫu cho thấy sự tồn tại mối quan hệ tuyến tính giữa 2 biến X và Y là >0, <0 hay =0? Lưu ý: phương trình hồi quy E(y) = β0 + β1x Với β0 gọi là hệ số chặn và β1 gọi là hệ số góc http://dichvudanhvanban.com www.hutech.edu.vn CÂU HỎI ÔN TẬP – BÀI 2 1. Cho biết những điều kiện cần thiết để xác định hàm hồi quy phù hợp. Nếu có mâu thuẫn thì cần xử lý ra sao? 2. Nêu cách tính hệ số xác định R2 và hệ số xác định R2 hiệu chỉnh? Giải thích ý nghĩa việc sử dụng hai hệ số này trong thực tế? 3. Tại sao cần xác định sự phù hợp của các hệ số ước lượng được? việc xác định này căn cứ vào quy luật phân phối xác suất nào trong toán thống kê? 4. Tại sao cần phải xác định khoảng tin cậy cho các hệ số ước lượng? Khi xác định khoảng tin cậy, điều gì cần phải biết trước? 5. Vì sao cần phải kiểm định sự phù hợp của mô hình trong khi đã kiểm định sự phù hợp của hệ số ước lượng và xác định khoảng tin cậy cho hệ số ước lượng rồi? http://dichvudanhvanban.com www.hutech.edu.vn BÀI 3 – BÀI TẬP ỨNG DỤNG HỒI QUY TUYẾN TÍNH TRONG TCNH Mục tiêu: • Kết hợp kỹ thuật hồi quy tuyến tính OLS với từng loại dữ liệu thường xuyên gặp phải trong kinh tế-tài chính; • Tăng cường khả năng nhận diện dữ liệu chéo, dữ liệu chuỗi thời gian và dữ liệu bảng thông qua các ví dụ thực tế bằng dữ liệu mô phỏng. http://dichvudanhvanban.com www.hutech.edu.vn 3.1 – BÀI TẬP ỨNG DỤNG DỮ LIỆU CHÉO Bài 3.1.1: 10 hộ gia đình với 2 biến là BH nhân thọ và thu nhập. Bài 3.1.2: 10 doanh nghiệp với 2 biến là thuế TNDN và lợi nhuận. Bài 3.1.3: 10 quốc gia gồm Trung Quốc, Mỹ, Anh, Pháp, Đức, Tây Ban Nha, Nhật, Canada, Ý và Nga với 2 biến là lao động và GDP. Bài 3.1.4: 7 tỉnh thành gồm Hà Nội, Vĩnh Phúc, Bắc Ninh, Hải Dương, Hải Phòng, Hưng Yên và Thái Bình với 2 biến là diện tích và năng suất lúa. Bài 3.1.5: 10 nhân viên công ty Bút bi Bến Nghé với 2 biến là mức lương và thâm niên. http://dichvudanhvanban.com www.hutech.edu.vn 3.2 – BÀI TẬP ỨNG DỤNG DỮ LIỆU CHUỖI THỜI GIAN Bài 3.2.1: Ảnh hưởng của diện tích lên giá nhà từ 2009-2018. Bài 3.2.2: Chi phí R&D của Apple cho phát minh từ 2010 đến 2019. Bài 3.2.3: Suất sinh lợi của thị trường và cổ phiếu của Hoàng Anh Gia Lai trong 8 tháng. Bài 3.2.4: Doanh thu và thu nhập bình quân đầu người của FPT từ 2012-2019. Bài 3.2.5: Tỷ lệ bỏ việc trên 100 người làm viêc và tỷ lệ thất nghiệp ở Việt Nam từ 2010-2018. Bài 3.2.6: Giá vàng thế giới và CPI Mỹ từ 2012 đến 2019. Bài 3.2.7: Mối quan hệ giữa tỷ giá hối đoái USD/VND và nhập khẩu trong 12 tháng của năm 2018. Bài 3.2.8: Đánh giá tác động của sự thay đổi của tỷ giá đến biến động của nhập khẩu tại TQ và Thái lan trong năm 2018. http://dichvudanhvanban.com www.hutech.edu.vn 3.3 – BÀI TẬP ỨNG DỤNG DỮ LIỆU BẢNG Bài 3.3.1: Lạm phát và lãi suất của Việt Nam, Lào và Cambodia từ 2017-2019. Bài 3.3.2: Chi tiêu dùng và lãi suất của Viêtnam, Trung quốc, và Mỹ từ 2016-2018. Bài 3.3.3: Lãi suất và cung tín dụng của BIDV, VCB, và MB Bank từ 2017-2019. Bài 3.3.4: Mối quan hệ giữa tỷ lệ nợ và chi trả cổ tức của HAGL, Vinamilk, và FPT từ 2017-2019. Bài 3.3.5: Mối quan hệ giữa tỷ lệ nợ và ROA của Bibica, Phát Đạt, và Vinalines từ 2016-2018. Bài 3.3.6: Mối quan hệ giữa ROA và tỷ lệ đầu tư của Bibica, Phát Đạt, và Vinalines từ 2017-2019. http://dichvudanhvanban.com www.hutech.edu.vn CÂU HỎI ÔN TẬP Sau khi đã làm qua tất cả các bài tập mô phỏng tình huống với 3 dạng dữ liệu chéo, chuỗi thời gian và bảng bằng phương pháp OLS, hãy cho biết: (a) Có sự khác biệt trong định lượng giữa 3 loại dữ liệu hay không? (b) Giải thích vì sao có sự khác biệt này? http://dichvudanhvanban.com www.hutech.edu.vn BÀI 4 – Mô hình định giá tài sản VỐN CAPM Mục tiêu phục vụ ra quyết định đầu tư, qua: • Cách xác định hệ số βeta - hệ số đo lường rủi ro hệ thống của các loại cổ phiếu dựa vào lãi suất phi rủi ro; • Cách ứng dụng các kỹ thuật kiểm định trong thống kê và kỹ thuật HQTT OLS để kiểm định sự phù hợp và kiểm định khoảng tin cậy đối với hệ số βeta ước lượng; http://dichvudanhvanban.com www.hutech.edu.vn 4.1 ƯỚC LƯỢNG β trong CAPM Mô hình định giá tài sản vốn CAPM Ri-Rf = β x (Rm-Rf) Trong đó = tỷ suất sinh lợi của cổ phiếu (stock i rate of return) = lãi suất phi rủi ro (risk-free-rate) = hệ số βeta, độ nhạy của lợi suất cổ phiếu so với lợi suất thị trường đo lường rủi ro hệ thống của cổ phiếu I so với thị trường Rm = tỷ suất sinh lợi suất thị trường (market rate of return) Rm-Rf = phần bù thị trường, chênh lệch giữa lợi suất thị trường và lãi suất phi rủi ro (market premium) Ri-Rf = phần bù rủi ro của cổ phiếu i, chênh lệch giữa lợi suất cổ phiếu và lãi suất phi rủi ro (stock premium) Ri Rf β http://dichvudanhvanban.com www.hutech.edu.vn 4.1 ƯỚC LƯỢNG β trong CAPM Tính chất của hệ số βeta: • Dùng để đánh giá rủi ro hệ thống của một số cổ phiếu hay toàn bộ danh mục đầu tư; • Cho thấy mức độ tương quan của biến động của cổ phiếu hay danh mục đầu tư với biến động chung của thị trường. Tính hệ số βeta cổ phiếu của VNM (Cty CP Sữa Vinamilk) từ 2 chỉ số: 1. Giá cổ phiếu VNM đã được điều chỉnh (adjusted stock price) 2. Chỉ số VN-Index đóng cửa (Index Price-close). http://dichvudanhvanban.com www.hutech.edu.vn Bảng 4.1 Ngày 04/11/2019 28/10/2019 21/10/2019 14/10/2019 07/10/2019 30/09/2019 23/09/2019 16/02/2019 09/09/2019 03/09/2019 26/08/2019 19/08/2019 12/08/2019 http://dichvudanhvanban.com Pi 131.30 133.80 133.60 128.60 129.10 129.70 124.50 147.37 128.83 118.70 111.28 112.82 112.34 www.hutech.edu.vn Pm 1,022.43 996.48 983.56 993.57 983.09 996.56 985.75 994.43 951.59 921.03 916.06 918.12 925.53 CÁC CHỈ SỐ CẦN XÁC ĐỊNH Dựa theo mô hình CAPM, tính: 1. Tỷ suất sinh lợi cổ phiếu: Ri = [(Pit-Pit-1) : Pit-1] x 100% 2. Tỷ suất sinh lợi thị trường: Rm = [(Pmt-Pmt-1) : Pmt-1] x 100% 3. Rm – Rf: Phần bù thị trường (tức chênh lệch lợi suất thị trường và lãi suất phi rủi ro) 4. Ri – Rf: Phần bù rủi ro cổ phiếu (tức chênh lệch giữa lợi suất cổ phiếu i và lãi suất phi rủi ro) Biết lãi suất phi rủi ro hiện tại là Rf = 5% http://dichvudanhvanban.com www.hutech.edu.vn Bảng 4.2 Ngày Ri Rm Rf Ri-Rf Rm-Rf 04/11/2019 -1.87 2.6 5 -6.87 -2.4 28/10/2019 0.15 1.31 5 -4.85 -3.69 21/10/2019 3.89 -1.01 5 -1.11 -6.01 14/10/2019 -0.39 1.07 5 -5.39 -3.93 07/10/2019 -0.46 -1.35 5 -5.46 -6.35 30/09/2019 -4.18 1.1 5 -0.82 -3.9 23/09/2019 2.47 -0.42 5 -2.53 -5.42 16/09/2019 -0.78 1.62 5 -5.78 -3.38 09/09/2019 0.41 -0.54 5 -4.59 -5.54 03/09/2019 2.9 -0.36 5 -2.1 -5.36 26/08/2019 -3.52 0.19 5 -8.52 -4.81 19/08/2019 3.57 0.59 5 -1.43 -4.41 12/08/2019 -1.15 0.22 5 -6.15 -4.78 http://dichvudanhvanban.com www.hutech.edu.vn CÁC CHỈ SỐ CẦN XÁC ĐỊNH Mô hình CAPM sẽ được chuyển thành phương trình HQ sau: Y = β0 + β1X + ê (1) Y = -0.538 + 1.856X + ê (1) Rm – Rf: Phần bù thị trường là biến độc lập Ri – Rf: Phần bù rủi ro cổ phiếu là biến phụ thuộc β: hệ số beta rủi ro của cổ phiếu α: hệ số chặn của mô hình e: sai số ngẫu nhiên của mô hình Hàm hồi quy tuyến tính để xác định hệ số góc beta có dạng: Y = α +βX + e http://dichvudanhvanban.com www.hutech.edu.vn XÁC ĐỊNH HÀM HQTT Ta có: X = -4.697; Ῡ = -4.558; Ʃx2 = Ʃ(xi-X)2 = 178.343 Ʃxiyi = Ʃ(xi-X) x (Yi-Ȳ) = 152.634 β = Ʃxiyi / Ʃx2 = Y = 152.634 / 178.343 = 0.856 Ῡ = α +βX => α = Ῡ- βX= -4.588-[0.856x(-4.697)]=-0.538 Hàm hồi quy tuyến tính Y = -0.538 + 0.856X + ê Ý nghĩa của các hệ số ước lượng: • Hệ số beta: nếu phần bù rủi ro của thị trường tang 1% thì phần bù rủi ro cổ phiếu tăng thêm 0.856% • Nếu phần bù rủi ro của thị trường = 0 thì cổ phiếu trung bình ở mức 0.538% http://dichvudanhvanban.com www.hutech.edu.vn Ý nghĩa các giá trị HỆ SỐ XÁC ĐỊNH Các giá trị hệ số xác định: ESS = (Ŷ-Ῡ)2 = 130.631 RSS = Ʃê2 = 364.767 TSS = Ʃyi2 = 496.4 Hệ số xác định R2 = ESS/TSS = 130.631/496.4 = 0.263 Giải thích Phần bù rủi ro do thị trường về trung bình giải thích được 26.3% sư thay đổi của phần bù rủi ro cổ phiếu VNM, 73.7% được giải thích bỡi các yếu tố khác ngoài mô hình CAPM http://dichvudanhvanban.com www.hutech.edu.vn Ý NGHĨA CÁC HỆ SỐ HỒI QUY Hàm hồi quy thuyến tính: Y = -0.538 + 0.856X + ê Ý nghĩa của các hệ số ước lượng • Hệ số βeta: nếu phần bù rủi ro thị trường tăng thêm 1% cổ phiếu trung bình sẽ tăng 0.856% • Nếu phần bù rủi ro thị trường bằng 0 thì phần bù rủi ro cổ phiếu trung bình ở mức -0.538% http://dichvudanhvanban.com www.hutech.edu.vn BÀI TẬP MÔ HÌNH CAPM Ngày 5/4/21 2/4/21 1/4/21 31/3/21 30/3/21 29/3/21 26/3/21 25/3/21 24/3/21 23/3/21 22/3/21 19/3/21 18/3/21 17/3/21 http://dichvudanhvanban.com Giá VNM 102.60 102.70 101.00 98.40 99.20 99.00 97.40 98.50 98.70 100.20 100.80 101.70 102.50 100.50 Chỉ số VN-Index 1236.05 1224.45 1216.10 1191.44 1186.36 1175.68 1162.21 1163.10 1161.81 1190.05 1194.05 1200.94 1186.09 1179.90 www.hutech.edu.vn 4.2 KIỂM ĐỊNH SỰ PHÙ HỢP KĐ sự phù hợp của Hệ số ước lượng với mức ý nghĩa 5% - Ta có: 2 𝜎 = 𝜎2 𝛴 𝒆𝟐 𝑛−𝑘 𝜎2 = 𝛴x𝟐 Se ( 𝛽 ) 364.767 7.295 52−2 7.295 = 0.041 178.343 = = = = 0.041= 0.202 = 𝜎2 Se(^𝛼 ) = 𝛽2 X2 * 𝑛 Se( 𝛽 = ) 1325.52 *0.202 52 - Kiểm định hệ số góc H0: 𝛽 = 𝛽* = 0 𝑡= 𝛽− 𝛽∗ 0.856−0 = Se 0.202 = 4.232 (𝛽) 52−2 Ta có: 𝑡 > 𝑡𝑎𝑛−𝑘 = 𝑡0.025 2 http://dichvudanhvanban.com www.hutech.edu.vn = 1.021 Do: 4.232 > 2.009 -> Nằm trong vùng bác bỏ -> bác bỏ giả thiết H0: 𝛽 = 0 - Kiểm định hệ số chặn H0: ∝ = ∝ ∗ = 0 𝑡= ∝− ∝∗ 0.538−0 = Se 1.021 = -0.5271 (∝) Ta có: 𝑡 > 𝑡𝑎𝑛−𝑘 = 𝒕52−2 0.025 2 Do: 0.5271 < 2.009 -> Nằm ngoài vùng bác bỏ -> không có cơ sở để bác bỏ giả thiết H0: 𝛽 = 0 Do đó, ∝ không có ý nghĩa thống kê với mức ý nghĩa 5% http://dichvudanhvanban.com www.hutech.edu.vn 4.2 KIỂM ĐỊNH SỰ PHÙ HỢP Ước lượng khoảng tin cậy cho HS góc và HS chặn với MYN 5% (t= ±2.009) - Hệ số góc: 𝛽− 𝛽∗ = Se 2.009 𝛽− 𝛽∗ = Se −2.009 (𝛽) 0.856− 𝛽∗ 0.202 0.856− 𝛽∗ 0.202 = 2.009 = −2.009 𝛽∗ = 0.45 𝛽∗ = 1.26 (𝛽) Với độ tin cậy 95% (mức ý nghĩa 5% hay xác suất mắc sai lầm 5%) thì hệ số 𝛽∗ có thể dao động trong khoảng từ 0.45 đến 1.26 - Hệ số chặn ∝− ∝ ∗ = Se 2.009 ∝− ∝ ∗ = Se −2.009 (𝛽) (𝛽) 0.538− 𝛽∗ 1.021 0.538− 𝛽∗ 1.021 = 2.009 ∝ ∗ = -2.59 ∝ ∗ = 1.51 = −2.009 Với độ tin cậy 95% (mức ý nghĩa 5% hay xác suất mắc sai lầm 5%) thì hệ số ∝ ∗ có thể dao động trong khoảng từ -2.59 đến 1.51 http://dichvudanhvanban.com www.hutech.edu.vn 4.2 KIỂM ĐỊNH SỰ PHÙ HỢP KĐ sự phù hợp của mô hình với xác suất mắc sai lầm 5% - Kiểm định H0 : R2 = 0; H1 : R2 > 0 F= R2 0.263 x 52 - 2 x n-k = 1-R2 1-0.263 k-1 2-1 F = 17.843 1,50 Ta có: F > F0.05 Do: 17.843 > 4.034 -> Nằm trong vùng bác bỏ -> bác bỏ giả thiết H0: R2= 0 Do đó, mô hình phù hợp với dữ liệu nghiên cứu với mức ý nghĩa 5% http://dichvudanhvanban.com www.hutech.edu.vn CÂU HỎI ÔN TẬP – Bài 4 1. Trình bày mô hình định giá tài sàn vốn CAPM? 2. Phân biệt phần bù rủi ro thị trường và phần bù rủi ro cổ phiếu? 3. Nêu ý nghĩa của hệ số beta trong mô hình định giá tài sản vốn? 4. Trình bày cách xác định lợi tức cổ phiếu và lợi tức thị trường trong mô hình định giá tài sản vốn? 5. Trên thực tế để xác định mô hình định giá tài sản vốn cần phải xác định các yếu tố nào? http://dichvudanhvanban.com www.hutech.edu.vn BÀI 5 – TÍNH KHÔNG CHỆCH CỦA OLS Mục tiêu: • Nắm vững tình huống, điều kiện nào để ứng dụng một cách hiệu quả kết quả của kỹ thuật hồi quy tuyến tính OLS với kết quả ước lượng trong những trường hợp nào; • Từ đó, các kết quả dự báo, ước lượng tác động của một yếu tố lên một yếu tố khác trong lĩnh vực kinh tế nói chung, tài chính ngân hàng nói riêng đạt độ tin cậy cao hơn và thuyết phục hơn; http://dichvudanhvanban.com CÂU HỎI ÔN TẬP – Bài 5 1. Tại sao phải có giả định về sự tuyến tính trong kỹ thuật hồi quy OLS? 2. Tại sao tồn tại giả định về sự ngẫu nhiên trong phép chọn mẫu? 3. Tại sao phải đặt giả định biến giải thích phải có biến động? 4. Tại sao cần phải thoả mãn giả định trung bình phần dư = 0? 5. Tại sao có giả định phương sai sai số không được thay đổi theo thời gian hay theo đối tượng nghiên cứu hay theo cả thời gian và cả đối tượng nghiên cứu? http://dichvudanhvanban.com www.hutech.edu.vn