BÁO CÁO ĐỀ TÀI DATA SCIENCE NGHIÊN CỨU ĐIỂM TIẾNG ANH CỦA SINH VIÊN K44 UEH NHÓM THỰC HIỆN: NHÓM 3 Giáo viên hướng dẫn: Đặng Thái Thịnh THÀNH VIÊN NHÓM Lê Văn Duẩn Nguyễn Thị Hồng Nhung Nguyễn Thùy Dương Tống Thảo Vy Mai Nguyễn Thành Hiệp Đỗ Thùy Linh Bùi Quỳnh Anh NHÓM 3 NỘI DUNG BÁO CÁO PHÂN TÍCH BẢNG SỐ LIỆU PHÂN LỚP, PHÂN CỤM THỐNG KÊ MÔ TẢ KẾT LUẬN Phần 1 PHÂN TÍCH BẢNG SỐ LIỆU Lọc dữ liệu bất thường: Crtl+H tìm lỗi và thay thế những nơi bị lỗi Bảng 2: Điểm thi Tiếng Anh của sinh viên ở kỳ thi THPTQG và 2 bài thi Tiếng Anh đầu vào của UEH K44 Bảng 1: Điểm thi THPTQG của sinh viên UEH K44 LÀM SẠCH DỮ LIỆU Bước 1: Gộp 2 bảng dữ liệu với hàm Vlookup Bước 2: Lọc data thiếu thông tin và bất thường về điểm Bảng số liệu sau khi làm sạch PHẦN 2 THỐNG KÊ MÔ TẢ CHỌN DỮ LIỆU Điểm thi THPT quốc gia BƯỚC 1 :Sắp xếp điểm số theo thứ tự từ nhỏ đến lớn . Sử dụng công cụ Pivot Table => Row Table (sắp xếp điểm theo cột dọc) 1. Copy + paste dữ liệu sau khi được sắp xếp qua một sheet mới BƯỚC 2 : Tính tần số xuất hiện của những điểm số đã sắp xếp 2. Tính tần số bằng cách sử dụng câu lệnh COUNTIF BƯỚC 2: Tính tần số xuất hiện của những điểm số đã sắp xếp Ví dụ: Tính tần số xuất hiện của điểm 1,4 = COUNTIF(A2:A4632,B2) VẼ BIỂU ĐỒ 1. Tô đậm hai cột dữ liệu cần dùng 2. Thực hiện vẽ bằng lệnh Insert KẾT QUẢ THỰC HIỆN 300 TẦN SỐ XUẤT HIỆN ĐIỂM AV THPT 260 250 236 227 221 220 205 205 200 184 165 TẦN SỐ 163 168 158 154 153 148 150 181 139 138 124 119 112 102 100 90 93 94 99 77 73 70 44 50 44 43 32 22 12 1 2 1 16 13 1,4 1,6 1,8 7 11 4 1 0 10 9,8 9,6 9,4 9,2 9 8,8 8,6 8,4 8,2 8 7,8 7,6 7,4 7,2 7 6,8 6,6 6,4 6,2 6 5,8 5,6 5,4 5,2 5 4,8 4,6 4,4 4,2 4 3,8 3,6 3,4 3,2 3 2,8 2,6 2,4 2,2 2 ĐIỂM NHẬN XÉT • Phổ điểm Tiếng anh THPT của các thí sinh có sự phân bố không đều phạm vi từ 1,4 đến 10,00. • Điểm Tiếng anh THPT thấp nhất là 1,4 Điểm Tiếng anh THPT cao nhất là 10,00 Khoảng chênh lệch: 10,00 – 1,4 = 8,6 điểm • Tần số xuất hiện nhiều nhất: điểm 7,4 với 259 lần xuất hiện Tần số xuất hiện ít nhất: điểm 1,4 với 1 lần xuất hiện, điểm 10,00 với 1 lần xuất hiện. Các yếu tố gây nên sự khác thường trong bảng số liệu Sự khác biệt về môi trường học tập Học lệch môn Tự học Phổ điểm test UEH Listening 250 TEST UEH LISTENING 200 194 191 184 169 170 165 158 153 150 TẦN SỐ 150 146 137 134 130 123 120119 110 98 100 95 92 83 81 78 74 84 79 71 62 56 50 60 59 56 49 50 45 45 45 45 39 40 39 37 32 32 24 25 4 0,4 1,2 1,6 1,8 1,9 2 1 1 1 25 30 23 10 9 5 1 33 25 20 22 19 21 22 17 9 12 14 12 13 10 9 6 7 7 3 2 9 9,1 9,2 9,3 9,4 9,5 9,7 9,8 2 1 3 2 1 1 0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9 ĐIỂM Đây là kết quả không tốt khi điểm số sinh viên được phân bổ lệch trái và số điểm xuất hiện nhiều nhất là 3.7đ cho thấy phần lớn kết quả sau kiểm tra của sinh viên phần lớn dưới mức trung bình (5đ). Phổ điểm test UEH Reading TEST UEH READING 140 126 122 117 114 112 111 122 121 120 118 120 114 113 109 108 105 105 103 102 104 104 98 97 100 98 96 97 89 86 83 83 TẦN SỐ 78 79 80 84 81 76 75 66 61 60 59 60 68 66 58 55 53 51 47 44 41 40 40 32 29 26 27 25 23 22 21 20 14 13 12 8 1 1 2 0,9 1,5 1,8 11 10 7 7 7 4 4 1 2 1 1 1 8,8 9,1 9,6 9,7 0 1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8 8,1 8,2 8,3 8,4 8,5 ĐIỂM Đồ thị tuy có sự phân phối chuẩn tuy nhiên số lượng sinh viên dưới mức trung bình vẫn chiếm tỉ lệ cao (55.04%). Số điểm xuất hiện nhiều nhất là 4.1đ đây vẫn là mức điểm dưới trung bình. 8,6 8,7 Điểm Tiếng Anh của các địa phương Bước 1: Dùng lệnh Sort sắp xếp để tổng hợp điểm theo thứ tự từng tỉnh Bước 3: Xếp điểm trung bình của từng nơi theo thứ tự từ cao xuống thấp 40 30 Bước 2: Tính điểm trung bình Tiếng Anh của từng tỉnh bằng Subtotal 20 10 0 Nhận xét: Điểm trung binh phổ biến nằm ở khoảng 5 đến 6 điểm. Không có quá nhiều sự khác biệt đáng kể về điểm số ở các tỉnh như trước đây vì hiện nay ở các tỉnh cũng đã tạo nhiều cơ hội cho học sinh của mình phát triển trình độ Tiếng Anh Item 1 Item 2 Item 3 Item 4 Item 5 Điểm Tiếng Anh từng vùng Nhận xét - Điểm thi Tiếng Anh của các bạn sinh viên khu vực phía Nam khá cao so với mặt bằng chung của cả nước ở cả kỹ năng nghe, đọc và bài thi THPTQG. - Sinh viên miền Bắc có số điểm Tiếng Anh khiêm tốn hơn sinh viên miền Nam về điểm Tiếng Anh ở kỹ năng nghe và bài thi THPTQG, và có điểm kiểm tra kỹ năng đọc thấp nhất. - Điểm số kiểm tra của sinh viên miền Trung, không quá chênh lệch với sinh viên ở miền Bắc ở các điểm, kỹ năng đọc tốt hơn sinh viên miền Bắc. 40 PHÂN LỚP Kỹ năng tiếng anh của sinh viên 30 20 Dùng hàm IF để phân lớp dựa trên kỹ năng Tiếng anh của sinh viên 10 0 Item 1 Item 2 Item 3 Item 4 Item 5 PHÂN CỤM o Bước 1: Đặt mã miền cho các vùng o Bước 2: Chạy trên phần mềm Orange Biểu đồ phân cụm được chia làm 3 phần: Yếu, Trung bình, Giỏi ở kỹ năng đọc và nghe ở sinh viên. Phân cụm vùng miền và điểm thi Tiếng Anh KẾT LUẬN • Với các kết quả từ quá trình nghiên cứu trên nhóm nhận thấy sinh viên hầu hết chưa thực sự đầu tư vào ngoại ngữ của mình, điển hình là các kỹ năng nghe - đọc nói viết. • Trong thời kỳ hội nhập hiện nay, sinh viên cần phải đầu tư thêm thời gian công sức của bản thân vào ngoại ngữ thì cơ hội nghề nghiệp tương lai càng rộng mở giúp các bạn phát triển bản thân và xã hội phát triển. CẢM ƠN THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE !