Uploaded by huynhtrang061003

Data-Science-PPT

advertisement
BÁO CÁO ĐỀ TÀI DATA SCIENCE
NGHIÊN CỨU ĐIỂM TIẾNG ANH
CỦA SINH VIÊN K44 UEH
NHÓM THỰC HIỆN: NHÓM 3
Giáo viên hướng dẫn: Đặng Thái Thịnh
THÀNH VIÊN NHÓM
 Lê Văn Duẩn
 Nguyễn Thị Hồng Nhung
 Nguyễn Thùy Dương
 Tống Thảo Vy
 Mai Nguyễn Thành Hiệp
 Đỗ Thùy Linh
 Bùi Quỳnh Anh
NHÓM 3
NỘI DUNG BÁO CÁO
PHÂN TÍCH BẢNG SỐ LIỆU
PHÂN LỚP, PHÂN CỤM
THỐNG KÊ MÔ TẢ
KẾT LUẬN
Phần 1
PHÂN TÍCH
BẢNG SỐ LIỆU
Lọc dữ liệu bất thường: Crtl+H tìm lỗi và thay thế những nơi bị lỗi
Bảng 2: Điểm thi Tiếng Anh của sinh viên ở
kỳ thi THPTQG và 2 bài thi Tiếng Anh đầu vào
của UEH K44
Bảng 1: Điểm thi THPTQG của sinh viên UEH K44
LÀM SẠCH DỮ LIỆU
Bước 1: Gộp 2 bảng dữ liệu với hàm Vlookup
 Bước 2: Lọc data thiếu thông tin và bất thường về
điểm
Bảng số liệu sau khi làm sạch
PHẦN 2
THỐNG KÊ MÔ TẢ
CHỌN
DỮ LIỆU
Điểm thi THPT quốc gia
BƯỚC 1 :Sắp xếp
điểm số theo thứ tự
từ nhỏ đến lớn
.
Sử dụng công cụ Pivot Table => Row Table (sắp xếp
điểm theo cột dọc)
1. Copy + paste dữ liệu sau khi
được sắp xếp qua một sheet mới
BƯỚC 2 : Tính tần số
xuất hiện của những
điểm số đã sắp xếp
2. Tính tần số bằng cách sử dụng
câu lệnh COUNTIF
BƯỚC 2: Tính tần số
xuất hiện của những
điểm số đã sắp xếp
Ví dụ: Tính tần số xuất hiện của điểm 1,4 = COUNTIF(A2:A4632,B2)
VẼ BIỂU ĐỒ
1. Tô đậm hai cột dữ liệu cần dùng
2. Thực hiện vẽ bằng lệnh Insert
KẾT QUẢ THỰC HIỆN
300
TẦN SỐ XUẤT HIỆN ĐIỂM AV THPT
260
250
236
227
221
220
205
205
200
184
165
TẦN SỐ
163
168
158
154
153
148
150
181
139
138
124
119
112
102
100
90
93
94
99
77
73
70
44
50
44
43
32
22
12
1
2
1
16
13
1,4
1,6
1,8
7
11
4
1
0
10
9,8
9,6
9,4
9,2
9
8,8
8,6
8,4
8,2
8
7,8
7,6
7,4
7,2
7
6,8
6,6
6,4
6,2
6
5,8
5,6
5,4
5,2
5
4,8
4,6
4,4
4,2
4
3,8
3,6
3,4
3,2
3
2,8
2,6
2,4
2,2
2
ĐIỂM
NHẬN XÉT
• Phổ điểm Tiếng anh THPT của các thí sinh có sự phân bố không
đều phạm vi từ 1,4 đến 10,00.
• Điểm Tiếng anh THPT thấp nhất là 1,4
Điểm Tiếng anh THPT cao nhất là 10,00
Khoảng chênh lệch: 10,00 – 1,4 = 8,6 điểm
• Tần số xuất hiện nhiều nhất: điểm 7,4 với 259 lần xuất hiện
Tần số xuất hiện ít nhất: điểm 1,4 với 1 lần xuất hiện,
điểm 10,00 với 1 lần xuất hiện.
Các yếu tố gây nên sự khác thường trong bảng số liệu
Sự khác biệt về môi trường học tập
Học lệch môn
Tự học
Phổ điểm test UEH Listening
250
TEST UEH LISTENING
200
194
191
184
169
170
165
158
153
150
TẦN SỐ
150
146
137
134
130
123
120119
110
98
100
95
92
83
81
78
74
84
79
71
62
56
50
60 59
56
49
50
45
45 45
45
39 40
39
37
32 32
24 25
4
0,4 1,2 1,6 1,8 1,9
2
1
1
1
25
30
23
10 9
5
1
33
25
20
22
19 21
22
17
9
12
14 12 13
10 9
6
7
7
3
2
9
9,1 9,2 9,3 9,4 9,5 9,7 9,8
2
1
3
2
1
1
0
2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
3
3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9
4
4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9
5
5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9
6
6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9
7
7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9
8
8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9
ĐIỂM
Đây là kết quả không tốt khi điểm số sinh viên được phân bổ lệch trái và số điểm xuất hiện nhiều
nhất là 3.7đ cho thấy phần lớn kết quả sau kiểm tra của sinh viên phần lớn dưới mức trung bình
(5đ).
Phổ điểm test UEH Reading
TEST UEH READING
140
126
122
117
114
112
111
122
121
120
118
120
114
113
109
108
105
105
103
102
104 104
98
97
100
98
96 97
89
86
83
83
TẦN SỐ
78 79
80
84
81
76 75
66
61
60
59
60
68
66
58
55
53
51
47
44
41
40
40
32
29
26 27
25
23 22
21
20
14
13 12
8
1
1
2
0,9
1,5
1,8
11
10
7
7
7
4
4
1
2
1
1
1
8,8
9,1
9,6
9,7
0
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9
7
7,1
7,2
7,3
7,4
7,5
7,6
7,7
7,8
7,9
8
8,1
8,2
8,3
8,4
8,5
ĐIỂM
Đồ thị tuy có sự phân phối chuẩn tuy nhiên số lượng sinh viên dưới mức trung bình
vẫn chiếm tỉ lệ cao (55.04%). Số điểm xuất hiện nhiều nhất là 4.1đ đây vẫn là mức
điểm dưới trung bình.
8,6
8,7
Điểm Tiếng Anh của các địa phương
Bước 1: Dùng lệnh Sort sắp xếp để tổng hợp
điểm theo thứ tự từng tỉnh
Bước 3: Xếp điểm trung bình của từng nơi theo
thứ tự từ cao xuống thấp
40
30
Bước 2: Tính điểm trung bình Tiếng Anh của từng tỉnh
bằng Subtotal
20
10
0
Nhận xét: Điểm trung binh phổ biến nằm ở khoảng 5 đến 6 điểm. Không có quá
nhiều sự khác biệt đáng kể về điểm số ở các tỉnh như trước đây vì hiện nay ở các
tỉnh cũng đã tạo nhiều cơ hội cho học sinh của mình phát triển trình độ Tiếng Anh
Item 1
Item 2
Item 3
Item 4
Item 5
Điểm Tiếng Anh từng vùng
Nhận xét
- Điểm thi Tiếng Anh của các bạn sinh viên khu
vực phía Nam khá cao so với mặt bằng chung
của cả nước ở cả kỹ năng nghe, đọc và bài
thi THPTQG.
- Sinh viên miền Bắc có số điểm Tiếng Anh
khiêm tốn hơn sinh viên miền Nam về điểm
Tiếng Anh ở kỹ năng nghe và bài thi
THPTQG, và có điểm kiểm tra kỹ năng đọc
thấp nhất.
- Điểm số kiểm tra của sinh viên miền Trung,
không quá chênh lệch với sinh viên ở miền
Bắc ở các điểm, kỹ năng đọc tốt hơn sinh
viên miền Bắc.
40
PHÂN LỚP
Kỹ năng tiếng anh của sinh viên
30
20
Dùng hàm IF để phân lớp dựa trên kỹ năng
Tiếng anh của sinh viên
10
0
Item 1
Item 2
Item 3
Item 4
Item 5
PHÂN CỤM
o Bước 1: Đặt mã miền
cho các vùng
o Bước 2: Chạy trên phần
mềm Orange
Biểu đồ phân cụm được chia làm 3 phần: Yếu, Trung bình, Giỏi ở kỹ năng
đọc và nghe ở sinh viên.
Phân cụm vùng miền và điểm thi Tiếng Anh
KẾT LUẬN
• Với các kết quả từ quá trình nghiên cứu trên nhóm nhận thấy sinh
viên hầu hết chưa thực sự đầu tư vào ngoại ngữ của mình, điển hình
là các kỹ năng nghe - đọc nói viết.
• Trong thời kỳ hội nhập hiện nay, sinh viên cần phải đầu tư thêm thời
gian công sức của bản thân vào ngoại ngữ thì cơ hội nghề nghiệp
tương lai càng rộng mở giúp các bạn phát triển bản thân và xã hội
phát triển.
CẢM ƠN THẦY VÀ CÁC
BẠN ĐÃ LẮNG NGHE !
Download