Uploaded by Xuyen Dinh Thi

1.07 Z-scores

advertisement
1.07 Z-scores
Save note
Bạn đang nhìn thấy mật độ hình xăm của cầu thủ bóng đá
thể hiện bằng tỷ lệ cơ thể phủ kín bằng hình xăm.
Các chấm tròn và các độ lệch chuẩn cho thấy độ biến thiên trong
phân phối ở đội 2 lớn hơn trong phân phối của đội 1.
Play video starting at ::22 and follow transcript0:22
Đôi khi các nhà khoa học đặt ra câu hỏi liệu một quan sát cụ thể là phổ biến
hay bất thường.
Để trả lời câu hỏi đó, họ đặt ra một hệ số, số lượng
các độ lệch chuẩn trừ cho số trung bình.
Số nà được gọi là hệ số z.
Trong video này, tôi sẽ giải thích làm thế nào để tính hệ số z,
và sẽ giải thích vì sao nó hữu ích.
Play video starting at ::44 and follow transcript0:44
Đầu tiên nhìn vào phân phối của đội 1.
Số trung bình là 15, độ lệch chuẩn là 2.5.
Để tính hệ số z, chúng ta dùng công thức này.
Play video starting at ::55 and follow transcript0:55
Nó không quá phức tạp.
Nó cho bạn tính
giá trị mà bạn đang quan tâm, hiệu số của giá trị đó
với số trung bình, chia cho độ lệch chuẩn.
Play video starting at :1:6 and follow transcript1:06
Thử xem nó có ý nghĩa gì với mật độ hình xăm là 10.8%.
Hệ số z của giá trị này là 10.8 - 15 chia cho 2.5.
Bằng -1.68.
Như vậy hệ số z là -1.68.
Bạn có thể làm tương tự cho tất cả các giá trị trong phân phối.
Như vậy bạn có kết quả như thế này.
Play video starting at :1:28 and follow transcript1:28
Chú ý rằng bạn sẽ có các hệ số z âm và cả hệ số z dương.
Hệ số z âm đại diện cho những giá trị nhỏ hơn số trung bình,
còn hệ số z dương đại diện cho những giá trị lớn hơn số trung bình.
Vì số trung bình là điểm quân bình trong dãy số, nên hệ số z
âm và dương cũng triệt tiêu lẫn nhau.
Nói cách khác, nếu cộng tổng các hệ số z, bạn sẽ có kết quả bằng 0.
Play video starting at :1:50 and follow transcript1:50
Rồi, tuyệt.
Nhưng làm thế nào để biết một hệ số z là cao hay thấp?
Play video starting at :1:56 and follow transcript1:56
Nó phụ thuộc vào phân phối của bạn trong bối cảnh.
Nguyên tắc là nếu biểu đồ tần suất (histogram) của các biến có dạng chuông,
68% số quan sát rơi vào khoảng hệ số z từ -1 đến 1.
95% nằm giữa hệ số z -2 đến 2.
và 99% nằm giữa hệ số z -3 đến 3.
Có nghĩa là với loại phân phối này hệ số z lớn hơn
hoặc bé hơn -3 được coi là bất thường.
Play video starting at :2:27 and follow transcript2:27
Tuy nhiên, nếu một phân phối xiên về bên phải như biểu đồ này
thì hệ số z dương lớn là bình thường,
vì có nhiều số cực trị nằm về bên phải phân phối.
Play video starting at :2:38 and follow transcript2:38
Tương tự, nếu một phân phối xiên về bên trái,
hệ số z âm lớn lại hay xảy ra hơn vì có nhiều
cực trị nằm bên trái phân phối.
Một nguyên tắc áp dụng cho bất kỳ phân phối nào, không cần tính đến hình dạng,
là 75% số liệu phải nằm trong khoảng hệ số z từ -2 đến 2.
Và 89% nằm trong khoảng hệ số z từ -3 đến 3.
Như vậy ở mức độ nào đó, bản thân hệ số z
cho bạn thông tin về mức độ bất thường của một quan sát.
Hệ số z thậm chí còn có ích hơn nếu bạn muốn so sánh sự khác nhau giữa các phân phối.
Ví dụ,
hãy xem xét câu hỏi liệu cân nặng 19.3 có là bình thường hay không.
Play video starting at :3:19 and follow transcript3:19
Chà, trong đội 1 thì không bình thường chút nào.
Hệ số z là 19.3 - 15 chia cho 2.5
Bằng 1.72.
Ở đội 2, giá trị 19.3 tương ứng với
hệ số z = (19.3 - 15)/8 = 0.54.
Nó cho thấy ở đội 2,
giá trị 19.3 phổ biến hơn ở đội 1.
Trong đội 2, chỉ có 0.54 các độ lệch chuẩn bị bỏ ra khỏi số trung bình.
Trong đội 1, có 1.72 độ lệch chuẩn bị bỏ ra khỏi số trung bình.
Play video starting at :3:57 and follow transcript3:57
Nếu chúng ta mã hoá các giá trị gốc về hệ số z,
chúng ta gọi đó là chuẩn hoá một biến.
Chuẩn hoá một biến nghĩa là chúng ta thay thế các giá trị đo trên thang gốc
bằng các hệ số tính ra từ độ lệch chuẩn và số trung bình.
Play video starting at :4:12 and follow transcript4:12
Thuận lợi là chúng có thể nhìn thấy ngay một giá trị cụ thể
là tương đối phổ biến hay bất thường.
Play video starting at :4:19 and follow transcript4:19
Như vậy, một cầu thủ xăm đến 1/5 cơ thể mình
là bất thường hay không?
Play video starting at :4:26 and follow transcript4:26
Ồ, nó phụ thuộc vào đội bóng
hay một nhóm nào đó mà bạn muốn so sánh anh ta.
Download