Uploaded by Xuyen Dinh Thi

1.1.4 Bức tranh toàn cảnh về thống kê

advertisement
1 Bức tranh lớn
Nói một cách ngắn gọn, Thống kê là tựu chung là chuyển đổi các dữ liệu thành thông tin
hữu ích. Bởi vậy Thống kê là một quá trình mà ở đó ta

Thu thập dữ liệu,

Tổng hợp dữ liệu, và

Làm sáng tỏ dữ liệu.
Để thực sự hiểu được quá trình này diễn ra như thế nào, ta cần phải đặt nó vào trong một
bối cảnh. Chúng tôi sẽ thực hiện bằng cách đưa ra một trong những vấn đề trọng tâm của khóa học
này - Bức tranh lớn của Thống kê. Khóa học sẽ giới thiệu Bức tranh lớn bằng cách xây dựng nó
một cách dần dần và giải thích từng bước một. Cho tới cuối phần giải thích mở đầu này, khi bạn
có nhìn được trọn vẹn Bức tranh lớn, chúng tôi sẽ lại thể hiện nó bằng ví dụ cụ thể.
2 Quần thể
Quá trình thống kê bắt đầu khi ta nhận định nhóm đối tượng nào ta muốn nghiên cứu hoặc
tìm hiểu về nó. Ta gọi nhóm đối tượng này là quần thể . Hãy nhớ rằng từ quần thể ở đây (và trong
suốt cả khóa học) không liên quan tới con người; nó được sử dụng theo nghĩa thống kê rộng hơn
để chỉ không chỉ con người, mà còn cho cả động vật, vật thể, v.v. Ví dụ: chúng ta có thể quan tâm
đến:

Ý kiến của người dân trưởng thành tại Mỹ về án tử hình.

Số lượng loài chuột phản ứng với một loại hóa chất nhất định như thế nào.

Mức giá trung bình của các căn hộ một phòng ngủ trong một thành phố.
Từ đó ta thấy Quần thể là cả một nhóm đối tượng quan tâm của nghiên cứu:
3 Mẫu
Trong hầu hết các trường hợp, quần thể có số lượng lớn như ta mong muốn, nhưng hiển
nhiên không có cách nào để ta có thể nghiên cứu toàn bộ quần thể đó (ví như khi ta cố gắng lấy ý
kiến của toàn bộ cư dân trưởng thành tại Mỹ về án tử hình). Một cách tiếp cận thực tế hơn là kiểm
tra và thu thập dữ liệu chỉ từ một nhóm quần thể, mà chúng tôi gọi là một mẫu. Ta gọi bước đầu
tiên này, trong đó bao gồm việc chọn một mẫu và thu thập dữ liệu từ nó, là xây dựng dữ liệu
Cần lưu ý rằng vì lý do thực tế, chúng ta cần phải sắp xếp và chỉ xem xét một nhóm nhỏ
dân số chứ không phải toàn bộ dân số, chúng ta nên nỗ lực chọn một mẫu theo tiêu chí khiến mẫu
đó có tính chất đại diện cho quần thể tốt. Ví dụ: nếu chúng ta chọn mẫu từ dân số người trưởng
thành ở Hoa Kỳ và hỏi ý kiến của họ về án tử hình, chúng ta không hề muốn mẫu của chỉ bao gồm
các đảng Cộng hòa hoặc chỉ đảng Dân chủ.
Một khi các dữ liệu được thu thập xong, ta sẽ có một danh sách dài các câu trả lời, hoặc
các con số, và để nghiên cứu và làm cho dữ liệu có ý nghĩa, ta cần tổng hợp danh sách đó theo một
cách hiệu quả. Bước thứ hai này, bao gồm cả bước tổng hợp dữ liệu, được gọi là phân tích dữ
liệu thăm dò.
Bây giờ chúng ta đã thu được kết quả mẫu và tổng kết chúng lại, nhưng vẫn chưa xong.
Hãy nhớ rằng mục tiêu của chúng ta là nghiên cứu quần thể, vì vậy điều ta muốn là có thể đưa ra
một kết luận về quần thể dựa trên các kết quả mẫu. Trước khi ta có thể làm điều đó, ta cần phải
xem xét các mẫu mà ta đang sử dụng có thể khác biệt so với toàn bộ quần thể hay không, để từ đó
ta có thể đưa yếu tố đó vào phân tích. Để kiểm tra sự khác biệt này, ta sử dụng xác suất
Về bản chất, xác suất là "công cụ" cho phép chúng ta đưa ra kết luận về quần thể dựa trên
việc thu thập dữ liệu về mẫu.
Cuối cùng, ta có thẻ sử dụng những kết quả tìm được về mẫu để rút ra kết luận về quần thể.
Ta gọi bước cuối cùng trong quá trình này là suy luận.
Đây là Bức tranh lớn của Thống kê
Download