Uploaded by Xuyen Dinh Thi

1.1.5 Các phương pháp thu thập dữ liệu thống kê

advertisement
1 Các nghiên cứu tạo mẫu cho thu thập dữ liệu thống kê
Hiển nhiên rằng việc tạo mẫu không thể hoàn thiện được quá trình nghiên cứu. Sau giai
đoạn đầu tiên trong quá trình xây dựng dữ liệu được hoàn thành, ta sẽ đến giai đoạn thứ hai, đó là
thu thập thông tin về các biến quan tâm từ các mẫu chọn độc lập. Trong bài đọc này, chúng ta sẽ
thảo luận về ba thiết kế nghiên cứu; mỗi thiết kế cho phép bạn xác định giá trị của biến theo một
cách khác nhau. Bạn có thể:
- Thực hiện một nghiên cứu quan sát, trong đó các giá trị của biến hoặc các biến quan
tâm được ghi lại khi chúng xuất hiện tự nhiên. Không hề có sự can thiệp của các nhà nghiên cứu
đang thực hiện nghiên cứu này.
- Thực hiện khảo sát mẫu, là một loại nghiên cứu quan sát cụ thể trong đó các cá nhân tự
báo cáo các giá trị của biến, thường xuyên bằng cách đưa ra ý kiến của họ.
- Thực hiện một thử nghiệm. Thay vì đánh giá các giá trị của các biến khi chúng tự nhiên
xuất hiện, các nhà nghiên cứu can thiệp, và họ gán các giá trị của biến giải thích cho các cá nhân.
Các nhà nghiên cứu "kiểm soát" các giá trị của biến giải thích bởi vì họ muốn xem những thay đổi
trong giá trị của biến giải thích ảnh hưởng đến biến trả lời như thế nào. (Lưu ý: Theo bản chất, bất
kỳ thử nghiệm đều nào liên quan đến ít nhất hai biến.)
Loại thiết kế được sử dụng, và chi tiết của thiết kế là rất quan trọng, bởi chúng sẽ quyết
định kết luận có thể rút ra từ các kết quả kết quả nghiên cứu. Đặc biệt, khi nghiên cứu các mối
quan hệ trong đơn vị Phân tích dữ liệu thăm dò, chúng ta nhấn mạnh rằng mối liên hệ giữa hai biến
không đảm bảo việc tồn tại mối quan hệ nguyên nhân - kết quả. Trong bài đọc, chúng ta sẽ tìm
hiểu việc các chi tiết của một thiết kế nghiên cứu đóng một vai trò quan trọng như thế nào trong
việc xác định khả năng thiết lập bằng chứng mang lại kết quả.
2 Ví dụ
Giả sử người nghiên cứu muốn xác định liệu con người có xu hướng ăn vặt nhiều hơn khi
xem tivi hay không. Nói cách khác, người nghiên cứu muốn tìm hiểu mối quan hệ giữa biến giải
thích "Tivi" (biến xác thực được gán cho giá trị "bật" và "không bật") và biến trả lời là "số lượng
đồ ăn vặt được dùng".
Xác định từng thiết kế sau đây như là một nghiên cứu quan sát, một khảo sát mẫu hoặc một
thử nghiệm.
1. Tuyển chọn người tham gia cho nghiên cứu này. Trong khi họ đang chờ đợi để được
phỏng vấn, một nửa số cá nhân ngồi trong phòng chờ với đồ ăn nhẹ có sẵn và một TV đang được
bật. Nửa còn lại ngồi trong phòng chờ với đồ ăn nhẹ và không có TV, chỉ có tạp chí. Các nhà
nghiên cứu xác định xem mọi người có tiêu thụ nhiều đồ ăn nhẹ nhiều hơn trong có TV hay không.
Đây là một thử nghiệm, bởi các nhà nghiên cứu đã kiểm
soát các biến giải thích
của quan tâm (có TV hoặc không có TV) bằng cách gán cho mỗi cá nhân
xem TV hay không, và xác định hiệu ứng xuất hiện trên các biến trả lời của quan tâm
(mức tiêu thụ đồ ăn nhẹ).
2. Tuyển chọn người tham gia cho nghiên cứu. Đưa cho những người tham gia các cuốn
tạp chí để ghi nhận các hoạt động của họ theo từng giờ vào cả các ngày kế tiếp, bao gồm cả khi họ
xem TV và khi họ ăn thức ăn nhẹ. Xác định liệu rằng họ có ăn nhiều đồ ăn nhẹ hơn khi xem TV
hay không.
Đây được gọi là nghiên cứu quan sát, bởi những người tham gia sẽ tự xác định họ có xem
TV hay không. Và không hề có sự can thiệp nào của các nhà nghiên cứu.
3. Tuyển chọn những người tham gia cho nghiên cứu. Yêu cầu họ hồi tưởng lại, trong mỗi
giờ vào ngày hôm trước, liệu họ có xem TV và loại thức ăn nhẹ nào họ dùng vào mỗi giờ. Từ đó
xác định mức tiêu thụ đồ ăn nhẹ có nhiều hơn khi xem TV hay không.
Đây cũng là một nghiên cứu quan sát, ở đây chính bản thân những người tham gia quyết
định việc xem TV hay không. Bạn có thấy được sự khác biệt giữa thiết kế số 2 và 3 không? Hãy
xem mục Bình luận bên dưới.
4. Thăm dò ý kiến một vài cá nhân mẫu với những câu hỏi như: Khi xem TV bạn có ăn nhẹ
không?: (a) ít hơn bình thường; (b) nhiều hơn bình thường; hoặc (c) như bình thường?
Đây là một khảo sát mẫu, bởi các cá nhân tự đánh giá mối liên hệ giữa việc xem TV và ăn
nhẹ.
Nhận thấy rằng trong Ví dụ 2, các giá trị của biến quan tâm (xem TV và tiêu thụ đồ ăn nhẹ)
được ghi lại theo tiến trình thời gian. Những nghiên cứu quan sát này được gọi là định hướng.
Trong khi đó, trong Ví dụ 3, các giá trị của biến quan tâm được ghi lại theo thời gian ngược lại.
Đây gọi là nghiên cứu quan sát hồi cứu. Ta sẽ cùng thảo luận về việc phân biệt giữa hai loại nghiên
cứu này trong học phần này sau.
Trong khi một số nghiên cứu được thiết kế để thu thập thông tin về một biến đơn, thì nhiều
nghiên cứu khác cố gắng đưa ra kết luận về mối quan hệ giữa hai biến. Đặc biệt, các nhà nghiên
cứu thường muốn đưa ra các bằng chứng rằng một biến thực sự là nguyên nhân dẫn đến sự thay
đổi của các biến khác. Ví dụ, câu hỏi nghiên cứu chỉ ra trong những ví dụ trước đó đã tìm cách
chứng minh bằng chứng về việc xem TV có thể là nguyên nhân ăn nhiều đồ ăn vặt hơn. Những
nghiên cứu này có thể đặc biệt hữu ích và lý thú, nhưng chúng cũng cực kỳ dễ bị ảnh hưởng do sai
sót có thể dẫn đến kết luận không còn tính thuyết phục. Ở một vài nghiên cứu trong học phần này,
chúng ta thấy rằng mặc dù bằng chứng về việc kết hợp giữa hai biến có thể rất rõ ràng, câu hỏi về
việc liệu một biến này có thực sự gây ra sự thay đổi của biến kia có thể là quá đỗi mù mờ để có
thể giải đáp trọn vẹn. Nói chung, với những thử nghiệm được thiết kế tốt chúng ta sẽ có cơ hội tốt
hơn trong việc thu được nguyên nhân - kết quả hơn là trong một nghiên cứu quan sát. Tuy nhiên,
các thử nghiệm cũng có một số rủi ro nhất định, và trong rất nhiều tình huống ta không thể sử dụng
nghiên cứu thử nghiệm. Một nghiên cứu quan sát được thiết kế tốt có thể vẫn sẽ cung cấp được
các bằng chứng khá thuyết phục về nguyên nhân - kết quả trong hoàn cảnh phù hợp.
3 Thử nghiệm và Nghiên cứu Quan sát
Trước khi đánh giá hiệu quả của các nghiên cứu quan sát và nghiên cứu thử nghiệm trong
việc cung cấp bằng chứng của mối quan hệ nhân - quả giữa hai biến, ta sẽ cùng minh họa sự khác
biệt về bản chất giữa hai kiểu thiết kế này.
Ví dụ
Hàng ngày, một số lớn những người đang cố gắng đấu tranh với một vấn đề mà kết quả
của nó có thể ảnh hưởng tới tuổi thọ và chất lượng cuộc sống của họ theo nghĩa đen: họ đang cố
gắng bỏ thuốc lá. Chỉ một loạt các kỹ thuật, sản phẩm và các cam kết cho thấy rằng việc bỏ thuốc
lá không hề dễ dàng, cũng như kết quả của nó cũng không được đảm bảo. Các nhà nghiên cứu
muốn nghiên cứu phương pháp nào dưới đây là tốt nhất:
1. Thuốc làm giảm bớt nghiện nicotin.
2. Liệu pháp đào tạo người hút thuốc để bỏ thuốc lá.
3. Kết hợp giữa thuốc và liệu pháp điều trị.
4. Không có hình thức can thiệp nào (bỏ "cai" một cách đột ngột).
Các biến giải thích ở đây là các phương pháp (1,2,3 hoặc 4), trong khi các biến trả lời là
kết quả cuối cùng cai thành công hay thất bại. Trong nghiên cứu quan sát, giá trị của các biến giải
thích xuất hiện ngẫu nhiên. Trong trường hợp này, nó có nghĩa là các đối tượng tham gia nghiên
cứu sẽ tự lựa chọn cách cai thuốc lá. Trong nghiên cứu thử nghiệm, các nhà nghiên cứu sẽ gán giá
trị của biến giải thích vào. Nói cách khác là họ chỉ cho mọi người biết dùng phương pháp nào.
Chúng ta hãy xem xét làm thế nào chúng ta có thể so sánh bốn kỹ thuật, thông qua một nghiên cứu
quan sát hoặc một thử nghiệm.
1. Một nghiên cứu quan sát về mối quan hệ giữa hai biến này yêu cầu ta phải thu thập một
mẫu đại diện từ quần thể những người hút thuốc đang bắt đầu cố gắng cai. Ta có thể hình
dung rằng một tỉ lệ đáng kể những người trong quần thể đang cố gắng sử dụng một trong bốn
phương pháp nêu trên để cai thuốc lá. Để thu được mẫu đại diện, ta có thể thực hiện cuộc khảo sát
bằng điện thoại trên toàn quốc để xác định nhóm
1,000 người đang mới bắt đầu cai
thuốc lá. Ta ghi lại phương thức cai thuốc lá nào trong bốn phương pháp
trên đang được họ sử dụng. Một năm sau, ta liên lạc lại với 1,000 người này và xác nhận
liệu họ có cai thuốc lá thành công hay không.
2. Trong một thử nghiệm, một lần nữa ta sẽ thu thập mẫu đại diện từ quần thể những
người đang bắt đầu cố gắng bỏ thuốc lá, sử dụng khảo sát qua điện thoại trên toàn quốc trên 1,000
cá thể. Tuy nhiên lần này, ta sẽ chia
mẫu làm 4 nhóm gồm 250 cá thể và gán cho
mỗi nhóm một phương pháp để cai thuốc lá. Một năm sau đó, ta liên lạc lại với
1,000 cá thể này và xác định cố gắng của ai đã thành công trong khi sử dụng phương pháp được
chỉ định.
Hình ảnh dưới đây sẽ minh họa hai thiết kế nghiên cứu:
1. Nghiên cứu quan sát:
2. Thử nghiệm:
Cả nghiên cứu quan sát lẫn thử nghiệm đều bắt đầu với một mẫu ngẫu nhiên lấy từ quần
thể những người mới bắt đầu cố gắng cai thuốc lá. Trong cả hai trường hợp , các cá thể trong mẫu
đều có thể được phân loại ra theo các giá trị của biến giải thích: phương pháp cai thuốc lá. Biến
trả lời đó là Thành công hay Thất bại sau một năm. Cuối cùng, ở cả hai trường hợp, ta có thể đánh
giá mối quan hệ giữa các biến bằng cách so sánh tỉ lệ phần trăm thành công của các cá thể trong
từng phương pháp sử dụng, sử dụng bảng dữ kiện hai chiều và tỉ lệ phần trăm có điều kiện.
Điểm khác biệt duy nhất giữa hai phương pháp là cách phân loại mẫu theo các biến giải
thích (phương pháp cai). Trong nghiên cứu quan sát, các cá thể được phân chia dựa trên phương
pháp là cách các cá thể lựa chọn để cai thuốc. Người nghiên cứu không gán giá trị vào biến giải
thích, nhưng thay vào đó lại ghi lại kết quả khi chúng xuất hiện ngẫu nhiên. Trong nghiên cứu thử
nghiệm, người nghiên cứu cố ý gán một trong bốn phương pháp cho từng cá thể trong mẫu. Người
nghiên cứu can thiệp bằng cách kiểm soát biến giải thích, và sau đó đánh giá mối quan hệ của nó
với biến trả lời.
Download