ĐÁNH GIÁ SỰ LIÊN QUAN Evaluating Associations Lê hoàng Ninh Mục tiêu: 1. Hiểu khái niệm : giá trị và sự liên quan thống kê . 2. Hiểu các giải thích khác/ có thể sự liên quan thống kê: --- Chance ( cơ hội) --- Bias ( sai lệch hệ thống) --- Confounding ( làm nhiễu) 3. Phân biệt các dạng sai lệch hệ thống quan trọng trong các nghiên cứu. 4. Phân biệt giá trị bên trong và giá trị bên ngoài. 5. Hiểu khái niệm về nhiễu và phương pháp đánh giá, kiểm soát chúng 6. Hiểu các hướng dẫn đánh giá sự liên quan nguyên nhân trong dịch tễ Đánh giá sự liên quan khi chúng ta thấy có sự liên quan cần xem xét: 1. Có giá trị không? (kết quả nghiên cứu có phán ánh sự liên quan thật sự không giữa bệnh tật và tiếp xúc? ) 2. Có là sư liên quan nguyên nhân không? (có bằng chứng đủ để cho rằng có sự liên quan nguyên nhân giữa tiếp xúc và bệnh tật không?) Evaluating Associations Đánh giá tính giá trị của sự liên quan: gồm ít nhất 3 giải thích khác có thể của kết quả nghiên cứu: 1. CHANCE ( cơ hội) 2. BIAS ( sai lệch hệ thống) 3. CONFOUNDING ( làm nhiễu) CHANCE “Sự may mắn lấy mẫu” 1. Hiếm khi nghiên cứu trên toàn bộ dân số nên suy diễn từ mẫu lên quần thể 2. Luôn luôn có sự thay đổi kết quả từ mẫu nầy tới mẫu khác 3. Nói chung, mẫu nhỏ thì kém chính xác, tin cậy, và lực thống kê (more sampling variability) CHANCE 4. Một test “statistical significance” được thực hiện để đánh giá mức độ mà bộ dữ liệu so sánh với Giả thuyết H0 (không liên quan) 5. The “p-value” phản ánh xác suất mà test thống kê như t-statistic or chisquare statistic) có được từ dữ liệu thì lớn hơn hay bằng với trị số quan sát được theo gỉa thuyết Ho. CƠ HỘI 6. Theo thông lệ, Nếu p < 0.05, thì sự liên quan giữa tiếp xúc và bệnh tật được xem như là to be “statistically significant.” (loại giả thuyết null hypothesis (H0) và chấp nhận giả thuyết (H1) What does p < 0.05 mean? Nó có nghĩa là chúng ta nghi ngờ rằng độ lớn của hệ quả quan sát được(như risk ratio) thì không do một mình cơ hội(thu thập hay phân tích dữ liệu không sai lệch) CƠ HỘI Example: Possible biased coin Coin Toss - 10 Times: Quan sát Kỳ vọng ngữa 7 5 xấp 3 5 Odds N:X 7:3 = 2.33 Excess Ngữa = O - E = 7 - 5 = 2 p-value: > 0.05 (computation not shown) The observed excess of ngữa đối với xấp thì không lớn hơn kỳ vọng dự kkiến xảy ra do cơ hội CHANCE Example: Possible biased coin Coin Toss – 1,000 Times: Observed Expected Heads 700 500 Tails 300 500 Odds H:T 700:300 = 2.33 Excess Heads = O - E = 700 - 500 = 200 p-value: < 0.05 (computation not shown) The observed excess of heads to tails is much greater than that which might be expected by chance CHANCE Lưu ý: Trị số p phản ánh cả hai độ lớn của sự khác biệt giữa các nhóm nghiên cứu VÀ cỡ mẫu Chính vì vậy, một số đo khác được tính đó là ckhoảng tin cậy (confidence interval =CI) CI = là một biên các giá trị mà trong đó có chứa Trị số thật của quần thể với một độ chắc chắn về xác suất CƠ HỘI THÍ DỤ KHOẢNGTIN CẬY 95% (95 %CONFIDENCE INTERVAL) Tiếp xúc: Hệ quả: Risk Ratio: p-value: 95% C.I.: uống cà phê (nhiều so với ít) tỷ suất mới mắc ung thư vú 1.32 (ước lượng điểm=point estima 0.14 (không ý nghĩa thống kê) 0.87 - 1.98 95% confidence interval ____________________________________________ 0.0 0.5 1.0 1.5 2.0 (null value) CƠ HỘI LÝ GIẢI KẾT QUẢ: Phụ nữ uống nhiều cà phê có nguy cơ bị ung thư vú 1,32 lần (or 32%) cao hơn phụ nữ uống cà phê ít Tuy nhiên, chúng ta tin rằng 95% trị số nguy cơ thật của quần thể nằm giữa khoảng 0.87 and 1.98 (giả định n.cứu không có sai lệch hệ thống). 95% confidence interval ____________________________________________ 0.0 0.5 1.0 1.5 2.0 (null value) CƠ HỘI Vì vậy, nếu 95% khoảng tin cậy KHÔNG chứa giá trị của Ho ( trị số 1.0 (p < 0.05), chúng ta nói rằng sự liên quan là “có ý nghĩa thống kê ” Câu hỏi: Khi nào chúng ta nói sự liên quan thống kê là có “giá trị” (valid statistical association)? Trả lời: Khi đã loại được sai lệch hệ thống / làm nhiễu CƠ HỘI Note: Mặc dù chúng ta vừa xem xét xong vai trò của cơ hội. Tuy nhiên theo thường qui thì cần xem xét đánh gía để loại ra sự hiện diện của sai lệch hệ thống trước. Nói cách khác, đánh giá vai trò của cơ hội sẽ không thể giải thích được khi nghiên cứu có sự hiện diện của sai lệch hệ thống ngay từ đầu. SAI LỆCH HỆ THỐNG(BIAS) BIAS: Sai lầm hệ thống trong dthiết kế, thực hiện, phân tích một nghiên cứu mà các kết quả dẫn đến ước lượng lầm lẫn mối quan hệ bệnh tật và tiếp xúc 1. SAI LỆCH CHỌN LỰA (SELECTION BIAS) 2. SAI LỆCH THÔNG TIN (INFORMATION BIAS): * Interviewer ( phỏng vấn) * Recall Bias ( nhớ lại) * Reporting Bias ( báo cáo) * Surveillance Bias ( giám sát) BIAS SAI LỆCH CHỌN LỰA: sai lầm hệ thống khi xác định các dân số nghiên cứu (thí dụ: 2 nhóm nghiên cứu được so sánh) • Xảy ra khi chọn các đối tương nghiên cứu (hoặc là tình trạng tiếp xúc hoặc là tình trạng bệnh tật) được dựa trên các tiêu chí khác nhau liên quan đến tiếp xúc hay bệnh tật • Kết quả là các nhóm nghiên cứu không so sánh được, trừ khi một số chỉnh lý thống kê được thực hiện SELECTION BIAS THÍ DỤ: nghiên cứu bệnh chứng Outcome : đột quị Exposure: dùng các sản phẩm ức chế sự thèm ăn có chứa Phenylpropanolamine (PPA) Cases: người bị đột quị Controls: người trong cộng đồng không bị đột quị Bias: nhóm chứng được nhận vào từ các cuộc điện thoại từ 9 giờ sáng cho đến 5 giờ chiều. Kết quả nầy đưa vào quá nhiều người không việc làm, thất nghiệp, người về hưu, những người có lẽ không đại diện cho việc dùng các sản phẩm ức chế sự thèm ăn. SELECTION BIAS THÍ DỤ: Đoàn hệ hồi cứu (Retrospective Cohort Study) HỆ QUẢ: Tiếp xúc: COPD Employment in tire manufacturing ( nhà máy võ xe) Exposed: Plant assembly line workers(cn) Non-exposed: Plant administrative personnel Bias: The exposed were contacted (selected) at a local pub while watching Monday night football; the non-exposed were identified through review of plant personnel files. Exposed persons may have been more likely to be smokers (related to COPD) SELECTION BIAS EXAMPLE: không- đáp ứng (Non-Response) • If refusal or non-response is related to exposure, the estimate of effect (exposure/disease) may be biased. For example, if controls are selected by use of a household survey, non-response may be related to demographic and lifestyle factors associated with employment. • Responders often differ systematically from persons who do not respond. SELECTION BIAS NOTE: • Restrictive sampling alone, so long as different criteria are not used between study groups, does not confer selection bias • It merely means that the study results may not generalize to the larger population (external validity) Sai lệch thông tin(INFORMATION BIAS) Definition: có sự khác biệt có hệ thống cách thức mà dữ liệu tiếp xúc và bệnh tật được thu thập trên các nhóm nghiên cứu khác nhau. Các dạng/ nguồn sai lệch thông tin: • Bias in abstracting ( trừu tượng)records • Bias in interviewing ( phỏng vấn) • Bias from surrogate ( đai diện)interviews • Surveillance bias ( giám sát) • Reporting and recall bias ( báo cáo và nhớ lại) Sai lệch phỏng vấn(INTERVIEWER BIAS) ĐỊNH NGHĨA: có sự khác biệt hệ thống trong thu thập, ghi nhận, giải thích thông tin từ các người tham gia nghiên cứu • Có thể ảnh hưởng tới từng loại nghiên cứu • có thể xảy ra nếu người phỏng vấn “KHÔNG BỊ MÙ” về tiếp xúc hay bệnh tật các đối tượng nghiên cứu INTERVIEWER BIAS • Interviewer’s knowledge of subjects’ disease status may result in differential probing of exposure history • Similarly, interviewer’s knowledge of subjects’ exposure history may result in differential probing and recording of the outcome under examination • Placebo control is one method used to maintain observer blindness in randomized trials. Sai lệch nhớ lại(RECALL BIAS) DEFINITION: các đối tương tham gia nghiên cứu khác có hệ thống về cách thức thu thập dữ liệu về tiếp xúc và bệnh tật • Vấn đề nầy nên được lưu ý trong các nghiên cứu bệnh chứng • Những đối tượng đã bị bệnh hay những hệ quả khác về sức khỏe thường có động cơ nhớ lại tiền sử tiếp xúc hơn người không bệnh hay không có những hệ quả sức khỏe khác RECALL BIAS Thí dụ: Nghiên cứu bệnh chứng Outcome: sứt môi, hở hàm ếch Exposure: Systemic infection during pregnancy Cases: Mothers giving birth to children with cleft palate Controls: Mothers giving birth to children free of cleft palate Sai lệch hệ thống: Mothers who have given birth to a child with cleft palate may recall more thoroughly colds and other infections experienced during pregnancy REPORTING BIAS DEFINITION: Sự nén lại hay bộc ra những thông tin như tiền sử bệnh lây truyền đường tình dục. • thường xảy ra do đối tượng báo cáo thái quá một tiếp xúc do attitudes, beliefs, and perceptions • “Wish bias” may occur among subjects who have developed a disease and seek to show that the disease “is not their fault.” SURVEILLANCE BIAS • Một quần thể được giám sát trong một thời gian, sự xác định bệnh trên quần thể đó sẽ tốt hơn dân số chung ( sai lệch giám sát) • Dẫn đến ước lượng có sai lệch về mối quan hệ tiếp xúc và bệnh tật. XẾP LOẠI SAI(MISCLASSIFICATION) DEFINITION: Xếp loại sai bệnh tật hay tiếp xúc một cá nhân vào loại không đúng với loại của họ Example: --Cases incorrectly classified as controls --Controls incorrectly classified as cases --Exposed incorrectly classified as nonexposed --Non-exposed incorrectly classified as exposed MISCLASSIFICATION Non-differential misclassification: The proportion of subjects misclassified on exposure does not depend on disease status OR The proportion of subjects misclassified on disease does not depend on exposure status MISCLASSIFICATION Non-differential misclassification: • Tends to make the exposure or disease groups more similar than they really are • Some non-differential misclassification is inevitable • Almost always results in bias towards the null • In interpretation, researcher must consider what real effect might have been obscured MISCLASSIFICATION Differential misclassification: Classification error of exposure status occurs more frequently among the diseased or non-diseased OR Classification error of disease status occurs more frequently among the exposed or nonexposed MISCLASSIFICATION Differential misclassification: • Results in relatively unpredictable effects • Can exaggerate or underestimate the true exposure/disease relationship • By chance (infrequently), can also result is estimate that is the same as the true exposure/disease relationship.