基本文獻評讀要點 藥劑科 鄭育宛 2012.8.22 分享大綱 簡介EBM及文獻評讀 偏誤Bias的分類 文獻評讀之通用要點(VIP) CEBM sheet簡介 實證醫學基本概念 Evidence-based medicine is the integration of best research evidence with clinical expertise and patient values (Sackett et al., 2000) Evidence-based medicine, EBM Evidence-based nursing, EBN Evidence-based Health Care, EBHC 臨床專長 研究實證 病人偏好 實證臨床照護模式(Geyman, 1998) EBHC的核心內容 1.三大要素(3E) (Evidence, Expertise, Expectation) 2.四大問題(4Q) (治療、診斷、危害、預後) 3.五大步驟(5A) (Asking, Acquire, Appraise, Apply, Assess) 4.證據及建議等級 (Level of Evidence, Grade of Recommendation) 實證醫學五步驟(5A) 提出問題(Ask: PICO) Formulate an answerable question 搜尋證據(Acquire) Track down the best evidence 嚴格評讀(Appraisal: VIP) Critical appraise the evidence 恰當運用(Apply:3E) Integrate with clinical expertise 衡量結果(Audit) Monitoring your performance 為何需要文獻評讀? 醫療資訊爆炸且虛實難解的年代…. 提供您面對文獻的一種思路及評估方式 文獻評讀 (Critical Appraisal) Critical Appraisal為被認為較耗費精力且不容 易理解的步驟。 實際評讀文獻的過程,即是審視研究中有可能 的偏誤(Bias)。 偏誤(Bias) 定義: 在研究之設計與實施過程中,凡是會使 數據(data)或結論朝向(toward)或偏離真實 (against truth)之任何因子,稱之為偏誤 如果在研究之設計與實施過程中,忽略可預期 之偏誤因素會使此研究之內部效度降低 偏誤(Bias)之分類 選擇性偏差(selection bias): – 必須讓所有參與研究對象都有相同機率被分派到實驗組 或控制組 評估偏差(observer bias, information bias, detection bias): – 實驗主持者參與研究數據之測量與結果之評估 – 主觀的評估(symptoms) vs 客觀的評估(death) 實驗過程退出偏差(withdrawal or dropout bias): – 無論研究組或對照組若中途退出太多(> 20%),必須探討 其原因,推論統計亦應注意。 偏誤(Bias)之分類 干擾因子(Confounding factor): – 與臨床問題無關、對所要觀察的結果有決定性的影響、 且在實驗組與控制組間分佈不平均 儀器或測量偏差(instrument or measurement bias): – 儀器之保養與校正。 – 標本之保存與運送: 微生物培養; 血液氣體分析,etc. – 測量標準作業流程(standard operation procedure;SOP) 偏誤(Bias)之分類 回憶性偏差(recall bias): – Case-control study: retrospective recall bias. – 研究組成員較對照組成員容易記起疾病相關因素: 血癌兒 童之父母較常記起住家附近有變電所或高壓電塔。 出版偏差(publication bias): – 研究者與雜誌傾向發表治療有效、副作用較少之正面 (positive)結論。 研究的偏差來源及解決方式? 預研究的族群(Target Population) 選擇性偏差 病患樣本(patient sample) 實驗組(experimental) 控制組(control) 執行性偏差 實際接受實驗 組研究的病患 實際接受控制 組研究的病患 病患耗損性 偏差 追蹤(follow-up) 追蹤(follow-up) 檢出性偏差 結果分析 結果分析 Randomization Blinding ITT 評讀文章時先快速篩選以下問 題以決定要不要繼續讀下去? Screening Questions 1.這篇研究是否問一個清楚的問題? (與我們的PICO比較) 2.這篇的研究設計是否為回答此問題的最佳 等級? 那一類的研究設計其偏誤較少? 研究證據評讀 研究證據的價值取決於其品質及效度 評讀文獻的黃金標準中,以雙盲隨機對照臨床 試驗(RCT)得出的結果為最佳證據等級。 The evidence Pyramid 隨機控制試驗 Randomized controlled trial (level1b) 隨機控制試驗幾乎成為判斷治療是否有益的唯 一可接受方法。 研究特點 – 1.在研究中導入了實驗/處置 – 2.固定其他的條件,兩組之間只有處置不同 – 3.隨機方式使兩組的干擾因素相似,使兩組 病人能充分的相提並論(可比較性comparable) 隨機化 Randomization 研究個案有相等的機率被分配到實驗組或控制 組。 隨機分配不保證兩組的狀況一定會一樣。 若樣本數少時,誤差就會產生。 確認問題的類別,才能找尋到最佳研 究設計之證據 Type of question Suggested best type of study Therapy RCT>cohort>case control>case series Diagnosis Prospective, blind comparison to a gold standard Etiology/Harm RCT>cohort>case control>case series Prognosis Cohort study>case control>case series Prevention RCT>cohort>case control>case series Clinical Exam Prospective, blind comparison to a gold standard Cost Economic analysis Level of evidence & Grade of Recommendation 文獻評讀之通用技巧(VIP) Validity (Reliability) 效度/信度 Can we believe it ? (研究方法的探討) – 錯誤errors – 偏誤bias Importance (Impact) 重要性 We believe it ! But does it matter? (研究結 果的分析) Practice (Applicability) 臨床適用性 If we believe it - does it apply to our patients? (如何在臨床運用) Critical Appraisal Therapy Question RCT 效度(Validity) RAMMbo, RABO Recruitment受試者招募 研究樣本是否具有代表性(Representative)? Allocation試驗分組 –病人的治療是否隨機分派Random? –隨機分配過程是否隱匿concealment? –兩組在治療開始時的baseline是否相似? 效度(Validity) RAMMbo, RABO Maintenance維持 – 對照組與實驗組是否被同等對待? – 是否所有的病人都被放到原先分派的組別中做分析? 治療意向分析(Intention-to-treat analysis, ITT) –是否追蹤夠久和完整follow-up Measurements結果測量 –病患、醫護人員、研究員是否對治療不知情 (blinded)? – 測量是否客觀(objective)及標準化? Guyatt. JAMA, 1993 文獻證據是否有效? 病患的治療分派是隨機的嗎? R 隨機分派過程使否隱匿? 對照組與實驗組在進入試驗時是否相似? 病人的追蹤是否夠久、夠完整? A 所有的病患都被放到原先分派的組別作分析? 病患、醫師、評估者是否對治療分派不知情? B O 對照組與實驗組病患是否被同等對待? Validity 病患的治療分派是隨機的嗎? 對已知有CAD病史的停經婦女,使用HRT -可以減少CAD的風險[case control & cohort studies] -不會減少CAD的風險[RCT] Confounders: -與臨床問題看似無關、對所要觀察的結果有決定性影響、 在暴露組與非暴露組間分布不平均。 -社經地位(Confounders)較高者,選擇HRT預防CAD , 同時也較注意養生、規則追蹤,因而CAD較少發生。 Validity-R 隨機分派過程是否隱匿? 醫師(caregivers)將不知道(blind)下一個病患 將接受哪一種治療,照顧或評估病患時將會一 視同仁,而不會扭曲。 採取嚴密的措施以保證病人分組的隱匿性 分組隱匿可以預防選樣偏誤,保護在給予介入 措施之前及已施予處置整個過程的隨機化順序 Validity-R Allocation Concealment分組隱匿 Adequate 適當方法 3rd party central computer randomization On-site computer from which assignment can only be determined after entering patient data Sequentially-Numbered, Opaque, Sealed Envelopes (SNOSE) 不透 光信封 Sequentially-numbered containers Pharmacy controlled Inadequate 不恰當 • PI responsible for generating sequence • Non-opaque, non-sealed & non-serially numbered envelopes • Known & predictable mechanism e.g.odd or even date of birth or medical record number, alternating clinic days 對照組與實驗組病患是否相似? 雖然經過隨機化,預期各組間可能的干擾因 素會平均分布,但分組後仍需確認各組在重 要參數上是否相似 [baseline characteristic] 如果不相似,可以藉由統計方法(多變數分析) 調整分析結果,減少干擾因素的影響。 通常是個案數太少,才會分布不平均。 Validity-R 追蹤夠久、夠完整? 確認追蹤夠久,方能看到重要的臨床結果? 例:如果評估使用statin的研究,只追蹤幾個 月,將看不出結果是否有益。根據目標疾病 (冠心病、中風)的特性,應該追蹤三、五年, 最好是十年以上。 在呈現臨床結果時,必須將時間因素考慮進去。 Validity-A 追蹤夠完整? 無法完成追蹤的紀錄及分析 和預後無關 vs 和預後有關。 “ 5與20“法則:失聯<5%所造成的偏差很小, 失聯>20%將嚴重威脅到研究結果的效度。 Validity-A 因原先分派的組別作分析? 爲了維持隨機化的意義,一但分配組別後就不 應變更。不論任何理由變更,一定帶有某些特 徵,將產生無法預期的結果。 即使失去追蹤,仍應依原先分派的組別進行分 析,即治療意向分析(intention to treat, ITT, analysis),此種方式保留了隨機取樣之精神, 且其結果較可能代表在原始設計情況下,病人 接受某種治療之真正的效度。 Validity-A 治療意向分析 (intention to treat analysis) 分析資料時依照原來分組的所有病人都納入分 析,包括中途退出或有遺失數值的病人。 好處 –依治療意願分析是為了維持隨機化的意義。 achieved by randomization –減少因遺失數值missing values所產生的偏誤,可 能造成研究結果扭曲。 壞處: – 低估治療效果 是否對治療分派不知情? 爲了避免病患對症狀的報告或對治療的順從性影 響治療的結果,實施盲法是必要的。 Patients: placebo effect Caregivers: performance bias Outcome assessors: detection bias patients: subjective (e.g. pain score, questionmaire) researchers: subjective OR objective Analyzers: analytical bias Validity-B 對照組與實驗組病患是否被 同等對待? 除了實驗治療外,所有組別應被平等對待 進行盲法 使用特定、明確的治療流程來進行治療及追蹤。 定義每一個重要的預後結果,並在所有組別一體 適用。 Validity-O 文獻證據是否重要(Importance) 1.治療效果有多大?多重要? 決定研究中所描述的治療可能利益(或傷害)是否 重要? 使用統計分析比較介入處置是否有統計差異? 2.治療效果的估計有多精確? NNT (number need to treat) 益一需治數 NNT:在研究試驗期間,我們必須使用試 驗性療法治療多少個病人,才能預防一個額 外的壞結果。 NNT=1/ARR=1/∣CER-EER∣ NNT必須為一個整數 NNH (number need to harm) =1/ARI (使 用試驗性療法治療多少個病人,才能造成一 個額外的壞結果。) Treatment Effects Occurrence of diabetic retinopathy at 5 years among insulin-dependent diabetic in the DCCT trial Usual insulin regimen (CER: control event rate): 38% Intensive insulin regimen (EER: experimental event rate): 13% Risk Reduction (calculation): NNT Absolute risk reduction (ARR) = │CER-EER│= 38%-13% = 25% Relative risk reduction (RRR) = │CER-EER│/CER = 25%/38% =66% Number needed to treat (NNT) = 1/ARR = 1/25% = 4 patients NNT: The number of patients that need to be treated to prevent one bad outcome or get one good outcome. Harm The proportion of patients with at least one episode of symptomatic hypoglycemia Usual insulin regimen (CER: control event rate): 23% Intensive insulin regimen (EER: experimental event rate): 57% Risk Increase(calculation): NNH Absolute risk increase (ARI) =│EER - CER│ = 57%-23% = 34% Relative risk increase (RRI) =│EER-CER│/CER = 57%-23%/ 23% = 148% Number needed to harm (NNH) = 1/ARI = 1/0.34 = 3 patients (整數) NNH: The number of patients that need to be treated to cause one bad outcome (being harmed). 治療效果有多大? 事件發生率(平均追蹤五 相對危險降低度 絕對危險降低度 年) (RRR) (ARR) 控制組事件 實驗組事 │CER-EER│ │CER-EER│ 發生率 件發生率 /CER (CRE) (EER) 4.3% MRC 研究 5.7% │5.7%-4.3%│/5.7% │5.7%-4.3%│ =25% =1.4% 假設性的小 0.000057% 0.000043 │0.000057%│0.000057%% 案例 0.000043%│ 0.000043%│= /0.000057%=25% 0.000014% 相對危險降低度 (relative risk reduction, RRR) 相對效益增加度 (relative benefit increase, RBI) 相對風險增加度 (relative risk increase, RRI) 益-需治數 (NNT) 1/ARR 1/1.4%= 72 1/0.000014 %= 7142857 相對風險降低度。RRR不能反映沒有治療的 事件危險性,因此無法區分治療效果的大小。 要看出治療效果的大小,必須以兩組間的差 異絕對值來估計,即絕對風險降低度(ARR)。 因此,在評估治療效果時,ARR是一個比 RRR更有意義的度量方式。 文章常以RRR 來表示療效,但用NNT (Number Needed to Treat), NNH來表達更 為直接。 一些有NNT的案例 主要症狀 舒張壓 110129 mmHg 舒張壓 90109 mmHg 無症狀的頸 動脈狹窄 輕微至嚴重 的阿茲海默 症 不規則的心 絞痛 腎機能不全 與冠狀動脈 攝影 抗高血壓藥物 Death, stroke, MI Event rate 追蹤時間 CER EER 13 % 1.4 % 1.5 years 抗高血壓藥物 Death, stroke, MI 5.5 % 4.7 % 5.5 years 128 頸動脈內膜切 除(與內科療法 相較) Donepezil (vs. placebo) Death or major stroke 18 % 8% 2 years 10 No functional decline 44 % 59 % 1 year 7 7 天以內的侵 入治療(與內科 療法相較) Oral acetylcysteine (vs. placebo) Death or MI 16 % 12 % 24 months 24 4% 12 醫療介入 預防事件 Contrast media12 % induced reduction in renal function 8 months NNT 8 治療效果的估計有多精確? 病患樣本 vs. 病患母群體 取樣結果純粹受機率的影響有多大? 信賴區間(confidence interval)提供一個 真實值的範圍,可以量化估計值的不確定 性。 信賴區間越窄,對結果越有信心! Practice (Applicability) 臨 床適用性 在你決定應用研究結果到你病人身上時, 應該問的問題... Practice (Applicability) 臨床適用性 我的病人是否不同於研究的那群病人,所以結 果不能應用?病人特性是否相同? 建議的措施是否適用於我們所在的場所、診療 環境?病患及醫療提供者的配合度如何? 病人可能從治療中得到什麼好處或壞處? 對於我的病人而言,治療的益是否多於弊? 對於預期的結果或提供的治療,病患的價值觀 和期望值為何? 我們的病人是否適用該研究結果? 我們的病患是否符合納入條件(Including criteria),而沒有在排除條件(excluding criteria)之中。 從研究樣本的人口學和臨床特徵的描述中,比 較我們的病人和文獻中的病人是否相似。 (baseline characteristics) Critical Appraisal Therapy Question Systematic Review 系統性回顧文獻評讀 (SR) 系統性回顧研究是回答治療問題最好的研究設 計。 有關治療文獻之搜尋,應從系統性回顧文獻開 始。 審慎評估依各系統性回顧文獻的優劣,還是需 要評估其中所包含的個別試驗。 SR文獻證據是否有效 這是一個RCT的系統性回顧嗎? 有關相關試驗搜尋的描述是否完整? 個別研究是否做過效度評估? 分析中是否使用個別研究的病患數據或合計數 據? SR文獻證據是否重要 這些研究的結果是否一致? 治療效果有多大?估計有多精確? 研究的結果是否一致 治療結果是一致性的,比較能採信這樣的結果。 查看不同試驗信賴區間的重疊程度。 不可能指望所有的試驗顯示完全相同的療效, 但是若有試驗結果明顯沒有好處,甚至有明確 的壞處,則應特別判讀。 研究設計上與統計上的異質性 (heterogeneity)。 治療效果有多大?估計有多精確? 和評讀單一試驗一樣,計算出NNT或NNH 。 大多數的systematic review仍用勝算比(OR) 或相對危險來表達其結果,需自行轉換成NNT 或NNH。 SR的結果是否適用於我的病人 我的病患與研究中的病患是否不同,因此可否 適用該研究結果? 該項治療適合於我們的診療環境嗎? 可從治療中的到什麼好處或壞處? 病患如何看待我們想要預防的結果或該項治療 可能造成的傷害? SR的結果是否適用於我的病人 評估方法和個別試驗中使用的方法一樣。 SR提供一個來自不同族群的整體平均治療結 果 SR提供次族群的精確資訊,有助於將個別化 的證據應用到我們的病人身上。 SUMMARY Validity (Reliability) 效度/信度 RAMMbo-研究方法的探討(決定實證等級) Importance (Impact) 重要性/效益 研究結果的分析(此結果是否有意義) Practice (Applicability) 臨床適用性 研究結果能否應用於照顧的病人 文獻搜尋及評讀主要有幾個方法 一、直接應用已經評讀過的文獻資料庫(例如: ACP journal club, Cochrane Library) 二、自行評讀文獻,也就是用簡單的評讀方式, 例如上述提到的VIP 或是PICO/RAMMbo 等概 念 第三、必要時使用評讀工具協助,如: CATmaker 、CASP(Critical Appraisal Skills Program) 、CEBM (center of evidence base medicine) CASP(Critical Appraisal Skills Program) sheet 敬請指教