Blokboek Klinisch Wetenschappelijk Onderzoek Geneeskunde CRU (+) Bachelor jaar 3 Cursusjaar 2021/2022 KWO Heb je klachten, opmerkingen of suggesties over dit blok? Mail dan naar bvt3@msfusams.nl De BVT gaat er dan mee aan de slag! Colofon De inhoud van dit blokboek is tot stand gekomen onder verantwoordelijkheid van Prof. dr. Y. van der Graaf, Dr. M. Kluijtmans, Dr. M.M. Rovers, Prof. dr. A. May en Dr. K. Jenniskens Het theoriedeel is tot stand gekomen onder verantwoordelijkheid van de staf klinische epidemiologie van het Julius Centrum. De auteursrechten van dit blokboek berusten bij het Universitair Medisch Centrum Utrecht. Niets uit deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke andere wijze dan ook, noch in een gegevens opzoeksysteem worden opgeslagen, zonder voorafgaande schriftelijke toestemming van het Onderwijscentrum van het UMC Utrecht. ©2021 Contact & vragen cru-epidemiology@umcutrecht.nl 2 KWO INHOUDSOPGAVE INHOUDSOPGAVE .................................................................................................................................................... 3 DEEL I Klinisch Wetenschappelijk Onderzoek ALGEMENE INFORMATIE CURSUS ........................................ 5 Voorwoord................................................................................................................................................................. 7 Inleiding ..................................................................................................................................................................... 9 a. Introductie ..................................................................................................................................................... 9 b. Over dit blokboek.......................................................................................................................................... 9 c. Leerdoelen van de cursus ............................................................................................................................ 9 d. Klinisch hoofdprobleem ................................................................................................................................ 9 e. Begeleiding ................................................................................................................................................... 9 f. Weekstramien en werkvormen ................................................................................................................... 10 Participatie ...................................................................................................................................................... 11 Online onderwijs ............................................................................................................................................ 11 g. Literatuur & Studiemateriaal ....................................................................................................................... 11 h. Toetsing ...................................................................................................................................................... 11 Honoursprogramma....................................................................................................................................... 12 Samenstelling cijfer ....................................................................................................................................... 12 Vervangende toets ......................................................................................................................................... 13 i. Tips nodig over efficiënt studeren? ............................................................................................................. 13 j. Vertrouwenspersoon .................................................................................................................................. 13 k. Evaluatie en kwaliteitsbewaking ................................................................................................................. 13 l. Arbo, veiligheid en milieu ............................................................................................................................ 14 m. Leerlijnen Academische Vorming, Professionele Ontwikkeling en Studie Reflectie ................................... 14 Waaraan dien je te voldoen om de leerlijnen Academische Vorming, Professionele & Persoonlijke Ontwikkeling en StudieReflectie te behalen? ..................................................................................... 14 n. Adreslijst ..................................................................................................................................................... 15 Coördinator..................................................................................................................................................... 15 Plaatsvervangend coördinator...................................................................................................................... 15 Onderwijsbureau ............................................................................................................................................ 15 Medewerkers van de medische bibliotheek die college PubMed verzorgen ............................................ 15 Hoofdbegeleiders en docenten ..................................................................................................................... 15 Week 1. Beschrijving van het klinisch hoofdprobleem ....................................................................................... 17 Indeling en uitvoering ....................................................................................................................................... 17 I. Zelfstudie ................................................................................................................................................ 17 II. Introductie college ................................................................................................................................. 17 III. Groepsopdracht ..................................................................................................................................... 17 IV. Hoor-werkcollege Diagnostisch onderzoek ........................................................................................ 18 V. Hoor-werkcollege Prognostisch onderzoek ........................................................................................ 18 VI. Werkgroepbijeenkomst ......................................................................................................................... 18 VII. Zelfstudie PubMed ................................................................................................................................. 19 VIII. Presentaties ........................................................................................................................................... 19 Week 2. Formuleren vraagstellingen & vooraanvraag subsidie ......................................................................... 21 Indeling en uitvoering ....................................................................................................................................... 21 I. Zelfstudie ................................................................................................................................................ 21 II. Zelfstudie: Statistiek.............................................................................................................................. 21 III. Hoor-werkcollege Frequentie- en associatiematen ............................................................................ 21 IV. Hoor-werkcollege Patiëntparticipatie ................................................................................................... 22 V. Groepsopdracht ..................................................................................................................................... 22 VI. Hoor-werkcollege Etiologisch onderzoek ........................................................................................... 29 VII. Hoor-werkcollege Interventieonderzoek .............................................................................................. 29 VIII. Werkgroepbijeenkomst ......................................................................................................................... 29 IX. Hoor-werkcollege Statistiek: Steekproefvariabiliteit en betrouwbaarheidsintervallen ................... 29 X. Presentaties ........................................................................................................................................... 29 Week 3. Herformuleren vraagstelling & analyseplan dataset ............................................................................. 31 Indeling en uitvoering ....................................................................................................................................... 31 I. Zelfstudie ................................................................................................................................................ 31 II. Zelfstudie: Statistiek.............................................................................................................................. 31 III. Groepsopdracht ..................................................................................................................................... 31 IV. Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets ........................................ 33 V. Hoor-werkcollege Statistiek: T-toetsen ............................................................................................... 34 VI. (computer)practicum Introductie SPSS (PC)....................................................................................... 34 VII. Werkgroepbijeenkomst ......................................................................................................................... 34 VIII. Presentaties ........................................................................................................................................... 34 Week 4. De resultaten............................................................................................................................................. 35 Indeling en uitvoering ....................................................................................................................................... 35 3 KWO I. Zelfstudie ................................................................................................................................................ 35 II. Zelfstudie: Krantenartikelopdracht ...................................................................................................... 35 III. Nabespreking statistiek opdracht ........................................................................................................ 36 IV. Analyse eigen data ................................................................................................................................ 36 V. Computer(computer)practicum diagnostisch en prognostisch onderzoek ..................................... 36 VI. Computer(computer)practicum etiologisch en interventieonderzoek .............................................. 36 VII. Groepsopdracht ..................................................................................................................................... 36 VIII. Werkgroepbijeenkomst ......................................................................................................................... 36 IX. Presentaties ........................................................................................................................................... 36 Week 5. Rapportage en discussie ......................................................................................................................... 37 Indeling en uitvoering ....................................................................................................................................... 37 I. Zelfstudie ................................................................................................................................................ 37 II. Zelfstudie: Krantenartikelopdracht ...................................................................................................... 37 III. (computer)practicum PubMed: zoeken voor mini-meta analyse ....................................................... 37 IV. Groepsopdracht ..................................................................................................................................... 37 V. Werkgroepbijeenkomst ......................................................................................................................... 38 Week 6. Eindpresentaties, eindverslag en toets .................................................................................................. 39 Indeling en uitvoering ....................................................................................................................................... 39 I. Groepsopdracht ..................................................................................................................................... 39 II. Werkgroepbijeenkomst ......................................................................................................................... 40 III. Eindpresentaties .................................................................................................................................... 40 IV. Eindtoets ................................................................................................................................................ 41 DEEL II Klinisch Wetenschappelijk Onderzoek OEFENINGEN BIJ COLLEGES & (COMPUTER)PRACTICA 43 Week 1. Oefeningen college diagnostisch onderzoek ........................................................................................ 45 a. Oefening 1 .................................................................................................................................................. 45 b. Oefening 2 .................................................................................................................................................. 46 c. Oefening 3 .................................................................................................................................................. 48 Week 1. Oefeningen college prognostisch onderzoek ........................................................................................ 51 a. Oefening 1 .................................................................................................................................................. 51 b. Oefening 2 .................................................................................................................................................. 53 Week 2. Oefeningen bij college frequentie- en associatiematen........................................................................ 55 a. Oefening 1 .................................................................................................................................................. 55 b. Oefening 2 .................................................................................................................................................. 56 c. Oefening 3 .................................................................................................................................................. 56 Week 2. Oefeningen college etiologisch onderzoek ........................................................................................... 57 a. Oefening 1 .................................................................................................................................................. 57 b. Oefening 2 .................................................................................................................................................. 58 Week 2. Oefening college interventieonderzoek ................................................................................................. 59 Week 4. Computer(computer)practicum diagnostisch onderzoek ..................................................................... 61 Week 4. Computer(computer)practicum prognostisch onderzoek .................................................................... 63 Week 4. Computer(computer)practicum etiologisch onderzoek ........................................................................ 65 Week 4. Computer(computer)practicum interventieonderzoek .......................................................................... 67 DEEL III Klinisch Wetenschappelijk Onderzoek THEORIE ................................................................................ 69 Hoofdstuk 1 KLINISCHE EPIDEMIOLOGIE ........................................................................................................... 71 Hoofdstuk 2 AANDACHTSGEBIEDEN BINNEN DE KLINISCHE EPIDEMIOLOGIE ............................................ 79 Hoofdstuk 3 UITVOERING VAN ONDERZOEK ................................................................................................... 103 Hoofdstuk 4 RAPPORTAGE ................................................................................................................................. 113 Appendix A EVIDENCE-BASED MEDICINE ................................................................................................... 119 Appendix B STEEKPROEFOMVANG ............................................................................................................. 123 Appendix C META-ANALYSE ......................................................................................................................... 127 4 KWO DEEL I Klinisch Wetenschappelijk Onderzoek ALGEMENE INFORMATIE CURSUS 5 KWO 6 KWO Voorwoord “To study the phenomena of disease without books is to sail uncharted seas, while to study books without patients is not to go to sea at all.” Sir William Osler Dit citaat van de grote arts en onderwijzer Sir William Osler geeft goed de gedachte weer die ten grondslag heeft gelegen aan het nieuwe medisch onderwijsprogramma in het Universitair Medisch Centrum Utrecht: vroeg in de studie kennismaken met de praktijk van de geneeskunde, zodat de theorie kan worden getoetst aan de praktijk en de praktijk inspiratie kan leveren om de theoretische kennis te vergroten. Het ligt voor de hand om ook de cursus ‘klinisch wetenschappelijk onderzoek’ te verbinden aan kennismaking met wetenschappelijk onderzoek in uitvoering en om dit parallel te laten verlopen met de eerste ervaringen met de klinische praktijk. Immers, het doel van wetenschappelijk onderzoek is om kennis aan te leveren die relevant is voor de uitoefening van de geneeskunde. Om die relevantie te kunnen beoordelen is het nodig inzicht te hebben in de soort kennis waar de arts in zijn werk behoefte aan heeft. De patiënt die een arts bezoekt komt om uitleg en advies. Wat heb ik, waarom heb ik dit en wat gaat er nu gebeuren? In wat formelere bewoordingen: wat is de diagnose, wat is de etiologie en wat is de prognose? Om als arts op die vragen antwoord te kunnen geven is kennis nodig. Diagnostische, etiologische en prognostische kennis. Toegepast medisch onderzoek heeft tot doel die kennis te leveren. Daarom is het, bij het opzetten en bij de uitvoering van onderzoek, van groot belang goed te weten welke vraag er beantwoord moet worden en voor welk soort patiënten. Evenzeer is het noodzakelijk om het wetenschappelijke antwoord op zodanige wijze te geven dat dit in een praktische toepassing vertaald kan worden. Het doel van het onderwijs in klinisch wetenschappelijk onderzoek is om de principes en methoden te leren begrijpen die ervoor zorgen dat onderzoek zo wordt opgezet, uitgevoerd en gepresenteerd dat het bijdraagt tot betere en effectievere medische zorg, preventie en interventie. Dat de resultaten ervoor zorgen dat medisch handelen kan plaatsvinden op basis van kennis over de waarde van diagnostiek, over het relatieve belang van verschillende oorzaken in het ontstaan van ziekte en over het effect en de bijwerkingen van behandeling. Dit is wat onder “evidence-based medicine” wordt verstaan. De klinische epidemiologie heeft zich in de afgelopen jaren ontwikkeld tot een discipline die in nauwe samenspraak met de kliniek een stelsel van methoden en technieken heeft ontwikkeld op basis waarvan toegepast klinisch onderzoek zo effectief en efficiënt mogelijk kan worden ontworpen en uitgevoerd. “Evidence-based research”, zou je kunnen zeggen. Met andere woorden: de klinische epidemiologie levert de architectuur van klinisch wetenschappelijk onderzoek. Evenals in de bouw, gaat deze architectuur uit van algemene principes. Immers, op basis van dezelfde bouwkundige uitgangspunten worden scholen, huizen en theaters gebouwd. In de toepassing van die uitgangspunten zullen architecten zich echter laten leiden door de gebruikers van de gebouwen en door deskundigen op het gebied van wonen, onderwijs en toneel. Evenzeer zijn klinisch epidemiologen slechts in staat de beste weg tot een relevant onderzoeksresultaat te helpen bereiden, wanneer zij voldoende inzicht hebben in de praktijk van de geneeskunde en kunnen rekenen op inbreng van en samenwerking met de klinische praktijk. Klinisch wetenschappelijk onderzoek is teamwork en het onderwijs op dit gebied wordt dan ook verzorgd door onderzoekers en artsen uit verschillende disciplines en specialismen. Een ander citaat van Osler: Ask of any active business man or a leader in a profession the secret which enables him to accomplish much work, and he will reply in one word, system; or as I shall term it, the Virtue of Method, the harness without which only the horses of genius travel. Als er één doel is waarvan wij hopen dat het wordt bereikt tijdens het onderwijs in wetenschappelijk onderzoek, is het dat de student het systeem leert doorgronden dat structuur brengt in het traject van klinische vraag naar wetenschappelijk antwoord. In deze cursus is dat systeem gebaseerd op epidemiologisch redeneren. In de epidemiologie staat steeds een relatie tussen zogenaamde determinanten en uitkomsten centraal. Bijvoorbeeld de relatie tussen bepaalde klachten en resultaten van testen (determinanten) en de kans op 7 KWO aanwezigheid van een bepaalde ziekte (diagnose = uitkomst). Of de relatie tussen een bepaalde behandeling (determinant) en de kans op verbetering van de symptomen (prognose = uitkomst). Niet alleen zal onderzoek het juiste verband tussen determinant en uitkomst moeten vaststellen, tevens zal dat verband in maat en getal moeten worden uitgedrukt. Het is immers van weinig waarde wanneer je als arts aan een patiënt meedeelt dat deze mogelijk een bepaalde ziekte heeft wanneer je niet zo nauwkeurig mogelijk kunt vertellen hoe groot de kans op aanwezigheid is. Het leggen van wetenschappelijke verbanden is daarom nauw verbonden met het hanteren van kansberekening en statistiek. Biostatistische grondbeginselen vormen om die reden onderdeel van het onderwijs in de cursus. Om Sir William te parafraseren: “To try to understand medicine without research is to sail uncharted seas, while to try to understand research without medicine is not to go to sea at all”. Het is de hoop en verwachting van de samenstellers en docenten van de cursus dat een vroege kennismaking met klinisch wetenschappelijk onderzoek zal bijdragen tot het opleiden van artsen die de waarde van wetenschappelijk onderzoek voor de praktijk en het belang van praktische relevantie voor het onderzoek begrijpen en waarderen. D.E. Grobbee, Hoogleraar klinische epidemiologie, Divisie Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde, UMC Utrecht 8 KWO Inleiding a. Introductie Het belangrijkste doel van deze wetenschappelijke cursus is u op te leiden tot een arts die zich bij iedere stap van het medisch handelen (diagnose, behandeling, voorspellen van de prognose) afvraagt in hoeverre zijn beleid gebaseerd is op goed uitgevoerd wetenschappelijk onderzoek. Alvorens iemand in staat is andermans artikelen te beoordelen, is het onontbeerlijk, zelf kennis gemaakt te hebben met onderzoek. Dit onderdeel staat dan ook centraal gedurende de cursus. U maakt tijdens de cursus kennis met klinisch wetenschappelijk onderzoek in het UMC Utrecht op het gebied van een frequent voorkomend klinisch probleem. Getracht wordt zoveel mogelijk verschillende aspecten van onderzoek te laten zien. In een periode van zes weken simuleert u zelf het proces van wetenschappelijk onderzoek. U leert een vraagstelling te formuleren, u werkt een onderzoeksprotocol uit, u verzamelt gegevens en u analyseert en rapporteert. De cursus wordt afgesloten met een tentamen waarin u een bestaand artikel moet analyseren. Vaardigheid hierin krijgt u via oefeningen, die opgenomen zijn in het blokboek. Daarnaast krijgt u, hoewel dit niet het hoofddoel van de cursus is, kennis over het specifieke hoofdprobleem, hoe vaak het voorkomt, wat de oorzaken zijn, hoe u het diagnosticeert, wat de prognose is, en hoe u een patiënt met een dergelijk probleem behandelt. b. Over dit blokboek Dit blokboek bestaat uit drie delen: - Deel I: Algemene informatie over (de opbouw van) de cursus - Deel II: Oefeningen die tijdens colleges en (computer)practica gemaakt dienen te worden - Deel III: Theorie waar gedurende de cursus kennis van dient te worden genomen c. Leerdoelen van de cursus - d. Ervaren hoe nieuwe kennis wordt gegenereerd Wetenschappelijke artikelen kunnen lezen en beoordelen op relevantie en validiteit Formuleren van een wetenschappelijke vraagstelling en kiezen van een onderzoeksopzet waarin deze vraagstelling kan worden beantwoord Kennis verwerven over (verschillen in) opzet, uitvoering en analyse van de kennisgebieden etiologisch, diagnostisch, prognostisch en interventieonderzoek Onderzoeksresultaten interpreteren en bediscussiëren Onderzoeksresultaten presenteren, zowel schriftelijk als mondeling Klinisch hoofdprobleem De cursus is opgebouwd rondom een klinisch hoofdprobleem, bijvoorbeeld pijn op de borst of neurologische uitval. In een studiejaar komen ongeveer zes klinische hoofdproblemen aan bod. Per blok wordt in een deelgroep (groepsgrootte ca. 35-40 studenten) gewerkt aan één klinisch hoofdprobleem. De hoofdproblemen zijn geselecteerd enerzijds omdat de arts relatief vaak met ze te maken krijgt, anderzijds omdat er in het UMC Utrecht veel wetenschappelijk onderzoek op die terreinen wordt uitgevoerd. In zes weken krijgt u kennis over het klinisch hoofdprobleem aangereikt en worden de lacunes in de kennis duidelijk. Onderweg maakt u kennis met de theorie en praktijk van verschillende aspecten van klinisch wetenschappelijk onderzoek, te weten: - De epidemiologie (etiologie, diagnostiek, interventie en prognostiek) - De statistiek - Zoeken in medische databases zoals PubMed - Patiëntparticipatie e. Begeleiding Iedere groep van 35-40 studenten wordt zes weken lang begeleid door twee senior stafleden van het UMC, een medisch specialist en een klinisch epidemioloog. Beiden hebben veel ervaring met patiëntgebonden onderzoek. Naast de introductie maandag zijn zij elke vrijdag aanwezig bij de wekelijkse presentaties en verzorgen zij aansluitend hierop een introductie van de daaropvolgende week. Gedurende de cursus werkt u in subgroepen van vier tot zes studenten aan een opdracht. Er zijn zes verschillende groepsopdrachten. Hierbij wordt u 9 KWO begeleid door een werkgroepbegeleider. Hij of zij zal 1 keer per week met uw werkgroep samenkomen, en daarnaast via email bereikbaar zijn voor vragen. Datum, tijd en plaats van de werkgroep dient u na het introductiecollege op de eerste maandag van het blok af te spreken met uw werkgroepbegeleider. f. Weekstramien en werkvormen Het onderwijs in dit blok wordt uitgevoerd volgens een weekstramien, dat bestaat uit de werkvormen zelfstudie, werkgroep, hoor-werkcollege, computer(computer)practicum en presentaties. Opnames van hoor-werkcolleges zullen via Blackboard digitaal beschikbaar worden gesteld. De werkvormen in CRU+ staan uitgebreid beschreven in het blokboek van de cursus Vorm en Functie. In de cursusperiode werkt u aan een onderzoeksopdracht op het terrein van het klinisch hoofdprobleem. De taken voor iedere week worden toegelicht in dit blokboek. U werkt in groepen van maximaal zes studenten binnen een bepaald klinisch probleem, en met de focus op een bepaald epidemiologisch aandachtsgebied (te weten diagnostiek, prognostiek, etiologie of interventie). De structuur voor de groepsindeling is als volgt: Niveau 1 Niveau 2 Niveau 3 Blok 1 - 4 75-80 studenten Klinisch probleem A 35-40 studenten Klinisch probleem B 35-40 studenten Groep 1 Diagnostiek 4-6 studenten Groep 5 Diagnostiek 4-6 studenten Groep 9 Diagnostiek 4-6 studenten Groep 13 Diagnostiek 4-6 studenten Groep 2 Prognostiek 4-6 studenten Groep 6 Prognostiek 4-6 studenten Groep 10 Prognostiek 4-6 studenten Groep 14 Prognostiek 4-6 studenten Groep 3 Etiologie 4-6 studenten Groep 7 Etiologie 4-6 studenten Groep 11 Etiologie B1 4-6 studenten Groep 15 Etiologie 4-6 studenten Groep 4 Interventie 4-6 studenten Groep 8 Interventie 4-6 studenten Groep 12 Interventie 4-6 studenten Groep 16 Interventie 4-6 studenten Afhankelijk van het type onderwijs wordt het onderwijs op een van bovenstaande niveaus gegeven: - Hoor-werkcolleges en (computer)practica Niveau 1 (75-80 studenten) - Introductiecollege en presentaties Niveau 2 (35-40 studenten) - Werkgroepen Niveau 3 (4-6 studenten) o In week 1 en 2 werken de subgroepen met hetzelfde onderwerp samen. Bijvoorbeeld groepen 1 en 5 van diagnostiek bij klinisch probleem A o In week 3 t/m 6 werken de subgroepen onafhankelijk van elkaar Met uw werkgroep schrijft u iedere week een korte rapportage over de taken van die week. Deze rapportages vormen de basis voor uw eindverslag. Iedere vrijdag worden per groep de taken van die week gepresenteerd en eventuele problemen besproken. Zorg dat per week minimaal twee leden van uw groep een deel van de presentatie invullen, zodat iedereen meerdere keren aan de beurt komt. De globale opbouw van onderwerpen die per week behandeld worden is als volgt: - Week 1: Beschrijving van het klinisch hoofdprobleem - Week 2: Formuleren vraagstellingen & vooraanvraag subsidie - Week 3: Herformuleren vraagstelling & analyseplan dataset - Week 4: Data-analyse & uitvoeren krantenartikelopdracht 10 KWO - Week 5: Mini meta-analyse & inleveren krantenartikelopdracht Week 6: Eindpresentatie, inleveren eindverslag & tentamen (TestVision) Participatie Het is belangrijk dat beide partijen, studenten én docenten, zich inzetten en hun verantwoordelijkheid nemen. Alleen dan kan een vruchtbaar interactief onderwijsklimaat ontstaan. Van u als student wordt zelfstudie verwacht en, vooral tijdens kleinschalig groepsonderwijs, een actieve bijdrage! Als u onvoorbereid bent en de opdracht(en) van het kleinschalig onderwijs niet hebt gemaakt, wordt u de toegang tot de bijeenkomst geweigerd of wordt u weggestuurd. Bij onvoldoende inspanning kan de cursuscoördinator, na voorafgaande waarschuwing, de student uitsluiten van verdere deelname aan de cursus of een gedeelte ervan. U bent niet verplicht om kleinschalig onderwijs (werkgroepen) te volgen, maar als u dat wel wilt doen, dan moet u voorbereid zijn. Er geldt een aanwezigheidsplicht voor alle(computer)practica en presentaties (zie rooster). Indien u meer dan 20% van het verplicht gestelde onderwijs in de cursus hebt gemist, wordt u uitgesloten van verdere deelname aan de cursus, dit geldt ook voor de toetsing (zie OER artikel 4.4 op de website van de bachelor Geneeskunde). Online onderwijs In aanvulling op deze algemene afspraken en regels is een aantal gedragsregels online onderwijs opgesteld: De camera’s van zowel de studenten als docenten staan aan tijdens het kleinschalig onderwijs. Tijdens werkgroepen doet u als student actief mee en neemt u een actieve houding aan. Stel u op zoals u dit ook zou doen bij fysiek kleinschalig onderwijs. Wij hopen met behulp van deze regels de interactie tussen student en docent en tussen studenten onderling te bevorderen in deze tijden van online onderwijs, zodat iedereen met plezier het onderwijs blijft geven en volgen. g. Literatuur & Studiemateriaal De volgende boeken, alsmede de achtergrondinformatie in deel III van dit blokboek, zullen worden gebruikt tijdens de cursus: 1. Grobbee DE, Hoes AW. Clinical Epidemiology: Principles, Methods, and Applications for Clinical Research. 2nd ed. Burlington: Jones & Bartlett Publishers; 2015. 2. Baldi B, Moore DS. The Practice of Statistics in the Life Sciences. 4th ed. WH Freeman & Company; 2018. In de medische bibliotheek kunt u ook andere epidemiologische en statistiek boeken en wetenschappelijke artikelen vinden. Publicaties die zich achter een zogenoemde “paywall” bevinden zijn direct toegankelijk vanuit computers in het UMCU, of vanaf locaties buiten het UMC Utrecht door via uw Solis-account in te loggen. Vragen omtrent toegang/beschikbaarheid van publicaties kunnen gericht worden aan de docenten van de medische bibliotheek (zie adreslijst). Vanwege de Covid19-crisis zal veel van het onderwijs online plaatsvinden. Om dat onderwijs goed te kunnen volgen en ook om er actief aan deel te kunnen nemen, is het nodig om te beschikken over een laptop/PC met camera (ingebouwd of los) en microfoon en een stabiele internetverbinding. h. Toetsing Voor algemene bepalingen rond toetsing, zie de Onderwijs en Examenregeling (OER) en het Reglement Examencommissie op: http://students.uu.nl/gnk-b/regelingen Je kunt met dit blok 8 studiepunten behalen. Het eindcijfer dient minimaal een 5,5 te zijn om voor het blok te slagen. De verplichte onderdelen van dit blok zijn de (computer)(computer)practica en presentaties. Wanneer meer dan 1 van deze verplichte onderdelen wordt gemist, is niet voldaan aan de minimale deelname van 80% en kan geen 11 KWO eindcijfer worden toegekend voor dit blok. Honoursprogramma Voor studenten die deelnemen aan het Honoursprogramma geldt het volgende: Om KWO af te ronden op Honours niveau, moet de student actief deelgenomen hebben aan alle groepsbijeenkomsten van het Honoursprogramma (inclusief de bijbehorende voorbereiding) en KWO met een voldoende hebben afgerond. (Pas na afronding van alle groepsbijeenkomsten van het Honoursprogramma, zal de registratie van KWO op Honours niveau in OSIRIS plaatsvinden.) Samenstelling cijfer De toetsing bestaat uit drie onderdelen, te weten: 1. Eindpresentatie cijfer van 0 tot 10 2. Eindverslag cijfer van 0 tot 10 3. Tentamen cijfer van 0 tot 10 Weging: 1 Weging: 1 Weging: 2 Om het blok met een voldoende af te sluiten moet voor ieder onderdeel minimaal een 5,5 gehaald worden, resulterend in een gewogen gemiddelde van een 5,5 of hoger. Om toegelaten te worden tot het tentamen moet de krantenartikelopdracht op tijd en volledig ingeleverd worden bij de werkgroepbegeleider, en met een ‘voldaan’ beoordeeld zijn. Tevens moet er zijn voldaan aan de minimale aanwezigheidsplicht. 1. Eindpresentatie U wordt beoordeeld door de hoofdbegeleiders op uw eindpresentatie en op de beantwoording van vragen na afloop. Iedere groep houdt gedurende 10 minuten een presentatie, waarbij elke student in een werkgroep een deel voor zijn/haar rekening neemt. Vervolgens worden er door de hoofdbegeleiders en werkgroepbegeleiders methodologische en inhoudelijke vragen gesteld aan de individuele studenten. Nadruk ligt op de wetenschappelijke inhoud en beantwoording van vragen. Cijfers voor de presentatie worden individueel gegeven. Dit gebeurt mede op basis van het oordeel van de werkgroepbegeleider. 2. Eindverslag Uw eindverslag wordt beoordeeld door de hoofdbegeleiders. Voor (mondelinge) feedback op uw eindverslag kunt u een afspraak aanvragen bij de hoofdbegeleider van uw blok. Het betreft hier een groepscijfer. Echter, bij minder inspanning van een student kan er van het groepscijfer worden afgeweken. Op Blackboard vindt u tips voor het schrijven van een onderzoeksverslag. 3. Tentamen Het tentamen zal worden afgenomen in TestVision, en bestaand uit open en gesloten vragen. Deze zullen gaan over abstracts uit Engelstalige en/of Nederlandstalige tijdschriften of op zichzelf staande vragen zijn. Het betreft een open boek eindtoets, waarbij u dus alle boeken en aantekeningen mee mag nemen. U mag echter geen gebruik maken van uw mobiele telefoon of laptop. TestVision biedt de mogelijkheid gebruik te maken van een digitaal rekenmachine, maar u wordt geadviseerd een eigen rekenmachine mee te nemen. De toets is niet gerelateerd aan het klinisch onderwerp van het blok. Alle stof die in de cursus aan bod komt zal onderdeel zijn van het tentamen. Dit betekent dat epidemiologische als statistische concepten, alsmede ook theorie over patiëntparticipatie aan bod zullen komen in de toets. Dit zal grofweg naar rato van tijdsbesteding per onderdeel zijn. Als u, op grond van een contract voor extra tentamentijd voor de toets, recht heeft op extra tentamentijd, dan dient u dit uiterlijk twee weken voor de tentamendatum per e-mail bij de coördinator (Dr. Kevin Jenniskens, K.Jenniskens@umcutrecht.nl) en het onderwijsbureau (cru-epidemiology@umcutrecht.nl) kenbaar te maken. 12 KWO Vervangende toets Voor alle onderdelen geldt dat enkel een reparatie (herkansing) kan plaatsvinden in hetzelfde studiejaar indien er een 4,0 of hoger is behaald voor het desbetreffende onderdeel. Indien de krantenartikelopdracht met een onvoldoende beoordeeld is kan deze worden gereviseerd n.a.v. de feedback van de werkgroepbegeleider en eenmalig opnieuw ingeleverd worden 1. Eindpresentatie KWO wordt vier keer in een studiejaar gegeven. De eindpresentatie kan worden herkanst bij het volgende KWO blok. Voor herkansing in blok 4 van KWO zal een apart moment worden vastgesteld. De data hiervoor ontvangt u via het onderwijsbureau, daar dient u zich ook op te geven voor de herkansing (cru-epidemiology@umcutrecht.nl). 2. Eindverslag Het verslag dient te worden herschreven op basis van feedback die de hoofdbegeleiders geven. U heeft met uw groep één mogelijkheid om een gereviseerde versie van het verslag in te leveren bij de hoofdbegeleiders 3. Tentamen KWO wordt vier keer in een studiejaar gegeven. Als u wilt herkansen kunt u aan het tentamen van het volgende KWO blok deelnemen. Voor herkansing in blok 4 van KWO zal een apart moment worden vastgesteld. De data hiervoor ontvangt u via het onderwijsbureau. Aanmelding voor de herkansing is noodzakelijk en doet u via Osiris en het onderwijsbureau (cru-epidemiology@umcutrecht.nl). i. Tips nodig over efficiënt studeren? Heb je weleens moeite om de hoofd- en bijzaken van elkaar te onderscheiden of zit je de nacht voor een tentamen nog tot midden in de nacht te studeren? Zou je hierin willen veranderen, maar weet je niet goed hoe? Je kunt je wenden tot je tutor of een studieadviseur. Ook kun je heel veel informatie en trainingen / workshops vinden bij het Skillslab van de UU: https://students.uu.nl/naast-destudie/trainingen j. Vertrouwenspersoon Voor studenten die tijdens de studie of coschappen te maken krijgen met ongewenste omgangsvormen is het van belang dat zij laagdrempelig de mogelijkheid hebben om dit in vertrouwelijk verband te kunnen bespreken. Onder ongewenste omgangsvormen wordt verstaan: ‘alles in de omgang en communicatie wat als ongewenst/kwetsend wordt ervaren en tot doel of gevolg heeft dat je je niet langer veilig voelt in de opleiding, tijdens de coschappen of in de privé-sfeer.’ Je kunt hierbij denken aan (seksuele) intimidatie, agressie en geweld, pesten en discriminatie. Over deze zaken kun je contact opnemen met: de studieadviseurs: adviseurs@umcutrecht.nl; vanuit het UMCU (ook voor studenten): Bureau Ombuds- en Vertrouwenszaken, telefoon: 088-7558620, e-mail ombudsenvertrouwenszaken@umcutrecht.nl - ook voor kwesties m.b.t. (wetenschappelijke) integriteit; vanuit de universiteit: mevrouw Jeanette van Rees: j.vanrees@uu.nl, vertrouwenspersoon voor alle UU-studenten. In het handboek Kwaliteit en Veiligheid staat uitgebreider beschreven wat de mogelijkheden bij dergelijke situaties zijn. k. Evaluatie en kwaliteitsbewaking De opleiding Geneeskunde voert na iedere cursus een schriftelijke evaluatie uit. Aan studenten wordt gevraagd om daaraan steeds mee te doen. De evaluaties zijn anoniem en worden bij onderwijsblokken na afloop van de eindtoetsen afgenomen. De evaluatieresultaten dragen bij aan de zorgvuldige kwaliteitsbewaking van het 13 KWO onderwijsprogramma en aan verbeteringen van het onderwijs. Tijdens de cursus kun je ook altijd terecht voor opmerkingen of suggesties bij de cursuscoördinator of de bachelor vertegenwoordiging. Eens per half jaar worden de resultaten van de onderwijsevaluaties op de Blackboardcommunity UMCU GNK Cursusevaluaties geplaatst en wordt per blok een korte terugkoppeling gegeven n.a.v. die evaluaties. l. Arbo, veiligheid en milieu Tijdens de opleiding Geneeskunde sta je bloot aan risico’s. De belangrijkste regels m.b.t. Arbo, veiligheid en milieu voor jezelf, de patiënt en het milieu staan beschreven in het Handboek Kwaliteit & Veiligheid. Hier vindt u ook de gedragslijnen ter voorkoming van risico’s en hoe moet worden gehandeld bij incidenten. Download het Handboek Kwaliteit & Veiligheid via deze directe link: http://students.uu.nl/gnk/geneeskunde-b/onderwijs/stages-coschappen/kwaliteit-enveiligheid In het blok KWO is geen sprake van bijzondere risico’s. Daar waar extra aandacht nodig is voor bepaalde handelingen, wordt dit in het blokboek (de (computer)practicumhandleiding) vermeld. m. Leerlijnen Academische Vorming, Professionele Ontwikkeling en Studie Reflectie Alles wat je leert in de Bachelor Geneeskunde staat in dienst van de patiëntenzorg waaraan je als toekomstig arts of arts-onderzoeker een bijdrage zult gaan leveren. De zogenoemde CanMEDS-competenties (https://www.medischevervolgopleidingen.nl/competentiegerichtopleiden) zullen tijdens de opleiding centraal staan. Deze competenties ga je op meerdere manieren ontwikkelen, namelijk tijdens de vakinhoudelijke blokken (toepassing en ervaring) én in speciaal ontwikkelde leerlijnen die door de blokken heen lopen. De leerlijnen richten zich op vaardigheden en competenties die vakgebied overstijgend zijn. Drie van deze speciaal ontwikkelde leerlijnen (gedurende de gehele bachelor) zijn: Academische Vorming Het doel van de leerlijn Academische vorming is, naast de medische feitenkennis, het opdoen van kennis & vaardigheden ten aanzien van een brede academische vorming ten behoeve van het kritisch en klinisch te leren denken, redeneren en handelen, zoals academische vaardigheden, wetenschappelijke integriteit, ethische professionaliteit en wereldburgerschap. Professionele & Persoonlijke Ontwikkeling Het doel van de leerlijn Professionele & Persoonlijke Ontwikkeling is aandacht te besteden aan verschillende aspecten van je professionele ontwikkeling tot arts. Denk hierbij aan het op een professionele manier leren omgaan met taken, anderen (samenwerking) en met jezelf (bv eigen emoties en bewaken van grenzen) StudieReflectie Het doel van de leerlijn StudieReflectie is onder andere om te leren reflecteren en zicht te krijgen op je eigen ontwikkeling aan de hand van de CanMEDS. Elke leerlijn heeft zijn eigen Blackboard community waarop uitgebreide informatie over de leerlijn staat. Voor de leerlijnen Academische vorming en Professionele & Persoonlijke Ontwikkeling maak je opdrachten die geïntegreerd in het reguliere (verplichte) onderwijs aan bod komen. Let op: de meeste van deze opdrachten dien je aan jouw individuele portfolio toe te voegen. Het portfolio bespreek je gedurende de bachelor in de individuele gesprekken met je tutor als onderdeel van Studiereflectie. In aansluitend (leerlijn-)onderwijs zoals PLO-CA (communicatie) en PLO-MT (Medisch technische vaardigheden), Medical Humanities, Klinisch Wetenschappelijk Onderwijs en Klinisch Lijn Onderwijs word je getraind in andere belangrijke academische en professionele vaardigheden, zoals communicatie met patiënten; deze vaardigheden worden beschreven in de blokboeken van dat onderwijs. Waaraan dien je te voldoen om de leerlijnen Academische Vorming, Professionele & Persoonlijke Ontwikkeling en StudieReflectie te behalen? Voorwaarden voor een voldoende beoordeling: 14 KWO 1. Het naar behoren uitvoeren van per leerlijn tenminste 80% van alle opdrachten in Bachelor jaar 1 en ten minste 80% van alle opdrachten van Bachelor jaar 2 en jaar 3 (zie OER, artikel 7.5); 2. Het samenstellen en tijdig inleveren van een compleet en correct portfolio met de opdrachten, de benodigde documenten en het schrijven van de gevraagde reflecties; 3. Het bespreken van de inhoud van het portfolio met de tutor tijdens individuele gesprekken. Voor de leerlijnen Academische Vorming en Professionele & Persoonlijke Ontwikkeling gelden de opdrachten en het bijbehorende werkgroeponderwijs als verplicht onderwijs. Dat verplichte werkgroeponderwijs valt onder de 80% aanwezigheidsplicht van een blok. Voor de groepsbijeenkomsten van StudieReflectie geldt een aanwezigheidsplicht van 80%. De individuele gesprekken met de tutor zijn 100% verplicht. Kijk op de Blackboard communities van de leerlijnen voor meer informatie. n. Adreslijst Coördinator Dr. K. Jenniskens, Julius Centrum tel. 088-7569636, k.jenniskens@umcutrecht.nl Plaatsvervangend coördinator Prof. dr. A. May, Julius Centrum tel. 088-7551132, a.m.may@umcutrecht.nl Onderwijsbureau Onderwijsbureau Epidemiologie, Julius Centrum, Str. 7.109, cru-epidemiology@umcutrecht.nl Medewerkers van de medische bibliotheek die college PubMed verzorgen Drs. P.H. Wiersma, medische bibliotheek, tel. 58087, P.H.Wiersma@uu.nl Dr. Ir. B. Kramer, medische bibliotheek, tel. 58087, B.M.R.Kramer@uu.nl F.P. Weijdema MSc, medische bibliotheek, tel. 58087, f.p.weijdema@uu.nl Drs. M.N.W. Niessen, medische bibliotheek, tel. 58087, M.Niessen@uu.nl Dr, M.S, Goudeau, medische bibliotheek, tel 58087, m.s.goudeau@uu.nl Hoofdbegeleiders en docenten Prof. dr. M.L. Bots, Julius Centrum, tel. 59352, m.l.bots@umcutrecht.nl Dr. P. Bruining-Verhagen, Julius Centrum, tel 68137, p.bruijning@umcutrecht.nl Dr. M.I. Geerlings, Julius Centrum, tel. 68494, M.Geerlings@umcutrecht.nl Dr. K. Jenniskens, Julius Centrum tel. 68050, K.Jenniskens@umcutrecht.nl Prof. Dr. A.M. May, Julius Centrum, tel. 51132, A.M.May@umcutrecht.nl Dr. J. Roodhart, Interne geneeskunde, tel. 55555, J.Roodhart@umcutrecht.nl Dr. A.P.E. Sachs, Julius Centrum, tel. 68505, a.p.e.sachs@umcutrecht.nl Dr. R.P. Venekamp, Julius Centrum, tel. 53513, R.P.Venekamp@umcutrecht.nl Prof. dr. F.L.J. Visseren, Interne geneeskunde, tel. 57324, F.L.J.Visseren@umcutrecht.nl Dr. J. Westerink, Interne geneeskunde , tel. 71149, j.westerink-3@umcutrecht.nl Dr. C.G. Schoemaker, WKZ, tel.xx, C.G.Schoemaker-4@umcutrecht.nl A. Hiensch Msc, Julius Centrum, tel. 67708, A.E.Hiensch@umcutrecht.nl Dr. J. Dorresteijn, Interne geneeskunde, tel. 56312, J.A.N.Dorresteijn-2@umcutrecht.nl Dr. A. Uijl, Julius Centrum, tel. 68644 A.Uijl@umcutrecht.nl Dr. C.H. Werkhoven, Julius Centrum, C.H.vanWerkhoven@umcutrecht.nl Dr. R.J. Toorop, Interne geneeskunde, R.J.Toorop@umcutrecht.nl 15 KWO 16 KWO Week 1. Beschrijving van het klinisch hoofdprobleem Om de juiste vragen te kunnen stellen over een bepaalde ziekte of ziektebeeld, is het allereerst noodzakelijk dat de onderzoeker gegevens kent over de achtergrond van de ziekte. Dit betreft zowel epidemiologische als klinische gegevens. U zult vooral bezig zijn met het verzamelen van basale kennis over het klinisch hoofdprobleem. Het gaat erom dat u kunt uitleggen wat de ziekte inhoudt, wat de symptomatologie is, hoe deze gediagnosticeerd en behandeld wordt, etc. Op de eerste maandag wordt het klinisch hoofdprobleem ingeleid door de klinische hoofdbegeleider, mogelijk aan de hand van een patiëntdemonstratie. U wordt ingedeeld in groepen en elke groep krijgt een werkgroepbegeleider toegewezen. Gedurende de week schrijft elke groep een beknopte samenvatting van het klinisch hoofdprobleem, welke als introductie van uw eindverslag zal dienen. Op vrijdag presenteren de verschillende groepen ieder hun aandachtsgebied zodat de verschillende aspecten van het klinisch hoofdprobleem allemaal aan de orde komen. Indeling en uitvoering I. II. III. IV. V. VI. VII. VIII. Zelfstudie Introductie college Groepsopdracht Hoor-werkcollege Diagnostisch onderzoek Hoor-werkcollege Prognostisch onderzoek Werkgroepbijeenkomst Zelfstudie PubMed Presentaties I. Zelfstudie Lees hoofdstuk 1 (klinische epidemiologie) in deel III van dit blokboek door. II. Introductie college Tijdens dit college zal de epidemiologische hoofdbegeleider de inhoud van het blok nader toelichten. De klinische begeleider zal aan de hand van een voorbeeld uit de klinische praktijk laten zien waarom dit blok zo belangrijk is binnen de opleiding. Tevens zullen aan het einde van dit college de werkgroepen bekend worden gemaakt. Maak op deze eerste dag afspraken met uw werkgroepbegeleider omtrent de datum, tijd en plaats waarop werkgroepen zullen plaatsvinden. Aangeraden wordt om deze halverwege de week te laten plaatsvinden. Spreek eveneens af met de werkgroepbegeleider of hij/zij de vragen voor de werkgroep aangeleverd wilt hebben. III. Groepsopdracht Deze week werkt u samen met de andere subgroep die hetzelfde aandachtsgebied heeft (niveau 3). U dient een introductie van het klinisch hoofdprobleem te schrijven dat in uw blok centraal staat. Het gaat om het weergeven van de huidige stand van wetenschappelijke kennis op dit terrein, en dus niet een verhaal voor leken (Nederlands Tijdschrift voor Geneeskunde en niet Libelle). Op deze manier krijgt de lezer inzicht in de oorzaken van de ziekte (etiologie), hoe de ziekte gediagnosticeerd wordt, wat de prognose is en hoe de ziekte wordt behandeld. Let op: schriftelijk dient u ALLE aspecten van het klinisch probleem aan de orde te laten komen; bij de mondelinge presentatie op vrijdag concentreert u zich op uw aandachtsgebied (etiologisch, diagnostisch, prognostisch of interventieonderzoek)! Hiervoor kunt u onderstaande lijst als uitgangspunt gebruiken; de genoemde gegevens dienen in ieder geval aan de orde te komen, maar niet noodzakelijk in de hieronder aangegeven volgorde. U bent vrij om dit verder aan te vullen. De maximale omvang van de samenvatting is twee tot drie pagina's A4. Verwerk in uw samenvatting ook de referenties middels de Vancouver stijl. 17 KWO - Wat is de definitie van de aandoening? Zijn er onderverdelingen? Wat is de prevalentie en incidentie? Zijn er verschillen naar leeftijd, geslacht, etniciteit? Welke diagnostische testen worden gebruikt en hoe goed zijn deze? Wat zijn de belangrijkste risicofactoren en beschermende factoren? (ga zowel in op omgevingsfactoren als erfelijke factoren) Wat is het natuurlijk beloop: complicaties, sterfte, effecten op dagelijks functioneren en kwaliteit van leven? Wat zijn de mogelijkheden voor behandeling? Geef van elke mogelijkheid de effectiviteit, voor- en nadelen, mogelijke subgroepen met specifieke indicaties Wat is het effect van behandeling op complicaties, sterfte, dagelijks functioneren en kwaliteit van leven? Zijn er mogelijkheden voor primaire en secundaire preventie? Het is belangrijk om aan te geven op welke terreinen de wetenschappelijke onderbouwing gering of afwezig is. Dit zijn de interessantste onderzoeksterreinen; zij vormen de basis (‘rationale’) voor toekomstig wetenschappelijk onderzoek, en een potentiele focus voor het schrijven van een subsidieaanvraag. Informatie om de vragen in bovenstaand kader te beantwoorden dient u op te zoeken in recente wetenschappelijke literatuur (PubMed) en klinische standaardwerken (medische bibliotheek). Maak binnen uw werkgroep een goede taakverdeling, en zorg dat iedereen een steentje bijdraagt. De samenvatting van de groepsopdracht levert u uiterlijk op donderdag om 17:00 in week 1 in bij de epidemiologische hoofdbegeleider. Deze samenvatting dient als basis voor de introductie van het eindverslag dat in week 6 ingeleverd moet worden. IV. Hoor-werkcollege Diagnostisch onderzoek Tijdens het college worden de belangrijkste aspecten van diagnostisch onderzoek behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek. V. Hoor-werkcollege Prognostisch onderzoek Tijdens het college worden de belangrijkste aspecten van prognostisch onderzoek behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek. VI. Werkgroepbijeenkomst Voorafgaand aan de bijeenkomst met uw werkgroepbegeleider komt u samen met uw eigen groep en bespreekt u de bevindingen en vragen tot dan toe. Om deze bespreking in goede banen te leiden wijst u zelf een voorzitter en een secretaris aan (uiteraard kunnen deze rollen per week wisselen). De voorzitter leidt de bijeenkomst; de secretaris schrijft de vragen op die u met uw werkgroepbegeleider wilt bespreken. U en uw groep zijn in de ‘lead’ tijdens de werkgroepbijeenkomst. Zorg dus dat u weet wat u wilt vragen. De werkgroepbegeleider is er om u en uw groep te adviseren omtrent uw onderzoek. U kunt gerichte vragen stellen, of vragen om feedback op uw presentatie of verslag. Wees gericht met uw vragen. Niet: wat vindt u van het verslag? Wel: moeten we bij dit probleem de prevalentie of de incidentie gebruiken? Naast het wekelijkse contactmoment is de werkgroepbegeleider ook via de mail bereikbaar voor vragen. De voorzitter van de week bespreekt de vragen die uw werkgroep heeft met de werkgroepbegeleider, waarna een discussie met de hele groep volgt. Het is aan u en aan uw werkgroep of u de groepsopdracht voor de bijeenkomst naar de werkgroepbegeleider stuurt voor feedback. U bent vrij om hier zelf een keuze in te maken. Indien de groepsopdracht tijdig naar de werkgroepbegeleider gestuurd is, zal deze zijn/haar suggesties en opmerkingen met u bespreken. NB: de ervaring is dat in deze eerste week relatief weinig vragen zijn aan de 18 KWO werkgroepbegeleider. Zie deze werkgroepbijeenkomst hiernaast dan ook als een kennismakingsgesprek, en een moment om afspraken te maken. VII. Zelfstudie PubMed Maak de trainingsmodule over PubMed die via Blackboard beschikbaar wordt gesteld. VIII. Presentaties Op vrijdag dient u een presentatie te geven over het klinisch hoofdprobleem. Deze dient gericht te zijn op de informatie die u in de groepsopdracht heeft verzameld met betrekking tot het aandachtsgebied (diagnostiek, prognostiek, etiologie of interventie) van uw werkgroep. Richtlijnen voor presentaties kunnen worden gevonden in het kader hieronder. Elke groep dient de powerpoint presentatie uiterlijk om 17:00 voor de dag van presentatie in te leveren via email bij de klinisch hoofdbegeleider, epidemiologisch hoofdbegeleider, en werkgroepbegeleider Voorbeeld bestandsnaam: Week 1 Diagnostiek groep 1 Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 2. Richtlijnen voor de presentaties: Algemeen: - Plaats niet te veel tekst op 1 dia. - Gebruik kernwoorden i.p.v. hele zinnen op de dia’s. - Duidelijk praten en richting de zaal kijken. Niet met uw rug naar de zaal om iets aan te wijzen en dan doorpraten. Bij powerpointpresentaties kunt u vaak zelf op het scherm kijken i.p.v. op de geprojecteerde dia en dus goed contact houden met de zaal. Eventueel kunt u de muis of een laserpointer gebruiken om dingen aan te wijzen. Vrijdagpresentaties: - Per keer voeren minimaal 2 studenten van een groep het woord. - Houd het kort: max. 15 minuten. De resterende 15 minuten zullen gebruikt worden voor discussie. De eindpresentatie in week 6 moet zelfs nog korter: maximaal 10 minuten! - Begin elke week de presentatie met een (korte) inleiding. Een beknopte handleiding powerpoint en beamergebruik vindt u in het studielandschap. 19 KWO 20 KWO Week 2. Formuleren vraagstellingen & vooraanvraag subsidie Patiëntgebonden onderzoek kan niet meer worden uitgevoerd zonder dat het plan daarvoor eerst door anderen wordt beoordeeld. Zo eist bijvoorbeeld de wet op onderzoek bij mensen dat onderzoeksplannen worden beoordeeld door een bevoegde medisch ethische toetsingscommissie alvorens het onderzoek te starten. In zulke commissies zitten bijvoorbeeld clinici, ethici, juristen, methodologen en vertegenwoordigers van patiëntenbelangen. Zij beoordelen of een onderzoeksplan voldoet aan de medisch-ethische criteria (niet te belastend, te veel risico) en of het onderzoek methodologisch voldoende kwaliteit heeft. Maar ook andere beoordelingen vinden vaak plaats. Zo is goed patiëntgebonden onderzoek vrijwel altijd afhankelijk van geld van subsidiegevers. Zij kijken niet alleen naar de wetenschappelijke kwaliteit, maar ook naar de relevantie voor de patiënt. De toewijzing van geld voor onderzoek gebeurt uiteraard altijd pas nadat collega’s een gedetailleerde positieve beoordeling van het plan hebben gegeven. Maar ook dichter bij huis worden onderzoeksplannen tegen het licht gehouden. Zo zullen ook collega’s in de directe omgeving graag over de opzet geïnformeerd willen zijn, zeker als zij worden geacht daaraan mee te werken. Gesteld dus dat beoordeling van een onderzoeksplan altijd, in welke vorm dan ook, vooraf plaatsvindt, dan is het onvermijdelijk dat een onderzoeker zijn/haar plan eerst op schrift goed uitwerkt. In de eerste week heeft u zich ingewerkt in de verschillende aspecten van het klinisch hoofdprobleem. In deze tweede week oefent u in uw groep het uitwerken van onderzoeksvraagstellingen die betrekking hebben op dit klinisch hoofdprobleem. U formuleert minimaal één vraagstelling op elk van de vier aandachtsgebieden van epidemiologisch onderzoek (diagnostiek, prognostiek, etiologie en interventie). De onderzoeksvraag gerelateerd aan het aandachtsgebied in uw werkgroep werkt u verder uit tot een vooraanvraag voor een subsidie. Op vrijdag presenteert u de onderzoeksvraagstellingen die u bedacht heeft, evenals uw vooraanvraag voor subsidie. Indeling en uitvoering I. II. III. IV. V. VI. VII. VIII. IX. X. Zelfstudie Zelfstudie: Statistiek Hoor-werkcollege Frequentie- en associatiematen Hoor-werkcollege Patiëntparticipatie Groepsopdracht Hoor-werkcollege Etiologisch onderzoek Hoor-werkcollege Interventieonderzoek Werkgroepbijeenkomst Hoor-werkcollege Statistiek: Steekproefvariabiliteit en betrouwbaarheidsintervallen Presentaties I. Zelfstudie Lees hoofdstuk 2 (aandachtsgebieden binnen de klinische epidemiologie) in deel III van dit blokboek door. II. Zelfstudie: Statistiek In het statistiek instructie/werkbestand op Blackboard (onder het kopje statistiek in course content) worden de zelfstudie modules voor statistiek aangegeven. In het werkbestand staat precies aangegeven welke modules wanneer doorlopen dienen te worden. De zelfstudie Beschrijvende Statistiek staat in het werkbestand zelf, maar er wordt ook verwezen naar een Grasple zelfstudiemodule. Je mag zelf kiezen of je de platte tekst in het werkbestand doorneemt, of de Grasple module. In beide gevallen bevat deze module de opdrachten die u dient te doorlopen als voorbereiding op het hoor-werkcollege statistiek van deze week. Opmerking: Er is tevens een SPSS-tutorial beschikbaar via Grasple (of een aantal praktische oefeningen in het werkbestand), indien u zich hier alvast bekend mee wilt maken. III. Hoor-werkcollege Frequentie- en associatiematen Tijdens het college worden de belangrijkste aspecten van frequentie- en associatiematen 21 KWO behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek. IV. Hoor-werkcollege Patiëntparticipatie Voor subsidiegevers wordt relevantie voor de patiënt steeds belangrijker, naast wetenschappelijke kwaliteit. Getrainde patiëntvertegenwoordigers beoordelen de onderzoeksvoorstellen, en beslissen mee over financiering. Waar letten ze op? Welke uitkomstmaten zijn voor hen relevant? Hoe schrijf je een goede publiekssamenvatting (vroeger lekensamenvatting genoemd) zodat de patiënt-referent jouw onderzoek begrijpt en dus positief beoordeelt? Ze beoordelen daarnaast ook of patiënten (-verenigingen) zijn betrokken bij je onderzoek. Hoe doe je dat? We laten aan de hand van enkele voorbeelden zien hoe patiënten en onderzoekers echt kunnen samenwerken. Lees ter voorbereiding de achtergrond over Evidence-based Medicine in Appendix A Lees ter voorbereiding de artikelen en bekijk het filmpje van de NIHR op Blackboard onder Course Content -> Patiëntparticipatie V. Groepsopdracht Deze week werkt u samen met de andere subgroep die hetzelfde aandachtsgebied heeft (niveau 3). U heeft zich aan het begin van de cursus ingelezen in een klinisch probleem, in casu een ziekte. U heeft zich in de eerste week verdiept in zaken als preventie, etiologie, diagnostiek, prognostiek en mogelijkheden voor interventie met betrekking tot deze ziekte. Hierbij bent u ongetwijfeld hiaten in de kennis en/of in de wetenschappelijke onderbouwing van de kennis tegengekomen. Een essentieel onderdeel van deze cursus is dat u leert om een klinisch probleem aangaande een ziekte te vertalen in een goede onderzoeksvraagstelling. Formuleren vraagstellingen U dient 4 vraagstellingen te formuleren, één op elk kennisgebied (diagnostiek, prognostiek, etiologie, en interventie). In het kader hieronder vindt u de handvatten die u hierbij kunt gebruiken. 22 KWO Vraagstelling (zie voorbeelden hieronder) - Omschrijf over welke typische soort patiënten in welke setting u met het onderzoeksresultaat in algemene zin een uitspraak wilt doen (domein); - Beschrijf de determinant(en) die u in uw onderzoek wilt meten; - Beschrijf de uitkomst(en) die u in uw onderzoek wilt meten en hun relevantie voor de patiënt; - Formuleer op basis van uw antwoorden een eenduidige vraagstelling. Voorbeeld 1: In de diagnostiek van perifeer vaatlijden is onbekend wat de waarde is van MR-angiografie bij atherosclerose. - Het domein: patiënten met klachten die doen denken aan atherosclerotisch perifeer vaatlijden en die daarvoor worden verwezen naar de specialist. - De determinant: uitkomst van MR-angiografie onderzoek. - De uitkomst: aan- of afwezigheid van atherosclerotisch perifeer vaatlijden zoals vastgesteld met de geldende gouden standaard. - De uitkomst van MR-angiografie in relatie tot aan-/afwezigheid van atherosclerotisch perifeer vaatlijden. - Heeft bij patiënten, verwezen met verdenking op atherosclerotisch perifeer vaatlijden, MR-angiografie een toegevoegde waarde als diagnostisch instrument? Voorbeeld 2: Bij kinderen met osteogenesis imperfecta zijn aanwijzingen dat orale toediening van bisfosfonaten een gunstige invloed heeft op de botstofwisseling. Een probleem is dat niet bekend is of dit ook gunstig is voor het motorisch functioneren van deze kinderen. - Het domein: kinderen met osteogenesis imperfecta - De determinant: bisfosfonaten - De uitkomst: verbetering motorische functie - Relatie tussen gebruik van bisfosfonaten en verbetering van motorische functie - Verbetert het motorisch functioneren van kinderen met osteogenesis imperfecta als zij bisfosfonaten gebruiken? Voorbeeld 3: Er zijn aanwijzingen dat te veel ijzer schadelijk is voor de bloedvaten maar directe bewijzen hiervoor ontbreken. Het is de vraag of personen met een ‘chronisch’ teveel aan ijzer een verhoogde kans hebben op hart- en vaatziekten. Personen die heterozygoot zijn voor het haematochromatose gen stapelen meer ijzer dan niet-dragers. - Het domein: personen zonder hart- en vaatziekten. - De determinant: het genotype van het haematochromatose gen. - De uitkomst: cardiovasculaire sterfte. - Relatie tussen ‘heterozygoot’ zijn voor het haematochromatose gen en het optreden van cardiovasculaire sterfte. - Is de cardiovasculaire sterfte bij dragers van het haematochromatose gen hoger dan bij niet- dragers? Vooraanmelding subsidieaanvraag Eén van de vier door u geformuleerde vraagstellingen gaat u vervolgens verder uitwerken: dit betreft de vraagstelling gericht op het aandachtsgebied van uw werkgroep (eveneens het aandachtsgebied waar u de eerste vrijdag over heeft gepresenteerd). Bijvoorbeeld: de prognostiek groep zal hun prognostische vraagstelling verder uitwerken. Bij deze vraagstelling dient u een ‘voor-aanmelding voor een subsidieaanvraag’ te beschrijven. Ofwel: beschrijf hoe een onderzoek eruit zou kunnen zien die deze onderzoeksvraag tracht te beantwoorden. Deze vooraanmelding bestaat uit een introductie, vraagstelling, domein, determinant, uitkomst en (in het kort) de methode die u wilt gebruiken in uw onderzoek. Het onderstaand kader kan u helpen om op een systematische manier een vooraanmelding voor een subsidieaanvraag op te stellen. Er zijn uiteraard vele variaties denkbaar op dit kader, maar zorg ervoor dat de verschillende aangegeven onderdelen (in min of meerdere mate) worden beschreven, en in een logische volgorde aan de orde komen. 23 KWO Titel onderzoek De titel van een onderzoek is uiteraard geënt op de inhoud. Een pakkende informatieve titel is over het algemeen aan te bevelen. Vaststelling van het probleem Of het nu gaat om etiologie, diagnostiek, prognose of interventie, een idee voor medisch onderzoek komt voort uit de waarneming dat op een bepaald terrein een hiaat bestaat in de kennis. De onderzoeker ervaart dat hiaat als een probleem dat opgelost zou moeten worden. De oplossing dient geleverd te worden met onderzoek. Uiteraard hoeft niet elk hiaat in de ogen van ieder lid van de (wetenschappelijke) gemeenschap een even groot probleem te zijn. Bijvoorbeeld onderzoek gericht op mechanismen en oorzaken van ziekte kan in de ogen van velen een groot, hoewel onvoorspelbaar, nut hebben voor de geneeskunde. Anderen zullen toch eisen stellen aan de directe toepasbaarheid van onderzoeksresultaten. In elk geval zal de onderzoeker aan zijn/haar wetenschappelijke omgeving (bijv. collegae onderzoekers, beleidsmakers, financiers, medisch ethische commissies en patiënten) op overtuigende wijze duidelijk moeten kunnen maken wat precies het probleem is. En waarom het relevant is. Als een onderzoeker dat niet kan, is er voor bijvoorbeeld een financier weinig reden om geld voor uitvoering te geven. Een belangrijke eis is dat de onderzoeker zeer goed op de hoogte is van de huidige stand van kennis en dat het hiaat daarin ook echt bestaat. Gesprekken met mensen uit de doelgroep kunnen helpen om de implicaties van het probleem te verhelderen, en daarmee de relevantie verduidelijken. Ook contacten met collega onderzoekers zijn vaak van groot belang om tot een goede afbakening van het probleem te komen. Realiseert u zich daarbij dat wat door de een als een belangrijk probleem wordt ervaren, door een ander soms als triviaal wordt gezien. Gegeven dat de onderzoeker de probleemstelling helder voor ogen heeft kan de volgende lijn worden gekozen voor de beschrijving ervan: Tip: voorkom dus dat beoordelaars na lezing kunnen vragen: ‘Maar wat is nou eigenlijk precies het probleem en waarom is dat relevant?’ Dit is in vele opzichten vaak een terechte maar tevens dodelijke vraag! Vraagstelling Een in de regel ietwat onderschat onderdeel van een onderzoeksbeschrijving is het formuleren van een goede onderzoeksvraagstelling. Vaak wordt die nog als impliciet onderdeel van de probleem-beschrijving gezien of van een aparte beschrijving van het studiedoel. Toch is het belangrijk om juist expliciet een onderzoeksvraag te formuleren, om de doodeenvoudige reden dat het die vraag is die u met uw onderzoek wilt beantwoorden. Een vage vraag is ook met uitstekend opgezet onderzoek niet te beantwoorden. Laat dus beoordelaars zien dat er een heldere eenduidige vraag ligt, gebaseerd op een goed gedefinieerd probleem, en dat uw onderzoek die vraag gaat beantwoorden. In algemeen epidemiologisch of klinisch onderzoek dient een goede vraag tenminste de volgende onderdelen te bevatten: Het domein: op welke karakteristieke groep personen of patiënten heeft mijn onderzoeksvraag betrekking. Studiepopulatie: hoe kom je aan de patiënten voor je studie (die representatief zijn voor het domein). De bestudeerde relatie: over welke te onderzoeken determinanten en eindpunten gaat het in grote lijnen. Voorbeeld Er zijn aanwijzingen dat uitlokkende factoren zoals zwaar lichamelijk werk, ongewone mentale of emotionele stress, overmatig alcoholgebruik, overmatige voedingsinname, een rol spelen in het ontstaan, kort daarna, van acute myocardinfarcten en beroerten. Deze factoren zouden dan een laatste stap vormen in de keten van gebeurtenissen, inclusief het relatief langzame proces van atherosclerose, die tot acute hart- en vaatziekten leidt. Onderzoekers wilden dit bestuderen door na te gaan of het op een bepaald moment blootgesteld zijn aan zulke factoren effect heeft op de nationale cardiovasculaire sterftecijfers (voor geïnteresseerden: zie BMJ 2000; 321:1552-4). Hun hypothese was dat een situatie, waarin bij een voldoende grote groep mensen een aantal van deze triggerfactoren aanwezig mag worden geacht op eenzelfde punt in de tijd, zou leiden tot een waarneembare stijging in het nationale aantal sterfgevallen ten gevolge van hart- en vaatziekten. Situaties waarin zulke ongewone stressoren bij een groot aantal mensen tegelijkertijd aanwezig zijn, zijn bijvoorbeeld aardbevingen of oorlogen. Deze situaties komen in Nederland gelukkig niet veel voor, maar deze onderzoekers kozen als blootstelling een spannende kwartfinale wedstrijd in het Europees 24 KWO kampioenschap van het Nederlands elftal tegen het Franse elftal in Engeland op 22 juni 1996. Deze wedstrijd werd door de Fransen door een penaltyserie gewonnen. Een kleine 10 miljoen mensen bekeek de wedstrijd. De uitkomst was de cardiovasculaire sterfte in juni 1996, en ter vergelijking in juni 1995 en juni 1997, zoals verstrekt door het Centraal Bureau voor de Statistiek. Domein: mensen die weleens aan momenten van acute stress blootstaan (=mensen). Determinant: doormaken van acute ongewoon hoge stress (spannende verloren voetbalwedstrijd). Uitkomst: cardiovasculaire sterfte. Tip 1 Het aantal onderzoeksvragen dat met één onderzoek kan worden beantwoord, wordt nogal eens schromelijk overschat. Voorkom dat beoordelaars kunnen zeggen ‘Er worden zoveel vragen gesteld, de onderzoek(st)er weet niet wat hij/zij wil’. Dus niet: Is er een relatie tussen een acute stollingsstoornis en cardiovasculaire sterfte? Is er een relatie tussen acute nicotine-intoxicatie en cardiovasculaire sterfte? Is er een relatie tussen acuut overmatig alcoholgebruik en cardiovasculaire sterfte? Is er een relatie tussen acute overmatige voedingsinname en cardiovasculaire sterfte? Etc. Maar: Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe? Tip 2 Een onderzoeksvraag is als zodanig het best herkenbaar als die ook als vraag wordt gesteld. Dus niet: We willen nagaan of ongewoon hoge stress iets te maken heeft met sterven aan hart- en vaatziekten. Maar: Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe? Tip 3 Stel een onderzoeksvraag op die algemeen geldende wetenschappelijke waarde heeft, dus los van plaats en tijd. Dus niet: Als mensen een spannende kwartfinale wedstrijd van het Nederlands elftal tegen Frankrijk in Engeland in 1996 meemaken, waarin Clarence Seedorf een penalty mist, hebben zij dan een hogere kans om aan hart- en vaatziekten te sterven? Maar: Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe? Tip 4 Beschrijf het (abstracte) domein zo breed mogelijk (zie ook boven). Dus niet: Hebben Nederlandse pensioengerechtigde mannen die aan ongewoon hoge stress worden blootgesteld een verhoogde kans om kort daarna te sterven aan hart- en vaatziekten? Maar: Hebben mensen die aan ongewoon hoge stress worden blootgesteld een verhoogde kans om te sterven aan hart- en vaatziekten? 25 KWO Tip 5 Houd een onderzoeksvraag leesbaar. Zet dus als regel niet bijv. een hele lijst determinanten en uitkomsten in de vraag t.b.v. de volledigheid. Dit gaat ten koste van het begrip. Studieopzet In de loop van deze cursus zal u duidelijk worden dat voor de beantwoording van een specifieke onderzoeksvraag vaak een keuze gemaakt moet worden voor een bepaalde vorm van onderzoek. De details daarvan worden u op een ander moment duidelijk gemaakt, maar de grote lijnen in de beschrijving van een onderzoeksontwerp zijn uniform. Een goede beschrijving van het studieontwerp is te onderscheiden in een theoretisch deel en een praktisch deel. In het theoretisch deel wordt beschreven met welke specifieke onderzoeksopzet de vraag optimaal beantwoord kan worden. Wil men bijvoorbeeld het effect van een bepaald geneesmiddel op het ziektebeloop bestuderen dan kan men tot het besluit komen dat een gerandomiseerd onderzoek daarvoor het beste onderzoeksontwerp is. Alle meer theoretische overwegingen die bij die keuze een rol spelen moeten in dit theoretisch deel aan bod komen. Waarom een gerandomiseerd onderzoek? Naar hoeveel en welke interventies wordt gerandomiseerd? Wordt er geblindeerd? Hoe lang moet de follow-up zijn? Dit soort vragen en de antwoorden daarop verdienen theoretische onderbouwing. Het praktisch deel (ook wel operationalisatie) bestaat uit het concreet maken van deze theoretische keuzen. Hoe worden patiënten geselecteerd die bij het gekozen domein passen? Hoe worden potentiële deelnemers benaderd? Hoe zal de randomisatieprocedure in de praktijk verlopen? Hoe, wanneer en bij wie worden determinanten en uitkomsten gemeten? Hoe worden de gegevens verwerkt en geanalyseerd? De theoretische en de praktische beschrijving dienen tezamen weer te geven hoe de onderzoeksvraag daadwerkelijk wordt beantwoord. U zou het daarmee ook kunnen opvatten als een nauwkeurige beschrijving van een werkplan. Om dat te bereiken kunt u een beschrijving zo opstellen dat de volgende onderdelen herkenbaar zijn: Algemeen Probeer een korte technische beschrijving te geven van de gekozen onderzoeksvorm (bijv. patiëntcontrole onderzoek, interventieonderzoek, etc.). Dit geeft beoordelaars de mogelijkheid om de beschrijving in dat licht te lezen. Beschrijf het domein (welke typische persoon, welke typische patiënt?). Bedenk dat, als u kiest voor een bepaald domein, u in het onderzoek deelnemers dient in te sluiten (studiepopulatie) die aan de kenmerken van dat domein moeten voldoen. M.a.w. laat zien hoe u aan de juiste deelnemers voor uw onderzoek komt. Vraag u bijvoorbeeld af of de setting waarin u van plan bent deelnemers te rekruteren ook die deelnemers opleveren die horen bij uw domein. Laat zien welke personen u juist wel wilt laten deelnemen en wellicht welke in het bijzonder niet. Geef dit bijvoorbeeld puntsgewijs aan door middel van inclusie- en exclusiecriteria. Bedenk dat u in feite elke deelnemer excludeert die niet aan de inclusiecriteria voldoet, dus inclusiecriteria zouden volstaan, maar soms kunt u door specifiek te laten zien wie u excludeert meer duidelijk maken over het doel van het onderzoek. Doel is om te laten zien met welke onderzoeksgroep u uiteindelijk iets wilt gaan zeggen over het (veel bredere) domein in uw onderzoeksvraag. Determinant-uitkomst relatie Geef een specifieke opsomming van de onderdelen van de determinant-uitkomstrelatie die in uw onderzoeksvraag vervat zijn. Doe dit bijvoorbeeld onder de kopjes ‘determinanten’ en ‘uitkomsten’. Geef bij elke determinant en elk eindpunt ook de operationalisatie, dus hoe gaat u precies ‘bloeddruk als determinant’ meten en hoe gaat u precies ‘een beroerte’ vaststellen. Geef ook aan waarom u bepaalde factoren meet. Zijn deze direct onderdeel van de onderzoeksvraag, dan zal dat de gemiddelde lezer duidelijk zijn. Soms echter meet u bijvoorbeeld zaken die moeten helpen om na te gaan of de bestudeerde determinant-uitkomstrelatie in etiologische zin een werkelijke is of een vertekende. Factoren die u meet als confounders of effect-modificatoren of wellicht intermediaire factoren (zie voor uitleg elders in deze cursus) moeten als zodanig herkenbaar worden beschreven. Doel is om de beoordelaar inzicht te geven in het hoe en waarom van metingen. Interventieonderzoek Soms is de determinant een interventie, bijv. een geneesmiddel. Dit vraagt in de beschrijving enkele 26 KWO aparte punten van aandacht. Beschrijf ook in een dergelijk geval exact wat deze interventie inhoudt (dosering, duur, etc.) en eventueel wat de interventie is bij een referentiegroep (bijv. placebo). Beschrijf zo nodig de randomisatieprocedure, de methode van randomiseren, stratificatie, etc. Tijdsrelatie In veel onderzoek zit een expliciete tijdsrelatie, bijv. bij follow-uponderzoek, of een impliciete tijdsrelatie, bijv. bij cross-sectioneel onderzoek. In zowel beschrijvend als etiologisch onderzoek is een notie van hoe de (kalender)tijd samenhangt met de determinant-uitkomstrelatie meestal van groot belang. Bij follow-up onderzoek is van belang aan te geven wanneer determinanten en eindpunten worden gemeten en wat de follow-upduur van personen in het onderzoek zal zijn. Bij een patiënt-controleonderzoek is het ook van belang om aan te geven wanneer eindpunten zijn gemeten en op welke periode de metingen van de determinanten betrekking hebben. Associatiemaat Soms vergemakkelijkt bijvoorbeeld het onder een apart kopje melden van de bestudeerde associatiemaat de lezing van een onderzoeksbeschrijving. Bestudeert u een gemiddeld groepsverschil of een relatief risico, etc.? Data analyse Het doel van de beschrijving van de (hoofd)analyse is, beoordelaars te laten zien hoe u in technische zin van de gegevens die u hebt verzameld naar de beantwoording van de vraag komt. Hier zijn twee delen te onderscheiden. Ten eerste dient u hier aan te geven hoe u de onderzoeksgegevens gaat beschrijven. Stel, u meet in een vervolgonderzoek klassieke risicofactoren voor hart- en vaatziekten, zoals de bloeddruk, het serum cholesterolgehalte in het bloed en rookgedrag, als determinanten van het optreden van herseninfarcten. U kunt hier dan aangeven dat u voor relevante groepen personen (bijvoorbeeld apart voor mannen en vrouwen) voor de bloeddruk en het cholesterolgehalte een gemiddelde waarde met een spreidingsmaat zult berekenen, zoals een standaard deviatie, en voor rookgedrag een percentage rokers in elke groep. Ten tweede dient u hier aan te geven hoe u in de analyse verbanden gaat leggen. U laat dan zien hoe u precies het verband bepaalt tussen bijvoorbeeld hoge bloeddruk en het optreden van beroerten, zoals het berekenen van een relatief risico. In hoofdlijnen kan hier worden aangegeven welke statistische modellen worden gebruikt en hoe. Dit hoeft geen exposé van statistische mogelijkheden te worden, maar dient meer om te laten zien dat u in staat bent om de statistiek efficiënt te gebruiken bij beantwoording van uw onderzoeksvraag. Steekproefomvang (=sample size, =statistische power) In Appendix B (‘Steekproefomvang’) wordt meer inhoudelijk ingegaan op het berekenen van de benodigde grootte van de steekproef voor een bepaalde studie. Het zal duidelijk zijn dat dit in de beschrijving van een onderzoek een plaats verdient. Behalve dat het zowel onderzoeker als beoordelaar een indruk van de haalbaarheid geeft, dwingt het de onderzoeker ook nog eens goed na te denken over de te verwachte sterkte van associaties en de relevantie daarvan. Haalbaarheid Soms is het goed om in een beschrijving apart in te gaan op omstandigheden die de haalbaarheid van onderzoek kunnen beperken of bevorderen. Bedenk hoeveel patiënten die voldoen aan de inclusiecriteria zich per jaar zullen melden bij de locatie waar je je onderzoek gaat uitvoeren. Hoe lang gaat de studie dan duren? Vraag ook eens aan patiënten of ze zouden willen meedoen aan het onderzoek, en waarom. Op grond daarvan kan je aanpassingen doen om de haalbaarheid te vergroten. Logistiek Hier kunnen zaken vermeld worden als: verantwoordelijkheden, communicatiestructuur, wijze van informatievoorziening aan onderzoeksdeelnemers (uitnodigingsbrieven, uitslagen, etc.), waarborgen anonimiteit/geheimhouding, etc. Rapportage Het eigenlijke eindproduct van elke wetenschappelijke onderneming is de rapportage. Omdat een onderzoeksbeschrijving in elk geval een goede planning behoeft, is het raadzaam om over de vorm en inhoud van deze rapportage vooraf na te denken. Soms bijvoorbeeld hebben resultaten van onderzoek een duidelijke praktische relevantie en dienen ze in die praktijk geïmplementeerd te worden. In zo’n geval 27 KWO kan bijvoorbeeld een beleidsondersteunend advies door de onderzoekers worden geschreven. Tijdsplanning Onmisbaar in een goede beschrijving van de studieopzet is een formele tijdsplanning. In grote lijnen kunnen daar in voorkomen: startdatum en duur voorbereiding; startdatum uitvoering; duur inclusie; einde inclusie; indien van toepassing einde follow-up; duur analyse en rapportage; duur totale studie. Begroting Vrijwel elke instantie die onderzoek beoordeelt eist als onderdeel van de beschrijving een deugdelijke begroting. De details hiervan worden voor dit werkboek buiten beschouwing gelaten. Echter, het is wel van belang dat u bij het opzetten van een onderzoek in deze cursus een idee hebt van de kosten die ermee gepaard gaan. Die zijn onder te verdelen in: Personeelskosten: meestal de hoogste kostenpost (dataverzameling, -management, -analyse, ondersteuning, etc.). Vergeet hier niet de vergoeding voor de patiëntvertegenwoordigers in je team. Materiaalkosten: geeft een overzicht van kosten van alle t.b.v. het onderzoek gebruikte materialen. Denk aan materiaal t.b.v. afname van en bepalingen in bloedmonsters, vervaardigen van vragenlijsten, portokosten, etc. Overige kosten: denk bijv. aan kantoorkosten (PC, huisvesting), huur onderzoeksruimte, publicatiekosten, reiskosten, vergoeding deelnemers, etc. Geef hierbij een totaal begroot bedrag. Tip: spendeer niet te veel tijd aan alle details, maar geef een grove inschatting. Algemene opmerkingen Een goede beschrijving van onderzoek kan een aantal doelen dienen. De mate van uitgebreidheid van de beschrijving hangt van deze doelen af. Een eerste, vaak onderschat, doel wordt gevormd door het nut van het opschrijven voor de onderzoeker zelf. Een gedetailleerde beschrijving in een protocol dwingt de onderzoeker met alle facetten van het onderzoek rekening te houden. Daarnaast is het doel van een goede beschrijving vrijwel altijd om beoordelaars van uw onderzoek ervan te overtuigen dat de kwaliteit én de relevantie zo hoog is dat het onderzoek financieel moet worden ondersteund. Tegenwoordig gaat dat vaak in stappen van een vooraanvraag en, na selectie, een definitieve aanvraag. In een vooraanvraag moeten de probleem-/vraagstelling en relevantie vaak goed worden beschreven. In een definitieve aanvraag komen dan ook alle relevante details aan de orde. Instellingen die onderzoek financieren kijken vaak niet alleen maar naar de inhoud van het onderzoek, maar ook naar de setting waarin het wordt uitgevoerd. Is het een goede onderzoeksgroep, hebben ze veel gepubliceerd, hebben ze ervaring met dit onderwerp, etc. Houd er rekening mee dat steeds vaker ook patiëntvertegenwoordigers mede beoordelen. Zij letten vooral op de relevantie van de onderzoeksvraag en de uitkomstmaten voor patiënten, de participatie van patiënten als meedenkers in het onderzoek (dus niet alleen als proefpersoon) en de aandacht in het projectvoorstel voor de implementatie van de resultaten. Het devies is, dat alles waarvan de onderzoeker denkt dat het aan financiering kan bijdragen, hier dan ook genoemd moet worden. Voor een onderzoeksprotocol dat voor alle betrokkenen als draaiboek kan dienen, moeten alle onder studieopzet beschreven onderdelen dermate gedetailleerd beschreven en goed geoperationaliseerd zijn, dat uitvoerbaarheid mogelijk is. 28 KWO VI. Hoor-werkcollege Etiologisch onderzoek Tijdens het college worden de belangrijkste aspecten van etiologisch onderzoek behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek. VII. Hoor-werkcollege Interventieonderzoek Tijdens het college worden de belangrijkste aspecten van interventieonderzoek behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek. VIII. Werkgroepbijeenkomst De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het werkgroepsproces. IX. Hoor-werkcollege Statistiek: Steekproefvariabiliteit en betrouwbaarheidsintervallen Tijdens dit college wordt u wegwijs gemaakt in de betrouwbaarheidsintervallen. Er zullen tijdens het college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint uitprint of digitaal beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven. X. Presentaties Op vrijdag presenteert u zowel de vier vraagstellingen als de subsidie vooraanmelding behorende bij de vraagstelling van het aan uw groep toegewezen aandachtsgebied. Geef tussen de vraagstellingen en de beschrijving van de vooraanmelding aan hoe en welke patiënten u graag zou willen betrekken bij het verder uitwerken van deze vooraanmelding voor subsidie. Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en werkgroepbegeleider Voorbeeld bestandsnaam: Week 2 Prognostiek groep 3 Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 3. 29 KWO 30 KWO Week 3. Herformuleren vraagstelling & analyseplan dataset Deze week staat in het teken van de statistiek en data-analyse. U heeft na de presentaties in week 2 toegang gekregen tot de achtergronddocumentatie, opdracht, en dataset horende bij uw aandachtsgebied. U gaat in deze week verder binnen uw eigen subgroep (4-6 studenten). U dient de onderzoeksvraag die u bij uw eigen aandachtsgebied in week 2 geformuleerd heeft aan te passen zodat deze met de aangeleverde dataset beantwoordt kan worden. Vervolgens maakt u een analyseplan in woorden en lege tabellen. Met andere woorden: u bedenkt hoe u uw vraagstelling gaat beantwoorden en hoe u de resultaten gaat presenteren. Dit vormt de basis voor de methoden sectie in uw eindverslag. Let op: hier staan dus nog geen resultaten in! Op vrijdag presenteert u de definitieve vraagstelling, de opbouw van de dataset, en het analyseplan. U laat uitsluitend lege tabellen zien, nog geen resultaten! Indeling en uitvoering I. II. III. IV. V. VI. VII. VIII. Zelfstudie Zelfstudie: Statistiek Groepsopdracht Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets Hoor-werkcollege Statistiek: T-toetsen (computer)practicum Introductie SPSS (PC) Werkgroepbijeenkomst Presentaties I. Zelfstudie Lees hoofdstuk 3 (uitvoering van onderzoek) in deel III van dit blokboek door. II. Zelfstudie: Statistiek In het statistiek instructie/werkbestand op Blackboard (onder het kopje statistiek in course content) wordt verwezen naar een zelfstudiemodule Mantel-Haenszel procedure (in het document zelf op in Grasple). Deze module bevat de opdrachten die u dient te doorlopen als voorbereiding op de hoor-werkcolleges statistiek van deze week. Er is tevens een SPSS-tutorial beschikbaar via Grasple (of een aantal praktische oefeningen in het werkbestand). Loop deze uiterlijk voor het practicum Introductie SPSS, door. Na afloop van het derde college statistiek is er een zelfstudieopdracht in het werkbestand op Blackboard waarin je zelf aan de slag gaat met het toepassen van de theorie. Neem deze opgaven uiterlijk voor de nabespreking in week 4, door. III. Groepsopdracht Vanaf deze week werkt u verder met uw eigen subgroep (4-6 studenten). Datasets zijn via Blackboard onder toetsing/eindopdracht beschikbaar gesteld. (tevens zijn de datasets te vinden op de cursus directory van de computers in het wetenschapslandschap, zie inloginformatie). Deze gegevens zijn afkomstig van patiëntgebonden onderzoek in het UMC Utrecht en bevatten echte onderzoeksgegevens, die in het kader van dit blok enigszins aangepast kunnen zijn. Bij de datasets wordt ook een bestand met achtergrondinformatie en context van het onderzoek geleverd, een lijst met beschrijving van de variabelen in de datasets (zg datadictionary), en enkele opdrachten die u kunnen helpen de dataset te doorgronden. Deze zijn als zelfstudie te maken en worden niet nabesproken, tenzij hier vanuit uw kant behoefte aan is. Niet alle vragen dienen reeds in week 3 beantwoord te worden. De vragen over de data-analyse komen pas in week 4 aan de orde. Deze week herformuleert u de vraagstelling die u in week 2 heeft opgesteld bij uw aandachtsgebied, zodat deze met uw dataset te beantwoorden is. 31 KWO Let op: Sluit met de andere subgroep kort dat u niet dezelfde onderzoeksvraag heeft (dus bijvoorbeeld: diagnostiek groep 1 en diagnostiek groep 5 dienen andere vraagstellingen te beantwoorden met hun dataset) Verslag Vervolgens kunt u de eerste twee delen van uw verslag schrijven: de inleiding (gebaseerd op wat u reeds in week 1 had geschreven maar nu toegespitst op uw dataset en vraagstelling), en de patiënten en methoden. Onderdelen van de patiënten en methodensectie zijn een beschrijving van de onderzoeksopzet, studiepopulatie, datacollectie, definitie van determinant(en) en uitkomst, en een analyseplan waarin alle analysestappen die u wilt gaan ondernemen worden beschreven (in woorden!). Een berekening van de groepsgrootte is niet nodig. U kunt hiervoor de informatie uit de achtergrondinformatie behorende bij de dataset gebruiken. Niet alles zal echter hierin vermeld staan. Bedenk zelf welke kenmerken van studie design logisch zijn, en passen bij uw dataset. Als u het analyseplan klaar heeft kunt u aan het einde van week 3, of anders begin week 4, de data verkennen. Hierbij maakt u gebruik van de volgende leidraad. Lees deze door voordat u met uw opdracht aan de slag gaat. Van ruwe data naar een analysebestand Onderzoeksgegevens die alleen nog maar ingevoerd zijn in een bestand, vormen de zogenaamde ruwe data. Omdat er allerlei foutenbronnen bestaan, zijn de databestanden per definitie niet perfect. Doel van deze fase van onderzoek is het beoordelen van de kwaliteit van de gegevens en het voldoende verbeteren van fouten. Bovendien dienen de gegevens toegankelijk te worden gemaakt om later de analyses soepel te kunnen verrichten. Belangrijke bijkomstigheid is dat u de gegevens leert kennen. Om een goed analysebestand te krijgen is een systematische aanpak vereist. Dit begint al bij de naamgeving van bestanden, van variabelen en van labels (etiketten). Aangezien u ook in deze fase fouten kunt maken, bewaart u op relevante momenten het gegevensbestand, zodat u later op eerdere versies kunt terugvallen. Bedenk een goede systematiek voor de bestandsnamen en handige namen voor variabelen, zodat u geen fouten maakt in de analyse. Voorbeeld van een databestand patnr leeftijd hartinf hyperten opleidng rook ooit 1 38 1 1 3 1 2 32 2 1 3 2 3 48 2 2 99 1 4 12 1 2 1 1 In een dataset hebt u altijd te maken met missende waarden. Missende waarden is een verzamelterm voor allerlei waarden die niet direct datgene weergeven wat gemeten zou moeten worden. Zij worden gebruikt voor een antwoord dat niet is ingevuld of een vraag die logischerwijs is overgeslagen (bij voorkeur moet u de missende waarden differentiëren en zelf definiëren, zodat u later precies weet of een variabele echt onbekend is of dat de variabele niet gemeten kon worden bij die patiënt). Als gegevens niet dubbel en/of met automatische controle zijn ingevoerd, rest er achteraf weinig anders dan ze te controleren op inconsistenties. Daarvoor is niet veel meer nodig dan logisch nadenken en af te wegen hoever u wilt gaan met de controle. Coderingen moeten eenduidig, logisch en volledig zijn, ze moeten elkaar uitsluitende categorieën vertegenwoordigen en het liefst consequent toegepast worden op alle variabelen. Documenteer de coderingen in een codeboek. 32 KWO Voorbeeld van een code-boek Variabele naam Label Patnr Leeftijd Hartinf nummer van patiënt leeftijd in jaren hartinfarct doorgemaakt Hyperten hypertensie Opleiding niveau opleiding Rookooit Ooit gerookt Ranges AMC3001-NIJM1054 Code voor missing nvt 18-74 1=ja 2=nee 99=onbekend 1=ja 2=nee 99=onbekend 1=geen/LBO 2=MBO 3=HBO 4=universitair 99=niet ingevuld 1=ja, ik rook nog steeds 2=ja, ik heb vroeger gerookt 3=nee, nooit gerookt 99=niet ingevuld 1-2 99 99 1-2 99 99 1-4 99 99 1-3 99 99 Allereerst dient gecheckt te worden op de in- en exclusiecriteria. Daarna gaat het vooral om rare waarden bij de variabelen. Invoer- en meetfouten zijn niet altijd even gemakkelijk op te sporen, wel als ze (in enige mate) extreem zijn. Denk daarbij ook aan combinaties van variabelen. Vermoedelijke of echte fouten in de gegevens kunnen op verschillende manieren worden behandeld, afhankelijk van de moeite die u wilt of kunt nemen om de databron weer te benaderen. Gezond verstand is een vereiste. Als u zeker bent van een misser maar u kunt niet meer de juiste waarde achterhalen, wijs dan een (aparte) missende waarde toe. Hulpmiddelen die statistische computerprogramma’s bieden om fouten op te sporen zijn grafieken (zoals histogrammen en scatter plots) en tabellen (zoals frequentie- en kruistabellen). Verder zijn er ook mogelijkheden om te sorteren, selecteren of hercoderen. Soms wilt u ook overzichten maken van bepaalde subsets (case summaries in SPSS) om daarmee terug te gaan naar de statussen, vragenlijsten, labuitslagen, enz. Tot zover moet er niets worden berekend; dat hoort bij de volgende fase. Hierop is één uitzondering, namelijk voor de variabelen die u uiteindelijk in een andere gedaante in de analyses wilt gebruiken. Denk aan transformaties van één of meerdere variabelen, zoals Quetelet index (gewicht/lengte2), lengte in centimeters in plaats van meters. Vaak is aan deelnemers gevraagd naar geboortedatum, terwijl het in het onderzoek gaat om de leeftijd op bijvoorbeeld het inclusietijdstip. Krantenartikelopdracht Tevens zoekt u deze week samen met uw subgroep naar een krantenartikel met betrekking tot epidemiologisch patiëntgebonden onderzoek (per subgroep één artikel). Dit dient een recent krantenartikel gevonden (< 4 weken oud) dat de resultaten van een epidemiologisch patiëntgebonden onderzoek te beschrijven (geen review, meta-analyse, case report/series (= een beschrijving van één of weinig patiënten zonder controle groep)). Vervolgens zoekt u met behulp van PubMed het bijbehorende wetenschappelijke artikel op. U informeert uw werkgroepbegeleider over het gekozen artikel, en laat controleren of deze geschikt is voor het beantwoorden van de vragen (zie Krantenartikelopdracht week 4) IV. Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets Tijdens dit college wordt u wegwijs gemaakt in het concept van statistische toetsen. Er zullen tijdens het college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint uitprint of digitaal beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven. 33 KWO V. Hoor-werkcollege Statistiek: T-toetsen Tijdens dit college wordt u wegwijs gemaakt in enkele specifieke toetsen. Er zullen tijdens het college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint uitprint of digitaal beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven. VI. (computer)practicum Introductie SPSS (PC) Tijdens dit (computer)practicum wordt u geïntroduceerd in SPSS. Aan de hand van een dataset worden verschillende opdrachten uitgevoerd. VII. Werkgroepbijeenkomst De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het werkgroepsproces. VIII. Presentaties Op vrijdag presenteert een van de twee groepen met dezelfde aandachtsgebied de vraagstelling, de patiënten en methoden, en uw data-analyseplan. Begin uw presentatie kort (1-2 slides) met een inleiding over het onderwerp, die leidt naar de vraagstelling. Hierin schrijft u hoe u de vraagstelling gaat beantwoorden. U laat, behalve de baselinetabel ter beschrijving van uw patiënten, enkel nog lege tabellen zien, dus wat u uit uw dataset wilt gaan halen, maar nog geen concrete resultaten. Er zal aan het begin van de presentaties geloot worden welke subgroep zal presenteren. De groep die niet hoeft te presenteren, stelt vragen aan de presenterende groep; alle groepen (ongeacht of ze hoeven te presenteren of niet) leveren hun eigen presentatie in. Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en werkgroepbegeleider Voorbeeld bestandsnaam: Week 3 Etiologie groep 5 Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 4. 34 KWO Week 4. De resultaten Nadat u vertrouwd bent geraakt met de data kunt u beginnen met de data-analyse die u in week 4 af dient te ronden. Dit doet u aan de hand van de vragen en opdrachten die u bij uw specifieke dataset hebt gekregen. In deze week gaat u verder met de bewerking van de gegevens. U beantwoordt nu uw onderzoeksvraag. Volg hierbij uw data-analyseplan. U schrijft de resultatensectie van uw verslag. Op vrijdag presenteert u uw resultaten. Daarnaast levert u de antwoorden op de vragen horende bij de krantenartikelopdracht in bij uw werkgroepbegeleider. Indeling en uitvoering I. II. III. IV. V. VI. VII. VIII. IX. Zelfstudie Zelfstudie: Krantenartikelopdracht Nabespreking statistiek opdracht Analyse eigen data Computer(computer)practicum diagnostisch en prognostisch onderzoek Computer(computer)practicum etiologisch en interventieonderzoek Groepsopdracht Werkgroepbijeenkomst Presentaties I. Zelfstudie Lees hoofdstuk 4 (rapportage) in deel III van dit blokboek door. II. Zelfstudie: Krantenartikelopdracht U heeft in week 3 met uw subgroep een recent krantenartikel gevonden (< 4 weken oud) dat de resultaten van een epidemiologisch patiëntgebonden onderzoek beschrijft (geen review, metaanalyse, case report/series (= een beschrijving van één of weinig patiënten zonder controle groep)). Hierbij heeft u met behulp van PubMed het bijbehorende wetenschappelijke artikel gezocht. Ondanks dat iedereen in uw subgroep hetzelfde artikel heeft is het de bedoeling dat iedereen individueel onderstaande vragen beantwoord: 1. Vat het krantenartikel in maximaal 5 regels samen. 2. Vat het wetenschappelijk artikel in maximaal 5 regels samen. 3. Wat vindt u van de kop van het krantenartikel? Dekt deze de lading van zowel het krantenartikel als het wetenschappelijke artikel? 4. In welke opzichten zouden de journalistieke uitspraken volgens u moeten worden genuanceerd of aangevuld? 5. Om welk kennisgebied (etiologisch, diagnostisch, prognostisch of interventieonderzoek) gaat het hier? Motiveer uw antwoord in maximaal 5 regels. 6. Wat is het onderzoeksdomein? Motiveer uw antwoord. 7. Wat is de onderzoekspopulatie? 8. Wat is/zijn de determinant(en)? Hoe wordt/worden deze gemeten? 9. Wat is/zijn de primaire uitkomstma(a)t(en)? Hoe wordt/worden deze gemeten? 10. Wat is de hoofdvraagstelling van het onderzoek? 11. Hoe noemen we deze onderzoeksopzet? Motiveer uw antwoord in maximaal 5 regels. 12. Wat is bias? Welke vormen van bias zijn er in het algemeen (dus los van het door u gekozen artikel)? Geef van elke bias een korte uitleg. 13. Loop alle soorten bias na en licht kort toe of en waarom deze wel of geen rol spelen bij het type onderzoek dat in uw artikel wordt beschreven. 14. Wordt er in het artikel door de onderzoekers rekening gehouden met de voor het type onderzoek relevante bias? Indien ja: leg uit hoe. Indien nee: wat hadden de onderzoekers volgens u moeten doen? Lever de volgende documenten per e-mail aan vóór dinsdag 12:00 uur (week 5) bij uw werkgroepbegeleider (tenzij deze andere afspraken met u gemaakt heeft): - PDF van het krantenartikel 35 KWO - PDF van het wetenschappelijk artikel Word document met de antwoorden op de vragen Tijdens de werkgroep in week 5 wordt de opdracht op groepsniveau besproken. Het op tijd inleveren van de volledige opdracht en een ‘voldaan’ beoordeling is een ingangseis voor het tentamen. III. Nabespreking statistiek opdracht De statistiek zelfstudie opdracht wordt tijdens dit college nabesproken. IV. Analyse eigen data Tijdens dit (computer)practicum heeft u de ruimte om de analyses uit uw data analyseplan uit te voeren. Er zal begeleiding aanwezig zijn vanuit de epidemiologie docent en enkele werkgroepbegeleiders. Zij zijn beschikbaar om hulp te bieden bij uitdagingen omtrent de analyses en/of het (technisch) gebruik van SPSS. V. Computer(computer)practicum diagnostisch en prognostisch onderzoek Tijdens dit (computer)practicum krijgt u twee nieuwe SPSS-bestanden met betrekking tot een prognostisch en diagnostisch onderzoek om zo tijdens dit (computer)practicum nog een keer te kunnen oefenen met de diverse begrippen en analyses die kenmerkend zijn voor deze twee typen onderzoek. VI. Computer(computer)practicum etiologisch en interventieonderzoek Tijdens dit (computer)practicum krijgt u twee nieuwe SPSS-bestanden met betrekking tot een etiologisch en interventieonderzoek om zo tijdens dit (computer)practicum nog een keer te kunnen oefenen met de diverse begrippen en analyses die kenmerkend zijn voor deze twee typen onderzoek. VII. Groepsopdracht Deze week voert u de analyses uit zoals u die vorige week in het analyseplan heeft opgeschreven. U schrijft deze week de resultatensectie van uw rapportage. VIII. Werkgroepbijeenkomst De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het werkgroepsproces. IX. Presentaties Op vrijdag presenteert één subgroep per aandachtsgebied de resultaten van de analyses. Let hierbij op de wijze van presenteren. De tabellen uit het (concept)artikel zijn meestal onleesbaar als ze in powerpoint geprojecteerd worden. Maak hier dus keuzes in. Ook nu start de presentatie met een korte introductie (1-2 slides), vraagstelling en methode. De subgroep die in week 3 presenteerde, zal deze week vragen stellen. De groep die in week 3 vragen stelde, zal deze week presenteren. Beide groepen leveren de presentatie in bij de hoofdbegeleiders. Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en werkgroepbegeleider Voorbeeld bestandsnaam: Week 4 Etiologie groep 5 Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 5. 36 KWO Week 5. Rapportage en discussie In deze week maakt u op basis van het commentaar op de vrijdagpresentatie van week 4 de resultatensectie van uw verslag af. Bij de presentatie van uw onderzoek hoort een beschouwing waarin u de gevonden resultaten plaatst in het licht van eerder gepubliceerde resultaten. Om enige indruk te krijgen voert u in deze week een mini-meta analyse uit, waarin u een grafisch overzicht maakt van de resultaten uit de belangrijkste publicaties (maximaal 10) op het onderzoeksterrein. Deze artikelen zult u zoeken tijdens het (computer)practicum PubMed: zoeken voor mini-meta analyse. U schrijft een discussie van uw resultaten voor uw verslag. Tevens levert u deze week uw krantenartikelopdracht op dinsdag vóór 12 uur ’s middags in (per email) bij uw werkgroepbegeleider. De antwoorden van de krantenartikelopdracht evenals de oefentoets op Blackboard kunnen tijdens de werkgroepbijeenkomst besproken worden als hier behoefte aan is. Indeling en uitvoering I. II. III. IV. V. Zelfstudie Zelfstudie: Krantenartikelopdracht (computer)practicum PubMed: zoeken voor mini-meta analyse Groepsopdracht Werkgroepbijeenkomst I. Zelfstudie Lees Appendix C (Meta-analyse) in deel III van dit blokboek. Maak de proeftoets op Blackboard -> Course Content -> Toetsing -> Tentamen en bespreek uw antwoorden met uw groepsgenoten tijdens de groepsbijeenkomst. II. Zelfstudie: Krantenartikelopdracht Lever uw antwoorden op de vragen vóór dinsdag 12:00 uur in bij uw werkgroepbegeleider (tenzij deze andere afspraken met u gemaakt heeft). Het op tijd inleveren van de volledige opdracht en een ‘voldaan’ beoordeling is ingangseis voor het tentamen. Zie voor meer informatie over de krantenartikelopdracht week 4. III. (computer)practicum PubMed: zoeken voor mini-meta analyse In dit (computer)practicum leert u een zoekstrategie voor uw onderzoeksvraag te formuleren. Hiermee zoekt u vervolgens de literatuur voor uw mini-meta analyse (zie hieronder). IV. Groepsopdracht U werkt deze week aan de discussie van uw artikel. Een onderdeel van de discussie vormt de mini-meta analyse. Het opsporen van de juiste literatuur is vaak een kunst. Over het aandachtsgebied binnen uw klinisch probleem zijn vaak duizenden publicaties verschenen en door de juiste zoekstrategie toe te passen kunt u het aantal artikelen zeer aanzienlijk beperken. Het is in deze cursus niet mogelijk een echte formele meta-analyse uit te voeren, omdat dit vaak een behoorlijke tijdsinvestering vraagt. Voor deze cursus is het voldoende als u een grafisch overzicht maakt van ‘effectmaten’ uit de belangrijkste publicaties op dit terrein. Probeer die studies te vinden en selecteren die de ‘ideale’ onderzoeksopzet hebben gebruikt en die in Engelstalige zogenaamde peer-reviewed tijdschriften zijn gepubliceerd. Let bij het zoeken van publicaties vooral ook op de studiepopulaties die in het gerapporteerde onderzoek onderwerp van studie-review waren. Als u geluk heeft, is over uw onderwerp recent een metaanalyse gepubliceerd en kunt u deze als uitgangspunt voor uw studie gebruiken. Als u minder geluk heeft vindt u weinig tot geen artikelen over uw specifieke onderzoeksvraag. Bekijk en bespreek dan de artikelen die het beste bij uw onderzoeksvraag in de buurt komen, ook als deze niet de ‘ideale’ onderzoeksopzet hebben. 37 KWO Bespreek, voordat u de literatuur gaat bewerken, uw zoekstrategie met de uw werkgroepbegeleider of met een medewerker van de medisch bibliotheek; dit kan u heel veel tijd besparen. Bedenk, voordat u in PubMed gaat zoeken, welke gegevens u uit een publicatie wilt extraheren. Voor een etiologisch onderzoek zal dat anders zijn dan voor een diagnostisch onderzoek. Plan van aanpak 1. Formuleer een zoekstrategie die op uw onderzoeksvraag van toepassing is 2. Bepaal welke gegevens u gaat extraheren 3. Maak een tabel van de geëxtraheerde gegevens 4. Voer de mini meta-analyse uit. U kunt daarbij de zogenoemde Forrest-plots maken. (zie Appendix B voor achtergrond en instructie) 5. Bespreek de resultaten van de mini-meta analyse in de discussiesectie van uw rapport, en vergelijk de resultaten met die van uw eigen onderzoek Rapportage discussie De opbouw van de discussie is belangrijk. Veel auteurs beginnen de discussie met het weergeven van de belangrijkste bevindingen uit de studie en vervolgens wordt de relatie met het eerdere werk van andere groepen kort besproken. Schrijf geen gedetailleerde lange kritieken op voorgaande studies, maar beperk u tot de belangrijkste publicaties. Vervolgens gaat u kort in op de tekortkomingen van uw studie, en de betekenis van de resultaten voor de klinische praktijk. U sluit af met een conclusie. V. Werkgroepbijeenkomst De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het werkgroepsproces. Ook is er ruimte om de antwoorden van de krantenartikelopdracht evenals die van de oefentoets tijdens de werkgroep te bespreken. U dient zelf aan te geven of hier behoefte toe is, en welke vragen u speciaal op zou willen focussen. De antwoorden van de oefentoets zullen niet op Blackboard komen, en worden ook niet aan studenten verstrekt. 38 KWO Week 6. Eindpresentaties, eindverslag en toets In deze week levert u uw eindverslag in, presenteert u uw bevindingen voor een “klinisch publiek” en vindt ook de eindtoets plaats. In deze laatste week schrijft u een gestructureerde samenvatting (abstract) over uw onderzoek. U maakt uw verslag nu helemaal af, delen hebt u reeds eerder geschreven. Het eindverslag bestaat uit de Abstract (nieuw), Inleiding (week 1), Methoden (week 3), Resultaten (week 4) en Discussie (week 5). Op donderdag (of in sommige gevallen vrijdag) presenteert u per groep uw onderzoek, inclusief discussie. Zie deze eindpresentatie als een ‘congrespresentatie’ voor een klinisch publiek. Geef dus een goed lopend afgerond verhaal met een begin (Introductie) en een eind (Discussie/ conclusies), maar wel beknopt! U krijgt slechts 10 minuten en er zal streng op de tijd worden gelet (maak ongeveer 10 dia’s in PowerPoint voor uw eindpresentatie). Na afloop worden aan elk van u individueel vragen gesteld door de hoofdbegeleiders. Lever uw eindverslag via de e-mail in bij: 1.) hoofdbegeleiders, 2.) werkgroepbegeleider, 3.) cruepidemiology@umcutrecht.nl Dit mag in één e-mail. De deadline voor het inleveren van het eindverslag is de laatste vrijdag van het blok om 23.59 uur. Op de vrijdag wordt de cursus afgesloten met een schriftelijke toets (open boek, waarbij u dus alle boeken en aantekeningen mee mag nemen. U mag echter geen gebruik maken van uw mobiele telefoon, dus neem een rekenmachine mee). Indeling en uitvoering I. II. III. IV. Groepsopdracht Werkgroepbijeenkomst Eindpresentaties Eindtoets I. Groepsopdracht U schrijft een gestructureerde samenvatting (abstract) over uw onderzoek. Deze samenvatting is veelal het belangrijkste onderdeel van een wetenschappelijk artikel. Niet alleen omdat deze opgenomen zal worden in PubMed, maar ook omdat de eerste indruk van de redacteuren van het beoogde tijdschrift op deze samenvatting is gebaseerd. Zij beslissen na het lezen ervan of het artikel wel interessant genoeg is voor het tijdschrift en of het aan beoordelaars zal worden gestuurd. Verder maakt u uw rapportage af door de samenvatting toe te voegen aan wat u vorige week reeds geschreven hebt. Uw eindverslag bestaat nu uit een titel, samenvatting, inleiding, patiënten en methoden, resultaten, en discussie. Volg bij het schrijven van een artikel met primaire data (= data verzameld in patiënten) altijd de structuur: introductie, methoden, resultaten en discussie (IMRaD). Enkele richtlijnen zijn hier kort samengevat, maar bekijk vooral ook eens de vergelijkbare publicaties in grote tijdschriften. Voor meer achtergrond kunt u de hoofdstukken uit het boekje van Hall et al lezen.1 1 Hall GM. How to write a paper. BMJ Publishing Group. 1999 London 39 KWO 1. Schrijf de introductie. De basis hiervoor heeft u reeds gelegd toen u het klinisch probleem heeft verkend (week 1), en in uw vooraanvraag (week 2). De introductie moet kort en pakkend zijn en onmiddellijk duidelijk maken waarom u de studie heeft opgezet en uitgevoerd. Geef duidelijk aan wat de studie die u heeft uitgevoerd gaat toevoegen aan de al bestaande kennis op dit terrein. Laat zien dat er echt nieuw onderzoek op dit terrein nodig was. Iets nog eens overgedaan hebben is voor editors van grote tijdschriften vaak geen reden om uw bevindingen te publiceren. Een zeer gedegen literatuuronderzoek voordat u de studie gaat opzetten kan voorkomen dat u zaken gaat uitzoeken die allang gedaan zijn. Als u subsidie nodig heeft zult u dit vaak al voor de subsidiegever hebben gedaan maar heel vaak wordt de literatuur pas goed nageplozen als het artikel wordt opgeschreven. In de introductie is geen plaats voor lange literatuuroverzichten. Wees kort en formuleer nauwkeurig de vraagstelling die u in het onderzoek gaat beantwoorden. 2. Schrijf de methodensectie. Ook deze sectie heeft u al uitgewerkt in uw onderzoeksprotocol (week 3). In dit onderdeel moet komen te staan hoe het onderzoeksontwerp eruitziet, hoe de studiepopulatie eruitziet, wat de uitkomsten van de studie zijn en hoe u de gegevens heeft geanalyseerd. Als u een studie heeft uitgevoerd waarin randomisatie heeft plaatsgevonden, beschrijf dan precies hoe deze is uitgevoerd. Als u een cohortonderzoek heeft uitgevoerd, beschrijf dan de tijdsrelatie tussen het vaststellen van het eindpunt en de determinant. De lezer moet weten in hoeverre de resultaten van de studie te gebruiken zijn in de praktijk. Om deze reden is een nauwkeurige beschrijving van de geselecteerde patiënten nodig. Wie kwamen er voor de studie in aanmerking, wie niet, en vooral: hoe werden ze gerekruteerd voor de studie. Geef altijd een beschrijving van de populatie waarin de studie werd uitgevoerd. In deze zogenaamde baseline tabel staan belangrijke kenmerken (bijvoorbeeld leeftijd, geslacht, symptomatologie, risicofactoren) van de onderzochte populatie. In een gerandomiseerde studie vindt u hier hoe de verschillende risicofactoren over de experimentele en controle groep zijn verdeeld. Vermeld ook altijd of u toestemming hebt verkregen van de medisch ethische commissie en leg de lezer met getallen uit, op basis waarvan de studieomvang is gekozen. Vaak worden stukken die in de Resultaten horen in de Methoden beschreven en omgekeerd. Let hier goed op. 3. Beschrijf de resultaten van uw onderzoek. Deze sectie heeft u in grote lijnen reeds geschreven bij het uitwerken van uw opdracht (week 4). De resultatensectie is het gemakkelijkste onderdeel van het artikel. Zij kan heel kort zijn en geeft antwoord op de gestelde vraagstelling. Leid de lezer door de resultaten en verwijs nooit alleen naar tabellen (dus niet: ‘in tabel 1-4 vindt u de belangrijkste resultaten’). Herhaal echter niet alles wat ook in de tabellen te vinden is. 5. Discussie. De opbouw van de discussie is belangrijk. Veel auteurs beginnen de discussie met het weergeven van de belangrijkste bevindingen uit de studie en vervolgens wordt de relatie met het eerdere werk van andere groepen kort besproken. Schrijf geen gedetailleerde lange kritieken op voorgaande studies maar beperk u tot de belangrijkste publicaties. Het snelst krijgt u hierover overzicht indien u een ‘quick and dirty’ mini-meta analyse uitvoert (zie hierboven). Vervolgens gaat u kort in op de tekortkomingen van uw studie, de betekenis van de resultaten voor de klinische praktijk. II. Werkgroepbijeenkomst De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het werkgroepsproces. Indien u nog niet de krantenartikelopdracht of de oefentoets tijdens de werkgroep in week 5 heeft besproken, kunt u dit alsnog in deze laatste week doen. U dient zelf aan te geven als hier behoefte toe is, en welke vragen u speciaal op zou willen focussen. De antwoorden van de oefentoets zullen niet op Blackboard komen, en worden ook niet aan studenten verstrekt. III. Eindpresentaties Bij de eindpresentaties geeft u uw definitieve presentatie. Deze zal tevens worden beoordeeld. De eindpresentaties zullen in de vorm van een klinisch wetenschappelijk congres 40 KWO gepresenteerd worden (dit i.t.t. eerdere presentaties die meer het karakter hadden van een werkbespreking). Verwerk in de eindpresentatie uw mini-meta analyse. Conform de meeste congressen zal de tijd om uw bevindingen te presenteren kort zijn, te weten 10 minuten! Beperk het aantal dia’s dat u wilt gebruiken; één minuut per dia is een aardige richtlijn om vast te houden. Realiseer u dat u in een presentatie niet alles kunt vertellen, en bedenk voor wie u staat te spreken. Zijn het artsen? Epidemiologen? Een patiëntenvereniging? Dit bepaalt welke informatie meer uitleg behoeft, en welke informatie sneller overheen kan worden gegaan. Dia’s moeten leesbaar zijn en uitkomsten kunnen niet zo worden weergegeven als in het uiteindelijke artikel Voorwaarden presentatie: - Maximale tijdsduur: 10 minuten - Na de presentatie: 15 minuten discussie - Uitloop / wissel: 5 minuten - Ieder lid van de groep neemt een deel van de presentatie voor zijn rekening. Na afloop zullen de hoofdbegeleiders en werkgroepbegeleiders individuele studenten (methodologische) vragen stellen. Deze week presenteren alle groepen hun bevindingen. De indeling zal in week 5 bekend gemaakt worden. De inzet van eerdere weken wordt meegenomen in de beoordeling van de eindpresentatie IV. Eindtoets Tot slot bereidt u zich voor op de eindtoets. Dit doet u aan de hand van de stof die gedurende de cursus is behandeld. Meer informatie omtrent de eindtoets is te vinden in deel I van dit blokboek, onder ‘Toetsing’. Om de cursus te evalueren en waar nodig in de toekomst te verbeteren, verzoeken wij u om na afloop van de eindtoets het evaluatieformulier van de cursus in te vullen. Doe dit alstublieft! Met name opmerkingen in de vrije tekstvelden worden geapprecieerd, en bieden ons het meeste input om de cursus te verbeteren en verfijnen. Bij voorbaat dank! 41 KWO 42 KWO DEEL II Klinisch Wetenschappelijk Onderzoek OEFENINGEN BIJ COLLEGES & (COMPUTER)PRACTICA 43 KWO 44 KWO Week 1. Oefeningen college diagnostisch onderzoek a. Oefening 1 Deze oefening is gebaseerd op het volgende onderzoek: Draaisma JMTh, Lemmen van RJ, Jong AAM de, Doesburg W. Temperatuurmeting bij kinderen: met de trommelvlies-infraroodmeter en de rectale kwikthermometer even goede resultaten op de spoedeisendehulp-afdeling. Ned Tijdschr Geneeskd 1997;141:938-941. Dit is een goed voorbeeld van zogenaamd testonderzoek. In testonderzoek worden de testeigenschappen van twee diagnostische testen vergeleken. Dit soort onderzoek geeft geen antwoord op de vraag wat de additionele waarde is van de test voor het stellen van een diagnose. De onderzoeksvraag was, of met behulp van een nieuwe trommelvlies-infraroodmeter accuraat de aanwezigheid van koorts kan worden gesteld bij kinderen jonger dan 11 jaar. In dit onderzoek werden in totaal 213 kinderen jonger dan 11 jaar gezien op een afdeling spoedeisende hulp van een algemeen ziekenhuis. Bij alle kinderen werd de temperatuur gemeten met de conventionele rectale kwikthermometer (RKT) en de nieuwe trommelvliesinfraroodmeter (TIM). De RKT werd als gouden standaard beschouwd en koorts werd voor beide methoden gedefinieerd als een afgelezen temperatuur hoger dan 38° C. Het gemiddelde verschil tussen de temperatuur gemeten met de TIM en de RKT was nihil. Bij 96 kinderen werd volgens de gouden standaard koorts geconstateerd. Volgens de TIM waren er 86 kinderen met koorts van wie 77 ook koorts hadden volgens de RKT. 1. Formuleer de onderzoeksvraag in termen van determinant en uitkomst relatie. Wat is het domein? 2. Bereken de sensitiviteit en specificiteit van de TIM. 3. Bereken de positief en negatief voorspellende waarde van de TIM. 4. Wat verwacht u van de voorspellende waarden als deze nieuwe thermometer in de huisartsenpraktijk wordt toegepast? 5. Wat zijn de overwegingen in termen van voorspellende waarden voor toepassing van de TIM in de huisartsenpraktijk? Wat vindt u belangrijker, de positief of de negatief voorspellende waarde? 45 KWO b. Oefening 2 Deze oefening is gebaseerd op het volgende onderzoek: Barenys M, Abad A, Pons JM, Moreno V, Rota R, Granados A, Admetlla M, Pique JM. Scoring system has better discriminative value than Helicobacter pylori testing in patients with dyspepsia in a setting with high prevalence of infection. Eur J Gastroenterol Hepatol. 2000;12:1275-82 2 Een internist verbonden aan een perifeer ziekenhuis krijgt een vrouw van 50 jaar op de polikliniek gastroenterologie verwezen in verband met borende pijn in het epigastrium. De klachten bestaan al enkele maanden, zijn vooral ’s nachts aanwezig en worden tijdelijk minder na het eten. Haar moeder had iets dergelijks gehad maar details ontbreken. De verdere anamnese vermeldt geen bijzonderheden. Alcoholgebruik: minimaal. Roken: neen. Medicatie: gemiddeld 3 maal per week ibuprofen (een NSAID) voor haar knieklachten. De internist denkt aan een zweer van de maag of de 12-vingerige darm (ulcus pepticum). Opgeleid in een moderne ‘Evidence-Based Medicine’ omgeving besluit de internist een diagnostische score te gebruiken om de patiënt als hoog of laag ulcus risico te kunnen classificeren. Dit heeft immers de consequentie van respectievelijk wel of geen endoscopie. De diagnostische score die de internist wil gebruiken is opgebouwd uit anamnestische gegevens en werd in de vorm van een tabel gepresenteerd: Indicator Punten Leeftijd > 40 jaar 1 Mannelijk geslacht 1 Alcohol gebruik > 30 gram / dag 1 Roken > 10 sigaretten per dag 1 NSAID gebruik > 2 doses / week 2 Episodische pijn in epigastrium 1 Pijn neemt af na eten 2 Eerdere ulcus diagnose 2 De score is de som van de punten. De positief voorspellende waarde bij score 3 is 57% en de negatief voorspellende waarde is 89% (score < 3 is 11% kans op peptisch ulcus). De voorafkans is 25%. 1. De bovenstaande tabel is het resultaat van een diagnostisch wetenschappelijk onderzoek. Hoe zou dat onderzoek eruit hebben gezien (ontwerp, uitkomst, determinanten)? 2. De internist, die inmiddels een kopie van deze tabel uit de bureaulade heeft getrokken, merkt dat het gegeven ‘episodische pijn’ van de patiënt nog ontbreekt. Hij vraagt hiernaar en krijgt een ontkennend antwoord. Tot welk domein behoort deze patiënte? 3. Wat is de score van de patiënte en wat is haar risico op peptisch ulcus? Neem daarbij aan dat het domein van de patiënte overeenkomt met dat van de patiënten waarvoor de anamnestische score bedoeld is. 4. Wat is uw bezwaar tegen deze wijze van presenteren van een gedichotomiseerde (= in tweeën gedeelde) score? 5. De internist gebruikt deze score en handelt naar bevinden. Tijdens het golfen bespreekt hij de patiënte met een collega die stelt dat een C-14-ureum-ademtest op H. Pylori veel informatiever is. Hij zegt dat de sensitiviteit van deze test 80% en de specificiteit 85% is voor ulcuslijden. Bereken met behulp van een kruistabel en een denkbeeldige populatie 2 Voor dit onderwijs werden de getallen uit dit onderzoek enigszins aangepast. 46 KWO van 100 patiënten uit ovengenoemd domein de positief en negatief voorspellende waarde van de ademtest. Neem hierbij aan dat de voorafkans op een ulcus in dit domein ook 25% is. 6. Wat vindt u van de diagnostische waarde van de ademtest op H. Pylori vergeleken met de anamnestische score? Waarom is de vraag welke van de twee “testen” de voorkeur heeft niet de klinisch relevante vraag? Welke is deze vraag dan wel? 7. Hoe zou u de ‘klinisch relevante vraag’ genoemd bij vraag 5 kunnen onderzoeken? Beschrijf kort het onderzoeksopzet. Vermeld ook de determinant-uitkomst relatie(s). 8. In het onderzoek waarin de score werd beschreven is ook de toegevoegde waarde van de ademtest onderzocht. De toegevoegde waarde bleek nihil. Hoe is dit te verklaren? 9. Is het in een onderzoek naar de toegevoegde waarde van de ademtest noodzakelijk (voor de validiteit) dat de beoordelaar van de ademtest niet op de hoogte is van het resultaat van de anamnestische score? Zo ja, waarom? 47 KWO c. Oefening 3 Verdenking op myocard infarct in de huisartspraktijk Patiënten in de huisartspraktijk met symptomen die kunnen duiden op een myocardinfarct (MI) worden doorverwezen voor additionele diagnostiek. Echter, slechts een deel van de doorverwezen patiënten blijkt een MI te hebben. De leeftijd van de patiënt kan gebruikt worden als ‘test’ of een MI waarschijnlijk is. In onderstaande tabel wordt de leeftijd weergegeven van 100 patiënten met een verdenking op een MI met de daadwerkelijke aanwezigheid of afwezigheid van een MI. 1. Pt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 2. Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten die 65 jaar zijn of ouder. Leeft 40 40 40 41 42 43 44 44 44 45 46 47 48 48 48 48 48 49 49 49 50 51 52 53 54 55 56 56 56 57 57 58 59 60 MI 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Pt 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Leeft 61 62 63 63 63 63 63 64 65 66 67 68 69 70 70 70 71 71 71 71 71 71 72 73 74 75 76 76 76 76 77 77 77 78 MI 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 Pt 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 Leeft 79 80 81 81 81 81 81 82 82 82 83 83 83 83 84 85 85 85 85 85 85 86 86 86 86 87 88 88 88 88 89 89 MI 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten bij meerdere afkappunten, namelijk a. van 50 jaar of ouder b. van 60 jaar of ouder c. van 70 jaar of ouder d. van 80 jaar of ouder en zet deze in een ROC curve (y-as: sensitiviteit = Terecht positief, x-as = 1-specificiteit = Vals positief). 48 KWO 49 KWO 50 KWO Week 1. Oefeningen college prognostisch onderzoek a. Oefening 1 Over de afgelopen decennia hebben talloze patiënten in de wereld een Björk-Shiley hartklepprothese ontvangen. Nu blijkt uit een studie dat er een kleine kans bestaat dat deze klep breekt. Als dat gebeurt, moet de patiënt acuut geopereerd worden, anders sterft hij/zij aan de klepbreuk. De sterfte onder patiënten met een klepbreuk is rond de 70%. In de studie is ook een predictiemodel ontwikkeld om voor iedere patiënt de kans op klepbreuk te bepalen. Men zou uit voorzorg bij iedereen met een Björk-Shiley hartklep deze klepprothese kunnen vervangen; echter het vervangen van een hartklep brengt ook risico’s met zich mee. Om dus een goede afweging te maken of de klepprothese al dan niet vervangen moet worden, is naast de kans op klepbreuk ook een voorspelling van de kans op sterfte na vervanging van een hartklepprothese nodig. U wordt gevraagd een onderzoek naar zo’n predictiemodel voor het risico van hartklepvervanging op te zetten. 1. Wat is de onderzoeksvraag? 2. Wat zijn domein, determinant, en uitkomst van de studie? Een soortgelijke studie is al eens gedaan. Op de volgende bladzijde ziet u Tabel 1 uit deze studie. 3. Wat is de 30 dagen sterfte voor de gehele groep patiënten? 4. Hoe groot is de kans dat iemand die met spoed wordt geopereerd in de eerste 30 dagen na hartklepvervanging sterft? 5. Wat zijn de sterkste voorspellers van 30 dagen sterfte na hartklepvervanging? 6. Denkt u dat deze factoren ieder een onafhankelijke rol hebben? Leg uit waarom wel/niet. 7. Bereken de kans op 30 dagen sterfte bij het vervangen van de klepprothese voor de volgende patiënten: - Man, 65 jaar, slechte linker ventrikel functie en coronair lijden met een aortaklepprothese. - Vrouw, 45 jaar, met een mitraalklepprothese. 51 KWO Table 1 Characteristics of the study population with 30 day mortality after valve replacement Variable Age (mean) Type of valve replacement Aortic Mitral Double Presence of endocarditis No Yes Left ventricular function Normal Reduced / Poor Previous Coronary Artery Disease No Yes, with CABG Yes, without CABG Emergency valve replacement No Yes Concommitant Aortic root replacement No Yes Concommitant Tricuspid valve plasty No Yes No. of Patients (%) 54.3 % Mortality 1,122(49.6) 800(35.3) 341(15.1) 4.6 7.4 12.6 2,032(89.8) 231(10.2) 5.9 15.2 2,159(95.4) 104(4.6) 6.4 15.4 1,516(67.0) 662(29.3) 85(3.7) 4.7 10.9 11.8 2,188(96.7) 75(3.3) 5.8 37.3 2,229(98.5) 34(1.5) 6.6 17.6 2,233(98.7) 30(1.3) 6.8 10.0 Om in de praktijk eenvoudig de sterftekans bij klepvervanging vast te stellen is binnen de studie een risico score opgesteld. Prognostic factor Age (years) 35 45 55 65 75 Mitral valve Double valve Endocarditis Poor left ventricular function Previous CAD Emergency Tricuspid valve plasty Aortic root reconstruction Add to score -2 -1 0 1 2 2 3 2 3 2 6 1 2 Total Score Predicted mortality (95% confidence interval) -2 -1 0 1 2 3 4 5 6 7 8 9 10 1.2 (0.7-2.2) 1.7 (1.0-2.8) 2.3 (1.5-3.6) 3.2 (2.1-5.0) 4.4 (3.0-6.7) 6.1 (4.0-9.3) 8.3 (5.3-13) 11 (7.3-17) 15 (8.8-25) 20 (11-33) 26 (15-41) 32 (19-49) 40 (25-58) Total score 52 KWO b. Oefening 2 Bij het kiezen van een behandeling speelt de prognose van de patiënt ook een belangrijke rol. Daar gaat deze oefening over. Casus Een man van 60 jaar, die reeds driemaal een hartinfarct heeft gehad, krijgt ’s nachts plotseling een onaangenaam gevoel achter zijn borstbeen. Hij ervaart dit als pijnlijk en drukkend en voelt zich misselijk, zweterig, en duizelig. De patiënt wordt met de ambulance naar het ziekenhuis gebracht. Onderweg maakt het ambulancepersoneel een 12-afleidingen elektrocardiogram (ECG), waarop de totale ST elevatie 1.5 millivolt (mV) is en de QRS duur 130 milliseconden. Zowel deze uitslagen als het klinisch beeld duiden op acute myocard ischemie. Op basis van de ECG bevindingen blijkt het om een infarct van de voorwand te gaan. De dienstdoende cardioloog staat voor de afweging of de patiënt een behandeling met trombolyse moet ondergaan. Het is bekend dat trombolyse (het oplossen van de thrombus die het infarct veroorzaakt) de mate van verdere infarcering van het hartweefsel kan beperken. Het kan echter ook tot bloedingen leiden. Om deze afweging goed te kunnen maken heeft de cardioloog inzicht nodig in de prognose van de patiënt, mét en zonder trombolyse behandeling. U wordt gevraagd hiervoor een prognostisch model te ontwikkelen. 1. en Wat is de onderzoeksvraag? Formuleer een onderzoeksvraag voor het hele onderzoek één vraag voor de additionele vraag. 2. Wat zijn onderzoeksontwerp, domein, determinant, en uitkomst van uw studie? Een van de manieren om een prognostisch model te ontwikkelen is door gebruik te maken van bestaande data. Op de volgende bladzijde vindt u de lange termijn resultaten uit een gerandomiseerde trial waarin 533 patiënten met een doorgemaakt hartinfarct tussen 1981 en 1985 werden gerandomiseerd naar behandeling met trombolyse (d.m.v. streptokinase) of zonder thrombolyse. De tabel geeft aan welke determinanten voorspellende waarde hadden voor de uitkomst. Voor iedere variabele ziet u de regressie-coëfficiënt en de odds ratio. 3. a) Wat betekent het woord ‘onafhankelijke’ in de titel van de tabel? b) Waar is de odds ratio een schatting voor? c) Wat betekent de term ‘gecorrigeerde OR’? d) Wat is de interpretatie van de gecorrigeerde OR van ‘leeftijd > 55 jaar’? 53 KWO Tabel 2. Onafhankelijke prognostische factoren voor de sterfte binnen 3 jaar na een acuut hartinfarct Factor Gecorrigeerde regressie- Gecorrigeerde Odds Ratio coëfficienta (OR)b Constante c -1.99 Eerder doorgemaakt hartinfarct (X1) 1.02 2.77 ST-elevatie > 1.2 mV (X2) 0.61 1.84 Leeftijd > 55 jaar (X3) 0.45 1.57 Inferieure infarct locatie (X4) -0.60 0.55 a b c Regressie-coëfficiënt: deze komen uit het multivariabele regressiemodel en worden gebruikt voor de schatting van absolute kansen voor de patiënt. De odds ratio geeft de kans op uitkomst (hier: sterfte) voor de mensen met een bepaalde prognostische factor ten opzichte van mensen die die factor niet hebben. De constante is een getal dat berekend wordt in het multivariabele regressiemodel en dat wordt gebruikt in de schatting van absolute kansen in de patiënt. Aan de hand van de regressie-coëfficiënten kan men voor iedere patiënt met een acuut myocard infarct zijn kans op sterfte binnen drie jaar uitrekenen via de volgende formule kans 1 1 e [ 1.99 (1.02* X 1) ( 0.61* X 2 ) ( 0.45* X 3) ( 0.60* X 4 )] Voor een vrouwelijke patiënt van 60 jaar, met een eerste onderwand infarct en ST-elevatie van 1 mV is deze kans gelijk aan 4. 1 1 e ( 1.99 (1.02*0 ) ( 0.61*0 ) ( 0.45*1) ( 0.60*1) = 0.11 Bereken aan de hand van de tabel de 3-jarige sterftekans voor de patiënt uit de casus. U weet nu de absolute sterftekansen voor deze 2 patiënten zonder thrombolyse behandeling. Uit bovengenoemd onderzoek bleek de regressie-coëfficient voor thrombolyse behandeling 0.40 te zijn, en de gecorrigeerde odds ratio 0.67. 5. Wat zegt de odds ratio van 0.67 over het effect van behandeling met trombolyse? 6. Wat wordt de 3-jaars sterftekans voor de patiënt uit de casus wanneer u zou trombolyseren? Wanneer u dit vergelijkt met de sterftekans zonder behandeling, zou u als cardioloog deze patiënt dan trombolyseren? Waarom wel/niet? 54 KWO Week 2. Oefeningen bij college frequentie- en associatiematen a. Oefening 1 1. Uit gegevens van het Transitie project in Nederland komt naar voren dat jaarlijks van de 1000 mannen er 19 een tonsillitis acuta krijgen, terwijl voor vrouwen dit 23 bedraagt. a. b. c. d. 2. Wat is het domein? Welke tijdsperiode betreft het? Welke frequentiemaat betreft het hier? Wat is de kans op tonsillitis acuta voor mannen per jaar gebaseerd op bovenstaande gegevens? Bij 3-10% van de kinderen in de algemene huisartspraktijk komt astma voor. a. Wat is het domein? b. Welke tijdsperiode betreft het? c. Welke frequentiemaat betreft het hier? 3. De kans op een mammacarcinoom gedurende het leven bedraagt 10%. a. Wat is het domein? b. Welke tijdsperiode betreft het? c. Welke frequentiemaat betreft het hier? 4. Bij 9% van mannen van 55-59 jaar is er sprake van wervelinzakkingen. Voor vrouwen bedraagt dit 10%. a. Wat is de kans op aanwezigheid van een wervelinzakking bij mannen in deze leeftijdsgroep? b. Wat is het domein? c. Welke tijdsperiode betreft het? d. Welke frequentiemaat betreft het hier? 5. In een interventieonderzoek naar het effect van hormoonsuppletie na de overgang op het ontstaan van fracturen wordt een gunstig resultaat gevonden van toediening. a. Wat is het domein? b. Welke tijdsperiode betreft het? c. Welke frequentiemaat betreft het hier? 55 KWO b. Oefening 2 Uit het ERGO onderzoek onder mannen en vrouwen van 55 jaar en ouder is het verband onderzocht tussen roken en het optreden van hart- en vaatziekten. De 7685 personen zijn gescreend en vervolgens gedurende 5 jaar vervolgd. Hieronder zijn de gegevens in tabelvorm weergegeven. Bereken voor het verband tussen roken en het optreden van hart en vaatziekten: 1. Wat is het domein? 2. Welke tijdsperiode betreft het? 3. Welke frequentiemaat betreft het hier? 4. Welke associatiematen (maten van verband) kunnen we hier berekenen? 5. Bereken deze associatiematen en leg in woorden uit wat ze betekenen. HUIDIGE ROKERS Rookt nu Ja Nee Totaal c. HVZ-ziekte Ja 41 107 148 Nee 1695 5842 7537 Totaal 1736 5949 7685 Oefening 3 Deze oefening is gebaseerd op het volgende onderzoek: van Duijn CM, Tanja TA, Haaxma R, Schulte W, Saan RJ, Lameris AJ, Antonides-Hendriks G, Hofman A. Head trauma and the risk of Alzheimer's disease. Am J Epidemiol. 1992;135:775-82 Een studie naar hoofdtrauma als mogelijke oorzaak van de ziekte van Alzheimer liet de volgende resultaten zien. Van de 198 incidente cases met de ziekte van Alzheimer, hadden er 33 ernstig hoofdletsel in de anamnese. Van de 198 populatiecontroles, die waren gematcht voor leeftijd en geslacht, hadden er 31 ernstig hoofdletsel in de anamnese. 1. Wat voor onderzoeksdesign is hier toegepast? 2. Wat is de determinant? 3. Wat is het domein? 4. Wat is de uitkomst? 5. Welke associatiemaat kun je hier berekenen? 6. Bereken deze. 56 KWO Week 2. Oefeningen college etiologisch onderzoek a. Oefening 1 Op 18 oktober 1995 verraste de Britse Committee on Safety of Medicines (CSM) de wereld met de aankondiging dat 3e-generatie anticonceptiepillen meer kans gaven op het ontstaan van veneuze trombose in vergelijking met de wat oudere 2e-generatiepillen. Het CSM stelde voor om 3e-generatiepillen niet langer voor te schrijven als eerste keuze bij jonge vrouwen. Deze aankondiging was gebaseerd op 3, toen nog niet gepubliceerde, onderzoeken en wekte veel protest en onrust. Vele artsen hadden moeite met het bericht: het zou immers toch zo kunnen zijn dat er systematische vertekening zat in het epidemiologisch onderzoek, en bovendien was geen enkel plausibel biologisch mechanisme bekend. De mededeling stond bovendien haaks op wat de industrie wilde omdat volgens haar 3e generatie anticonceptiepillen juist beter waren dan 2e generatie wat betreft het optreden van hart- en vaatziekten. In 1997 werd een biologisch mechanisme ter verklaring van het verhoogde risico voorgesteld: bij een nieuwe proefopzet voor het bepalen van resistentie tegen geactiveerd proteïne C (APC) vond men hogere waarden bij vrouwen die de 3e-generatie pil gebruikten. Ook een aantal andere stollingsafwijkingen bleken net iets minder uitgesproken bij de 2e-generatiepil. In 1999 waren er 13 gepubliceerde patiënt-controle en cohortonderzoeken met gegevens over de kans op veneuze trombose bij de verschillende soorten contraceptiva; in 10 van deze onderzoekingen vindt men een verhoogd risico van 3e-generatiepreparaten en in 3 onderzoekingen relatieve risico’s van ongeveer 1. Ondertussen zijn de verschillende partijen het nog steeds niet met elkaar eens. Zo wordt anno 1999 in het leerboek ‘Clinical Gynecologic Endocrinology and Infertility’ van Speroff, Glass and Kase na een uitgebreide discussie van alle relevante literatuur op pagina 888 geschreven dat: ‘…the apparent differences associated with the new progestins, it is now apparent, were due to the marketing and preferential prescribing of new products, which influenced the characteristics of the patients for whom the new products were prescribed’. En in het Farmacotherapeutisch kompas 2000/2001 is de 2e-generatiepil het anticonceptiemiddel van 1e keus vanwege het ‘... lager risico op veneuze trombose... 2e generatiepillen zijn bovendien goedkoper dan 3 e-generatiepillen’. 1. Benoem de drie componenten (domein, determinant, en uitkomst) van de klinisch epidemiologische vraagstelling van bovenstaand probleem. 2. Welke studieopzet (design) zou u gebruiken om deze vraag te beantwoorden, en waarom? 3. Zijn er nog andere mogelijkheden? 57 KWO b. Oefening 2 Deze oefening is gebaseerd op het volgende onderzoek: Key TJ, Sharp GB, Appleby PN, Beral V, Goodman MT, Soda M, Mabuchi K. Soya foods and breast cancer risk: a prospective study in Hiroshima and Nagasaki, Japan. Br J Cancer 1999;81: 1248-56 De kans op borstkanker is verhoogd bij een hoge blootstelling aan endogene en exogene oestrogenen (vrouwelijke geslachtshormonen). Sojavoeding is rijk aan stoffen, die een structuur hebben die erg lijkt op oestrogenen. Deze stoffen heten phyto-estrogenen, en ze hebben zowel een zwak oestrogeen als een zwak anti-oestrogeen werking. Dit heeft geleid tot de hypothese dat een hoge consumptie van phyto-estrogenen door interactie met het oestrogeenmetabolisme de kans op borstkanker zou kunnen beïnvloeden. De onderzoeksvraag van deze studie is of het eten van sojavoeding de kans op borstkanker verlaagt. Soja wordt traditioneel veel gegeten in Aziatische landen. Omdat er markante verschillen in het voorkomen van borstkanker bestaan tussen Westerse (hogere incidentie) en Aziatische landen wordt al vele jaren gezocht naar een verklaring hiervoor. Waarschijnlijk spelen leef- en voedingsgewoonten een belangrijke rol. Het eten van de traditionele Oosterse gerechten rijk aan soja en sojaproducten (miso, tofu) zou de kans op borstkanker kunnen verlagen en de oorzaak kunnen zijn van de lage incidentiecijfers die in Aziatische landen gezien worden. Het onderzoek, dat in dit artikel is beschreven, werd uitgevoerd in het cohort van de zogenaamde ‘Life Span Study’, een cohort vrouwen in Hiroshima en Nagasaki, Japan. Een eerder onderzoek in ditzelfde cohort heeft laten zien dat blootstelling aan radioactieve straling de kans op borstkanker verhoogt. Voor de studie in dit artikel maakten de onderzoekers gebruik van voedings-vragenlijsten, die tussen 1969 en 1981 door 34 759 vrouwen uit dit cohort werden ingevuld. Van de vrouwen werd bijgehouden - tot 1993- bij wie borstkanker was opgetreden. 427 keer werd borstkanker gediagnosticeerd in een totaal van 488 989 persoonsjaren ‘follow-up’. De resultaten zagen er als volgt uit: Aantal gevallen Persoonsjaren Geen tofu 37 52 793 <=1/week 139 164 476 2-4/week 199 219 025 >=5/week 52 52 695 Relatieve risico Tofu 1. Benoem de determinant, de uitkomst en het domein van de klinisch epidemiologische vraagstelling. 2. Wat is het (absolute) risico op borstkanker voor de hele populatie? En wat is het (absolute) risico op borstkanker voor vrouwen die een hoge tofu consumptie hebben? 3. Wat voor type onderzoek is het beschreven onderzoek (etiologisch, diagnostisch, prognostisch, interventie)? Bestaat er kans op ‘confounding’ in het beschreven onderzoek? Zo ja, noem een mogelijke ‘confounder’ in dit onderzoek. Zo nee, waarom niet? 4. Wat is het onderzoeksontwerp (design) van het beschreven onderzoek (follow-up, patiënt-controle, gerandomiseerd). De onderzoeksvraag zou ook door middel van een patiëntcontrole- onderzoek onderzocht kunnen worden. Omschrijf voor dezelfde onderzoeksvraag hoe een patiëntcontroleonderzoek eruitziet. Wat zou een mogelijk probleem kunnen zijn? 58 KWO Week 2. Oefening college interventieonderzoek Deze oefening is gebaseerd op het volgende onderzoek: Kalliomäki M, Salminen S, Arvilommi H, Kero P, Koskinen P, Isolauri E. Probiotics in primary prevention of atopic disease: a randomised placebo-controlled trial. Lancet 2001;357:1076-79. Het is een goed voorbeeld van een primaire preventie trial waarbij men met een specifieke interventie probeert het risico op ontstaan van ziekte te verminderen. Het onderzoek is gebaseerd op eerdere waarnemingen passend bij de zogenaamde hygiëne hypothese. Kinderen die op heel jonge leeftijd veel infecties doormaakten hadden een kleinere kans op het ontwikkelen van atopische ziekten (atopisch eczeem, allergische rhinitis, astma) dan kinderen die minder infecties doormaakten. Deze onderzoekers veronderstelden dat bepaalde darmbacteriën belangrijk zouden kunnen zijn in het voorkomen van atopie. Zij onderzochten 159 zwangere vrouwen met een eerstegraads familielid of een partner die leed aan atopische ziekte. Deze zwangeren werden random toegewezen aan capsules met een probioticum (n=77, waarvan 64 de studie afmaakten), Lactobacillus rhamnosus, dagelijks gedurende 2 - 4 weken voor de verwachte bevalling of placebo capsules (n=82, waarvan 68 de studie afmaakten). Na de bevalling gingen moeders die borstvoeding gaven gedurende 6 maanden met de capsules door en anders kregen de kinderen de capsule inhoud. Na de volledige twee jaar follow-up van het onderzoek hadden 15 kinderen in de lactobacillus groep een atopische ziekte en 31 kinderen in de placebogroep. 1. Formuleer de vraagstelling (domein, determinant, uitkomst) 2. Zie tabel: beargumenteer of het doel van de randomisatie is bereikt? Verdeling van familiegeschiedenis en geboortekarakteristieken na randomisatie. Placebo (n=82) Lactobacillus (n=77) 77 71 43 40 37 34 21 12 11 21 Gemiddelde zwangerschapsduur (wk) 39 39 Jongens (%) 52 64 Detecteerbaar IgE in navelstrengbloed (%) 30 40 Gemiddeld gewicht (g) 3612 3631 Gemiddelde hoofdomtrek (cm) 35 35 Familiegeschiedenis Atopie moeder (%) Atopisch eczeem in familie (%) Ouder broertje/zusje met atopie (%) Roken ouders (%) Huisdier met vacht (%) Geboortekarakteristieken 59 KWO Trial profiel 159 moeders gerandomiseerd 82 placebo 14 lost to follow-up 2 ante partum 12 post partum 77 Lactobacillus 13 lost to follow-up 2 ante partum 11 post partum 68 compleet 64 compleet Hierboven staat het ‘trial profiel’ met aantallen gerandomiseerde moeders, aantallen die uitvielen (lost to follow-up) en aantallen die analyseerbaar waren (complete follow-up). 5 van de 14 uitvallers in de placebogroep vielen uit na 6 maanden follow-up en in de Lactobacillus groep waren dat er 4 van de 13. Geen van de uitvallers had een atopie diagnose voor uitval. 3. Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2 levensjaren een atopische ziekte te krijgen onder Lactobacillus behandeling? 4. Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2 levensjaren een atopische ziekte te krijgen onder placebo behandeling? 5. Wat is het relatieve risico? 6. Wat is het 95% betrouwbaarheidsinterval behorend bij dit relatieve risico? Ziekte Determinant Ja Nee Totaal Ja A1 B1 N1 Nee A0 B0 N0 Het 95% betrouwbaarheidsinterval van het relatieve risico is bij benadering: elnRR ± 1.96√[B1/(A1N1) + B0/(A0N0)] 7. Waarom berekent men dit interval? 8. Kan dit resultaat (deels) verklaard worden door verschillen tussen de groepen na randomisatie? Of door de loss to follow-up? Beargumenteer. 9. Welke conclusie kan op basis van deze resultaten worden getrokken? 60 KWO Week 4. Computer(computer)practicum diagnostisch onderzoek De diagnostische waarde van anamnese, lichamelijk onderzoek en verscheidene testen voor het stellen van de diagnose longembolie Inleiding Een longembolie ontstaat wanneer een stukje bloedstolsel (embolus), bijvoorbeeld vanuit een ader in de benen, via het hart in een bloedvat van de longen terecht komt en dit afsluit. De diagnose longembolie is moeilijk te stellen. De uiteindelijke diagnose wordt gesteld door een combinatie van een longperfusie- en ventilatiescintigram (‘longscan’) en een pulmonaire angiografie. Het nadeel van deze testen is dat ze invasief en kostbaar zijn. Indien longembolie ook te diagnosticeren zou zijn met behulp van eenvoudigere testen, zou dit uiteraard de voorkeur verdienen. Het is nog onbekend of en welke eenvoudige testen zoals anamnese, lichamelijk onderzoek, echografie van de benen, thorax röntgenfoto en bloedgaswaarden werkelijk een belangrijke bijdrage hebben in het stellen van de diagnose. De bijdrage van bovengenoemde testen kan worden onderzocht met behulp van een dataset van 398 patiënten die werden verdacht van longembolie en werden verwezen naar één van twee geselecteerde academische ziekenhuizen in Nederland. Alle patiënten ondergingen de volgende diagnostische testen: anamnese (ongeveer 10 testen), lichamelijk onderzoek (ongeveer 3 testen), bloedgaswaarden, thorax röntgenfoto, en een echo van de diepe venen in de benen. Vervolgens ondergingen alle patiënten de referentietest (gouden standaard). Dit was een combinatie van een longscan en/of pulmonaire angiografie. Indien de longscan of pulmonaire angiografie wees op de aanwezigheid van longembolie, dan werd longembolie bewezen geacht. De echo, röntgenfoto, scans en angiogrammen werden ieder beoordeeld zonder kennis van de uitslag van de overige beeldvorming of andere diagnostische informatie. Hieronder wordt een tabel gegeven van de variabelen die in deze dataset aanwezig zijn: Variabele LFT MAN MAL1 OK3M PDVT PPE DYS PLEURCHP WHEE COLL WRIJ TACHP1 DVTS XRAYAFW ECHOAFW PCO2 PO2 EMBOLY PE Beschrijving Leeftijd in jaren Geslacht (1=man, 0=vrouw) Aanwezigheid van maligniteit (1=ja, 0=nee) Operatie in de laatste 3 maanden (1=ja, 0=nee) In het verleden een diep veneuze trombose gehad (1=ja, 0=nee) In het verleden een longembolie gehad (1=ja, 0=nee) Dyspneu (1=ja, 0=nee) Pleuritische pijn in de borst (1=ja, 0=nee) Piepende ademhaling (1=ja, 0=nee) Syncope/collaps (1=ja, 0=nee) ‘Pleurawrijven’ (1=ja, 0=nee) Tachypneu – aantal ademhalingen per minuut Symptomen van diep veneuze trombose (1=ja, 0=nee) Afwijkingen op thorax röntgenfoto (atelectase, verhoogde hemidiagfragma, pleurale effusie, parenchymale afwijkingen) (1=ja, 0=nee) Afwijkingen op echografie benen (diep veneuze trombose werd vastgesteld indien v. femoralis en/of v. popliteale niet samendrukbaar) (1=ja, 0=nee) pCO2 (arterieel) in mm Hg pO2 (arterieel) in mm Hg Longembolie aanwezig (vastgesteld m.b.v. gouden standaard) (1=ja, 0=nee) Vraag 1: a) Wat is (zijn) de determinant(en)? b) Wat is de uitkomst? c) Wat is het domein? d) Wat is de onderzoeksvraag? e) Beschrijf de onderzoeksopzet. f) Wat zijn de voor- en nadelen van deze onderzoeksopzet? g) Geef een beschrijving van de onderzoekspopulatie in de vorm van een zogenaamde baselinetabel (=tabel 1 in een wetenschappelijk artikel). 61 KWO Vraag 2: a) Wat is de prior (vooraf) kans dat een patiënt die wordt verwezen in verband met verdenking op longembolie ook inderdaad longembolie heeft (dus vóór er enige test is uitgevoerd)? b) Maak een 2x2 tabel voor iedere dichotome diagnostische test uitgezet tegen de uitkomst; wat staat er in rijen en wat in de kolommen? c) Bereken bij iedere tabel de sensitiviteit en de specificiteit. Bereken tevens de kans dat longembolie aanwezig is bij een positieve test en bij een negatieve test. Welke dichotome testen veranderen de prior kans op longembolie in een lage posterior (achteraf) kans en zijn dus nuttig voor het uitsluiten van longembolie? Welke testen veranderen de prior kans op longembolie in een hoge posterior kans en zijn dus nuttig voor het vaststellen van longembolie? d) Er zijn 4 testen met een continue uitkomst. Om de diagnostische waarde van deze testen te beoordelen kun je een ROC curve maken, en de ‘area under the curve’ (AUC) met 95% betrouwbaarheidsinterval berekenen. (Gebruik in SPSS Analyze en dan ROC curve). Interpreteer ROC curve en de AUC met bijbehorend 95% betrouwbaarheidsinterval. e) Een AUC kan variëren tussen 0.5 en 1.0; toch vind je bij d) ook ROC curves met een AUC kleiner dan 0.5. Wat is hier de reden van? Zoals reeds op college is verteld, wordt in de praktijk een diagnose nooit op basis van één enkele test gesteld, maar op basis van een combinatie van testen. Ook in diagnostisch onderzoek zijn we dus vooral geïnteresseerd in de diagnostische waarde van een combinatie van testen. In dit (computer)practicum hebben we individuele testen geëvalueerd. De volgende stap is om te kijken of combinaties van testen de diagnostische waarde verder verbeteren. We doen dit gewoonlijk met behulp van multivariabele (logistische) regressieanalyse en bijbehorende ROC curves. Dit valt echter buiten het bestek van dit onderwijsblok. 62 KWO Week 4. Computer(computer)practicum prognostisch onderzoek Predictoren van sterfte binnen 30 dagen na een acuut myocardinfarct Inleiding De behandeling van het acute hartinfarct is enorm verbeterd de laatste jaren. Desondanks is de vroege sterfte nog altijd substantieel (6-9% in de eerste 30-35 dagen), zelfs voor patiënten die in de eerste 6 uur na het hartinfarct trombolytische interventiebehandeling krijgen. Om verschillende redenen is het belangrijk om al vroeg te weten welke patiënten een groot risico op sterfte hebben. Een predictieregel, waarin belangrijke voorspellers zijn vertegenwoordigd, kan van groot nut zijn in de klinische praktijk. Van u wordt gevraagd een dergelijke predictieregel af te leiden (derivatie). Hierbij maakt u gebruik van een dataset met 785 patiënten met een acuut hartinfarct, waarvan er 52 binnen een termijn van 30 dagen stierven. Hieronder vindt u een overzicht van de 10 predictoren in de dataset. Variabele Beschrijving (codering: nee/ja is gecodeerd als 0/1) DAY30 Overlijden binnen 30 dagen na hartinfarct SEX AGE A65 KILLIP SHO DIA HYP HRT ANT PMI Vrouwelijk geslacht (0/1) Leeftijd in jaren Leeftijd > 65 jaar (0/1) Killip class: maat voor het functioneren van de linker ventrikel (code 1 – 4) Shock: Killip class 3 of 4 versus 1 of 2 (0/1) Diabetes mellitus (0/1) Hypotensie (systolische bloeddruk < 100 mmHg) (0/1) Tachycardie: pols > 80 slagen/minuut (0/1) Anterior hartinfarct (0/1) Myocardinfarct in de voorgeschiedenis (0/1) Vraag 1: a) b) c) d) e) f) g) Wat is (zijn) de determinant(en)? Wat is de uitkomst? Wat is het domein? Wat is de onderzoeksvraag? Beschrijf de onderzoeksopzet. Wat zijn de voor- en nadelen van deze onderzoeksopzet? Geef een beschrijving van de onderzoekspopulatie in de vorm van de zogenaamde baselinetabel. Vraag 2: a) b) c) Wat is de prior kans op overlijden binnen 30 dagen? Maak een 2x2 tabel voor iedere (gekozen) predictor uitgezet tegen de uitkomst; wat staat er in rijen en wat in de kolommen? Bereken het absolute risico op overlijden binnen 30 dagen bij aan- en afwezigheid van iedere predictor. Bereken voor iedere 2x2 tabel ook het relatieve risico. Vraag 3: a) Hoeveel predictoren mogen maximaal gebruikt worden voor de predictieregel? b) Welke predictoren zou u in de predictieregel willen opnemen? c) Hoe zouden zonder multivariabele model toch meerdere factoren tegelijk beschouwd kunnen worden? d) Sommige predictoren kunnen zwaarder wegen dan andere; hoe zou je gewichten aan de verschillende predictoren kunnen geven? 63 KWO Vraag 4: a) Doe een voorstel voor een predictieregel. b) Bereken voor iedere patiënt in SPSS de uitkomst van de regel (de predictiescore). (Hint: gebruik hiervoor Transform, en vervolgens Compute om de score-variabele te maken). Vraag 5: a) b) Maak een ROC curve om de prognostische waarde van uw predictieregel te beoordelen (Gebruik in SPSS Analyze en dan ROC curve). Beoordeel het risico op overlijden binnen 30 na een hartinfarct in groepen met oplopende predictiescores. (Maak hiervoor een kruistabel waarbij u zelfgemaakte score variabele uitzet tegen sterfte binnen 30 dagen) Ga na of er bij een hogere score inderdaad een grotere kans bestaat om binnen 30 dagen te overlijden. 64 KWO Week 4. Computer(computer)practicum etiologisch onderzoek Verband tussen lengte en de kans op coronaire hartziekte: de rol van leeftijd en overgewicht als verstorende variabelen Inleiding In een beperkt aantal onderzoekingen is beschreven dat kleinere (geringere lichaamslengte) personen een hogere kans hebben op coronaire hartziekten. Dit werd met name beschreven voor mannen. Tevens bleek dat in een aantal artikelen onvoldoende goed rekening gehouden was met andere risicofactoren voor coronaire hartziekte. Als onderliggend mechanisme werd gepostuleerd dat dit toegenomen risico wellicht veroorzaakt wordt doordat kleinere personen vaak een iets hogere bloeddruk hebben. De bovenstaande gegevens zijn de aanleiding om het verband tussen lichaamslengte en kans op coronaire hartziekte te onderzoeken in een dataset afkomstig van cohortonderzoek onder ruim 17.000 postmenopausale vrouwen. Om de onderzoeksvraag te beantwoorden werd een genest patiënt-controleonderzoek uitgevoerd. Hieronder ziet u een codeboek van de variabelen die in deze dataset aanwezig zijn: Variabele Beschrijving incichd Incidente coronair hart ziekte (1 = ja, 0 = nee) wgt80 Gewicht (1= above 80 kg: overweight, 0<= 80 kg) hgt165 Lengte (1< 165 cm: small, 0 >= 165 cm) age60 Leeftijd (1 > 60 jaar, 0 <= 60 jaar) hypert Hypertensie (1 = ja, 0 = nee) hyperch Hypercholesterolemia (1 = ja, 0 = nee) rooknu Huidige roker (1 = ja, 0 = nee) sbp Systolic pressure dbp Diastolic pressure Vraag 1: a) b) c) d) e) f) g) h) i) Wat is de determinant? Wat is de uitkomst? Wat is het domein? Wat is de onderzoeksvraag? Beschrijf de onderzoeksopzet, probeer daarbij te bedenken wat “genest” zou kunnen betekenen. Wat zijn de voor- en nadelen van deze onderzoeksopzet? Beargumenteer of en waarom u het zinvol vindt om voor de door u gedefinieerde vraagstelling een “geneste” analyse te doen? Welke associatiemaat zou u gebruiken om het verband tussen de determinant en de ziekte aan te geven? Geef een beschrijving van de onderzoekspopulatie in de vorm van de zogenaamde baselinetabel Vraag 2: a) b) c) d) Maak voor de hoofdvraag een 2x2 tabel; wat staat er in de rijen en wat in de kolommen? Bereken de associatiemaat die het verband aangeeft tussen de determinant en de ziekte. Geef het 95% betrouwbaarheidsinterval. Beschrijf het gevonden verband. 65 KWO Vraag 3: a) b) Ga na of leeftijd voldoet aan het criterium ‘confounder’. Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de ‘gepoolde schatter van het verband’. Is leeftijd een confounder, en zo ja waarom? Vraag 4: a) b) Ga na of overgewicht voldoet aan het criterium ‘confounder’. Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de ‘gepoolde schatter van het verband’. Is overgewicht een confounder, en zo ja waarom? Vraag 5: a) b) Ga na of bloeddruk voldoet aan het criterium ‘confounder’. Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de ‘gepoolde schatter van het verband’. Is bloeddruk een confounder, en zo ja waarom? 66 KWO Week 4. Computer(computer)practicum interventieonderzoek Leidt het plaatsen van trommelvliesbuisjes bij kinderen met een middenoorontsteking (OME) tot een vermindering van het gehoorverlies? Inleiding Otitis Media met Effusie (OME) is een zeer frequent voorkomende aandoening bij kinderen. De aandoening gaat gepaard met een ophoping van vocht achter het trommelvlies zonder dat het kind hierbij duidelijke klachten of symptomen heeft. De aanwezigheid van vocht zorgt meestal voor een gering tot matig gehoorverlies en dit gehoorverlies heeft mogelijk een nadelige werking op de (taal)ontwikkeling van deze kinderen. Het doel van het inbrengen van trommelvliesbuisjes is het vocht te verwijderen en daarmee het gehoor te herstellen om zo eventuele ontwikkelings-problemen te voorkomen. Aan de hand van een dataset van een gerandomiseerde interventiestudie bij 187 kinderen met OME kan worden nagegaan of het plaatsen van trommelvliesbuisjes inderdaad leidt tot een vermindering van het gehoorverlies. Hieronder wordt een tabel gegeven van de variabelen die in deze dataset aanwezig zijn. Variabele Beschrijving Variabele Type IDENT Uniek identificatienummer van de deelnemende patiënten Continu GEBDAT Geboortedatum van de kinderen Datum GESLACHT Geslacht (1 = jongen; 2 = meisje) Dichotoom AGE Leeftijd (1 <2 jaar; 2 >= 2 jaar) Dichotoom BEHANDEL Wel of geen trommelvliesbuisjes (1 = trommelvliesbuisjes; 2=afwachtend beleid) Dichotoom meanhl0r Gemiddeld gehoorverlies rechteroor op baseline Continu meanhl0l Gemiddeld gehoorverlies linkeroor op baseline Continu Meanhl6r Gemiddeld gehoorverlies rechteroor na 6 maanden Continu Meanhl6l Gemiddeld gehoorverlies linkeroor na 6 maanden Continu Meanhlfr Gemiddeld gehoorverlies rechteroor na 12 maanden Continu Meanhlfl Gemiddeld gehoorverlies linkeroor na 12 maanden Continu Vraag 1: a) b) c) d) e) f) g) h) Wat is de determinant? Wat is de uitkomst? Wat is het domein? Wat is de onderzoeksvraag? Beschrijf de onderzoeksopzet. Wat zijn de voor- en nadelen van deze onderzoeksopzet? Moeten we bij een dergelijke onderzoeksopzet rekening houden met confounders? Waarom wel/niet? Geef een beschrijving van de onderzoekspopulatie in de vorm van een zogenaamde baselinetabel (= tabel 1 in een wetenschappelijk artikel). 67 KWO Vraag 2: a) b) Ieder kind heeft uiteraard 2 oren. Hoe zou je toch tot één uitkomstmaat per meetmoment kunnen komen? Maak een dergelijke nieuwe variabele (tip: gebruik de functie Compute). Bereken het effect in beide groepen voor beide meetmomenten (6 en 12 maanden follow-up). Is er een statistisch verschil? Vraag 3: Op grond van een klinische inschatting kun je groepen patiënten bedenken waarbij het effect van trommelvliesbuisjes groter is dan bij anderen. Dit soort variabelen noem je potentiële effectmodificatoren. a) Welke subgroep(en) zou je op theoretische gronden kunnen onderscheiden om naar de relatie trommelvliesbuisjes en mate van gehoorverlies te kijken? b) Analyseer de determinant-uitkomst relatie voor deze subgroep(en). Vraag 4: Bij wie lijken trommelvliesbuisjes het meest effectief te zijn? 68 KWO DEEL III Klinisch Wetenschappelijk Onderzoek THEORIE Colofon Een publicatie van het Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde Universitair Medisch Centrum Utrecht Postbus 85500 3508 GA Utrecht Auteurs: Prof. dr. A. Algra, A.A.A. Bak, J.G. van der Bom, M.L. Bots, J.H. den Breeijen, H. Burger, E. Buskens, Y. van der Graaf, D.E. Grobbee, P.H.M. Peeters, C.G. Schoemaker, Y.T. van der Schouw, C.S.P.M. Uiterwaal Auteursrecht voorbehouden Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde, Utrecht, 2003, 2011, 2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021 69 KWO 70 KWO Hoofdstuk 1 KLINISCHE EPIDEMIOLOGIE 1. Inleiding Aan de opbouw van medische kennis hebben zowel culturele, politieke, economische, religieuze, filosofische, als wetenschappelijke elementen bijgedragen. Vooral in de Westerse wereld wordt de arts tegenwoordig meer en meer geacht op basis van wetenschappelijke kennis te handelen. Traditioneel komt een groot deel van deze kennis uit de medisch-biologische deelwetenschappen zoals de anatomie, celbiologie, genetica, fysiologie en biochemie. Dit heeft ertoe geleid dat artsen hoofdzakelijk handelden op basis van deterministisch, causaal, pathofysiologisch redeneren, uiteraard in combinatie met eigen ervaring en die van de opleider. In de loop der tijd is in wisselende mate, maar vooral gedurende de afgelopen decennia, het besef ontstaan dat deze sterk theoretische basis ontoereikend is. Onder andere door de grote complexiteit van ziekte, de relatief geringe nauwkeurigheid van veel klinische waarnemingen en de beperkte waarde van individuele ervaringen wordt de medicus practicus geconfronteerd met een grote mate van onvoorspelbaarheid van vrijwel alle facetten van ziekte. De epidemiologie, en vooral de klinische epidemiologie, stelt zich ten doel door formele en systematische kwantificatie die kennis te leveren die de hieruit voortvloeiende onzekerheid moet verkleinen. Het medisch praktisch belang van empirische en statistische kennis in plaats van theoretische en deterministische kennis wordt zeer sterk benadrukt door een stroming die in 1992 ontstond uit de klinische epidemiologie. Volgens de aanhangers van deze stroming, de 'Evidence-Based Medicine’ (EBM), behoort eigenlijk elke medische handeling gebaseerd te zijn op de integratie van 'evidence' uit klinisch epidemiologisch onderzoek met de klinische expertise van de behandelaar en de waarden, voorkeuren en omstandigheden van de patiënt. De EBM-stroming zal apart worden besproken in paragraaf 5.1. Terwijl de algemene epidemiologie de frequentie van het optreden van ziekte en haar determinanten bestudeert in de algemene populatie, richt de klinische epidemiologie zich vooral op vragen die zich voordoen in de klinische praktijk. Deze vragen betreffen etiologie, diagnose, prognose en interventie (inclusief bijwerkingen) van ziekten. Voordat deze vragen ofwel aandachtsgebieden binnen de klinische epidemiologie apart worden besproken in hoofdstuk 2, volgen eerst vier algemene paragrafen. Literatuur Grobbee DE, Miettinen OS. Clinical epidemiology. Introduction to the discipline. Neth J Med 1995;47:2-5 Bronvermelding Paragrafen 1.1, 1.3, 1.4 en 1.5 van hoofdstuk 1 zijn gebaseerd op: Burger H, Hofman A. Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red). Interne Geneeskunde. Houten: Bohn Stafleu van Loghum, 2001: respectievelijk paragrafen 1-0 (Inleiding), 1-1 (Kans), 1-2 (Vormen van klinisch epidemiologisch onderzoek), 1-3 (Precisie en validiteit), en 1-4 (Risico). 1.2 ONDERZOEKSONTWERP 1.2.1 Inleiding Elk onderzoek begint met een bepaalde vraag. In het klinisch wetenschappelijk onderzoek moet deze klinisch relevant zijn. Vragen met betrekking tot ziekten of ziekte-uitkomsten die erg weinig voorkomen, slechts een zeer geringe belasting voor de patiënt betekenen of nauwelijks consequenties hebben, zullen in het algemeen weinig relevant zijn. Omgekeerd zullen vragen over frequente en ernstige ziekten met medische consequenties vaak wel relevant zijn. Zo is bijvoorbeeld de vraag of bij mannelijke 65-plussers met een aneurysma aortae een hoge polsdruk een indicator is van een hoog risico op ruptuur, uitermate relevant. Aneurysma aortae is immers bij mannelijke 65-plussers niet zeldzaam (rond 4%), de uitkomst is niet onschuldig (mogelijk letale bloeding), en bij hoog ruptuurrisico niet zonder consequentie: onmiddellijke verwijzing naar de chirurg. De vraagstelling moet ook helder zijn. Dus niet: ‘de rol van oestrogenen bij mammacarcinoom’, maar ‘bevordert een verhoogde blootstelling aan exogeen oestrogeen het ontstaan van mammacarcinoom?’. Uit een duidelijke vraagstelling volgt het onderzoeksontwerp vanzelf. Het onderzoeksontwerp wordt onderverdeeld in een theoretisch en in een praktisch gedeelte. In het 71 KWO praktische gedeelte worden de elementen van het theoretisch ontwerp geoperationaliseerd, dat wil zeggen vertaald in praktisch toepasbare definities en procedures. Er staat bijvoorbeeld in waar de patiënten vandaan komen, hoe de diagnose bevestigd gaat worden, welke metingen gedaan moeten worden, hoe afwijkingen zijn gedefinieerd, et cetera. Het praktische gedeelte van het onderzoeksontwerp alsmede de aspecten van het theoretisch ontwerp die specifiek zijn voor de verschillende aandachtsgebieden van de klinische epidemiologie, komen nader aan de orde in de volgende hoofdstukken. We beperken ons hier tot het algemeen theoretische. Het theoretisch onderzoeksontwerp heeft twee elementen: de determinant-uitkomstrelatie, in het voorbeeld hoge polsdruk en ruptuur, en het domein, in het voorbeeld (mannelijke) 65-plussers. 1.2.2 Determinant-uitkomstrelatie De determinant-uitkomstrelatie, ook wel epidemiologische functie genoemd, beschrijft welke uitkomst als functie van welke determinant(en) wordt bestudeerd. In formule: U = ƒ (D1, D2, …, Dx), waarbij U=uitkomst en D=determinant De uitkomst moet, zoals gezegd, in elk geval klinisch relevant zijn. De uitkomst kan een prevalentiecijfer betreffen, zoals meestal in diagnostisch onderzoek, een incidentiecijfer, een score van een ‘kwaliteit van leven lijst’, of de uitslag van een meting, bijvoorbeeld oogboldruk. Voor de keuze van de determinanten moet men nagaan of de determinant-uitkomstrelatie causaal (oorzakelijk) geïnterpreteerd moet worden of niet. Als dit niet zo is noemt men de relatie descriptief, beschrijvend. Alle diagnostische vragen zijn descriptief: is er een groep determinanten (testuitslagen) die de ziekte (de uitkomst) karakteriseert? Of simpeler gezegd: hoe ziet de typische patiënt met ziekte “X” er uit? Veel prognostische vragen zijn eveneens descriptief: is er een groep determinanten die de hoog risicopatiënt karakteriseert (en dus een slechte afloop voorspelt)? Simpeler: hoe ziet de typische hoogrisicogroep eruit? Men is bij descriptieve vragen louter en alleen geïnteresseerd in een stel determinanten dat de uitkomst voorspelt, causaal of niet. Het onderscheid causaal – descriptief is belangrijk omdat het consequenties heeft voor de onderzoeksopzet, zoals gezegd in het bijzonder voor de keuze van de determinanten. We lichten dit verder toe. Stel dat men wel een oorzakelijk (causaal) verband wil aantonen zoals in al het etiologisch onderzoek (per definitie) en in veel interventieonderzoek. In dat geval staat één determinant centraal en zijn alle externe determinanten van de uitkomst potentiële confounders (verstorende determinanten) van de relatie van onderzoek (zie hoofdstuk 1.5). De consequentie voor het onderzoeksontwerp van het al dan niet causaal willen interpreteren van een bepaalde determinantuitkomstrelatie is, dat voor het aantonen van een causale relatie in principe met alle potentiële confounders als determinant rekening gehouden zal moeten worden. Dit, om er uiteindelijk in de analyse voor te kunnen corrigeren. Men zal daarom bijvoorbeeld in al het onderzoek naar de etiologie van kanker het rookgedrag van de onderzoekspopulatie nauwkeurig moeten kwantificeren. Bij descriptieve vragen hoeft dit niet; er bestaan eenvoudigweg geen confounders. Er is immers niet één determinant die los van externe determinanten, dat wil zeggen causaal, aan de uitkomst gerelateerd moet worden. Bij descriptieve vragen is het enige doel, de gezamenlijke voorspellende waarde van een groep van determinanten te kennen. Wat bij descriptief onderzoek dan wel de keuze van determinanten bepaalt, komt in hoofdstuk 2 aan de orde. 1.2.3 Domein Nadat uitkomst en determinanten gedefinieerd zijn richten we ons op het domein van de determinantuitkomstrelatie. Het domein is de abstracte beschrijving van het soort situatie waar de determinantuitkomstrelatie betrekking op heeft, bijvoorbeeld patiënten met decompensatio cordis bij de huisarts. Tot het domein behoren die kenmerken van de situatie die grenzen stellen aan de generaliseerbaarheid van determinant-uitkomstrelatie of, minder formeel gezegd, het domein geeft aan in wat voor situaties de determinant-uitkomstrelatie geldig is. In de praktijk zijn de elementen van het domein vooral de diagnose en de ‘setting’, dus eerste lijn, tweede lijn, EHBO, consultatiebureau, enzovoort. Als het domein eenmaal is gedefinieerd moet een onderzoekspopulatie worden gevonden die past bij dat domein (dit laatste hoort strikt genomen bij het praktisch onderzoeksontwerp). De onderzoekspopulatie kan dus een heel selectieve groep zijn maar mag niet afwijken op punten die van belang zijn voor de generaliseerbaarheid van de determinant-uitkomstrelatie. Beschouw bijvoorbeeld de relatie tussen bloeddruk en tweede beroerte in het domein van 60-plussers met een herseninfarct die onder behandeling zijn van een neuroloog. Deze relatie kan prima onderzocht worden bij mannen tussen de 60 en 70 jaar met een herseninfarct die zich op de EHBO van een academisch ziekenhuis melden, als deze patiënten niet wezenlijk, dat wil zeggen op voor 72 KWO generalisatie relevante kenmerken, anders zijn dan hun domein-genoten: alle andere 60-plussers onder behandeling van een neuroloog voor herseninfarct. Of de gevonden relatie ook geldig is voor dezelfde groep maar dan onder behandeling van de huisarts, is echter maar de vraag. De grenzen van het domein zijn vaak onderwerp van discussie. De generaliseerbaarheid van onderzoeksresultaten komt terug in paragraaf 1.5.2. 1.3 VORMEN VAN KLINISCH EPIDEMIOLOGISCH ONDERZOEK Een essentieel onderdeel van het praktisch onderzoeksontwerp is de vorm van onderzoek waarmee de determinant-uitkomstrelatie gekwantificeerd moet worden. De belangrijkste vormen van klinisch-epidemiologisch onderzoek zijn vermeld in tabel 1-3-1. De onderzoeksvormen die in de klinische epidemiologie worden gebruikt vallen uiteen in twee wezenlijk verschillende categorieën, te weten experimenteel en niet-experimenteel onderzoek. Het niet-experimenteel onderzoek wordt ook wel, foutief, ‘observationeel onderzoek’ genoemd. Bij experimenteel onderzoek bepaalt de onderzoeker, meestal at random (door het lot bepaald), welke patiënt aan de te onderzoeken factor wordt blootgesteld, en wie niet. Deze vorm van onderzoek vindt zijn belangrijkste toepassing in het onderzoek naar de effectiviteit van interventie, de clinical trial. Bij niet-experimenteel onderzoek heeft de onderzoeker geen invloed op de blootstelling. In nietexperimenteel onderzoek is, ten opzichte van experimenteel onderzoek, causaliteit van een bepaald verband vaak moeilijker aannemelijk te maken. Hier komen we bij het begrip 'confounding' in paragraaf 1.5 nog op terug. Een tweede fundamenteel onderscheid betreft longitudinaal versus cross-sectioneel onderzoek. Experimenteel onderzoek is altijd longitudinaal, dat wil zeggen dat de toewijzing van de blootstelling voorafgaat aan de vaststelling van de uitkomst, meestal ziekte. Niet-experimenteel onderzoek kan zowel longitudinaal als cross-sectioneel zijn. Bij cross-sectioneel onderzoek (ook wel dwarsdoorsnedeonderzoek of transversaal onderzoek) worden determinant en uitkomst op hetzelfde moment vastgesteld. Veel diagnostisch onderzoek is cross-sectioneel omdat de vraagstelling geen tijdsverloop kent: wat is de kans op de aanwezigheid van een bepaalde ziekte nu, gegeven de uitslagen van diagnostische testen op dit moment. Eén van de problemen van cross-sectioneel onderzoek is dan ook dat er geen tijdsrelatie tussen determinant en uitkomst is vast te stellen. De meeste andere dan diagnostische vragen in de klinische epidemiologie zijn namelijk inherent longitudinaal van aard en de beantwoording met een dwarsdoorsnedeonderzoek kan problematisch zijn. Een vraag van etiologie is bijvoorbeeld of een lage botdichtheid bij vrouwen rond de menopauze leidt tot wervelinzakkingen op hogere leeftijd. Stel nu dat in een dwars-doorsnedeonderzoek bij 80-jarigen de vrouwen met wervelinzakkingen een lagere botdichtheid hebben dan die zonder deze afwijkingen. In dat geval is het niet zomaar duidelijk of de lage botdichtheid, wellicht via verminderde mobiliteit, de oorzaak is van de wervel-inzakkingen, of juist een gevolg. Het longitudinaal onderzoek is weer te verdelen in follow-up onderzoek (ook wel vervolgonderzoek of cohortonderzoek genoemd) en patiënt-controleonderzoek. Bij follow-up onderzoek wordt een groep personen gevolgd in de tijd waarna de frequentie van ziekte of complicatie tussen determinantcategorieën wordt vergeleken. Deze onderzoeksopzet biedt vele voordelen. De belangrijkste zijn dat naast het relatieve ook het absolute risico van de uitkomst kan worden gemeten en dat relatief gemakkelijk meerdere uitkomsten bestudeerd kunnen worden. Bij patiënt-controleonderzoek wordt een serie patiënten met een bepaalde aandoening verzameld en bij hen wordt vervolgens de frequentie van blootstelling bepaald. Tevens wordt uit de al dan niet denkbeeldige populatie waar de patiënten vandaan kwamen een steekproef met niet-zieken ('controles') genomen om de blootstellingsfrequentie in de bronpopulatie te schatten. De selectie van controles is vaak aanleiding voor discussie. In het algemeen is er geen probleem wanneer de controles zodanig worden gekozen dat zij, als zij de ziekte hadden gekregen, ook als patiënten in het onderzoek zouden zijn opgenomen. Een groot voordeel van het patiënt-controleonderzoek is dat verschillende determinanten van zeldzame ziekten met relatief geringe inspanning onderzocht kunnen worden. 73 KWO De patiëntencasus of -serie is een onterecht ondergewaardeerde vorm van niet-experimenteel crosssectioneel of longitudinaal onderzoek. Bij dit onderzoek heeft de arts een aantal patiënten met een bepaalde aandoening opgemerkt en in kaart gebracht. Vervolgens wordt gekeken of er een gemeenschappelijk kenmerk is, bijvoorbeeld het gebruik van een bepaald geneesmiddel. Ook kan een enkele patiënt waarbij een geheel onverwachte ziekte optreedt, aanleiding zijn voor nader onderzoek. Een mooi voorbeeld stamt uit 1961 toen de diagnose van longembolie werd gesteld bij een jonge vrouw. Deze aandoening is zo zeldzaam op lage leeftijd, zeker bij vrouwen, dat haar gebruik van een oraal anticonceptivum als mogelijke oorzaak werd geopperd. Later werd deze associatie in grootschalig onderzoek bevestigd. Ten slotte moet hier de meta-analyse worden genoemd als bijzondere vorm van onderzoek. Bijzonder, omdat de resultaten van verschillende onderzoeken de basis vormen voor de analyse in plaats van de gegevens van verschillende individuen, vandaar de naam meta-analyse. Dit type onderzoek wordt apart besproken in paragraaf 5.4 Tabel 1-3-1 Vorm van onderzoek Cross-sectioneel onderzoek Follow-up-onderzoek Vraagstelling Diagnose Interventie-veiligheid Voorbeeld De waarde van het inspannings-ECG bij de diagnostiek van coronairsclerose Botdichtheid als risicofactor voor heupfractuur 10-jaars-overleving na diagnose borstkanker als functie van stadium Jaarlijks risico van maagbloeding bij aspirinegebruik. Bevordert carotisstenose het ontstaan van de ziekte van Alzheimer? Relatief risico van hartritmestoornissen bij antihistaminica-gebruik Plotse dood en sildenafil Interventie-effectiviteit Interventie-effectiviteit Bestraling bij hyperthyreoïdie Antibiotica bij ulcus pepticum Etiologie Prognose Interventie-veiligheid Patiënt-controleonderzoek Etiologie Interventie-veiligheid Patiënten-casus of serie Clinical trial Meta-analyse 1.4 RISICO 1.4.1 Vormen van risico Men kan twee vormen van risico onderscheiden: het absolute risico en het relatieve risico. Strikt genomen is een risico gelijk aan een kans, maar dan een kans op iets ongewenst. Het absolute risico is gelijk aan de kans op ziekte, complicatie van ziekte of overlijden. Een absoluut risico dient altijd voor een tijdsperiode te worden gegeven. Dit kan een concreet omschreven periode zijn, zoals het tienjaarsrisico (10-jaars cumulatieve incidentie) van een hartinfarct bij een veertigjarige man, maar ook een abstracte tijdsperiode, zoals het life-time risico van leukemie, waarmee de kans dat iemand in zijn leven leukemie krijgt wordt bedoeld. Over lange perioden wordt de cumulatieve incidentie en daarmee het risico van sterfte gelijk aan 1. Absolute risico's komen in de geneeskunde in vele gedaanten voor. De vijf- of tienjaarsoverleving is een cumulatieve incidentie. Onder letaliteit of case-fatality wordt meestal verstaan, het risico van overlijden bij patiënten die lijden aan een bepaalde ziekte; het is dan een cumulatieve incidentie van sterfte. Het begrip attack rate wordt veel gebruikt voor infectieziekten en is een cumulatieve incidentie over een korte periode. In de medische praktijk wil men het absolute risico zo specifiek mogelijk weten. Zo hebben we weinig aan het kennen van de kans op een hartinfarct van een Nederlander. Men wil die kans weten voor mannen en vrouwen, voor verschillende leeftijden, voor mensen met of zonder hypertensie, met of zonder een positieve familieanamnese voor het hartinfarct, dus het risico gespecificeerd volgens de determinanten van ziekte. Deze determinanten worden vaak risico-indicatoren genoemd omdat het risico van ziekte varieert met categorieën van de determinanten. Wanneer de risico-indicator een causale relatie heeft met de ziekte, wordt gesproken van een risicofactor. Zo zijn leeftijd en geslacht risico-indicatoren voor een hartinfarct, terwijl bloeddruk en serumlipiden risicofactoren zijn; leeftijd is een risico-indicator voor longkanker, en rookgewoonten een risicofactor. 74 KWO Er zijn twee relatieve maten van risico: het risicoverschil (RV) en de risicoratio, vrijwel altijd aangeduid als het relatief risico (RR). Het relatief risico geeft het aantal keren dat het absolute risico hoger is in één categorie van de determinant (de index-groep) tegenover een andere categorie (de referentiegroep). Zo is het relatief risico van roken op longkanker ongeveer tien. Dat betekent dat het absolute risico van longkanker onder rokers (R1) tien keer zo hoog is als dat onder niet-rokers (R0). Het relatief risico kan worden berekend door de absolute risico's van index-groep (R1) en referentiegroep op elkaar (R0) te delen: RR = R1/R0. Uit patiënt-controle-onderzoek kan men meestal geen absolute risico’s berekenen, maar wel de verhouding van de blootstellingsfrequenties bij patiënten en controles. Deze verhouding wordt de odds ratio (OR) genoemd en geldt als benadering van het relatieve risico. Het risicoverschil is een maat die het verschil tussen twee absolute risico's aangeeft. Als R1 het risico in de indexgroep en R0 het risico in de referentiegroep is, dan geldt RV = R1 - R0. Deze maat kan worden gebruikt om na te gaan hoeveel het absolute risico van een patiënt hoger is dan een referentiepatiënt. De reciproque van het risicoverschil, dat wil zeggen 1/RV, kan worden gebruikt om het aantal personen te berekenen dat moet worden behandeld om één "event" (complicatie, dood) te voorkomen. Een voorbeeld is ontleend aan een trial die werd uitgevoerd door de Engelse Medical Research Council (MRC) bij patiënten met matige hypertensie. In deze MRC-trial werden matig hypertensieve patiënten behandeld met een anti-hypertensivum (bèta-blokker of diureticum) of placebo. Bij de vergelijking van de effectiviteit van het antihypertensivum met de placebo bleek dat in de medicatiegroep (de indexgroep) de tienjaars cumulatieve incidentie van het cerebrovasculaire accident 1,4% was (R1 = 0,014), tegen 2,6% (R0 = 0,026) in de placebogroep. Het risicoverschil bedroeg dus 1,2%. Dat betekent dat men gedurende tien jaar 1/0,012 = 83 patiënten met een matig hoge bloeddruk moet behandelen om één CVA te voorkomen. Uit hetzelfde onderzoek bleek dat men 333 patiënten met milde hypertensie tien jaar moest behandelen om één myocardinfarct te voorkomen. Voor nuancering van dit begrip verwijzen wij naar een recente publicatie [1]. 1.4.2 Risicofuncties Tot nu toe hebben we de relatie tussen één determinant en de kans op ziekte besproken. Voor de klinische praktijk is het echter veel waardevoller om de gezamenlijke invloed van een aantal determinanten op het absolute risico van ziekte te kennen. Deze gezamenlijke invloed kan kwantitatief beschreven worden met een risicofunctie, ook wel risicoscore of predictieregel genoemd. De risicofunctie is in feite een verzameling van 'gewichten' die aangeven hoeveel de afzonderlijke determinanten bijdragen aan het absolute risico en hoe deze gecombineerd moeten worden. Vaak heeft de risicofunctie de vorm van een scoresysteem dat bij een individuele patiënt wordt toegepast door voor de aanwezigheid van elke determinant een aantal punten (het gewicht) toe te kennen en deze op te tellen. Het totaal aantal punten kan dan vertaald worden in een absoluut risico. Een goed voorbeeld is een groot Nederlands follow-up onderzoek waarin een risicofunctie voor de 10jaars mortaliteit werd afgeleid [2]. Hiermee kan de clinicus voor een patiënt het risico om binnen 10 jaar te overlijden op eenvoudige wijze berekenen aan de hand van een aantal risico-indicatoren. Volgens deze functie is dit risico, bijvoorbeeld voor een 60-jarige man met een lengte van 1,74 meter, een gewicht van 87 kilo, een systolische bloeddruk van 165 mm Hg waarvoor hij wordt behandeld, een hartfrequentie van 85 slagen per minuut, en een cholesterol van 6.3 mmol/liter die 30 sigaretten per dag rookt en geen diabetes of hartinfarct heeft gehad, gelijk aan 35% Literatuur [1] Lubsen J, Hoes AW, Grobbee DE. Implications of trial results: the potentially misleading notions of number needed to treat and average duration of life gained. Lancet 2000;356:1757-9. [2] Hoes AW, Grobbee DE, Valkenburg HA, Lubsen J, Hofman A. Cardiovascular risk and all-cause mortality; a 12-year follow-up study in the Netherlands. Eur J Epidemiol 1993;9:285-292. 1.5 PRECISIE EN VALIDITEIT 1.5.1 Precisie De precisie of nauwkeurigheid van een onderzoek kan geïnterpreteerd worden als de mate waarin het onderzoek bij denkbeeldige herhalingen hetzelfde resultaat laat zien. De precisie zegt dus niets over de juistheid van de resultaten, alleen iets over de reproduceerbaarheid. Zij neemt toe met de grootte van de onderzoekspopulatie en neemt af met de grootte van meetfouten. Op basis van de grootte van de onderzoekspopulatie en een schatting van de meetfout uit het 75 KWO onderzoek kan daarom een uitspraak over de precisie worden gedaan, bij voorkeur in de vorm van een 95% betrouwbaarheidsinterval. Dit interval geeft aan dat in 95 van de 100 herhalingen van het onderzoek het gevonden 95%-betrouwbaarheidsinterval de onderliggende, onbekende, effectmaat zou bevatten. In plaats van een betrouwbaarheidsinterval wordt de precisie van een onderzoek ook vaak uitgedrukt in de p-waarde. De p-waarde geeft aan hoe vaak bij herhaling van het onderzoek een waarde voor de effectmaat wordt gevonden die minstens zo groot is als die in het huidige onderzoek, gegeven dat er in werkelijkheid geen effect is, dat wil zeggen dat de nulhypothese van geen effect juist is. De p-waarde is moeilijk te interpreteren omdat deze zowel afhangt van genoemde factoren als ook van de grootte van het gevonden effect. Bij het betrouwbaarheidsinterval daarentegen, krijgen we direct een indruk van de toevalsvariatie in de grootte van het effect, een maat voor de precisie in de meting van een effect. Daarom wordt in de epidemiologie de voorkeur gegeven aan een betrouwbaarheidsinterval in plaats van een p-waarde. De vraag blijft hoe we deze maten van precisie betrekken bij de conclusie uit een onderzoek, de statistische inferentie. Hierin zijn twee scholen. In de traditionele school wordt de nulhypothese verworpen of aanvaard. Volgens conventie wordt bij een p-waarde kleiner dan 0.05, de alpha, de nulhypothese ten gunste van de alternatieve hypothese van “wel een effect” verworpen. Stel dat in een onderzoek het relatief risico van diabetes op retinopathie 2.3 bedraagt met een p-waarde van 0.04, dan wordt de nulhypothese van geen effect verworpen en wordt geconcludeerd dat er een statistisch significant verband is tussen diabetes en retinopathie. Bij een p-waarde groter of gelijk 0.05 wordt geconcludeerd dat dit verband niet aangetoond kon worden. Ook op basis van een betrouwbaarheidsinterval kan men een dergelijke ja-nee uitspraak doen. Als de nulwaarde, bij een relatief risico is dit 1, zich buiten het 95%-betrouwbaarheidsinterval bevindt, betekent dit dat er een significant verband is bij een alpha van 0.05. In genoemd voorbeeld zou dan het 95%-betrouwbaarheidsinterval (1.4-5.2) kunnen zijn. Omgekeerd zou de conclusie bij een betrouwbaarheidsinterval (0.9-5.7) “geen statistisch significant verband aangetoond” zijn. Overigens doet een dergelijke conclusie geen recht aan de informatieve waarde van het betrouwbaarheidsinterval, vooral bij een niet significant resultaat. Als bijvoorbeeld een relatief risico van 1.1 met een klein 95%-betrouwbaarheidsinterval (0.9-1.3) wordt gevonden, dan is direct zichtbaar dat waarden boven de 1.3 en onder de 0.9 niet erg plausibel zijn. Een p-waarde, in dit geval bijvoorbeeld 0.2, is veel minder informatief en leidt er waarschijnlijk slechts toe dat de nulhypothese niet verworpen wordt. Bij de meer recent ontwikkelde statistische inferentie volgens Bayes (zie ook diagnose) wordt de nulhypothese niet verworpen of aanvaard. In plaats daarvan wordt de statistische informatie uit het onderzoek gebruikt om de geloofwaardigheid van een hypothese zoals die vóór het onderzoek bestond, de a priori geloofwaardigheid, te veranderen in een achteraf (a posteriori) geloofwaardigheid. Stel dat een arts ervan overtuigd is dat antibiotica bij de behandeling van een maagzweer niet effectief zijn, dan zal door een onderzoek dat met geringe significantie de effectiviteit van deze behandeling wel aantoont, die mening niet of nauwelijks worden bijgesteld. Als deze arts echter de week erop kennis neemt van juist een zeer significant effect van antibiotica bij maagzweren, dan kan dit wel de aanleiding zijn om zijn mening te herzien. De voortdurende verandering van het geloof in een bepaalde hypothese op basis van steeds nieuwe gegevens is de essentie van de Bayesiaanse inferentie. Voor nadere beschouwing verwijzen wij naar een boek gewijd aan statistische inferentie [1]. 1.5.2 Validiteit Bij de beoordeling van de validiteit van een onderzoek wordt onderscheid gemaakt tussen de interne en externe validiteit. De interne validiteit is de mate waarin, afgezien van toevalsfouten, het gevonden effect gelijk is aan het werkelijk effect bij personen met overeenkomstige kenmerken als die van de onderzoekspopulatie. Vertekening, ook wel aangeduid als “bias”, is datgene wat de interne validiteit negatief beïnvloedt. Er wordt onderscheid gemaakt tussen drie soorten van bias: selectiebias, informatiebias en confounding bias. Selectiebias treedt op als de inclusie van personen met de te bestuderen uitkomst niet onafhankelijk gebeurt van de determinant, of andersom. Als in een onderzoek naar de diagnostische waarde van ST-depressie op het elektrocardiogram (ECG) voor de diagnose “coronairsclerose” patiënten op een hartafdeling worden onderzocht, zal er vertekening van het resultaat optreden als deze patiënten juist omwille van deze ECG-afwijking op de hartafdeling liggen. Informatie- bias is het gevolg van onvergelijkbare waarneming van de determinant of de uitkomst tussen de te vergelijken groepen. 76 KWO Stel, dat in een clinical trial de nieuwste ACE-remmer wordt onderzocht op de effectiviteit voor de behandeling van hypertensie. Als degene die de bloeddruk meet op de hoogte is van het feit of een deelnemer het nieuwe middel krijgt of een placebo, dan is het niet onaannemelijk dat bij de ACEremmergroep systematisch anders wordt afgelezen dan bij personen in de placebogroep. Informatiebias wordt onder andere tegengegaan door blindering van de onderzoeker en de onderzochte personen voor de aard van de determinanten, in een trial de aard van de interventie. Een derde vorm van bias betreft confounding, letterlijk “verwarring”. Er is sprake van confounding als een derde factor die samenhangt met de onderzochte determinant, los van het desbetreffende causale pad, een voorspeller is van de onderzochte uitkomst. In dat geval zijn de te contrasteren groepen niet meer vergelijkbaar voor wat betreft de kans op de uitkomst. Indien men bijvoorbeeld onderzoek heeft gedaan naar het serum-cholesterol als risicofactor voor een tweede myocardinfarct, dan kan bij analyse blijken dat er in de groep personen met een hoog cholesterol veel meer rokers zitten dan in de referentiegroep met een normaal tot laag cholesterol. Omdat de twee groepen louter op grond van de proportie rokers prognostisch onvergelijkbaar zijn, kan een eventueel verschil in prognose niet meer uitsluitend aan het verschil in cholesterol geweten worden. Men spreekt van “confounding” door roken, dat wil zeggen roken, de ‘confounder’, belemmert een valide vergelijking van de twee groepen. Terwijl de mogelijkheid van selectiebias en informatiebias voorkómen moet worden in de onderzoeksopzet, zijn er voor het tegengaan van confounding bias meerdere opties. Confounding kan allereerst voorkómen worden door het onderzoek te beperken tot één categorie van de confounder, i.e. restrictie, bijvoorbeeld door alleen rokers in het onderzoek op te nemen. Verder kan bij follow-up onderzoek confounding voorkomen worden door de onderzoekspopulatie zo te selecteren, dat de confounder gelijkelijk wordt verdeeld over de blootgestelde en de referentiegroep. Dit proces wordt “matching” genoemd. Tenslotte kan als onderdeel van de data-analyse door statistische aanpassing gecorrigeerd worden voor één of meerdere confounders. Voor al deze methoden is het vereist dat bekend is wat de mogelijke confounders zijn en dat zij goed gemeten kunnen worden. Dit voorbehoud geldt niet als men randomiseert in voldoende grote groepen, dat wil zeggen dat men het lot laat bepalen wie de behandeling krijgt en wie niet. Op deze manier worden ‘automatisch’ alle factoren die de uitkomst kunnen beïnvloeden in gelijke mate verdeeld over de te contrasteren groepen. Zoals reeds besproken in paragraaf 1.2 is confounding alleen aan de orde als men geïnteresseerd is in de causale relatie tussen één bepaalde factor en de uitkomst. De externe validiteit, beter aangeduid als de generaliseerbaarheid, is de mate waarin de onderzoeksresultaten van toepassing zijn op personen met duidelijk andere karakteristieken dan de personen die tot de onderzoekspopulatie behoorden (zie ook hoofdstuk 1.2.3 over domein). Stel bijvoorbeeld dat de effectiviteit van een nieuw antibioticum voor de behandeling van pneumonie werd vastgesteld bij mannen, dan is het zeer aannemelijk dat dit middel ook effectief is bij vrouwen. Als het onderzoek echter de diagnostische waarde van het inspanningselektrocardiogram voor coronairsclerose zou betreffen, is de generaliseerbaarheid van mannen naar vrouwen minder vanzelfsprekend, dit gezien het grote geslachtsverschil in ernst en voorkomen van hart- en vaatziekten. Generaliseerbaarheid kan overigens niet gegarandeerd worden door zogenaamde “representatieve steekproeven”; zij berust in wezen op een subjectief oordeel, waarbij ook informatie uit ander(soortig) onderzoek moet worden betrokken. 1.5.3 Hiërarchie Tenslotte willen wij erop wijzen dat er bij de beoordeling van de waarde van onderzoek een duidelijke hiërarchie van criteria is. De (interne) validiteit staat voorop, dan volgt precisie, en tenslotte generaliseerbaarheid. Wanneer bijvoorbeeld een onderzoek zeer precies is maar niet valide, heeft het geen enkele waarde voor de wetenschap. Omgekeerd kan een zeer valide maar niet zo precies onderzoek wel degelijk van waarde zijn, bijvoorbeeld door zijn bijdrage aan een meta-analyse (zie paragraaf 5.4). De generaliseerbaarheid komt pas aan de orde wanneer het onderzoek intern valide en voldoende precies is. Literatuur [1] Oakes M. Statistical inference, a commentary for the social and behavioural sciences. New York: Wiley, 1986 77 KWO 78 KWO Hoofdstuk 2 AANDACHTSGEBIEDEN BINNEN DE KLINISCHE EPIDEMIOLOGIE 2.1 ETIOLOGIE 2.1.1 Inleiding Onder etiologie verstaat men de oorzaak of verzameling oorzaken van ziekte of haar beloop. Het gaat in etiologisch onderzoek derhalve om causale, dat wil zeggen oorzakelijke, verbanden (zie ook paragraaf 1.2.2). Dit onderzoek kan gebeuren bij gezonde mensen, en heeft dan als onderzoeksvraag welke determinanten het ontstaan van een bepaalde ziekte veroorzaken. Het onderzoek kan echter ook bij zieke mensen worden gedaan en heeft dan als onderzoeksvraag welke determinanten een bepaald beloop veroorzaken, bijvoorbeeld het optreden van een complicatie of een recidief. In tegenstelling tot het later te bespreken prognostisch onderzoek is de onderzoeker in etiologisch onderzoek op zoek naar de oorzaak of oorzaken van ziekte of haar beloop. In prognostisch onderzoek wil de onderzoeker kunnen voorspellen en is op zoek naar die kenmerken die het beste de kans op bijvoorbeeld een recidief voorspellen. Deze kenmerken hoeven niet noodzakelijkerwijs oorzakelijk samen te hangen met het optreden van het recidief en de prognostische studie is daarom beschrijvend (zie ook hoofdstuk 2.3). In een etiologische studieopzet zal de vraag zijn of één specifieke determinant, bijvoorbeeld een virus, oorzakelijk geassocieerd is met het optreden van een recidief. In dat geval zal men rekening moeten houden met de samenhang van deze factor met andere mogelijk oorzakelijke factoren voor de ziekte. Dit zijn in het etiologisch onderzoek de verstorende variabelen, meestal ‘confounders’ genoemd (zie paragraaf 1.5.2). Determinanten die in etiologisch onderzoek onderwerp van studie zijn noemen we risicofactoren en zijn aanwezig vóórdat ziekte (of complicatie) optreedt. De gerandomiseerde interventiestudie (trial) is het “rolmodel” voor etiologisch onderzoek. Een gerandomiseerde interventiestudie is een experiment waarbij de onderzoeker geïnteresseerd is in het specifieke effect van een bepaalde interventie, zoals medicamenteuze interventie, waarbij het effect van andere kenmerken of invloeden is uitgesloten. In een trial waarin deze bepaalde interventie op haar effect geëvalueerd wordt is deze interventie de etiologische determinant. Hoewel interventieonderzoek dus etiologisch onderzoek is, wordt zij door haar geheel eigen karakteristieken elders apart (hoofdstuk 2.4) besproken. Voor veel etiologische vraagstellingen kan de opzet van een gerandomiseerde trial echter niet gehanteerd worden, bijvoorbeeld door de aard van het te onderzoeken kenmerk. Zo zal het, alleen al op ethische gronden, onverantwoord zijn om in een gerandomiseerd onderzoek uit te zoeken of de ziekte van Alzheimer wordt veroorzaakt door een virus. Vaak ziet men daarom in etiologisch onderzoek de niet-experimentele onderzoeksopzetten (cross-sectioneel, patiënt-controle, follow-up). De methodologie van etiologisch onderzoek is terug te vinden in vele leerboeken [1,2]. In dit hoofdstuk wordt een standaard gegeven voor de opzet van etiologisch onderzoek. 2.1.2 Onderzoeksopzet 2.1.2.1 Determinant-uitkomstrelatie De determinantuitkomst relatie volgt meestal direct uit de vraagstelling. Er is één specifiek kenmerk, één specifieke determinant onderwerp van studie. De kans op ziekte is de uitkomst van de relatie tussen die specifieke determinant en de ziekte. De onderzoeker is geïnteresseerd in een causale relatie en zal een uitspraak over deze relatie willen doen, rekening houdend met (of corrigerend voor) al bekende voorspellers van de ziekte voor zover zij geassocieerd zijn met de determinant van onderzoek. Een verband wordt in de epidemiologie vaak uitgedrukt als een relatief risico (RR). Deze geeft aan hoe groot de kans is dat een bepaalde gebeurtenis optreedt in een groep personen met de determinant vergeleken met een groep zonder deze determinant. Als gezegd wordt in etiologisch onderzoek gezocht naar de oorzaken van het ontstaan van ziekte. Dit gebeurt soms om puur wetenschappelijke redenen (fundamenteel onderzoek) maar vaak ook om aangrijpingspunten te vinden voor interventies zoals behandeling of preventie. In etiologisch onderzoek kunnen allerlei soorten oorzaken van een ziekte onderwerp van studie zijn. Voorbeelden van risicofactoren die nogal eens in etiologisch onderzoek worden betrokken zijn: persoonskenmerken (geslacht, leeftijd), anthropometrische kenmerken (lengte, gewicht, heup-taille-omtrek), leefgewoonten (roken, alcohol, voeding), reproductieve gegevens (menarche leeftijd, pariteit, menopauze leeftijd), omgevingsfactoren (blootstelling asbest, milieu, werk), klinische gegevens (bloeddruk, cholesterol), et cetera. Gebruikelijk is er in etiologisch onderzoek steeds één hoofd vraagstelling, één determinant die 79 KWO men wil onderzoeken. Men zal dan de mogelijk verstorende werking van andere reeds bekende determinanten willen uitsluiten. Als men bijvoorbeeld wil onderzoeken of een vitaminegebrek de kans op longkanker verhoogt, zal men willen voorkómen dat roken het waarnemen van deze relatie beïnvloedt. Dit probleem van verstoring of confounding is vrijwel in ieder etiologisch onderzoek aanwezig door de multicausaliteit van ziekten. Zie paragraaf 1.5.2. voor een bespreking van de mogelijkheden om met confounding om te gaan. 2.1.2.2 Domein Het domein bij etiologisch onderzoek bestaat uit die mensen in een bepaalde ‘setting’, zoals huisartsenpraktijk of algemene bevolking, die de ziekte (of complicatie) in principe kunnen krijgen. Dat betekent dat ze op het ‘moment’ van blootstelling de ziekte (of de complicatie) nog niet hebben maar die wel kunnen krijgen. Bij een onderzoek naar de oorzaak van endometriumkanker bestaat het domein dus uit vrouwen in een bepaalde ‘setting’ zonder deze vorm van kanker, maar die wel hun baarmoeder nog hebben, vrouwen die dus geen hysterectomie hebben ondergaan. 2.1.3 Uitvoering 2.1.3.1 Algemeen Bij de opzet van etiologisch onderzoek is men veelal aangewezen op een niet-experimentele onderzoeksopzet, met name een follow-up onderzoek (ook vervolg- of cohortonderzoek), een patiëntcontroleonderzoek of een cross-sectionele opzet (ook wel transversaal of dwarsdoorsnedeonderzoek genoemd). Bij deze laatste twee onderzoeksopzetten kan onduidelijkheid bestaan of de determinant aan de ziekte voorafging of dat deze een vroege uiting of gevolg van de ziekte is. Deze opzetten zijn zeker geschikt bij determinanten die niet veranderen in het leven van de onderzochte, of die aangeboren zijn, zoals bloedgroep of DNA-profiel. 2.1.3.2 Onderzoekspopulatie In een follow-up onderzoek worden groepen samengesteld op basis van het al dan niet blootgesteld zijn aan de potentieel ziek makende determinant. Een groep personen mèt de determinant wordt geïdentificeerd en vergeleken met een groep personen zonder dit kenmerk. Een follow-up onderzoek kan prospectief of retrospectief zijn. Bij prospectief onderzoek worden de onderzochte personen vanaf de start van het onderzoek gevolgd tot de uitkomst optreedt. Bij het retrospectieve follow-uponderzoek kan de ziekte reeds zijn opgetreden bij de start van het onderzoek. De onderzoeker identificeert dan de verschillende groepen op basis van aan-of afwezigheid van de determinant in het verleden, en gaat vervolgens in deze groepen de kans op ziekte (of complicatie) na. In een patiënt-controleonderzoek wordt een serie patiënten met een bepaalde aandoening verzameld en vervolgens wordt bij hen de frequentie van voorkomen van de determinant bepaald. Tevens wordt uit de al dan niet denkbeeldige populatie waar de patiënten vandaan komen een steekproef als 'controles' genomen om de determinantfrequentie in de bronpopulatie te schatten (zie ook hoofdstuk 1.3). 2.1.3.3 Determinanten De keuze van determinanten is afhankelijk van de onderzoeksvraag. In etiologisch onderzoek is er meestal één determinant waarin de onderzoeker geïnteresseerd is. Daarbij moet men ook andere determinanten zoals confounders meten om er in de analyse voor te kunnen corrigeren. Bij de keuze wat de belangrijkste confounders zijn laat de onderzoeker zich leiden door wat er over de ziekte bekend is aan risicofactoren en oorzakelijke mechanismen. Deze kennis heeft de onderzoeker uit eigen ervaring of uit de medisch wetenschappelijke literatuur. In etiologisch onderzoek is de onderzoeker geïnteresseerd in een zo nauwkeurig mogelijke meting van de determinant. Vele soorten determinanten kunnen onderwerp van studie zijn. Het verkrijgen van gegevens over de determinant kan gebeuren door metingen aan de onderzoekspersonen te verrichten (bijvoorbeeld lengte, bloeddruk), door onderzoekspersonen te interviewen of vragenlijsten voor te leggen (over voeding, roken), door gebruik te maken van routinematig geregistreerde gegevens (bedrijfsblootstellingen, medisch dossier), door metingen in bloed of anderszins te doen (cholesterol, cotinine in bloed als afspiegeling van het roken, milieublootstelling m.b.v. een persoonlijke blootstellingsmeter). In een follow-up onderzoek worden de te onderzoeken groepen geïdentificeerd op basis van aan- of afwezigheid van de determinant. In prospectief onderzoek is de determinant gemeten vóórdat de ziekte is opgetreden. Dit is belangrijk omdat een oorzakelijke factor uiteraard vooraf moet gaan aan de uitkomst. Vaak is het efficiënt de te vergelijken onderzoekspopulaties zo samen te stellen dat er een 80 KWO maximaal verschil in blootstelling is. Het meten van de determinant gebeurt zelden foutloos, maar in prospectief onderzoek is de misclassificatie die optreedt meestal random (of non-differentieel): dat wil zeggen dat eventuele meetfouten optreden onafhankelijk van het later in de tijd optreden van de ziekte. Dit leidt meestal tot een onderschatting van bestaande verbanden. In een patiënt-controleonderzoek wordt de determinant in de regel gemeten nadat de ‘patiënten’ en de ‘controles’ gedefinieerd zijn. Hierbij bestaat naast het gevaar voor random misclassificatie ook de kans op differentiële misclassificatie van de determinant. In dit laatste geval wordt de blootstelling systematisch anders (beter of slechter) gemeten bij patiënten in vergelijking met controles. Dit leidt tot een vorm van vertekening die wordt aangeduid als informatiebias (zie ook 1.5.2). Voorbeeld: In een patiënt-controleonderzoek naar de relatie tussen blootstellingen tijdens de zwangerschap en het optreden van congenitale afwijkingen vergelijkt men de blootstellings-frequentie onder moeders van kinderen met een aangeboren afwijking met die van moeders die een gezond kind kregen. Dit kan bijvoorbeeld door de moeders te interviewen. Daarbij is de kans groot dat de moeders van kinderen met een afwijking een betere weergave geven van mogelijke zwangerschapsblootstellingen dan de controlemoeders. Het feit dat zij een kind met een aangeboren afwijking hebben gekregen maakt dat zij eventuele blootstellingen beter in hun geheugen bewaard hebben. Dit kan leiden tot een overschatting van een bestaand verband. Deze vorm van informatiebias wordt ook wel ‘recall bias’ genoemd. Recall bias kan ook de andere kant op werken en leiden tot een onderschatting van het verband. In een patiënt-controleonderzoek bestaat ook het gevaar van selectie bij de keuze van de patiënten en de controles. In het geval van selectiebias hebben bijvoorbeeld patiënten met aanwezigheid van de determinant een grotere kans om in het onderzoek betrokken te raken dan patiënten zonder deze determinant. Dit kan leiden tot een overschatting van het effect van deze determinant. Selectiebias kan ook leiden tot systematische onderschatting van de bestaande relatie. 2.1.3.4. Uitkomst In etiologisch onderzoek is de uitkomst een ziekte of een andere aan gezondheid gerelateerde uitkomst, bijvoorbeeld kanker, hemoglobinegehalte in het bloed, hoofdpijn, complicatie. Het is belangrijk om een eenduidige definitie van de ziekte te hanteren. Dit is van belang omdat het onderzoek een oorzakelijke determinant wil vinden. Deze determinant werkt mogelijk alleen voor een specifieke ziekte-entiteit (bijvoorbeeld bepaalde histologische subtypen bij kanker). Overigens is dit ook van belang voor vergelijkbaarheid met andere studies en voor mogelijke generaliseerbaarheid van het gevonden resultaat. De uitkomst wordt eerst theoretisch geformuleerd, daarna wordt de operationele uitkomst geformuleerd. Zo kan bijvoorbeeld ‘de kwaliteit van leven’ de theoretische uitkomst zijn, en kan de onderzoeker besluiten deze te meten met een bestaande, gestandaardiseerde vragenlijst, zoals de Short Form-36 [1]. Een ander voorbeeld: het meten van ‘pijn’ kan gebeuren met een ‘visual analoge scale’ (VAS), een schaal van 0 (pijnvrij) tot 10 (zeer ernstige pijn), waarop de onderzochte de mate van pijn in een getal probeert aan te geven. In een follow-up onderzoek worden de onderzochte personen in de tijd gevolgd tot de ziekte optreedt. Dit kan een periode van dagen tot weken beslaan maar ook jaren, bijvoorbeeld als het optreden van kanker eindpunt is. Het aantal mensen dat gevolgd moet worden kan eveneens sterk variëren, van enkele tientallen tot enkele duizenden. Het aantal hangt sterk af van de frequentie van het eindpunt, maar ook van de sterkte van het verwachte verband. Hoe frequenter de uitkomst, des te kleiner het benodigd aantal personen in het onderzoek. En: hoe zwakker het vermoedelijke verband, des te groter het benodigde aantal (zie verder hoofdstuk 5.3). In een follow-up-onderzoek is het belangrijk alle personen te volgen tot het eindpunt is opgetreden of tot het einde van de studie is bereikt. Follow-up dient voor beide groepen dus zo compleet mogelijk te zijn, dat wil zeggen dat bij het einde van het onderzoek van zoveel mogelijk personen de uitkomst bekend moet zijn. Als de volledigheid van follow-up zowel aan de uitkomst als aan de determinant gerelateerd is, zal vertekening (bias) van de associatie optreden. Tevens is van belang dat dit volgen en tellen van ziektes in de te vergelijken groepen op dezelfde manier gebeurt. Verschillen hierin kunnen ook leiden tot bias (informatiebias). In een patiënt-controleonderzoek worden de patiënten op basis van het eindpunt gedefinieerd. Het aantal personen in een patiënt-controleonderzoek is over het algemeen veel lager dan voor eenzelfde vraagstelling in een follow-uponderzoek nodig zou zijn. In dit laatste geval zou het aantal personen dat de ziekte ontwikkelt wel ongeveer even groot zijn als in een patiënt-controleonderzoek. Het patiëntcontroleonderzoek heeft ook geen lange prospectieve follow-up tijd nodig, omdat de ziekte al is 81 KWO opgetreden. Dit maakt de patiënt-controleonderzoek in veel situaties een goedkope en efficiënte studieopzet. 2.1.4 Data-analyse 2.1.4.1 Algemeen In de data-analyse van etiologisch onderzoek staat het probleem van confounding centraal. Dit is al aan de orde geweest in hoofdstuk 1.2.2 en 1.5.2. Kort samengevat: er is sprake van confounding als een derde factor die samenhangt met de onderzochte determinant, los van het desbetreffende causale pad, een voorspeller is van de onderzochte uitkomst. In dat geval zijn de te contrasteren groepen niet meer vergelijkbaar voor wat betreft de kans op de uitkomst. In de volgende paragraaf wordt een aantal manieren geschetst hoe rekening kan worden gehouden met de veroorzaakte verstoring door andere determinanten, dan wel hoe men deze verstoring kan opsporen. 2.1.4.2 Keuze van confounders In een etiologisch onderzoek is de onderzoeker geïnteresseerd in het effect van één specifieke determinant op een bepaalde uitkomst. De meeste ziektes worden door meerdere determinanten veroorzaakt. Vaak is een aantal risicofactoren al bekend, c.q. min of meer geaccepteerd als verwekker of determinant van de ziekte. Wanneer één van deze factoren samenhangt met de te onderzoeken determinant, dan kan deze factor de te onderzoeken relatie verstoren. Als dit gebeurt noemen we dit confounding. Met deze factor moet - naast de te onderzoeken determinant- in het onderzoek rekening gehouden worden, zodat deze niet de te bestuderen relatie tussen een nieuwe risicofactor en de ziekte kunnen verstoren. In vrijwel ieder etiologisch onderzoek wordt rekening gehouden met de determinanten leeftijd en geslacht. Welke andere determinanten gemeten moeten worden is afhankelijk van inzichten van de onderzoeker en hetgeen op basis van de literatuur bekend is. Voorbeeld: Een onderzoeker wil de relatie tussen koffiedrinken en de kans op pancreaskanker onderzoeken. Hij kiest voor een follow-up onderzoek, waarbij hij de kans op ziekte berekent voor koffiedrinkers en dit vergelijkt met de kans bij personen, die geen koffie drinken. De groepen hebben dezelfde geslachts- en leeftijdsverdeling. Het resultaat is een verhoogde kans op pancreaskanker bij koffiedrinkers. Bij nadere inspectie van de gegevens blijken koffiedrinkers meer te roken dan nietkoffiedrinkers. Roken is een bekende risicofactor van pancreaskanker. Het verhoogde risico op pancreaskanker bij koffiedrinkers is nu mogelijk geen gevolg van het koffiedrinken, maar is (in ieder geval voor een deel) een gevolg van het roken. In dit voorbeeld is roken een confounder voor de relatie koffiedrinken en het optreden van kanker. 2.1.4.3 Rekening houden met confounders Er zijn verschillende manieren om rekening te houden met ‘confounders’. De eerste, belangrijkste, stap moet gebeuren vóórdat het onderzoek start. Dit is het bedenken van de ‘confounders’ die in de te bestuderen relatie een rol kunnen spelen. Daarna kan men kiezen om hiervoor te corrigeren vóórdat de studie begint, of naderhand in de analysefase. Vóór de start van de studie kan men beslissen de onderzoekspopulatie zodanig te selecteren dat de ‘confounder’ homogeen wordt (bedoeld wordt: niet meer samenhangt met de te onderzoeken determinant). Men zou er bijvoorbeeld voor kunnen kiezen om in bovenstaand voorbeeld onderzoek te doen alleen bij mannen, die niet roken, en die allemaal tussen 50 tot 55 jaar zijn. In dat geval kunnen geslacht, roken en leeftijd geen ‘confounder’ meer zijn. Dat wil zeggen dat zij de te onderzoeken relatie tussen koffie drinken en de kans op pancreaskanker niet kunnen verstoren. Dit wordt restrictie van de onderzoekspopulatie genoemd. Een andere manier is om in de analysefase te corrigeren voor de verstorende werking van ‘confounders’. Een eerste stap is dan dat ‘confounding’ opgespoord moet worden. Dit kan door de te bestuderen relatie voor verschillende niveaus van de ‘confounder’ te bestuderen. Dit heet stratificeren. Dit betekent dat het verband tussen een determinant en een ziekte wordt berekend voor verschillende klassen (= strata) van de confounder. Zo kan men bijvoorbeeld de resultaten van een onderzoek apart berekenen voor mannen en vrouwen en voor verschillende leeftijdsgroepen. Wanneer nu in deze klassen andere waarden voor het effect worden gevonden dan voor de ‘overall’ maat (ook wel ruwe effectmaat genoemd), dan spreekt men van ‘confounding’. Voorbeeld: In bovenstaand voorbeeld heeft men voor koffiedrinken ten opzichte van niet koffiedrinken een relatief risico van 4 gevonden. Dit betekent dat de kans op pancreaskanker voor koffiedrinkers vier keer hoger is vergeleken met personen die niet koffiedrinken. De onderzoeker wil nagaan of deze relatie verstoord is door een effect van roken. Hij bestudeert daartoe de relatie apart voor personen 82 KWO die roken, en voor personen die nooit rookten. In deze klassen vindt hij relatieve risico’s van respectievelijk 2 en 2,6. Deze waarden wijken af van de ruwe effect-maat (RR=4) en dus betekent dit dat roken een confounder is. De beste schatter voor de relatie tussen koffiedrinken en pancreas-kanker zal ergens tussen de 2 en 2,6 liggen. Als de relatieve risico’s voor de beide klassen respectievelijk bijvoorbeeld 3,9 en 4,2 waren geweest, dan zou er geen sprake van ‘confounding’ zijn geweest. Als een onderzoeker heeft geconcludeerd dat een bepaalde determinant (of meerdere) als confounder heeft gewerkt, dan zal hij de ruwe effectmaat moeten bijstellen. De mogelijkheid bestaat om dan tot een schatting voor het verband te komen door de verschillende relatieve risico’s (of odds ratio’s) te middelen. Gebruikelijk gebeurt dit gewogen, met het zwaarste gewicht voor die klasse, waarin de meeste onderzoekspersonen voorkomen. Een voorbeeld is de Mantel Haenszel odds ratio (zie Rothman). Voorbeeld: In bovenstaand onderzoek naar koffiedrinken en pancreaskanker wordt een relatief risico van 4 gevonden. Het resultaat voor rokers en niet-rokers is respectievelijk 2 en 2,6. Een gemiddelde maat voor het effect zal ergens tussen deze twee waarden liggen, en wel het dichtste bij die waarde, die tot stand is gekomen op basis van de klasse met de meeste onderzoekspersonen. Het gecorrigeerde relatieve risico is dus lager dan het ongecorrigeerde relatieve risico. Dit is een gevolg van het feit dat roken een confounder is: het vertroebelt het zicht op de werkelijke relatie tussen koffiedrinken en pancreaskanker. Wanneer men hiervoor corrigeert, vindt men een minder sterk verband. Het probleem van stratificeren (= in klassen opdelen) is duidelijk. Bij vele waarden van een confounder of bij meerdere confounders worden de aantallen in iedere klasse (stratum) al snel erg klein en ontstaan onbetrouwbare schattingen van de stratumspecifieke relatieve risico’s. In zo’n geval maken we gebruik van een zogenaamde multivariate analysetechniek. Deze is vaak gebaseerd op het logistische regressiemodel. Hierbij is de y-variabele (de uitkomst variabele) dichotoom; de ziekte (of complicatie) is gecodeerd als aanwezig of afwezig (ziek of niet ziek). De etiologische determinant (continu, in klassen of dichotoom) wordt als eerste covariaat in het model opgenomen (X1). Alle determinanten die confounding kunnen veroorzaken worden als overige variabelen in het model opgenomen (X2-Xn). In de analysefase wordt vervolgens gekeken wat er gebeurt met de schatting van de regressiecoëfficiënt van de etiologische determinant (beta1) bij het verwijderen, c.q. toevoegen van mogelijke confounders in het model (X2, X3…Xn). Een confounder wordt in het model gehandhaafd wanneer deze bij weglaten uit het model een relevante verandering in de schatting van de regressiecoëfficiënt van de etiologische determinant (beta1) teweegbrengt. Of een verandering in deze regressie-coëfficiënt (beta1) van belang is wordt over het algemeen niet bepaald door statistische significantie, maar door relevante veranderingen. De onderzoeker bepaalt vooraf welke grootte van veranderingen van de beta1 relevant worden geacht en is dan verplicht die covariaten als confounders in het model op te nemen, als deze bij weglating relevante veranderingen in de beta1 van de determinant teweegbrengen. Op deze manier verkrijgt men een schatting van de regressiecoëfficient voor de etiologische determinant (beta1), die gecorrigeerd is voor de verstorende werking van andere determinanten. Literatuur [1] VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997. [2] Rothman KJ, Greenland S (eds). Modern Epidemiology. Philadelphia: Lippincott-Raven Publishers, 1998. [3] Ware JE. The SF-36 health survey. In: Spilker B (editor). Quality of Life and pharmacoeconomics in clinical trials. 2nd ed. Philadephia, Lippencott-Raven Publishers, 1996: 337-345. 2.2 DIAGNOSTIEK 2.2.1 Inleiding Onder diagnose verstaat men die aandoening die het meest waarschijnlijk de klachten en symptomen van een gegeven patiënt verklaart. Artsen willen diagnosen stellen om beslissingen te kunnen nemen over het optimale beleid, inclusief een expectatief beleid. Het diagnostisch proces begint in de praktijk altijd met de patiënt die zich bij de arts presenteert met een bepaald symptoom of een bepaalde klacht, bijvoorbeeld met dyspnoe, hoesten en/of pijn op de borst bij ademhaling. Bij het horen van deze klachten schiet de arts meestal al een aantal aandoeningen te binnen die de klachten zouden 83 KWO kunnen verklaren. Dit noemt men de differentiaaldiagnose. De waarschijnlijkheidsdiagnose is over het algemeen de meest kansrijke en/of meest ernstige aandoening, waarvan de aan- of afwezigheid allereerst moet worden aangetoond of uitgesloten. In het voorbeeld van de patiënt met dyspnoe, hoesten en/of pijn op de borst bij ademhaling, is de waarschijnlijkheidsdiagnose een longembolie en de differentiaaldiagnose omvat o.a. longontsteking, tumor en hartinfarct. Al dan niet bewust schat de arts in deze fase, voordat anamnese en aanvullende diagnostiek is verricht, de kans op aanwezigheid van de waarschijnlijkheidsdiagnose. Dit wordt de a priori kans of voorafkans op de ziekte genoemd. In het voorbeeld is deze ongeveer 25%. Vaak is de arts in deze fase nog te onzeker over de diagnose om een behandeling te initiëren dan wel te onthouden, vooral als deze behandeling ook risico’s kent. Nadere diagnostiek dient om deze onzekerheid te reduceren, d.w.z. de voorafkans te veranderen in een extreem hoge of lage achterafkans (de a posteriori kans). Deze diagnostiek bestaat uit een aantal opeenvolgende fasen; altijd een anamnese en lichamelijk onderzoek, en in ons voorbeeld ook aanvullend onderzoek, zoals (soms in willekeurige volgorde) thoraxfoto, bloedgasanalyse, elektrocardiografie, echografie van het diep veneuze systeem, ventilatie-perfusiescan, en pulmonaire angiografie. Voor elk klinisch probleem betreft de eerste diagnostische fase vrijwel altijd anamnese en lichamelijk onderzoek. Niet altijd is de arts daarna voldoende zeker over de diagnose. Er volgt dan nadere diagnostiek om de onzekerheid te reduceren, waarbij de achterafkans weer de a priori kans is voor de volgende diagnostische test. Dit diagnostische proces duurt voort totdat een verantwoorde beleidskeuze kan worden gemaakt. De grenzen waarboven en -onder men besluit dat er voldoende zekerheid bestaat zijn vaak arbitrair en afhankelijk van de aard van de aandoening. Het ligt voor de hand de vraag te stellen waarom niet alle diagnostische testen die voor een bepaald probleem beschikbaar zijn, worden toegepast. Dit zou immers tot de grootst mogelijke diagnostische zekerheid leiden. Het antwoord is natuurlijk dat die benadering eenvoudigweg te duur, te tijdrovend, te belastend voor de patiënt of het medisch personeel zou zijn. Diagnostiek moet daarom zo efficiënt mogelijk worden uitgevoerd, met inachtneming van acceptabele percentages foute beslissingen. De algemene vraag bij diagnostiek is dus hoe men met een minimum aan belasting voor patiënt, personeel en budget, een zo groot mogelijke diagnostische zekerheid bereikt. Het doel van diagnostisch onderzoek is dan om te kijken of een bepaalde nieuwe test, gegeven een bepaald klinisch probleem en gegeven reeds aanwezige diagnostische informatie, toegevoegde diagnostische waarde heeft. Een nieuwe test wordt nooit in isolatie geëvalueerd omdat altijd reeds diagnostische informatie voorhanden is, bijvoorbeeld leeftijd en geslacht. 2.2.2 Onderzoeksopzet 2.2.2.1 Determinant-uitkomst relatie De determinant-uitkomst relatie volgt direct uit de vraagstelling. Deze moet bovenal relevant zijn. Zo is een onderzoek naar de diagnostische waarde van een of andere nieuwe test bij urineweginfecties niet erg relevant omdat deze aandoening nu al accuraat, snel, veilig en goedkoop vastgesteld kan worden. De diagnostische vraag is vrijwel altijd een vraag van toegevoegde waarde: gegeven de overige diagnostische informatie (leeftijd, geslacht, anamnese en/of lichamelijk onderzoek en/of testuitslagen), wat voegt de nieuwe te evalueren test toe aan de diagnostische zekerheid over de aanwezigheid van een bepaalde ziekte. In de determinantuitkomst relatie is de uitkomst de kans op ziekte. De determinanten vertegenwoordigen de reeds aanwezige diagnostische informatie en de te evalueren test, in het voorbeeld de echografie van de beenvenen. De determinant-uitkomstrelatie in het voorbeeld wordt zoiets als: P(L) = ƒ (leeftijd, geslacht, anamnese, lichamelijk onderzoek, X-thorax, …, echografie), waarbij P(L)= kans op longembolie volgens de referentietest, en de variabelen tussen haakjes de determinanten. De uitkomst, ziekte, wordt vastgesteld met behulp van de referentietest, ook wel aangeduid als de ‘gouden standaard’. De referentietest voor verdenking longembolie is een combinatie van de uitslagen van de ventilatie-perfusiescan en de pulmonaire angiografie. Voor de determinanten neemt men, naast de te evalueren test, die gegevens die in de praktijk reeds voorhanden zijn in de betreffende fase van de diagnostische ‘work-up’. De diagnostische vraag is een descriptieve vraag, er bestaat geen interesse in causale relaties tussen testuitslag en ziekte; men hoeft zich dus geen zorgen te maken over confounders. 84 KWO 2.2.2.2 Domein Het domein van een diagnostische studie is de theoretische definitie van de patiëntenpopulatie bij wie de te evalueren diagnostische testen in praktijk zullen worden toegepast. De setting waarin het probleem zich afspeelt is belangrijk voor het domein, dus bijvoorbeeld huisartspraktijk, tweede lijn, of consultatiebureau. Het domein wordt gedefinieerd door het klinische probleem waarmee patiënten zich presenteren of verwezen zijn, in ons voorbeeld alle patiënten verdacht voor longembolie. Met andere woorden: het domein wordt gekenmerkt door de indicatie tot diagnostiek. Het domein stelt de grenzen aan de generaliseerbaarheid (zie ook 1.2.3). Als het theoretische domein gedefinieerd is, moet een concrete onderzoekspopulatie worden gevonden binnen dat domein (zie 2.2.3.2) 2.2.3 Uitvoering 2.2.3.1 Algemeen Een diagnostische vraagstelling kan men beantwoorden met behulp van een cross-sectioneel onderzoek, het gaat immers om de aanwezigheid van een bepaalde aandoening op het moment dat bepaalde klachten, symptomen, testuitslagen, et cetera ook aanwezig zijn. Het lijkt op het eerste gezicht efficiënt om diagnostisch onderzoek uit te voeren met behulp van reeds verzamelde gegevens. Helaas gebeurt het in de praktijk zelden dat het allerbelangrijkste gegeven in diagnostisch onderzoek, de indicatie, geregistreerd wordt. Dit gegeven is essentieel voor het selecteren van een onderzoekspopulatie die representatief is voor het domein. Uiteindelijk wordt naast wat demografische gegevens alleen de diagnose vastgelegd in de ziekenhuisregistratie. Als men voor de onderzoekspopulatie uitgaat van deze registratie mist men alle patiënten die ergens in het traject een negatieve test hadden en daarom niet de referentietest kregen, maar natuurlijk wel tot het domein van de van de ziekte ‘verdachte’ patiënten behoren. Men houdt dus selectief patiënten met positieve testuitslagen over. Dit kan leiden tot de meest voorkomende bias in diagnostisch onderzoek, de zogenaamde verwijzings- of ‘referral’-bias, een vorm van selectiebias. Meestal is het noodzakelijk om diagnostisch onderzoek nieuw op te zetten en prospectief systematisch patiënten met een bepaald klachten- en symptomenprofiel, dat wil zeggen met een bepaalde indicatie, te onderwerpen aan diagnostische tests en de referentietest. 2.2.3.2. Onderzoekspopulatie Bij de uitvoering van diagnostisch onderzoek zal men eerst de patiëntenpopulatie definiëren waarbij men de diagnose wil stellen. Dit is de onderzoekspopulatie die de kenmerken van het domein moet hebben. Het kritische kenmerk hierbij is de indicatie voor diagnostiek. In de praktijk is het goed de populatie te operationaliseren aan de hand van de specifieke klachten, symptomen of kenmerken waarbij de diagnose longembolie wordt overwogen. In het voorbeeld zou dat kunnen zijn: patiënten verwezen door de huisarts naar de tweede lijn met dyspnoe, hoesten en/of pijnlijke ademhaling. De onderzoekspopulatie kan meer beperkingen hebben dan door het domein worden opgelegd; voor bijvoorbeeld het domein ‘de mens’ kunnen mannen de studiepopulatie vormen. Met andere woorden, een onderzoekspopulatie hoeft niet noodzakelijk een random sample van het domein te zijn. 2.2.3.3. Determinanten In diagnostisch onderzoek worden alle relevante gegevens uit de opeenvolgende fasen die de patiënten normaliter in de praktijk doorlopen, nauwkeurig vastgelegd. Het is hierbij van belang dat de testen in het onderzoek op dezelfde manier worden uitgevoerd (inclusief verslaglegging) als in de praktijk. Gebeurt dit niet, bijvoorbeeld veel nauwkeuriger, dan valt de waarde van de test zoals die in het onderzoek werd gevonden waarschijnlijk in de praktijk erg tegen. Vooraf definieert men wat afwijkend is en wat niet. Bij voorkeur definieert men objectieve en reproduceerbare parameters (bijvoorbeeld de aan- of afwezigheid van atelectasis, pneumothorax) en niet alleen positief/negatief of verdacht/normaal. Als de test in de praktijk wordt beoordeeld met kennis van andere diagnostische informatie (zoals meestal), dan moet dit in de onderzoekssituatie ook gebeuren. Indien echter testen worden vergeleken, dan moet elke beoordeling onafhankelijk plaatsvinden door middel van blindering voor de uitslag van de andere. 85 KWO 2.2.3.4. Uitkomst Indien de bijdrage van een test aan het aantonen of uitsluiten van een ziekte wordt geëvalueerd, is een referentietest vereist. Een procedure of test die in praktijk wordt gebruikt om bij bestaande twijfel de doorslag over de aan- of afwezigheid van een aandoening te geven, kan worden beschouwd als een geschikte referentietest voor wetenschappelijk onderzoek. Deze wordt ook vaak ‘gouden’ standaard genoemd, maar men dient te beseffen dat ook deze ‘gouden’ standaard in praktijk tot een verkeerde beslissing kan leiden en dus niet 24-karaats is. Daarom kan beter het begrip referentietest worden gebruikt. Referentietesten bestaan voor veel aandoeningen, zoals bijvoorbeeld angiografie voor hart- en vaataandoeningen, artroscopie voor gewrichtsaandoeningen, of biopsie bij een verdenking op een maligniteit. Voor veel aandoeningen ontbreekt één bepaalde referentietest of is deze te invasief om uit te voeren bij alle onderzoeksdeelnemers en wordt voor onderzoeksdoeleinden gekozen voor een meer pragmatische aanpak. We onderscheiden hierbij studies waarin gebruik wordt gemaakt van een combinatie van testen, consensus diagnose, of van informatie die in de follow-up wordt verkregen. Ten slotte moge duidelijk zijn dat de referentie-test uitgevoerd moet worden zonder kennis van de uitslag van de te evalueren test(en). 2.2.4. Data-analyse 2.2.4.2. Selectie van voorspellers Na datacontrole wordt in de analyse allereerst een dichotome uitkomstmaat gedefinieerd: aan- of afwezigheid van de referentiediagnose (longembolie). Met behulp van logistische regressie analyse wordt de kans hierop gerelateerd aan elk diagnostisch gegeven. Deze analyse gebeurt eerst voor iedere voorspeller (determinant) apart (univariate analyse). Alleen die variabelen die univariaat de uitkomst voorspellen, komen in aanmerking voor het multivariate (logistische regressie) model. Met dit model kan ook goed onderzocht worden of een bepaalde determinant toegevoegde voorspellende waarde heeft. 2.2.4.3. Constructie van een predictieregel De predictieregel wordt afgeleid uit de regressie-coëfficiënten van het multivariate model dat het best voorspelde met de minste diagnostische gegevens. De multivariate analyse gebeurt in de volgorde waarin de gegevens in praktijk zijn verzameld. Allereerst worden alle anamnestische variabelen samen gemodelleerd en de niet-significante variabelen uit het model verwijderd. Dit levert een model op met alleen die anamnestische variabelen die de aan- of afwezigheid van longembolie werkelijk voorspellen. Gebleken is dat dit met name de leeftijd, aanwezigheid van maligniteiten, collaps, recent ondergane chirurgie, en pijn in de benen zijn. Door vervolgens de bevindingen van het lichamelijk onderzoek toe te voegen, ziet men of het lichamelijk onderzoek iets toevoegt aan het stellen van de juiste diagnose. Zo gaat men verder, tot alle diagnostische fasen zijn doorlopen. De formule voor een predictieregel ziet er als volgt uit: P(Ziekte) 1 1 e ( 1 X1 2 X 2 3 X 3 ... n X n ) waarbij de ’s de regressiecoëfficiënten voorstellen en de X-variabelen de waarden voor de verschillende diagnostische parameters, bijvoorbeeld X 1=1 als de patiënt een vrouw is, en X2=65 als de leeftijd van de patiënt 65 jaar is. 2.2.4.4. Testen van een predictieregel Van het multivariate model met anamnestische gegevens wordt een Receiver Operating Characteristic (ROC)-curve (een plot van sensitiviteit tegen 1- specificiteit) geconstrueerd, zoals weergegeven in figuur 2-2-1. Deze curve geeft de diagnostische waarde aan van de gehele anamnese (d.w.z. de geselecteerde anamnestische variabelen) ofwel het vermogen om patiënten met en zonder longembolie te onderscheiden op basis van louter de anamnese. Hoe beter het model, des te meer de curve in de linkerbovenhoek ligt. Het slechtst denkbare model, dat helemaal niet discrimineert, heeft een oppervlak van 0.5 (zie de diagonaal in figuur 1) en een perfect discriminerend model een oppervlak van 1.0. In ons fictieve voorbeeld is de oppervlakte 0.76, hetgeen min of meer betekent dat bij 76% van de patiënten het anamnestische model de aan- of afwezigheid van longembolie correct voorspelt. 86 KWO Voor technische details met betrekking tot logistisch modelleren, ROC curven en het toepassen van variabele-selectietechnieken, verwijzen wij naar de literatuur [1,2]. Door vervolgens de bevindingen van het lichamelijk onderzoek toe te voegen ziet men of het lichamelijk onderzoek iets toevoegt aan het stellen van de juiste diagnose. Indien de oppervlakte groter wordt is er sprake van toegevoegde waarde en kan worden nagegaan welke bevindingen bij lichamelijk onderzoek hiervoor verantwoordelijk zijn. In ons voorbeeld bleken dit met name de ademhalingsfrequentie, parese, roodheid, zwelling, en pijn van het been te zijn. Als het oppervlak gelijk blijft is de toegevoegde waarde nihil. Verschillen tussen ROC-oppervlakten kan men statistisch toetsen. Dit proces wordt vervolgens herhaald door de diverse diagnostische testen stapsgewijs toe te voegen aan het voorgaande model. Het blijkt bijvoorbeeld dat echografie aanvullende diagnostische waarde heeft ten opzichte van anamnese en lichamelijk onderzoek. Merk op dat men in verschillende volgorde de aanvullende (beeldvormende) testen kan toevoegen teneinde verschillende diagnostische strategieën te evalueren. Ook kan men nagaan of en welke beeldvormende technieken het laboratoriumonderzoek zouden kunnen vervangen. In deze analyse geldt als uitkomstmaat embolie aanwezig versus afwezig, waarbij de categorie afwezig alle differentiaaldiagnosen bij elkaar bevat. Een thoraxfoto kan echter in eerste instantie niet bijdragen aan het in- dan wel uitsluiten van een longembolie, maar naderhand, wanneer deze eenmaal is uitgesloten, wel bijdragen aan het aantonen van bijvoorbeeld een longontsteking. Met behulp van moderne analysetechnieken, zoals polytome logistische regressie, waarin een uitkomstmaat met meerdere categorieën (de differentiaal-diagnose zelf) gemodelleerd kan worden, kan dit direct geëvalueerd worden. 2.2.4.5. Valideren van een predictieregel Indien men op de hierboven geschetste wijze een predictieregel heeft geconstrueerd (derivatiefase), moet deze worden gevalideerd in een andere populatie. De voorspellers zijn immers geselecteerd en geschat op basis van één bepaalde dataset en vervolgens is de waarde van het model ook nog eens geëvalueerd op diezelfde dataset. Dit betekent dat vrijwel altijd het onderscheidend vermogen van de predictieregel overschat zal zijn. Indien men dezelfde predictieregel gaat toepassen in een andere populatie, zal het discriminerend vermogen daarom lager zijn. Om de mate waarin dit het geval is empirisch vast te stellen, moet de predictieregel gevalideerd worden. Dit kan met statistische methoden in dezelfde populatie maar het is beter de predictieregel toe te passen in een andere populatie uit het domein, en vervolgen te kijken in hoeverre de oppervlakte onder de ROC-curve kleiner is geworden. Figuur 2-2-1 ROC-curve Figuur 2-2-1 ROC-curve 1.00 Sensitivity .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 1 - Specificity Misschien is het opgevallen dat de maten sensitiviteit en specificiteit hier niet aan de orde zijn geweest. In onze visie horen deze maten thuis bij het testonderzoek. Testonderzoek is ons inziens nuttig in een beperkt aantal situaties. Enerzijds in situaties waarin de diagnose nagenoeg gebaseerd is op één test zoals bij screening, anderzijds in de initiële fase van ontwikkeling van een nieuwe test of van een bestaande test in een nieuwe medische context, waarbij om efficiency redenen testonderzoek geïndiceerd is. Tot slot gebruiken we het bij het testen van een predictieregel, waarbij de ene constellatie van testen wordt vergeleken met de andere, door middel van het vergelijken van de oppervlakten onder de ROC-curven. 87 KWO Bronvermelding Deze paragraaf is gebaseerd op: Moons KGM, Van der Graaf Y. Evaluatie van de toegevoegde waarde van diagnostische tests. Ned Tijdschr Geneeskd 2000;144:1256-61. Literatuur Van der Schouw YT, Verbeek ALM, Ruijs JHJ. ROC Curves for the initial assessment of new diagnostic tests. Family Practice 1992;9:506-11. Altman DG. (computer)practical Statistics for Medical Research. London: Chapman & Hall, 1991. 2.3 PROGNOSE 2.3.1 Inleiding Onder prognose verstaat men de voorspelling omtrent het beloop van ziekte. De ‘typische’ prognose van een ziekte betreft het beloop bij de gemiddelde patiënt. Deze prognose wordt ook wel aangeduid als de ‘leerboekprognose’, bijvoorbeeld de 5-jaars overleving na de diagnose van een bepaalde maligniteit. Voor de klinische praktijk echter, waarin de arts wordt geconfronteerd met één bepaalde patiënt, heeft een dergelijke gemiddelde prognose niet of nauwelijks betekenis. Er wordt immers geen rekening gehouden met prognostisch belangrijke verschillen tussen patiënten. Zo is bij een vrouw met mammacarcinoom de 5-jaars overleving aanzienlijk slechter als bij diagnose ook metastasen worden geconstateerd. De 5-jaars overleving is echter weer iets beter naarmate de vrouw bij diagnose ouder is. Dergelijke patiënt-karakteristieken, in het voorbeeld leeftijd en metastasering, worden prognostische indicatoren genoemd. Het zal duidelijk zijn dat, hoe meer men rekening houdt met deze indicatoren, hoe preciezer een individuele prognose wordt. Deze reductie van onzekerheid is het doel van prognose voor zowel arts als patiënt. Kennis van de individuele prognose is belangrijk voor de patiënt omdat hij dan weet waar hij aan toe is. Voor de arts is de individuele prognose belangrijk, omdat hij zo patiënten kan indelen in bijvoorbeeld gunstig of ongunstig beloop en vervolgens zijn beleid hierop kan afstemmen: in het algemeen zal een meer intensieve interventie worden gegeven bij een ongunstiger prognose. We richten ons in dit hoofdstuk daarom op individuele in plaats van gemiddelde prognoses. Tot nu toe hebben we vooral gesproken over ‘de prognose’. Dit is echter te vaag. Er zijn bij een gegeven patiënt immers verschillende prognoses: ten aanzien van de kans op overleving, zoals in het voorbeeld, maar ook ten aanzien van de kans op recidief, de kans op bepaalde lichamelijke handicaps, pijn, sociaal disfunctioneren, het complicatierisico, enzovoort. De totale prognose omvat dus de verzameling van absolute (niet relatieve) kansen op de relevante uitkomsten van ziekte. Kansen of risico’s zonder meer hebben geen betekenis. Bij een kans op een bepaalde uitkomst moet ook altijd een tijdsperiode worden genoemd, bijvoorbeeld de kans op het ontwikkelen van hart- en vaatziekte bij diabetes in de komende tien jaar. In de Framingham Study werd onder andere onderzocht hoe het 10-jaars risico van hart- en vaatziekte bij diabetespatiënten afhangt van leeftijd, geslacht, roken, bloeddruk en de cholesterol/HDLcholesterol ratio. Uiteraard kon men met dit onderzoek voor een patiënt met diabetes de gemiddelde kans om binnen 10 jaar hart- en vaatziekte te krijgen berekenen. Dit is de zogenaamde ‘leerboekprognose’. Voor de praktijk veel relevanter is dat het onderzoek ook liet zien dat met behulp van bovengenoemde prognostische indicatoren een veel preciezere, individuele, prognose kan worden bepaald. Zo is het 10-jaars risico van hart- en vaatziekte 11% voor een 50-jarige man met diabetes die niet rookt, een normale bloeddruk en een normale cholesterol/HDL-cholesterol ratio heeft, terwijl dit risico 42% bedraagt voor een man van 60 met diabetes die wel rookt, wel een hoge bloeddruk en wel een hoge cholesterol/HDL-cholesterol ratio heeft. Hier moet nog worden vermeld dat een arts ook altijd de prognoses zal beschouwen gegeven de verschillende behandelingsopties, inclusief geen behandeling. De behandeling is dan dus één van de prognostische indicatoren. Het schatten van de prognose vereist gedetailleerde informatie. De arts moet weten welke prognostische indicatoren relevant zijn en hoe ze kwantitatief samenhangen met een bepaalde uitkomst. Hij moet deze informatie uit de literatuur halen en vervolgens voor de patiënt uitrekenen hoe dat precies voor hem uitpakt. Helaas is de benodigde informatie veelal niet voorhanden. De methodologie van prognostisch onderzoek is relatief jong en onderzoeks-resultaten bevatten vaak net niet die informatie die juist nodig is voor een individuele prognose. Ook leerboeken rapporteren hier 88 KWO nauwelijks over. In dit hoofdstuk wordt uiteengezet hoe onderzoek zo kan worden opgezet, uitgevoerd en gepresenteerd dat voor individuele prognose relevantie informatie boven water komt. 2.3.2 Onderzoeksopzet 2.3.2.1 Determinant-uitkomstrelatie Zoals in al het klinisch epidemiologisch onderzoek, wordt de vraagstelling, en daarmee de determinant-uitkomstrelatie, geïnspireerd door de praktijk. Bij artsen die bij patiënten een hals-cyste diagnosticeren, leeft bijvoorbeeld de vraag wat nu de kenmerken zijn die maligne degeneratie voorspellen. Patiënten met deze kenmerken moeten immers regelmatig gecontroleerd worden. Heel algemeen gesteld is de vraagstelling bij prognostisch onderzoek of het mogelijk is om met enkele eenvoudig, veilig en “goedkoop” vast te stellen determinanten de absolute kans op een bepaalde uitkomst precies te schatten. Daarbij zal vaak de vraag zijn of één bepaalde determinant (bijvoorbeeld een dure meting) toegevoegde voorspellende waarde heeft t.o.v. de informatie (bijvoorbeeld leeftijd, geslacht, anamnese en lichamelijk onderzoek) die al voorhanden is. Prognostisch onderzoek kan, evenals diagnostisch onderzoek, beschouwd worden als efficiency- ofwel doelmatigheids-onderzoek. Bij de keuze van de uitkomst zal men zich vooral laten leiden door de relevantie voor de patiënt. Een typisch voorbeeld van een voor de patiënt relevante uitkomst is beperking in lichamelijk functioneren, bijvoorbeeld spraakstoornissen bij multiple sclerose. Andere voorbeelden van relevante uitkomsten zijn kwaliteit van leven, pijn, zelfredzaamheid, sociaal-psychologisch functioneren, et cetera. Uitkomstmaten zoals bijvoorbeeld de grootte van een tumor, of het stenose-percentage van een coronair arterie zijn in een prognostisch onderzoek van minder belang omdat zij voor de patiënt niet direct klinisch relevant zijn. Zij kunnen wel als benaderingen (zogenaamde proxies) dienen indien er een goede correlatie bestaat met een voor de patiënt relevante uitkomst op de lange termijn. De keuze van de determinanten (ook voorspellers of prognostische indicatoren genoemd) wordt in de prognostiek door dezelfde overwegingen bepaald als in de diagnostiek. Dit betekent dat men zich laat leiden door wat a priori voorspellers van de uitkomst zijn, en wat er in de praktijk beschikbaar en haalbaar is. Het betekent ook dat men zich geen zorgen hoeft te maken om confounders, omdat prognostisch onderzoek, net als diagnostisch onderzoek, descriptief (beschrijvend) van aard is. Vaak zijn er vele (50 tot 200) potentiële determinanten gemeten waarvan men de invloed op het beloop van ziekte wil bestuderen. Bestudering van veel variabelen is echter inefficiënt, vaak onnodig en statistisch ongunstig omdat het tot instabiele modellen leidt. Bovendien zijn de schattingen van modellen met een beperkt aantal variabelen nauwkeuriger. 2.3.2.2 Domein Het domein van een prognostische studie is de abstracte definitie van de patiëntenpopulatie bij wie de prognose in de praktijk bepaald moet worden. Het domein wordt bepaald door de setting en door het klinische probleem waarmee patiënten zich presenteren. Zie verder hoofdstuk 1.2.3. Als het theoretische domein eenmaal gedefinieerd is, moet een concrete onderzoekspopulatie worden gevonden die past bij dat domein. 2.3.3 Uitvoering 2.3.3.1 Algemeen Een prognostische vraagstelling zal men bij voorkeur door middel van een follow-up onderzoek proberen te beantwoorden. Het voordeel van het kwantificeren van de determinant-uitkomstrelatie in een cohort is dat absolute kansen geschat kunnen worden, dit in tegenstelling tot de patiëntcontrolebenadering. Indien men bijvoorbeeld wil weten welke prognostische indicatoren het risico van complicaties bij chirurgische patiënten (het domein) bepalen, zal men bij voorkeur een prospectief follow-up onderzoek opzetten, waarin alle patiënten die in een bepaalde periode worden opgenomen op een chirurgische afdeling worden vervolgd voor een bepaalde periode, bijvoorbeeld tot 30 dagen na ontslag. Het is meestal lastig om in een retrospectieve studie juist die informatie te verzamelen die men nodig heeft. Vaak is deze immers niet systematisch vastgelegd. 2.3.3.2 Onderzoekspopulatie Bij de uitvoering van prognostisch onderzoek zal men allereerst de populatie definiëren waarvan men de prognose wil schatten. Dit is de onderzoekspopulatie of het onderzoekscohort en moet de kenmerken van het domein hebben. In de praktijk wordt vaak een cohort ten behoeve van prognostisch onderzoek gedefinieerd in termen van datum waarop een diagnose werd gesteld, 89 KWO bijvoorbeeld alle patiënten die in een bepaalde tijdsperiode in het ziekenhuis werden opgenomen met een hartinfarct. Een nauwkeurige definitie van de onderzoekspopulatie is van groot belang, omdat deze de reikwijdte ofwel de generaliseerbaarheid van de conclusies bepaalt. 2.3.3.3 Determinanten Zoals gezegd wordt de keuze van determinanten (voorspellers) die men wil bestuderen bepaald door praktische haalbaarheid, kennis, klinische inzichten, literatuurgegevens, plausibiliteit vooraf, en de hypothesen die men wil toetsen. Het is belangrijk dat, net als bij diagnostisch onderzoek, de determinanten op dezelfde manier, met name met dezelfde precisie als in de dagelijkse praktijk, gemeten worden. Gebeurt dit niet, dan valt het voorspellend vermogen van een bepaalde determinant bij toepassing in de praktijk vaak tegen. Als een determinant (bij voorbeeld de uitslag van een röntgenfoto) in de praktijk wordt beoordeeld met kennis van andere prognostische informatie (bijvoorbeeld leeftijd), dan moet dit in het onderzoek ook gebeuren. Indien echter determinanten onderling worden vergeleken voor wat betreft voorspellend vermogen, dan moet elke beoordeling onafhankelijk plaatsvinden door middel van blindering voor de te vergelijken determinant. In het followup onderzoek waarin men wil onderzoeken welke prognostische indicatoren complicaties na chirurgie voorspellen, kan men als determinanten denken aan gegevens die te maken hebben met de ziekte van de patiënt, de patiënt zelf, en de gepleegde interventie. Voorbeelden zijn diagnose, leeftijd van de patiënt, rookgedrag, longfunctie, en de aard van de interventie (bijvoorbeeld een vaatinterventie, appendectomie of circumcisie). Ook factoren zoals duur van de operatie, hoeveelheid bloedverlies, ervaring van de chirurg of assistent zullen worden meegenomen. 2.3.3.4 Uitkomst Net als in een etiologisch follow-up onderzoek moet men ervoor zorgen dat follow-up zo compleet mogelijk is en dat de uitkomst onafhankelijk van de determinanten wordt vastgesteld. In tegenstelling tot de determinanten moet de uitkomst niet persé conform de praktijk worden vastgesteld, maar juist zo precies mogelijk. In het onderzoek naar prognostische indicatoren van het complicatierisico op een chirurgische afdeling kiest men als eindpunt natuurlijk complicatie. Dit klinkt simpel, maar vervolgens moet nauwkeurig gedefinieerd worden wat onder een complicatie wordt verstaan. Het is verstandig hierbij zoveel mogelijk aan te sluiten bij erkende definities. Zo is een veelgebruikte definitie van een complicatie: ‘any state or event unfavourable to the patient's health that requires additional treatment or causes damage and that was not intentional’. Vervolgens kun je dan complicaties naar ernst gaan indelen. Het maakt uit of een patiënt als gevolg van een complicatie (zoals een gebroken heup na een val uit bed) een operatie moet ondergaan of dat hij een urineweginfectie ontwikkelt als gevolg van een blaaskatheter. Het aantrekkelijke van prognostisch onderzoek is dat het uitgevoerd kan worden in de poliklinische en klinische setting van een ziekenhuis of huisartspraktijk en dat de dataverzameling zoveel mogelijk kan aansluiten op de klinische praktijkvoering. Omdat de uitkomsten waarnaar wij op zoek zijn vaak frequent (vaak 10-30% in een jaar) optreden (relevantie!) kan prognostisch onderzoek vaak in één centrum worden gedaan. In het complicatieonderzoek werden alle patiënten die in 1996 op de chirurgische afdeling werden opgenomen in het onderzoek betrokken. Het onderzoekscohort dat op deze manier werd verzameld bestond uit ruim 3200 patiënten, waarvan bij 694 patiënten complicaties optraden. Bij alle patiënten werd op gestructureerde wijze door de zaalarts een aantal patiëntkenmerken (leeftijd, geslacht, diabetes, CARA, etc.) en gegevens over ziekte (diagnose) en behandeling (welke ingreep, dagbehandeling, wie deed de ingreep, hoeveel bloedverlies, etc.) vastgelegd. Iedere dag werd per patiënt nagegaan of er een complicatie was opgetreden. Deze werden door de behandelend arts, de verpleegkundige en de onderzoeker vastgelegd. 2.3.4 Data-analyse Prognostisch onderzoek heeft veel gemeen met diagnostisch onderzoek, zowel in concept (descriptief onderzoek, op doelmatigheid gericht), als qua uitvoering (de praktijk volgend). Hoewel op één of andere manier met de tijd tussen de meting van de determinanten en het optreden van de uitkomst rekening moet worden gehouden, is de data-analyse in principe vrijwel identiek. Daarom verwijzen wij hiervoor naar paragraaf 2.2.4 van deze klapper. Uiteraard moet dan voor diagnostische determinanten prognostische determinanten gelezen worden, en voor ziekte als uitkomst een bepaalde prognostische uitkomst. 90 KWO Literatuur Grobbee DE, Miettinen OS. Clinical epidemiology. Introduction to the discipline. Neth J Med 1995;47:2-5 91 KWO 2.4 INTERVENTIE 2.4.1 Inleiding Onder interventieonderzoek wordt een onderzoek verstaan, waarbij de onderzoeker het effect van een preventieve of therapeutische interventie (een ingreep of andere behandeling) wil bestuderen. De arts wordt opgeleid om medisch te kunnen handelen of om medisch in te grijpen en hij is dus bij uitstek geïnteresseerd in het effect hiervan. De grootte van het effect en het optreden van eventuele bijwerkingen bepalen of de interventie zinvol is, of dat het beter is ervan af te zien. In een interventieonderzoek zal de onderzoeker het specifieke effect van de interventie willen meten. Hij wil niet alleen weten òf de interventie zinvol is, maar ook hóe zinvol deze is. Met andere woorden: in een interventie- onderzoek moet ook de grootte van het effect worden gemeten. Onderwerp van studie kan een interventie zijn in de vorm van toediening van bepaalde medicijnen of een chirurgische ingreep, maar ook een preventieve maatregel. Zo kan de arts bijvoorbeeld willen weten of het zinnig is mensen met hoge bloeddruk te behandelen met antihypertensiva. Bij de behandeling van borstkanker kan de chirurg zich afvragen of een borstsparende ingreep even effectief is als een borstamputatie. Onderwerp van studie kan ook zijn of het regelmatig verrichten van een uitstrijkje van de baarmoederhals werkt ter voorkoming van sterfte aan cervixkanker. Een interventiestudie is een etiologisch onderzoek: in de regel is de onderzoeker geïnteresseerd in het oorzakelijk effect van één bepaalde interventie en de effecten van andere factoren worden dan als verstorend ervaren. Dit wordt ‘confounding’ genoemd. Het bestuderen van het effect van een interventie gebeurt bij voorkeur in een zogenaamd gerandomiseerd experiment. Dit betekent dat de te bestuderen interventie door toevallige toewijzing (random) tot stand komt. Ook een niet gerandomiseerde simultane of voor/na-vergelijking kan een schatting van het effect geven. En ook met behulp van een patiënt-controleonderzoek kan het effect van een interventie onderzocht worden. Voor een bespreking van niet gerandomiseerde studieopzetten wordt verwezen naar het hoofdstuk over etiologisch onderzoek (hoofdstuk 2.1). Wij beperken ons hier voornamelijk tot de gerandomiseerde experimenten. Over gerandomiseerde studies, ook wel gerandomiseerde trials (randomised controlled trial = RCT) genoemd, is veel in de leerboeken terug te vinden en een enkel leerboek is zelfs volledig hieraan gewijd [1,2]. In dit hoofdstuk wordt daarom alleen een kort overzicht gegeven van de principes en de opzet van gerandomiseerd interventieonderzoek. 2.4.1.1 Definitie Interventieonderzoek is onderzoek waarbij de grootte van het effect van een bepaalde interventie wordt gemeten. Voor een dichotome uitkomst (gebeurtenis treedt wel of niet op) wordt het effect uitgedrukt in een relatieve maat. Deze maat geeft aan hoe groot de kans is dat een bepaalde gebeurtenis optreedt in een groep personen die de interventie krijgt vergeleken met (relatief ten opzichte van) een groep personen die deze interventie niet krijgt. Voor een continue uitkomst (bijvoorbeeld bloeddrukwaarden) wordt meestal een verschil in gemiddelde of in de mediaan tussen de interventie- en de controlegroep berekend. In een interventie studie wordt onderzoek gedaan naar het effect van een ingreep. De reden is meestal dat de onderzoeker direct relevante informatie wil verkrijgen over de waarde van bepaalde therapeutische of preventieve ingrepen. De informatie uit een interventiestudie kan dan direct toegepast worden in de behandeling of preventie van ziekte. In een enkel geval is er een puur fundamenteel wetenschappelijke reden voor de interventie studie. In dit laatste geval kan bijvoorbeeld de producent van een geneesmiddel geïnteresseerd zijn in het effect van een specifiek onderdeel van een pil. Onderwerp van een interventie studie kunnen eigenlijk alle vormen van interventie zijn, als ook het afzien van interventie. Zo kan men willen uitsluiten dat een eventueel waargenomen effect een gevolg is van bijvoorbeeld de extra aandacht die de patiënt krijgt doordat hij medicijnen krijgt voorgeschreven (een zogenaamd placebo effect). Het waargenomen effect kan ook een gevolg zijn van veranderde leefgewoonten, die de patiënt doorvoert terwijl hij medicatie krijgt. Om voor deze externe effecten te corrigeren kan bijvoorbeeld gebruik worden gemaakt van een controlegroep die een vergelijkbare pil slikt, maar dan zonder het te bestuderen bestanddeel (dit wordt een placebo of neppil genoemd). In de regel weet arts noch patiënt of het echte middel wordt geslikt of de placebo. Men noemt het onderzoek dan ‘geblindeerd’. 92 KWO 2.4.2 Onderzoeksopzet 2.4.2.1 Determinant-uitkomstrelatie De determinant-uitkomstrelatie in een interventieonderzoek volgt direct uit de vraagstelling. Een specifieke interventie is onderwerp van onderzoek. De kans op genezing is de uitkomst van de relatie tussen de specifieke interventie en de genezing. Het gaat om een causale relatie. Zoals gezegd zijn voor een interventieonderzoek verschillende onderzoeksopzetten mogelijk, zoals een patiënt-controleonderzoek of een ‘voor/na’ of ‘simultane vergelijking’ (cohortonderzoek). Wij beperken ons hier tot het gerandomiseerde interventieonderzoek. Het is belangrijk de essentie van randomisatie te begrijpen, ook omdat het gerandomiseerde onderzoek model kan staan voor veel ander etiologisch onderzoek. Voorbeeld: Stel, een arts wil het effect van bepaalde bloeddruk verlagende medicijnen weten. Hiertoe geeft hij het medicijn aan een aantal patiënten, bij wie de bloeddruk boven een zekere waarde ligt. Vervolgens besluit hij na één week de bloeddruk opnieuw te meten. Hij vindt voor de meeste patiënten een lagere bloeddruk en gemiddeld voor de groep is de bloeddruk gedaald. Is het medicijn dan effectief? Er kunnen verschillende redenen zijn waarom de bloeddruk gedaald is. De eerste verklaring is dat het natuurlijk beloop van de (hoge) bloeddruk wisselend is en dat het gevonden effect is toe te schrijven aan random variatie of aan het fenomeen ‘regressie naar het gemiddelde’ (na selectie hebben uitersten de neiging bij een volgende meting dichter bij het populatie-gemiddelde te liggen). Een andere verklaring kan zijn dat patiënten gunstig reageren op de aandacht en het voorschrijven van de medicatie. Dit is het eerder genoemde placebo effect (effecten inherent aan de interventie). Het kan ook zijn dat de patiënten hun leefgewoonten hebben gewijzigd: minder zout en vet eten, meer bewegen, misschien zijn ze licht afgevallen. Het waargenomen effect is dan een gevolg van zogenaamde ‘externe effecten’. Het is ook mogelijk dat de arts die de bloeddrukken meet, dit met een ‘gekleurde bril’ doet en geneigd is lagere waarden af te lezen of waarden naar beneden af te ronden omdat hij een gunstig effect aannemelijk acht. Dit leidt tot waarnemer-fouten: een systematische fout (bias) in de informatieverzameling; we noemen dit ‘informatie bias’. En tenslotte kan het effect natuurlijk ook toe te schrijven zijn aan de werkzame bestanddelen uit de medicatie. Probleem is dat de bijdrage van deze factoren aan het uiteindelijk effect niet zonder meer is vast te stellen. Een waargenomen effect van een interventie in een groep patiënten is dus een combinatie van ‘effect van het natuurlijk beloop’ + ‘externe effecten (inclusief placebo-effecten)’ + ‘waarnemer-effecten’ + ‘interventie effect’. Een eerste stap om een goede effectmeting van de interventie te verkrijgen is het gebruik van een vergelijkingsgroep, waarin dezelfde effecten van het natuurlijk beloop, van externe effecten en van waarnemingen optreden. Hoe wordt dit bereikt? 1) Vergelijkbaarheid in natuurlijk beloop Tot de vergelijkingsgroep behoren patiënten met dezelfde aandoening, die hetzelfde natuurlijke beloop hebben als de patiënten in de interventiegroep gehad zouden hebben zònder de interventie. Om dit te bewerkstelligen is ‘randomiseren’ de beste manier. Hierbij worden patiënten at random door toevallige toewijzing - verdeeld over de interventie groep en de controle groep. Hiermee creëert de onderzoeker twee groepen die optimaal ‘vergelijkbaar’ zijn voor wat betreft het natuurlijk beloop. Alle factoren die het beloop en de prognose van de ziekte beïnvloeden, zijn gelijk verdeeld over de twee groepen, met uitzondering van de behandeling. Dit geldt voor bekende en onbekende prognostische factoren. Een voorwaarde is natuurlijk wel dat de te randomiseren groep patiënten voldoende groot moet zijn. Randomisatie zorgt dus voor een vergelijkbaar natuurlijk beloop in de interventie groep en de controle groep. Dit is te beoordelen door na te gaan of de verdeling van prognostische factoren over de twee te vergelijken groepen bij start van de studie gemiddeld hetzelfde is. (Overigens hoort deze verdeling van prognostische factoren in de eerste tabel van een artikel te staan). Wellicht het grootste probleem in niet gerandomiseerd interventieonderzoek is ‘confounding by indication’. Meestal is er een reden waarom in de praktijk de ene patiënt wel en de andere niet de specifieke interventie heeft gekregen. Het kan zijn dat met name ernstig zieke patiënten of patiënten met co-morbiditeit niet voor de specifieke interventie in aanmerking kwamen. Omdat deze eigenschappen prognostische kenmerken zijn, betekent dit dat deze patiënten ‘van huis uit’ een andere prognose hebben dan de groep patiënten zonder deze interventie. Dit vertroebelt het 93 KWO waarnemen van een interventie-effect (‘confounding by indication’). 2) Vergelijkbaarheid in externe factoren Hierbij valt een onderscheid te maken in twee categorieën externe factoren. De eerste categorie wordt gevormd door factoren die inherent zijn aan de interventie. Hierbij valt te denken aan de extra aandacht die met de interventie gepaard gaat: een witte jas-effect, de smaak en de kleur van een tablet, het onder narcose gaan voor een operatie, etc. Dit worden placebo-effecten genoemd. Of de onderzoeker vergelijkbaarheid in placebo-effecten wil bereiken, is afhankelijk van de onderzoeksvraag. In een zogenaamd ‘pragmatisch’ onderzoek zal dit vaak niet het geval zijn. In een pragmatisch onderzoek wil men de interventie met alles wat erbij hoort evalueren. Omdat farmaceutisch onderzoek het domein van de gerandomiseerde interventie studies lange tijd gedomineerd heeft, is er (te) veel aandacht gegaan naar placebo gecontroleerde studies. De producent wil in dat geval enkel en alleen het effect weten van een bepaald bestanddeel in een pil: dit is een ‘explanatory’ of ‘verklarende’ trial. In de klinische praktijk van alle dag is een pragmatische studie vaker op zijn plaats, en is gebruik van een placebo om placebo-effecten uit te sluiten soms zelfs ongewenst. Een tweede categorie ‘externe effecten' betreft effecten, die niet inherent zijn aan de interventie maar die wel geïnduceerd kunnen worden door de interventie. Met name veranderingen in leefstijl (prognostische factoren) in de interventiegroep kunnen het waarnemen van een interventie-effect vertroebelen. Om vergelijkbaarheid in externe factoren te bewerkstelligen kan een ‘placebo’ (nepmiddel) of een nepbehandeling gebruikt worden. Het gebruik van een placebo bewerkstelligt vergelijkbaarheid in beide categorieën van externe effecten. Voorbeeld: Wanneer men bijvoorbeeld het effect van het insnijden van het trommelvlies bij een acute oorontsteking bij kinderen wil bepalen, moet de controlegroep dan ‘niets’ krijgen (pragmatische studie), of een placebobehandeling (verklarende studie)? In dit laatste geval zullen kinderen een slaaproesje krijgen en eveneens naar de operatiekamer gaan, maar zal niet het trommelvlies ingesneden worden. Wanneer het effect van enkel het insnijden gemeten dient te worden, is een controlegroep met een nep-behandeling de controlegroep bij uitstek. Dit is een verklarende trial. Een controlegroep met ‘niets’ benadert de praktijksituatie echter het beste en is de controlegroep bij uitstek in een pragmatische gerandomiseerde trial. In de klinische praktijk is de keuze immers ‘insnijden met alles wat erbij hoort (‘package deal’)’ of niets doen. 3) Vergelijkbaarheid in waarnemer-effecten Het eindpunt moet in beide groepen (interventie- en controlegroep) op dezelfde wijze gemeten en verzameld worden. Om dit te bereiken is in ieder geval een eenduidige en heldere definitie van het eindpunt nodig, alsook een protocollering over hoe het eindpunt wordt gemeten, c.q. gegevens verzameld worden. Om te voorkomen dat systematische fouten optreden (met systematische fouten (bias), wordt bedoeld dat het meten voor de interventie groep systematisch anders gebeurt dan voor de controle groep), wordt vaak blindering nagestreefd. Wanneer het om eindpunten gaat die de patiënten zelf moeten aangeven, bijvoorbeeld vermindering in pijn of klachten of kwaliteit van leven, dan dient de patiënt bij voorkeur geblindeerd te worden. Dit wil zeggen dat de patiënt niet weet of hij in de interventie- of in de controlegroep zit. Dit kan bijvoorbeeld bereikt worden met een placebo of een ‘placebobehandeling’. Wanneer de onderzoeker of de arts de eindpunten bij de patiënt meet, bijvoorbeeld de bloeddruk, dan kan het van belang zijn dat de onderzoeker ook blind is. Dan is er sprake van een dubbelblinde studie. Soms kan ook volstaan worden met een enkelblinde studie. Zo kan men bijvoorbeeld besluiten de onderzoekspersonen niet te blinderen voor de interventie, omdat zijzelf de uitkomst niet kunnen beïnvloeden. Een voorbeeld van een dergelijke uitkomst is bijvoorbeeld botdichtheid op röntgenscans. Overigens kunnen eindpunten in een open studie alsnog blind beoordeeld worden door onderzoekers die verder niet bij het onderzoek betrokken zijn. In geval van ‘triple’ blind onderzoek is behalve de patiënt (onderzoekspersoon) en de arts (degene die het eindpunt meet) ook de persoon geblindeerd die de analyses uitvoert, en wordt pas op het allerlaatst de blindering opgeheven. Het is de vraag of dit wenselijk is. Voor ‘slimme’ data-analyse is zekere kennis van zaken (en dus ook van de betekenis van de gegevens) een voorwaarde. De aard van het eindpunt bepaalt mede of blindering noodzakelijk is. Bij zogenaamde relatief harde eindpunten (bijvoorbeeld sterfte) zal dit minder noodzakelijk zijn dan bij de relatief ‘zachte’ of subjectieve eindpunten (bijvoorbeeld pijn). 94 KWO 2.4.2.2 Het domein Het domein bij interventieonderzoek bestaat uit die patiënten voor wie de interventie zinnig wordt geacht. 2.4.3 Uitvoering 2.4.3.1 Algemeen Voor een gerandomiseerd onderzoek is een ethische toetsing en goedkeuring nodig (zie ook hoofdstuk 3.2). Deelnemers aan een trial moeten volledig geïnformeerd worden over het onderzoek. Het doel dient uitgelegd te worden. Verder behoren ze geïnformeerd te worden over wat hen te wachten staat: welke medicijnen c.q. interventies ze krijgen (inclusief de kans van 50% dat ze de ‘nepbehandeling’ krijgen, indien van toepassing), hoe vaak ze op controle moeten komen, en wat er dan gebeurt. Eventuele vergoedingen worden toegelicht. Na volledige voorlichting en uitleg over werking en eventuele bijwerkingen, moeten zij schriftelijk toestemming geven (met een handtekening). Dit heet een ‘informed consent’. Een patiënt kan zich op ieder moment zonder opgaaf van reden uit de studie terugtrekken. Geen deelname aan de studie mag geen consequenties hebben voor de verdere behandeling c.q. de arts-patiëntrelatie. Deze patiënten krijgen dan de conventionele behandeling. De organisatie van een trial is in het algemeen arbeidsintensief. Vooral de randomisatie: ‘om en om’ wordt in de regel beschouwd als ongeschikt, men maakt liever gebruik van ‘random’ nummers. Vraag is dan hoe dit op de werkvloer wordt toegepast: bellen naar het trialbureau door een arts, et cetera). Ook eventuele blindering vereist een goede voorbereiding en een consequente uitvoering. 2.4.3.2 Populatie Ook bij de generalisatie van een resultaat dat verkregen is in een gerandomiseerd onderzoek, is de nodige voorzichtigheid geboden. Meestal zijn er voor de trial strenge inclusiecriteria (of exclusiecriteria) gehanteerd, en bovendien zijn deelnemers vaak zeer gemotiveerd. Dit kan tot gevolg hebben dat deelnemers een heel selecte groep patiënten vormen. Veel van onze huidige kennis is gebaseerd op trials bij mannen, niet te oud, en zonder co-morbiditeit. De medicatie willen we echter veel breder toepassen. Dit is niet altijd een probleem, maar wel als aannemelijk kan worden gemaakt dat de medicatie in andere groepen een verschillend effect kan hebben. 2.4.3.3 Determinanten De determinant in een interventiestudie kan een bepaalde medicatie zijn, of een bepaalde dosis van de medicatie. Deze dosis hoeft overigens niet constant te zijn. Deze kan even goed op basis van effecten of bijwerkingen worden bijgesteld (ook in de controlegroep). De controlegroep kan ‘niets’ krijgen, een placebo, of een andere medicatie (standaard interventie). Dit hangt af van de ziekte, de interventie en de precieze vraagstelling. De determinant kan ook een chirurgische ingreep zijn of een andere therapeutische interventie (bijvoorbeeld fysiotherapie). In dit geval is blinderen meestal onmogelijk. Of dit een probleem is, is afhankelijk van de vraagstelling (pragmatisch of verklarend) en de aard van het eindpunt (objectief of subjectief). De controlegroep kan een andere chirurgische interventie krijgen, geen interventie, of met medicatie behandeld worden. Tenslotte kan de determinant een preventieve maatregel zijn. Zo kan random onderzocht worden of regelmatig mammografisch screenen de vroegtijdige ontdekking van borstkanker bevordert en uiteindelijk een reductie in borstkankersterfte teweegbrengt. Of: verlaagt regelmatig bewegen het risico op suikerziekte? In deze laatste twee voorbeelden zijn erg grote aantallen (gezonde) mensen nodig die gerandomiseerd dienen te worden. Vervolgens moeten ze een lange tijd (jaren) gevolgd worden. Dit legt beperkingen op aan gerandomiseerd interventieonderzoek. 2.4.3.4 Uitkomst Afhankelijk van de aard van de ziekte, de te onderzoeken interventie en de precieze onderzoeksvraag wordt een relevant (doorgaans klinisch) eindpunt gekozen. Dit is bij voorkeur een klinisch relevante maat, waar de patiënt direct iets aan heeft. Dat pleit ervoor om patiënten of patiëntenvertegenwoordigers te betrekken bij de keuze van uitkomstmaten. Nogal eens worden eindpunten gekozen die ‘medisch-biologisch’ interessant zijn, maar die te weinig zekerheid geven over uiteindelijke gezondheidswinst voor de patiënt. Een uitzondering kan gemaakt worden voor eindpunten, waar de patiënt misschien niet direct iets aan heeft, maar waarvan op grond van eerder wetenschappelijk onderzoek voldoende is aangetoond dat ze uiteindelijk tot gezondheidswinst leiden (in overleving of kwaliteit van leven). We spreken dan van intermediaire eindpunten. 95 KWO Voorbeeld: Men wil nagaan of het gebruik van Statines (een soort geneesmiddel) het cholesterolgehalte verlaagt bij patiënten met te hoge cholesterol waarden. Hiertoe randomiseert men patiënten over een controlegroep met placebo en een interventiegroep met een bepaalde dosis statines. Na enige weken wordt het cholesterolgehalte gemeten. Hoewel de patiënt zich hier niet direct beter of slechter door voelt wordt dit eindpunt toch als klinisch relevant beschouwd, omdat voldoende vaak is vastgesteld dat een cholesterolverlaging uiteindelijk het risico op een hart- en vaatziekte verlaagt. Al eerder hebben we gemeld dat de aard van het eindpunt mede bepaalt of blindering gewenst is. Bij harde, objectieve eindpunten is blinderen minder noodzakelijk. 2.4.5 Data-analyse 2.4.5.1. Algemeen De validiteit van een gerandomiseerde trial is hoog. Door het randomiseren, de toepassing van blindering en het eventuele gebruik van een placebo, is optimale vergelijkbaarheid verkregen tussen de interventiegroep en de controlegroep in natuurlijk beloop, externe effecten en waar-nemer-effecten. Dit betekent dat een valide, betrouwbare schatting van het effect verkregen wordt. Overigens is het wel van belang alle studiedeelnemers te blijven volgen tot het optreden van het eindpunt of het einde van de studie. ‘Loss to follow-up’ kan de interne validiteit aantasten en de onderzoeker moet er dan ook alles aan doen mensen (deelnemende patiënten en artsen) blijvend te motiveren voor de studie. 2.4.5.2 Confounding Een discussie die vaak gevoerd wordt is of voor een eventuele toevallige ongelijke verdeling van een prognostische factor bij de start van de studie toch gecorrigeerd moet worden in de analysefase (zie 2.1.4). Een ongelijke verdeling van een factor komt niet zo vaak voor, maar een enkele keer kan de randomisatie toch zo uitvallen. Sommige epidemiologen vinden dat hiervoor niet gecorrigeerd moet worden. Immers, voor veel onbekende prognostische factoren die misschien eveneens onevenredig verdeeld zijn kan ook niet gecorrigeerd worden. Het lijkt echter niet aan te bevelen correctie achterwege te laten indien de groepen aanzienlijk in belangrijke prognostische kenmerken verschillen. Door randomisatie wordt ‘confounding by indication’ voorkomen. In niet gerandomiseerd interventieonderzoek dient zeker voor confounders gecorrigeerd te worden. Het probleem is echter dat vaak niet of onvoldoende bekend is waarom de ene patiënt wel en waarom de andere patiënt niet de betreffende interventie heeft gekregen. Voor de daardoor mogelijke ‘confounding by indication’, is dan niet te corrigeren. Het gevolg is een niet valide schatting van het interventie effect. 2.4.5.3 Intention to treat In een gerandomiseerde interventiestudie hanteert men bij voorkeur het ‘intention to treat’ principe. Dit betekent dat de analyse plaatsvindt naar de twee groepen zoals ze oorspronkelijk tot stand zijn gekomen (zoals de intentie van gerandomiseerde behandeling is). Wanneer een deel van de patiënten stopt met de medicatie, of overstapt op de andere medicatie (bijvoorbeeld die uit de controlegroep) dan toch blijven ze, voor het bepalen van het effect van de interventie, tijdens de analyse tot hun oorspronkelijke groep behoren. Uiteindelijk benadert dit ook het beste de praktijksituatie, waar de arts de intentie heeft tot behandelen en geen invloed heeft op het daadwerkelijke gebruik van de voorgeschreven medicijnen. Bovendien handhaaft het ‘intention to treat’ principe de oorspronkelijke randomisatie en wordt confounding door selectieve uitval voorkómen. Vaak wordt ook een ‘per protocol’ of ‘on treatment’ analyse gedaan: hierin wordt het effect gemeten bij de mensen die werkelijk de medicatie gebruikten, vergeleken met die mensen die deze medicatie niet slikten. Voorzichtigheid bij de interpretatie van het verkregen resultaat is dan geboden, omdat een selectieve groep patiënten uitgevallen kan zijn. De onderzoeker wil ook vaak subgroep analyses doen: bijvoorbeeld kijken of het medicijn bij ouderen net zo effectief is als bij jongeren. Vaak zijn de aantallen echter te klein om hier zinvolle uitspraken over te doen. 96 KWO 2.4.5.4 Associatiematen Bij een dichotome uitkomst in een gerandomiseerd interventieonderzoek berekent men een relatief risico of een risicoverschil. Het risico op het eindpunt in de interventie-groep wordt eerst berekend. Dit is het aantal eindpunten, gedeeld door het aantal mensen die de interventie kregen (R1). Dit risico berekent men ook in de controlegroep (R0). Het relatief risico (RR) is R1/R0; bij een waarde groter dan 1 heeft de interventie een grotere kans op het eindpunt, en bij een waarde kleiner dan 1 heeft de interventie een kleinere kans op het eindpunt. Men kan een 95%-betrouwbaarheidsinterval eromheen berekenen om de precisie te schatten. Hoe smaller het betrouwbaarheidsinterval, des te preciezer is de schatting. De absolute risico’s kunnen ook van elkaar worden afgetrokken, men krijgt dan het risicoverschil (R1-R0). De reciproke hiervan wordt vaak gegeven als ‘het aantal nodig om te behandelen om een (ongunstig) eindpunt te voorkomen’. Het gebruik van deze intuïtief aantrekkelijke maat kent echter een aantal problemen (zie ook hoofdstuk 1.4). Een uitkomst in een gerandomiseerd onderzoek kan ook continu zijn. Men wil bijvoorbeeld nagaan of een medicatie effectief is om de bloeddruk te doen dalen. In dit geval is de meest voor de hand liggende analyse de vergelijking van de gemiddelde bloeddrukdaling in de interventiegroep met die in de niet behandelde groep. De effectmaat is in dit geval dus het verschil in de gemiddelden. Literatuur Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996. Pocock SJ. Clinical trials. A (computer)practical approach. Chicester- New York - Brisbane Toronto - Singapore: John Wiley & Sons Ltd., 1983. 2.5 BIJWERKINGEN 2.5.1 Inleiding Niet-experimenteel onderzoek (observationeel onderzoek) is van beperkte waarde bij het bestuderen van het effect van behandeling. Zoals hiervoor beschreven is dat vooral het gevolg van fenomenen als regressie naar het gemiddelde en confounding-by-indication. De onbedoelde effecten of bijwerkingen van geneesmiddelen kunnen heel goed in niet experimenteel onderzoek worden bestudeerd. Dit is in het bijzonder het geval omdat het probleem van confounding-by-indication niet speelt. De ziekte, dat is de indicatie waarvoor het geneesmiddel dat leidt tot de bijwerking wordt gegeven, is immers in het algemeen niet gerelateerd aan die bijwerking. Hieronder wordt in het kort een opsomming gegeven van de verschillende onderzoeksmogelijkheden om bijwerkingen te bestuderen (zie ook tabel 1-3-1). 2.5.2 Onderzoeksvormen 2.5.2.1 Case report Het case report of de patiëntenserie is van oudsher een zeer belangrijke bron van kennis over bijwerkingen. Als voorbeelden kunnen worden gegeven: de agranulocytose na analgeticagebruik, de retroperitoneale fibrose na gebruik van de bèta-blokkeerder practolol, en meer in het verleden de retrolentale fibrose na zuurstof-toediening bij premature baby’s en het optreden van vulvacarcinoom bij dochters van moeders die tijdens de zwangerschap diethylstilbestrol hadden gebruikt. Een recent voorbeeld is het vermeende hogere risico op acuut myocardinfarct bij sildenafil gebruik. Dit werd beschreven in The Lancet naar aanleiding van één 65-jarige patiënt. Zoals te verwachten ontstond discussie of de patiënt die beschreven werd niet al voorafgaand aan het gebruik van sildenafil een verhoogd risico op myocardinfarct had, in het bijzonder of de man niet aan een hyperlipidaemie leed. 2.5.2.2 Cohortonderzoek Cohortonderzoek of follow-up onderzoek kan goed worden gebruikt om bijwerkingen na te gaan. Hierbij wordt een indexgroep van gebruikers van het geneesmiddel vergeleken met een referentiegroep van mensen die het geneesmiddel niet gebruiken. Een belangrijk principe in het selecteren van de referentie-groep is dat het basisrisico van een bijwerking in de referentiegroep even groot moet zijn als dat in de indexgroep. 97 KWO Met andere woorden: indien de indexgroep geen geneesmiddel zou hebben gebruikt, zouden er evenveel ‘events’ die als bijwerkingen worden aangeduid moeten zijn opgetreden als in de referentiegroep. Dit onderzoekdesign wordt toegepast in zogenoemde ‘post-marketing' surveillance van geneesmiddelen. Patiënt-controleonderzoek kan uitstekend worden toegepast om zeldzame bijwerkingen vast te stellen. De patiëntengroep wordt dan gevormd door de ziekte die het gevolg is van de bijwerking (bijvoorbeeld agranulocytose), en een referentie- of controlegroep wordt gevormd door een groep mensen die deze ziekte ten gevolge van de bijwerking niet heeft (het kan overigens heel wel een andere ziekte zijn). In een patiënt-controleonderzoek wordt dan de frequentie van geneesmiddelengebruik tussen de patiëntengroep vergeleken met die van de referentiegroep. Zo wordt het gebruik van analgetica in de agranulocytosegroep vergeleken met het gebruik van analgetica in de referentiegroep. Een recent voorbeeld waarin deze onderzoek-opzet in een Nederlands onderzoek is gebruikt, betreft het onderzoek naar plotse hartdood als mogelijke bijwerking van patiënten die voor hypertensie met niet-kaliumsparende diuretica worden behandeld. In dit patiënt-controleonderzoek werden patiënten met hypertensie die plotseling overleden vergeleken met vergelijkbare hypertensiepatiënten die niet overleden. De frequentie van het gebruik van diuretica, en met name niet-kaliumsparende diuretica, werd vastgesteld. Zo kon worden nagegaan of er een oversterfte was bij patiënten die nietkaliumsparende diuretica kregen voorgeschreven. Literatuur Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996. Bronvermelding Deze paragraaf is gebaseerd op: Burger H, Hofman A. Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red). Interne Geneeskunde. Houten: Bohn Stafleu van Loghum, 2001: paragraaf 1-7-2 (Veiligheid van therapie). 2.6 SCREENINGSONDERZOEK 2.6.1 Inleiding Screening of vroege opsporing houdt in dat men personen die geen medische hulp zoeken gaat testen op de aanwezigheid van een afwijking. Hoewel vele aandoeningen zich in principe lenen voor screening, richt dit hoofdstuk zich vooral op de meest typische vorm ervan, namelijk die op voorstadia van kanker. De meest bekende voorbeelden betreffen baarmoederhalskanker en borstkanker. Door een uitstrijkje van de baarmoederhals te maken beoordeelt men een grote hoeveelheid cellen op premaligne veranderingen en door het maken van een röntgenfoto van beide borsten screent men de borst op de aanwezigheid van kanker. Op deze manier kan men in een vroeg stadium tumoren opsporen die anders pas jaren na het moment van screening tot klachten zouden hebben geleid. Screening lijkt op het eerste gezicht heel aantrekkelijk omdat men de ziekte in een vroeg stadium opspoort en behandelt, hetgeen de prognose meestal gunstig beïnvloedt. In het geval van kanker betekent vroegere detectie een geringere kans op uitzaaiing. Een belangrijk nadeel van screening daarentegen, is dat men in het algemeen zeer veel mensen moet screenen om slechts enkele tumoren op te sporen. Zo vertonen bijvoorbeeld ongeveer 3 van de 1000 uitstrijkjes premaligne afwijkingen en zijn lang niet alle verdachte uitstrijken ook werkelijk een voorstadium van kanker (foutpositieven). Daarnaast kan screening veel ongerustheid teweeg brengen. Ook is het niet altijd zo dat tumoren die via de screening ontdekt worden, vervolgens ook succesvol behandeld kunnen worden. Indien de patiënt moeilijk kan leven met deze wetenschap dan heeft men eigenlijk alleen maar schade toegebracht. Voor de vroege opsporing van longkanker zijn in het verleden wetenschappelijke onderzoeken uitgevoerd waarin de waarde van de thoraxfoto werd onderzocht. Hier kwam uit dat de thorax-foto niet gevoelig genoeg was voor de opsporing van hele kleine longtumoren, waardoor resectie van de tumor wel mogelijk was, maar niet tot genezing leidde. Er bestaat nu een nieuwe techniek: spiraal CT (computer tomografie), die een grotere gevoeligheid heeft dan de thoraxfoto. Of screening met spiraal-CT ook werkelijk tot minder longkankerdoden leidt, is nog niet bekend. Voordat men kan gaan screenen moet aan veel voorwaarden voldaan zijn. Behalve dat men een goede screenings-test moet hebben, die acceptabel en niet invasief is, moet er ook een goede behandeling zijn en moet screening uiteindelijk leiden tot minder klinisch manifeste ziekte en sterfte. 98 KWO 2.6.2 Onderzoeksopzet 2.6.2.1 Determinant-uitkomst relatie Screeningsonderzoek wordt opgezet als diagnostisch onderzoek of als interventie-onderzoek, afhankelijk van de precieze vraag. De vraag of screening effectief is wordt bij voorkeur in een gerandomiseerd experiment beantwoord, waarbij de determinant bestaat uit het geheel van vroege opsporing en het daaraan gekoppelde verdere beleid, en de uitkomst meestal uit sterfte. De vraagstelling wordt in feite net zo beantwoord als bij iedere andere interventie (medicatie, chirurgische ingreep); zie hoofdstuk 2.4. Bij een screeningsvraagstuk kan echter ook de diagnostische waarde van de test centraal staan. Bij de evaluatie van de diagnostische waarde van een screeningstest moet men zich realiseren dat het vrijwel altijd de waarde van één specifieke test is ten aanzien van de vroegdiagnostiek van een aandoening. Het gaat immers om VROEGdiagnostiek, op een moment dat meestal nog geen klachten of symptomen, laat staan testuitslagen, aanwezig zijn. Dit maakt de typische determinant-uitkomstrelatie bij screeningsonderzoek anders dan bij diagnostisch onderzoek, waarbij immers de waarde van een test gegeven een aantal andere testuitslagen wordt geëvalueerd. De determinant is dus de te onderzoeken screeningstest, bijvoorbeeld de mammografie van de borst of het uitstrijkje van de baarmoederhals, en de uitkomst is de kans op ziekte, in casu borstkanker. In formule: P(Z) = ƒ (screeningstest) waarbij P(Z)= kans op ziekte volgens de referentietest, en de variabele tussen haakjes de determinant. De uitkomst van het diagnostische deel van de evaluatie, ziekte, wordt vastgesteld met behulp van de referentietest, ook wel aangeduid als de ‘gouden standaard’. Bij vrouwen met een mammogram verdacht voor borstkanker zal een biopt de referentietest zijn. Om de sensitiviteit van het mammogram (de screeningstest) te bepalen terwijl niet bij alle vrouwen (alleen bij degenen met een hoge verdenking) een biopt van de borst kan worden genomen, moeten ook de zogenaamde intervalcarcinomen bij de berekening worden betrokken. Intervalcarcinomen zijn gedefinieerd als die carcinomen die worden ontdekt in het tijdsinterval tussen de screening en de follow-up. 2.6.2.2 Domein Het domein van een screeningsonderzoek is de theoretische definitie van de patiëntenpopulatie bij wie de te evalueren diagnostische testen in de praktijk zullen worden toegepast. De setting waarin het probleem zich afspeelt is belangrijk voor het domein, dus bijvoorbeeld huisartspraktijk, tweede lijn, of consultatie-bureau. Een screeningstest wordt meestal uitgevoerd in de algemene bevolking, vaak met een bepaalde leeftijdsrestrictie. Voorbeelden zijn screening naar borstkanker bij alle Nederlandse vrouwen tussen de 50 en 75 jaar, en de screening naar baarmoederhalskanker bij alle Nederlandse vrouwen tussen 30 en 50 jaar. Als men op longkanker zou willen gaan screenen, zou men dat bijvoorbeeld kunnen doen bij rokende mannen van 50-70 jaar. 2.6.3 Uitvoering 2.6.3.1 Algemeen De diagnostische eigenschappen van een screeningstest kan men niet beantwoorden in een crosssectioneel onderzoek zoals de gewone diagnostische vraagstelling, omdat ook de follow-up van de proefpersonen van belang is. 2.6.2 Onderzoekspopulatie Bij de uitvoering van screening zal men eerst de patiëntenpopulatie definiëren waarbij men de ziekte wil opsporen. Dit is de onderzoekspopulatie die de kenmerken van het domein moet hebben, bijvoorbeeld 50-75 jarige vrouwen. 2.6.3.3 Determinant Het is hierbij van belang dat de test in het onderzoek op dezelfde manier wordt uitgevoerd (inclusief verslaglegging) als in de praktijk. Gebeurt dit niet, bijvoorbeeld veel nauwkeuriger, dan valt de waarde van de test zoals die in het onderzoek werd gevonden waarschijnlijk in de praktijk erg tegen. 99 KWO Men moet het erover eens zijn wat afwijkend is en wat niet, en de testuitslagen moeten reproduceerbaar zijn. In screening heeft men niet alleen te maken met duidelijke stadia van kanker maar ook met allerlei voorstadia waarvan niet bekend is of zij ook werkelijk maligne zullen ontaarden. Behalve uitslagen waarin geadviseerd wordt histologisch onderzoek te doen, zal dan ook vaak het advies ‘screeningstest’ herhalen worden gegeven. 2.6.3.4 Uitkomst 1) Diagnostische vraagstelling: Een procedure of test die in praktijk wordt gebruikt om bij bestaande twijfel de doorslag over de aan- of afwezigheid van een aandoening te geven, kan worden beschouwd als een geschikte referentietest voor wetenschappelijk onderzoek. Voor de referentietest gelden dezelfde overwegingen als in hoofdstuk 2.2 genoemd. Omdat het niet mogelijk is bij de vrouwen met een negatief mammogram ook een biopt te doen (ook niet in een evaluatie situatie) zal uit een combinatie van de terecht positieven en de follow-up (intervalcarcinomen) de sensitiviteit van de test moeten worden geschat. 2) Interventie vraagstelling: Vrijwel altijd is de uitkomst bij de evaluatie van screening de sterfte aan de betreffende ziekte, niet het optreden van de ziekte zelf. 2.6.4. Data-analyse Data-analyse bij het berekenen van de testeigenschappen van een screeningstest is relatief simpel. Men stelt een tabel op als tabel 2-6-1 en men kan sensitiviteit, specificiteit en voorspellende waarden uitrekenen. Tabel 2-6-1 Screeningstest Sensitiviteit Pos Neg Referentietest Pos Neg A B C D A+C B+D A+B C+D Totaal Specificiteit A A C Positief Voorspellende Waarde A A B D B D Negatief Voorspellende Waarde D C D De sensitiviteit is de kans op een positieve testuitslag bij de zieken. De specificiteit is de kans op een negatieve testuitslag bij de niet-zieken. De positief voorspellende waarde is de kans op ziekte bij de mensen met een positieve testuitslag. De negatief voorspellende waarde is de kans op afwezigheid van ziekte bij de mensen met een negatieve testuitslag. De aard van de ziekte (hoe erg is het om de ziekte te missen) die men wil opsporen en de invasiviteit van de referentietest (hoe schadelijk is de referentietest bij iemand die uiteindelijk de afwijking niet blijkt te hebben) bepalen hoe men sensitiviteit en specificiteit tegen elkaar afweegt. Bij screening zal men in het algemeen niet geneigd zijn om veel fout-positieven te accepteren, zeker als de referentietest invasief is, omdat het hier om mensen zonder klachten gaat. In het voorbeeld van screening op borstkanker is de referentie-test het mammabiopt. Iedere vrouw met een verdacht mammogram zal een mammabiopt moeten ondergaan. Testeigenschappen van een screeningstest zijn vaak pas na jaren te bepalen omdat de follow-up bij de analyse moet worden betrokken. De dataanalyse van het screeningsonderzoek als interventie is gelijk aan die van een gerandomiseerd experiment (zie hoofdstuk 2.4). 2.6.5 Evaluatie van screening De evaluatie van screening als interventie geschiedt bij voorkeur door het uitvoeren van een gerandomiseerd onderzoek. De ene helft krijgt met een bepaald interval screening aangeboden (iedere 5 jaar bij de screening op baarmoederhalskanker, iedere 2 jaar bij de screening op borstkanker) en de andere helft niet. De sterfte aan de desbetreffende ziekte in de beide groepen wordt na een aantal jaren vergeleken en op deze manier kan worden vastgesteld of screening leidt tot een reductie en zo ja, hoe groot die reductie is. Vaak worden hier ook de kosten bij betrokken (kosteneffectiviteitsonderzoek) en wordt uitgerekend hoeveel een gewonnen levensjaar kost. 100 KWO Het evalueren van screening is dus een kostbare en langdurige bezigheid. Bovendien is het moeilijk uit te leggen dat screening lang niet altijd beter is en eist de populatie (of de politiek) in de controlegroep ook screening omdat men het gevoel heeft dat hen iets goeds wordt onthouden. Dit overkwam onderzoekers in de jaren 70 bij de opzet van een wetenschappelijk onderzoek naar baarmoederhalskanker. De politiek verhinderde een gerandomiseerd experiment waardoor er altijd twijfels zijn blijven kleven aan de effectiviteit van deze vorm van screening. Alleen nieuwe vormen van screening kunnen goed geëvalueerd worden in een gerandomiseerd experiment. Zo gauw de test (bijvoorbeeld de echo van de aortadiameter) gemakkelijk verkrijgbaar is wordt de vraag naar screening in de controlearm zo groot, dat het effect van screening wordt verdund. Om het effect van screening aan te tonen zijn duizenden mensen nodig omdat de incidentie van kanker relatief laag is. Aan andere manieren van evaluatie, zoals het vergelijken van een gescreende en niet gescreende populatie, kleven belangrijke nadelen. Het vergelijken van overlevingscijfers in de gescreende en niet gescreende groep leidt tot een onterecht gunstiger overlevings-cijfer in de gescreende groep doordat de ziekte door screening eerder onderkend wordt. De overleving is immers de periode tussen onderkenning van de ziekte en het tijdstip van overlijden aan de ziekte. Dit wordt ook wel ‘lead time’ bias genoemd en ontstaat omdat de diagnose wordt vervroegd terwijl het tijdstip van overlijden hetzelfde is. Length-time bias ontstaat omdat men met screening relatief meer langzaam groeiende tumoren opspoort die over het algemeen een gunstiger prognose hebben. Voor een nadere bespreking van screening verwijzen wij naar de literatuur. Literatuur [1] VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997 [2] Hennekens CH, Buring JE, Mayrent SL (eds). Epidemiology in medicine. Boston/Toronto: Little, Brown and Company, 1987 101 KWO 102 KWO Hoofdstuk 3 UITVOERING VAN ONDERZOEK 3.1 DATA VERZAMELING, MANAGEMENT EN ANALYSE 3.1.1 Inleiding Wetenschappelijk onderzoek kan niet zonder gegevens ofwel data. Om de kwaliteit van de data te verhogen is het zinvol om direct bij de opzet van een studie na te denken over hoe de data verzameld gaan worden en de wijze van verwerken, zodat uiteindelijk een databestand ontstaat waar de statistische analyses mee uitgevoerd kunnen worden. 3.1.2 Proefpersonen Alvorens met een onderzoek te beginnen, is het nodig na te denken, hoe de benodigde proefpersonen het beste bereikt kunnen worden. Als het om patiënten gaat, zal het vaak wenselijk zijn dat ze door hun eigen behandelaar gevraagd worden deel te nemen aan het onderzoek. Betreft het gezonde mensen, dan is het soms mogelijk deelnemers aan een eerdere of nog lopende studie weer te benaderen voor het nieuwe onderzoek. Dit heeft als voordeel dat eerdere deelnemers vaak goed gemotiveerd zijn om aan onderzoek deel te nemen. Soms kunnen patiënten met een bepaalde aandoening geïdentificeerd worden via een bestaande registratie, zoals de kankerregistraties. Werving via een advertentie in de lekenpers, dan wel telefonisch middels ‘random digit dialing’, zijn enkele andere mogelijkheden om aan deelnemers te komen. 3.1.3 Data verzameling De relevante data kunnen van verschillende kanten komen. Voorbeelden hiervan zijn medische dossiers, waarin informatie is vastgelegd, de patiënt zelf die een vragenlijst invult, en onderzoeksassistent/onderzoeker die vragen stelt en metingen verricht. Hoe beter de wijze van gegevensverzameling is uitgedacht, hoe minder problemen er later te verwachten zijn. 3.1.3.1 Algemene aandachtspunten Een aantal aandachtspunten leiden samen tot een goede gegevensverzameling. Het is belangrijk dat met alle betrokkenen (onderzoekers, onderzoeksassistenten, verpleegkundigen) besproken is hoe je de meet-instrumenten moet gebruiken. Gebruikelijk is hiervoor een Standard Operating Procedure (SOP) te schrijven, waar iedereen zich aan dient te houden. Een SOP bevat een gedetailleerd werkvoorschrift, opgesteld op een wijze die ervoor zorgdraagt dat iedereen de meting zou kunnen uitvoeren. Dit waarborgt uniformiteit in het onderzoek. Alleen al een simpele meting als de tailleomtrek kan op zeer verschillende wijzen worden uitgevoerd, hetgeen resulteert in sterk variërende meetresultaten die alleen een reflectie zijn van verschillen in meettechniek en niet van biologische verschillen tussen proefpersonen. Bespreek met collegae en begeleiders of alle gegevens die verzameld moeten worden ook daadwerkelijk in de lijst staan en stel niet-relevante vragen of metingen aan de orde. 3.1.3.2 Aandachtspunten voor vragenlijsten Draag er zorg voor dat alle betrokken goed zijn geïnstrueerd en hebben geoefend met de vragenlijsten. Het is belangrijk voor de geloofwaardigheid van de onderzoeksgegevens dat, waar mogelijk, een gevalideerde vragenlijst gebruikt wordt. Van een gevalideerde vragenlijst is namelijk bekend dat de antwoorden op de vragen inderdaad meten wat gemeten moet worden. Daarnaast is vaak de reproduceerbaarheid van de vragenlijst bekend. Van groot belang is dat de formuleringen helder zijn. Dat wil zeggen dat elke vraag maar één onderwerp heeft en dat er geen combinaties gemaakt moeten worden. De vragen dienen begrijpelijk te zijn voor de doelgroep en de antwoordmogelijkheden moeten aansluiten bij de vraag. Het moet duidelijk zijn wat er ingevuld moet worden. Geef de invuller niet onbeperkt de ruimte in zijn antwoorden, maar stel bij voorkeur gesloten vragen. Een veel gemaakte fout is dat de antwoordcategorieën elkaar niet uitsluiten. De mogelijkheid ‘nee’ aan te kruisen, (i.p.v. ‘afvinklijstjes’) is belangrijk omdat het dan duidelijk is dat het item niet vergeten is. Soms zijn er meerdere antwoorden mogelijk, zet dat er dan duidelijk bij. Wil men open vragen stellen, bedenk dan vooraf goed wat er uiteindelijk met de antwoorden moet gebeuren. Vaak brengen open vragen veel werk met zich mee en hebben ze maar beperkte waarde. Wanneer er meerdere vragen nodig zijn om uiteindelijk een score te bepalen, controleer dan of alle relevante vragen opgenomen zijn door de berekening alvast te 103 KWO maken. Een vragenlijst dient natuurlijk gemakkelijk in te vullen te zijn. Aandacht voor de lay-out is hierbij heel belangrijk. Bij het maken van de lay-out moet men al denken aan de wijze van verwerken. Vooral als de gegevens handmatig ingevoerd worden is het handig dat de codes die bij de antwoorden horen al bij de aankruishokjes staan. Verder dienen op elke vragenlijst, en soms op elke pagina van de vragenlijst, relevante identificeerbare gegevens (bijvoorbeeld een patiëntnummer) opgenomen te zijn. Tenslotte verdient het de voorkeur de vragenlijsten bij de doelgroep te testen voorafgaand aan het onderzoek, of in een pilot studie. 3.1.3.3 Aandachtspunten voor metingen Bij het doen van metingen aan proefpersonen, bijvoorbeeld het meten van de bloeddruk, staat voorafgaand aan het onderzoek het testen van de meting voorop. Tevens krijgt men dan een idee hoe de databestanden eruit komen te zien en welke waarden de meting kan aannemen. Ook moet het duidelijk zijn bij wie de gegevens uit de meting horen. Zij moeten immers later gekoppeld worden aan de gegevens van de vragenlijst. Het uitvoeren van reproduceer-baarheidsonderzoek voorafgaand aan het onderzoek is belangrijk, met name voor nieuwe metingen. Maar ook wanneer oude technieken gebruikt worden, zal men moeten laten zien dat in hun handen de metingen reproduceerbaar zijn. 3.1.4 Invoer van gegevens 3.1.4.1 Data dictionary Zodra de formulieren en de metingen klaar zijn, is het tijd om na te denken over hoe die gegevens in de computer gezet worden. Voordat begonnen wordt, dient een uitgebreide beschrijving van de dataset beschikbaar te zijn, een zogenaamde ‘data dictionary’ (code-boek). Dit is een document waarin van elke variabele naam, label, waarden, ranges, coderingen voor ‘missing’, et cetera beschreven staat. Een voorbeeld van een deel van een data dictionary (codeboek) is weergegeven in tabel 3-1-1. 3.1.4.2 Invoer in de computer Bij grote aantallen formulieren is het zinvol een computerprogramma te kiezen waar de gegevens ‘automatisch’ ingelezen worden. Vaak zal het echter zo zijn dat de gegevens handmatig ingevoerd worden. Het beste is om daarvoor invoerschermen te maken in bijvoorbeeld de ‘data entry’ module van SPSS of het databaseprogramma Access. Het invoerscherm lijkt erg op het papieren formulier, en bij elk antwoord is het mogelijk precies op te geven wat er ingevoerd mag worden. Zo worden grove invoerfouten voorkomen. Daarnaast is het wel van belang dat er bij een steekproef gecontroleerd wordt of er niet teveel invoerfouten zijn gemaakt. Dit kan door bijvoorbeeld 10% van de formulieren een tweede keer in te voeren en de twee bestanden door SPSS te laten vergelijken. Bij meer dan 5% fouten bij de eerste invoerder is de kwaliteit niet goed genoeg en is actie nodig. In sommige gevallen worden de meetresultaten eerst op papier gezet en vervolgens ingevoerd. Voor deze benadering gelden dezelfde normen als voor een vragenlijst. In andere gevallen, bijvoorbeeld laboratoriumbepalingen, komen gegevens direct in digitale vorm beschikbaar (Excel bestand, ascii bestand). Van belang is ook om van deze bestanden een beschrijving te hebben van de inhoud en lay-out alsmede een beschrijving van de procedure die gevolgd wordt bij de koppeling van de laboratoriumwaarden aan de vragenlijstgegevens. 3.1.4.3 Tips voor invoer Gebruik consistente coderingen voor antwoordcategorieën die vaak terugkomen (1= ja, 0=nee). Neem de codes mee in de lay-out van het formulier door voor de aankruishokjes heel klein een cijfer te plaatsen. Laat het programma subvragen overslaan als de hoofdvraag ‘nee’ is. Gebruik altijd een vaste code als er geen antwoord is ingevuld, bijvoorbeeld ‘999’, en als vragen niet van toepassing zijn, bijvoorbeeld ‘888’. Begin elke nieuwe pagina op een nieuw scherm. Controleer altijd het identificatienummer. 104 KWO Tabel 3-1-1 Onderzoeksnaam: Bestandsnaam: Datum gemaakt: Gemaakt door: Variable naam MI SMART Study SMART questionnaire 01-01-2001.sav 01 01 2001 Dr S. Pannend Label Myocard infarct Waarden Ranges Format * Code voor missing 9 0=nee 1,2,9 F1.0 1=ja 9=niet ingevuld SYSBP Systolische 80-250 80-250, F3.0 999 bloeddruk 999=niet gemeten 999 (in mmHg) HDLCHOL HDL 0,1-2,5 0.1-2,5,99 F3.1 99 cholesterol 99=missing (in mmol/l) KKARWEI Kleine 1=zonder moeite 1,2,3,4,5,9 F1.0 9 karweitjes 2=enige moeite doen 3=veel moeite 4=onmogelijk 5= met hulpmiddel 9=niet ingevuld *F: ‘floating point’ genoteerd; F3.1 betekent 3 cijfers met 1 cijfer achter de komma 3.1.5 Datacontrole Als de gegevens zijn ingevoerd komt de data controle. Eerst wordt de compleetheid van de gegevens gecontroleerd: zijn alle formulieren van een deelnemer wel ingevoerd, welke gegevens ontbreken en welke zijn alsnog te achterhalen (bijv. in een dossier, of vragen aan de deelnemer). Het gebruik van een code voor ‘niet van toepassing’ helpt de echte missings te selecteren. Vervolgens wordt gekeken of de gegevens wel logische waarden hebben door per gegeven een grenswaarde te stellen. Alle gegevens boven (of onder) die grenswaarde worden nagekeken. Een bloeddruk van 300 mm Hg is op z’n zachtst gezegd onwaarschijnlijk. Als laatste zijn er checks op consistentie: kloppen de antwoorden van vragen die met elkaar samenhangen wel, komen gegevens die meerdere malen gemeten zijn wel met elkaar overeen, etc. Zo zal bijvoorbeeld van personen die aangeven dat ze nooit gerookt hebben, de variabele ‘hoeveel sigaretten rookt u per dag’ niet beantwoord zijn, dan wel de waarde ‘0’ hebben. Is dit niet het geval, dat is er sprake van invoerfouten en zal dit probleem nader moeten worden bekeken. De variabele ‘hoeveel glazen bier per dag’ zal een waarde moeten bevatten voor die personen die eerder aangegeven hadden in de vragenlijst bier te drinken. Ook zal bijvoorbeeld in een dataset de bezoekdatum nooit liggen vóór de geboortedatum. Gegevens over de overgang of over een baarmoederoperatie kunnen niet behoren bij de gegevens van een man, et cetera. 3.1.6 Analysebestanden Als alle controlestappen doorlopen zijn is het databestand gereed voor analyse. Uiteraard is het van belang dat alle variabelen kort en duidelijk omschreven zijn en alle mogelijke antwoord-categorieën ook voorzien zijn van een omschrijving (label). Als er nieuwe variabelen berekend worden of ingedeeld in nieuwe categorieën (bijv. leeftijd in 5-jaars leeftijdscategorieën), maak dan ook direct de omschrijvingen aan, dan is het voor iedereen duidelijk wat er bedoeld wordt. Controleer berekeningen en indelingen door dit met de hand na te rekenen of door frequentie- of kruistabellen te maken. Vraag eventueel een ander om te controleren. Vaak zijn er meerdere analysebestanden bij 1 onderzoek. Gebruik een statistisch pakket om gegevens aan elkaar te plakken. Gebruik daarbij een identificatienummer en controleer altijd of het goed is gegaan. Wanneer de gegevensset gebruikt wordt voor statistische analyse, komen er af en toe toch nog invoerfouten te voorschijn. Deze moeten wederom gecorrigeerd worden. Er zal dus met enige regelmaat een ‘definitief’ analyse- bestand beschikbaar komen. Zorg ervoor dat deze bestanden goed te scheiden zijn door ze bijvoorbeeld specifiek te dateren en ze ‘read only’ te maken. Met name in observationele onderzoekingen komen steeds nieuwe gegevens binnen en zullen dus met regelmaat nieuwe analyse bestanden beschikbaar komen. Vooraf gemaakte afspraken maken duidelijk wanneer nieuwe bestanden te verwachten zijn. 105 KWO 3.1.7 Data analyse 3.1.7.1 Inleiding Het doel van de data analyse is het krijgen van een valide en precies antwoord op de onderzoeksvraag. Dit is geen eenvoudig proces en voor een meer grondige bespreking moeten wij verwijzen naar de literatuur [1,2]. Voor 1970 werd de data analyse vooral gedreven door het bewijzen dat de bevindingen niet toe geschreven konden worden aan 'toeval'. De analyses destijds benadrukten het al dan niet verwerpen van de nulhypothese en het al dan niet statistisch significant zijn van de bevindingen. Dus resultaten van een onderzoek waren significant of niet, een tussenweg was er niet. De huidige zienswijze verlaat het concept van 'wel of niet statistisch significant' als een zwart of wit fenomeen, en richt zich veel meer op het kwantificeren van het verband en de vraag hoe precies (nauwkeurig) het beschreven verband is. In plaats van de bewering dat 'een toegenomen leeftijd significant verband houdt met de hoogte van de systolische bloeddruk' geven we tegenwoordig aan dat 'met het stijgen van de leeftijd van 10 jaar de systolische bloeddruk met gemiddeld 2 mmHg [95% BI 1-3] toeneemt'. De epidemiologie houdt zich dan ook bezig met de bestudering van het kwantitatieve verband tussen ziekte en de factoren die de ziekte bepalen: Uitkomst = F (Determinanten). Deze relatie geldt voor etiologische, diagnostische, prognostische en interventieonderzoeksvraagstellingen. De data analyse omvat een aantal stappen. Dit betreft controle van de verzamelde gegevens (juistheid, compleetheid, consistentie), beschrijving van de gegevens, het schatten van verbanden, en ten slotte, het interpreteren van de gegevens. 3.1.7.2 Beschrijven van de data De beschrijving van de gegevens heeft tot doel de onderzoeker bekend te maken met de variabelen waarmee geanalyseerd gaat worden. Dit betreft natuurlijk het eindpunt (de ziekte) en de determinanten die van invloed zijn op het eindpunt (determinant, verstorende variabelen, effect modificerende variabelen). Bij de beschrijving van de gegevens wordt gebruikgemaakt van frequentie uitdraaien, 2 bij 2 tabellen, gemiddelden, standaard deviatie, minima, maxima, histogrammen en scatter plots, echter zonder gebruik te maken van statistische toetsen. Het gaat hier alleen om beschrijven van de gegevens. Er volgt nu een voorbeeld ter verduidelijking. Tabel 3-1-2 geeft een aantal factoren weer die van belang zijn bij de bestudering van het verband tussen zwangerschapsduur (determinant=zw-duur) en slagaderverkalking in de hals (uitkomst=cca_mean) in het ARYA onderzoek. De onderzoeker wil graag weten van hoeveel personen gegevens beschikbaar zijn, en wat uitersten en gemiddelden zijn. De tabel is als volgt te lezen. Gegevens over zwangerschapsduur zijn aanwezig bij 205 van de 249 deelnemers. De zwangerschapsduur varieerde van 28 tot 43 weken, en was gemiddeld 39.86 weken. Voor de uitkomst (de dikte van de slagaderwand in de hals =cca_mean) zijn gegevens van 220 personen beschikbaar. De dunste wand was 0.40 mm en de dikste wand 0.75 mm, met een gemiddelde voor alle 220 personen van 0.49 mm. De variabele geslacht' gaat van 0 (man) naar 1 (vrouw). Tabel 3-1-2 N Minimu Maximu m m Mean SD Geslacht 249 0 1 ,45 ,50 zw-duur 205 28 43 39,86 1,75 CCA_MEAN 220 ,40 ,75 ,4929 0.05 Geboorte245 gewicht 1430 5100 3404,10 551,64 106 KWO Figuur 3-1-1 geeft de verdeling weer van de systolische bloeddruk in bovengenoemd onderzoek. Uit een dergelijke figuur blijkt dat de verdeling van de systolische bloeddruk redelijk normaal verdeeld is. Tevens zien we uiterste waarden die biologisch wel waarschijnlijk lijken. Figuur 3-1-1 Frequentieverdeling 50 40 30 20 10 Std. Dev = 12,21 Mean = 129,6 N = 252,00 0 100,0 110,0 105,0 120,0 115,0 130,0 125,0 140,0 135,0 150,0 145,0 160,0 155,0 165,0 gemiddelde systolische bd in bezoek 1 3.1.7.3 Schatten van effecten Wanneer de gegevens gecontroleerd zijn en de onderzoeker zich redelijk goed bekendgemaakt heeft met de belangrijkste variabelen, kan de data-analyse beginnen. In eerdere hoofdstukken werd reeds aangegeven hoe de analyse aanpak zou moeten zijn in etiologisch, diagnostisch, prognostisch en interventieonderzoek. De statistische analyse richt zich op de bestudering van de determinantuitkomstrelatie en deze zal in een kwantitatieve vorm dienen te worden weergegeven. Over het algemeen, wanneer de uitkomst een continue variabele is en het een normale verdeling betreft (zie figuur), zoals bijvoorbeeld bloeddruk, kan gebruikgemaakt worden van een (ongepaarde) ttoets of een lineaire regressietechniek. Een t-toets wordt gebruikt bij het nagaan of de gemiddelde waarde, bijvoorbeeld systolische bloeddruk, in de ene groep, bijvoorbeeld mannen, verschilt van die in de andere groep, bijvoorbeeld vrouwen. Elk statistisch rekenprogramma heeft deze mogelijkheid in zich. Een t-toets heeft als uitslag dat het gemiddelde in de ene groep significant verschilt met het gemiddelde in de andere groep. Een nadere kwantificering wordt in de regel niet gegeven. Doordat de gemiddelde waarden in beide groepen gegeven worden in de uitdraai, kan men toch een indruk krijgen van het verschil in gemiddelden tussen beide groepen. Een andere benadering is het lineaire regressie model toe te passen. Een lineair regressie model wordt in eenvoudige vorm weergegeven als Y = a + (b 1X1) + (b2X2) + …… (bnXn) Hierbij is Y de uitkomst, X1 de eerste variabele, bijvoorbeeld leeftijd, en X2 de tweede variabele, bijvoorbeeld geslacht. Dus, Y = a + (b1 * leeftijd) + (b2 * geslacht) Met een dergelijke analyse wordt een schatting gekregen die bijvoorbeeld aangeeft dat met een toename van 1 jaar in leeftijd de bloeddruk met 'b1' toeneemt. In tegenstelling tot de t-toets geeft het lineaire model een kwantificering van het gemiddelde verschil tussen beide groepen en een precisie maat (95% betrouwbaarheidsinterval). Voor verdere bespreking van deze analyse techniek wordt verwezen naar de bestaande leerboeken. 107 KWO Wanneer de uitkomstmaat dichotoom is (een waarde 0 of 1) heeft, kan gebruikgemaakt worden van een chi-kwadraattoets of logistische regressie technieken. Een chi-kwadraat (2)-toets vergelijkt het percentage, bijvoorbeeld rokers, in de ene groep, bijvoorbeeld mannen, met die in de andere groep, bijvoorbeeld vrouwen. Een en ander is altijd in een 2x2 tabel weer te geven: Roken Ja Nee Totaal Man 30 70 100 Vrouw 1545 85 100 Totaal 1575 155 200 Een chi-kwadraattoets gaat na in hoeverre de geobserveerde getallen hetzelfde zijn als de getallen die verwacht zouden kunnen worden, wanneer de percentages in beide groepen identiek zouden zijn. 2 = som alle vier cellen van (Obs-Exp)2 / E Expected wordt berekend door voor elke cel van de 2x2 tabel het rijtotaal te vermenigvuldigen met het kolomtotaal, en dat vervolgens te delen door het totale aantal. In formule: E = (rijtotaal * kolom totaal)/n In ons voorbeeld voor de mannelijke rokers bedraagt dit (45*100)/200. Voor de vrouwelijke niet-rokers bedraagt dit (155*100)/200. Hierna wordt de 2 grootheid berekend door voor elke cel (Observed– Expected)2 uit te rekenen en te delen door Expected en tenslotte deze 4 berekeningen op te tellen. De chi-kwadraattoets geeft weer in hoeverre de percentages significant met elkaar verschillen. Doordat de percentages in tabel vorm worden weergegeven, krijgt men een indruk over het kwantitatieve verschil tussen beide groepen. Een andere benadering betreft de logistische regressietechniek. In eenvoudige vorm wordt dit weergegeven als: Ln [Y/(1-Y)] = b0+ (b1*leeftijd) + (b2*geslacht) Hierbij is Y de kans op ziekte en zijn leeftijd en geslacht de determinanten. De uitdrukking in [Y/(1-Y)] wordt ook wel logit genoemd. De regressie coëfficiënten (b1 en b2) weerspiegelen de natuurlijke logaritme van de odds ratio. De anti logaritme geeft de odds ratio, een maat die in de epidemiologie vaak gebruikt wordt om de sterkte en de richting van een verband aan te geven. Een andere vorm van logistische regressie betreft het Cox proportional hazards model. Voor diepgaande beschrijvingen wordt echter verwezen naar de leerboeken. De lineaire en logistische regressie modellen worden veel gebruikt in epidemiologisch onderzoek. Let wel dat beide technieken toegepast worden in specifieke situaties en dus niet altijd toe te passen zijn. De schattingen van de verbanden, de regressiecoëfficient en de odds ratio, geven op kwantitatieve wijze de richting en sterkte van het verband weer. 3.1.8 Interpretatie Het analyseproces is een tijdrovende aangelegenheid. Wanneer de data geschoond zijn en de statistische bewerking kan plaatsvinden, kost het veel tijd om de onderzoeksvraagstelling te beantwoorden. Ook de statistische analyse is een proces van stappen. Bij elke stap wordt de analyse bekeken en geïnterpreteerd. Dit laatste richt zich met name op de validiteit van het verband (is het echt, of is er nog sprake van vertekening) en de biologische plausibiliteit in het licht van de onderliggende onderzoeksvraag. Vervolgens zal er wederom verder geanalyseerd worden om uiteindelijk te komen tot de meest valide beantwoording van de onderzoeksvraag. Literatuur 1. VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997. 2. Houwelingen van JC, Stijnen Th, Strik van R (red). Inleiding tot de medische statistiek. Utrecht: Bunge, 1995. 108 KWO 3.2 ETHIEK, REGELS EN GOOD CLINICAL PRACTICE 3.2.1 Inleiding Als er klinisch onderzoek wordt uitgevoerd waarbij sprake is van deelname door proefpersonen moeten rechten, veiligheid en welzijn van proefpersonen worden beschermd. Dit is in overeenstemming met de beginselen die hun oorsprong vinden in de Verklaring van Helsinki. Om te waken over rechten, veiligheid en welzijn van proefpersonen, schrijft de Wet Medisch Wetenschappelijk Onderzoek met mensen (WMO) voor, dat onderzoeksvoorstellen vooraf beoordeeld moeten worden door een erkende Medisch Ethische Toetsingscommissie. Veel Nederlandse ziekenhuizen en onderzoeksinstellingen hebben een dergelijke toetsingscommissie. In deze commissie zitten personen met verschillende kennis over wetenschappelijk onderzoek bij mensen. Dat zijn artsen en verpleegkundigen, maar ook methodologen, juristen, ziekenhuisapothekers, huisartsen, deskundigen op het gebied van medische ethiek en personen die het onderzoek vanuit het oogpunt van de proefpersonen beoordelen. De commissie beoordeelt onder andere of: het onderzoek zinvol is er niet teveel risico’s of nadelen voor de proefpersoon zijn er toereikende schriftelijke informatie voor de proefpersonen beschikbaar is de proefpersoon zijn toestemming zelf uit vrije wil kan geven. Als de commissie vindt dat het onderzoek te weinig rekening houdt met de belangen van de proefpersoon, of een te zware belasting vormt, keurt ze het onderzoek niet goed. Voor de onderzoeker betekent dit dat hij zijn onderzoek moet aanpassen. Onderzoekers kunnen dus niet zonder beoordeling en goedkeuring vooraf wetenschappelijk onderzoek bij mensen doen. Artsen mogen wel zonder toetsing en toestemming vooraf onderzoek doen met de gegevens van hun eigen patiënten. Voor onderzoek met geanonimiseerd materiaal, waarbij herleidbare persoonsgegevens niet aan de onderzoeker worden verstrekt, is ook geen toetsing in de zin van de WMO nodig. Wel vraagt de instelling waar het onderzoek plaatsvindt vaak een toetsing van de lokale uitvoerbaarheid van het onderzoek. Verder vragen steeds meer wetenschappelijke tijdschriften dat het onderzoek waarover wordt gepubliceerd, getoetst is door een Medisch Ethische Toetsingscommissie. 3.2.2. Instemmingsprocedure Indien onderzoek bij patiënten wordt uitgevoerd, dient de behandelend arts of een andere zorgverlener potentieel geschikte patiënten te vragen of ze willen deelnemen aan het wetenschappelijk onderzoek. Bij gezonde proefpersonen kan de onderzoeker deze benaderen, o.a. via een algemene oproep in de lekenpers. Hij bespreekt het onderzoek met de potentiële proefpersoon en geeft deze informatie ook op papier. De informatie betreft onder meer: het doel van het onderzoek de interventie die wordt onderzocht hoe het onderzoek is opgezet de eventuele extra belasting van het onderzoek voor de deelnemers de eventuele risico's en bijwerkingen de voordelen die er voor deelnemers kunnen zijn wat er van deelnemers wordt verwacht tijdens het onderzoek. Daarnaast zal de onderzoeker vertellen welke rechten en plichten de deelnemer heeft. Voordat mensen de beslissing nemen om wel of niet mee te doen, dienen ze bedenktijd te krijgen. Het is bij wet verplicht om, voor eventuele vragen, in de beschikbare informatie een onafhankelijk arts te vermelden die niet betrokken is bij het wetenschappelijk onderzoek. Als een deelnemer bereid is om mee te doen, vraagt de onderzoeker een 'informed consent' (‘geïnformeerde toestemming’)-formulier te tekenen. Het ondertekenen is een soort intentieverklaring, die bevestigt dat het onderzoek naar behoren is uitgelegd en dat men vrijwillig medewerking aan het onderzoek verleent. Het wil niet zeggen dat deelnemers zich daarmee verplichten het onderzoek af te maken. Ook degene die toestemming vraagt, dient het formulier te ondertekenen. 3.2.3. Wilsonbekwame en minderjarige proefpersonen De wet biedt proefpersonen die (tijdelijk) niet voor zichzelf kunnen beslissen, extra bescherming. Het 109 KWO gaat om zogenaamde wilsonbekwamen en minderjarigen. Wilsonbekwaam zijn bijvoorbeeld patiënten die in coma zijn, of patiënten die zo ernstig dement zijn dat ze niet meer begrijpen wat er van hen gevraagd wordt. Minderjarigen zijn personen tot 18 jaar. De wetgever hanteert hier een “Nee, tenzij”principe. Dat wil zeggen dat onderzoek met mensen die niet voor zichzelf kunnen beslissen alleen onder zeer strikte voorwaarden is toegestaan. Dat is het geval als het onderzoek aan de deelnemers ten goede komt of als het onderzoek uitsluitend met die groep patiënten uitgevoerd kan worden. En dan mag het alleen als de belasting voor de deelnemers gering is en de risico’s minimaal zijn. Omdat de proefpersoon zelf (tijdelijk) niet kan beslissen, wordt toestemming gevraagd aan een ‘wettelijk vertegenwoordiger’. Meestal is dit iemand van de directe familie of de partner, maar het kan ook iemand anders zijn die daarvoor is aangewezen. Voor kinderen tot 18 jaar wordt om schriftelijke toestemming gevraagd aan de ouders of aan een voogd. Kinderen vanaf 12 jaar moeten daarnaast ook zelf toestemming geven om mee te doen aan het onderzoek. 3.2.4. Rechten en plichten voor proefpersonen De rechten van proefpersonen zijn in wetgeving in de vorm van richtlijnen vastgelegd. De belangrijkste zijn: Recht op vrijwillige deelname Als mensen besluiten om niet mee te doen, mag dat geen nadelige gevolgen hebben voor de behandeling. Recht op het ontvangen van informatie en stellen van vragen> Niet alleen vooraf, maar ook tijdens en na het onderzoek hebben proefpersonen recht op informatie. Recht op tussentijds stoppen met het onderzoek Recht op vertrouwelijke behandeling van de gegevens uit het onderzoek. De gegevens uit onderzoek zijn vertrouwelijk en moeten anoniem verwerkt worden. Ze krijgen een code zodat identificerende informatie kan worden weggelaten. Naast rechten heeft een proefpersoon ook verplichtingen, zoals nuchter komen of resterende geneesmiddelen telkens meenemen. In het geval dat proefpersonen zich niet aan die afspraken houden, kan de onderzoeker de deelname beëindigen. 3.2.5. Overige regels Bij sommige onderzoeken is het noodzakelijk dat andere medische beroepsbeoefenaars weten dat hun patiënt deelneemt aan het onderzoek. De deelnemers dienen hierover schriftelijk geïnformeerd te worden. Wanneer tijdens het wetenschappelijk onderzoek blijkt dat de neveneffecten van het onderzoek schadelijk zijn, of dat de ene behandeling duidelijk betere resultaten oplevert dan de andere, zal het onderzoek beëindigd moeten worden. Wanneer het onderzoek voor een deelnemer persoonlijk een schadelijk effect heeft (en dus niet voor alle proefpersonen), dan zal de onderzoeker de deelname van die specifieke persoon beëindigen. Onderzoekers zijn verplicht te zorgen dat een verzekering is afgesloten waaruit eventuele schade als gevolg van het onderzoek kan worden betaald. In het geval van commerciële belangen van de opdrachtgever, doet de opdrachtgever dat. Anders sluit de instelling waar de onderzoeker werkt een verzekering af. Deze verzekering is door de wet gebonden aan bepaalde voorwaarden over de hoogte van de verzekerde bedragen en de uitsluitingen van verzekering. 3.2.6. Opdrachtgevers De opdrachtgevers voor wetenschappelijk onderzoek met mensen kunnen verschillende instanties zijn. In de specifieke informatie die proefpersonen van de onderzoeker krijgen, hoort te staan wie de opdrachtgever is van het wetenschappelijk onderzoek. Er zijn twee grote categorieën: - De geneesmiddelenindustrie of fabrikanten van medische apparatuur. Zij hebben in hun bedrijf een nieuw medicijn of instrument ontwikkeld dat, voordat het op de markt mag komen, eerst onderzocht moet worden op voldoende effectiviteit en veiligheid. - Speciale onderzoeksfondsen of instituten Voorbeelden zijn collectebusfondsen (bijvoorbeeld Nederlandse Hartstichting, Nierstichting, Kankerbestrijding) en overheidsfondsen (via bijvoorbeeld de Nederlandse organisatie voor Wetenschappelijk Onderzoek (NWO) of ZonMw. 3.2.7 Good Clinical Practice 3.2.7.1 Definitie, doel en historie Good Clinical Practice (GCP) is een internationale standaard voor het ontwerpen, opzetten, uitvoeren, controleren, vastleggen, analyseren en rapporteren van klinisch onderzoek, die zeker stelt dat de 110 KWO gegevens en de gerapporteerde resultaten betrouwbaar en nauwkeurig zijn en dat de rechten, integriteit en vertrouwelijkheid van proefpersonen beschermd worden. GCP heeft de vorm van een gedragscode voor alle partijen betrokken bij klinisch onderzoek: de onderzoeker, de Medisch Ethische Toetsing Commissie en de opdrachtgever. Deze partijen hebben verschillende belangen en daarom is het goed dat er richtlijnen voor hun handelen zijn opgesteld. De twee belangrijkste doelstellingen van GCP zijn: De bescherming van de rechten van de patiënten die meedoen aan klinisch onderzoek. De integriteit van de onderzoeksgegevens waarborgen. Sinds 1990 bestaan GCP richtlijnen voor Europa, die sinds 1994 opgenomen zijn in de Nederlandse wetgeving. In 1996 zijn de bestaande regelgevingen van de Europese Unie, Japan en de Verenigde Staten, alsook van Australië, Canada, de Scandinavische landen en de Wereldgezondheidsorganisatie geharmoniseerd tot één wereldwijd geldend ICH (Int’l. Conference on Harmonisation) richtlijn voor GCP. Het voordeel van deze harmonisatie is dat klinische onderzoeksresultaten die voorgelegd worden aan autoriteiten overal ter wereld geproduceerd kunnen zijn, mits de ICH/GCP richtlijn bij het onderzoek gevolgd is. Voor de harmonisatie kwam het regelmatig voor dat identiek geneesmiddelonderzoek uitgevoerd moest worden in verschillende delen van de wereld teneinde overal een registratie te verkrijgen. 3.2.7.2 Beginselen en toepassing De beginselen van ICH/GCP zijn dezelfde als die verwoord in de paragrafen 3.2.2., 3.2.4 en 3.2.5 van dit hoofdstuk. Verdere beginselen zijn: Als het om een nieuw geneesmiddel gaat moet er voldoende informatie zijn uit eerdere (dier-) experimenten om het nieuwe onderzoek te onderbouwen. De medische zorg en medische beslissingen ten behoeve van de proefpersonen moeten altijd onder verantwoordelijkheid van een bevoegd (tand)arts vallen. Overigens wordt in de GCP richtlijn naast de beginselen ook beschreven wat de precieze verantwoordelijkheden van de verschillende betrokken ‘partijen’ bij een klinisch onderzoek zijn. Bij onderzoek waarvan de gegevens voorgelegd zullen worden aan de bevoegde instanties, zoals de Inspectie voor de Gezondheidszorg of het College ter Beoordeling van Geneesmiddelen, moet men het ICH-richtsnoer voor GCP in acht nemen. De richtlijnen kunnen uiteraard ook worden toegepast op ander klinisch onderzoek dat de veiligheid en het welzijn van proefpersonen zou kunnen beïnvloeden. Er is een handboek voor onderzoek met geneesmiddelen met de vertaling naar de Nederlandse praktijk: het rood-wit-blauwe GCP-boekje. Hierin zijn de integrale tekst van het ICH-richtsnoer voor GCP opgenomen, samen met aanpalende wet- en regelgeving en een bruikbare praktische interpretatie van het ICH/GCP document. 111 KWO 112 KWO Hoofdstuk 4 RAPPORTAGE 4.1 PUBLICEREN 4.1.1 Inleiding Om met Vandenbroucke te spreken: “Zodra men beslist heeft over de vraagstelling …… schrijve men onmiddellijk het artikel waarin de uiteindelijke gegevens zullen worden gepresenteerd” [1]. Dit klinkt provocerend, maar nadere beschouwing zal duidelijk maken dat dit standpunt heel goed is te verdedigen. Hieronder wordt de stelling van Vandenbroucke nader toegelicht, waarbij frequent wordt geput uit een onder auspiciën van het Nederlands Tijdschrift voor Geneeskunde uitgegeven boek: “Publiceren in biomedische tijdschriften” [2]. De vorige hoofdstukken van deze syllabus behandelden de opzet van verschillende vormen van patiëntgebonden onderzoek. Kern daarbij was steeds de vraagstelling. Deze bepaalt hoe een onderzoek het best kan worden opgezet. De vraagstelling bepaalt ook grotendeels de inhoud van de hoofdelementen van een wetenschappelijk artikel: inleiding, methoden, resultaten en discussie. Men kan daarom al lang voordat het onderzoek voltooid is beginnen met schrijven, conform de stelling van Vandenbroucke. De inleiding van een artikel bevat de beschrijving van de achtergronden die hebben geleid tot de formulering van de vraagstelling. In de methoden staat de uitwerking van de onderzoeksopzet. Voor de resultaten kan men al lege tabellen definiëren. In de beschouwing, ten slotte, kan men reeds anticiperen op de mogelijke uitkomsten van het onderzoek, de bijbehorende alinea’s schrijven, en commentaar geven op de gebruikte methoden. 4.1.2 Vormen van publicaties en medische tijdschriften Een artikel waarin de auteurs de resultaten van eigen onderzoek publiceren wordt een “oorspronkelijk artikel” (Engels “original publication”) genoemd. Voorbeelden van andere vormen van publicaties zijn: het overzichtsartikel (‘review’), waarin aan de hand van een aantal oorspronkelijke artikelen de huidige stand van zaken over een onderwerp wordt samengevat en voorzien van de interpretatie van de schrijvers van het overzicht, en verder de beschrijving van een of meer ziektegeschiedenissen (‘case reports’), en commentaren. De laatste categorie, in de Angelsaksische literatuur aangeduid als Editorial, wordt meestal op uitnodiging van de redactie van een tijdschrift geschreven en bespreekt veelal een in hetzelfde tijdschrift gelijktijdig gepubliceerd oorspronkelijk artikel. Tijdschriften laten zich indelen naar lezerspubliek en taal. Enerzijds onderscheidt men de algemene tijdschriften, die zich richten op een brede en grote medische lezerskring, anderzijds zijn er de vaktijdschriften die alleen artikelen over een deelgebied van de geneeskunde publiceren en een veel beperktere oplage hebben. Voorbeelden van de algemene Engelstalige tijdschriften zijn de New England Journal of Medicine (oplage 240.000), de British Medical Journal (160.000), de Lancet (80.000) en de Journal of the American Medical Association (kortweg JAMA). Voorbeelden van Engelstalige vaktijdschriften zijn de Annals of Internal Medicine, Cancer, Stroke, Pediatrics ,et cetera. Deze laatste tijdschriften hebben een oplage van hooguit enkele duizenden exemplaren. Het Nederlands Tijdschrift voor Geneeskunde is een Nederlandstalig algemeen medisch tijdschrift (oplage 30.000). Voorbeelden van Nederlandstalige vaktijdschriften zijn het Nederlands Tijdschrift voor Heelkunde, Tijdschrift voor Sociale Gezondheidszorg, enzovoort. 4.1.3 Het oorspronkelijk artikel Voorbeeld Een fictief interventieonderzoek dient als voorbeeld. De vraagstelling van dit onderzoek is: geneest het eten van wortels jeugdpuistjes (acne)? Achtergrond van deze vraagstelling is de volgende mix van realiteit en fictie. Acne ontstaat door verdikking van de opperhuid, hyperkeratose. Daardoor treedt vernauwing op van de uitmonding van de haarzakjes en kan de talg uit de talgkliertjes niet meer goed worden afgevoerd. Dit leidt vervolgens tot mee-eters (comedomen) en pustels. Op de tienerleeftijd komt acne veel voor en dit wordt als zeer hinderlijk ervaren. Effectieve behandeling is daarom gewenst. Bij muizen is aangetoond dat toevoeging van caroteen aan het dieet reeds aanwezige hyper-keratose vermindert. In wortels komt het geelrode pigment caroteen veel voor. Hoge caroteen-spiegels kunnen leiden tot een geelrode verkleuring van de huid, die soms lijkt op icterus. Het onderzoek, CARROT (Carotene in Acne RegRessiOn Trial), bestond uit een randomised controlled trial bij 200 tieners met acne. De ene helft kreeg aselect een wortelrijk dieet voor-geschreven, de andere groep een wortelvrij dieet. Na drie maanden bepaalde een dermatoloog, die niet op de hoogte was van het gevolgde dieet, 113 KWO de ernst van de acne op basis van gelaatsfoto’s. De hoofdtekst De hoofdelementen van een oorspronkelijk artikel worden samengevat met het Engelse acroniem IMRAD: Introduction, Methods, Results And Discussion. Deze hoofdelementen worden nu achtereenvolgens behandeld. De inleiding beschrijft de achtergrond van de vraagstelling en eindigt met een precieze formulering daarvan. De literatuur wordt daarbij aangehaald om te beschrijven wat de huidige stand van zaken is op het terrein van de onderzoeksvraag. In het geval van ons voorbeeld wordt hier niet alleen geschetst hoe vaak acne op de tienerleeftijd voorkomt en wat de psychologische belasting is van de aandoening, maar ook dat bij muizen met caroteen hyperkeratose in regressie kan worden gebracht. Verder kunt u refereren dat uit vooronderzoek bij de mens is gebleken dat een dieet met tenminste 2 kg wortelen per week bij een groep vrijwilligers haalbaar bleek. De vraagstelling zou u kunnen formuleren als: “In a randomised controlled trial we investigated whether a carrot rich diet is more effective than a carrot free diet in curing acne presenting in the teens.” De methoden dienen de onderzoeksopzet goed te beschrijven zodat de lezer in elk geval de volgende vragen kan beantwoorden: 1. Hoeveel en welke patiënten kwamen in aanmerking voor het onderzoek, hoeveel daarvan namen ook deel aan het onderzoek, en hoeveel (en welke) deden tot het einde mee? 2. Hoe werd(en) de onderzochte determinant(en) theoretisch gedefinieerd en geoperationaliseerd? 3. Hoe werd(en) de onderzochte uitkomst(en) theoretisch gedefinieerd en geoperationaliseerd? 4. Hoe werden de gegevens uit het onderzoek geanalyseerd? Deze vier vragen worden nu voor het voorbeeld kort behandeld. Men zal beschrijven dat de onderzochte patiënten 12 tot 18 jaar oud zijn en acne hebben. Daarbij zal een aanduiding van de ernst van de ziekte nodig zijn (inclusiecriterium, bijvoorbeeld tenminste 10 actieve pustels in het gelaat). Als uitsluiting-criterium kan men onder meer vermelden “lust geen wortels”. Verder zal men beschrijven hoeveel patiënten in aanmerking kwamen, hoeveel er meededen, en hoeveel er tot het einde in het onderzoek bleven. De behandelingen (punt 2) bestaan uit de wortelrijke en wortelarme diëten. Het is essentieel te vermelden dat de behandelingen gerandomiseerd werden voorgeschreven en ook hoe de randomisatieprocedure plaatsvond, bijvoorbeeld door naar een centraal trialbureau op te bellen om de patiënt aan te melden en te vernemen wat de toegewezen behandeling is. Uitkomstmaat van het onderzoek (punt 3) is de ernst van de acne na drie maanden. U moet aangeven hoe die ernst precies wordt vastgesteld, zodat de lezers goed kunnen begrijpen om welke mate van de ziekte het nu gaat. Daarbij kunt u eventueel verwijzen naar een (gevalideerde!) uitkomstschaal die reeds wijd en zijd bij deze ziekte in gebruik is. Maar als die schaal niet bestaat zult u zelf moeten uitleggen hoe u de ernst scoorde. Bijvoorbeeld: “Three months after enrolment, a picture of the face of the patient was taken. Two dermatologists, unaware of the patient’s diet independently, counted the number of active pustules.” De methoden worden besloten met een alinea over de data analyse. In het voorbeeld zou daar in komen te staan dat als effectmaat het verschil van de gemiddelde aantallen pustels na drie maanden werd genomen. Daarbij mag niet worden vergeten dat ook de nauwkeurigheid van de effectschatter (het verschil van de gemiddelden) moet worden beschreven, bij voorkeur met een 95% betrouwbaarheidsinterval. Wanneer u sub-groep analyses hebt gepland, horen deze hier te worden aangekondigd. Ook vermeldt u op deze plaats de aannames die u voor de omvangberekening maakte (zie ook hoofdstuk 5.3). Voor het beschrijven van de resultaten is in principe niet veel tekst nodig. Als het goed is, staan alle essentiële gegevens in tabellen en figuren. Zij moeten wel kort worden besproken. Daarbij is het dus niet de bedoeling de inhoud van de tabellen geheel te herhalen in de tekst – noem alleen de krenten uit de pap. Het kan verhelderend zijn om in een stroomdiagram te tonen welke deelnemers potentieel voor de trial in aanmerking kwamen, welke werden gerandomiseerd en of ze tot het einde meededen. In ons voorbeeld zou dit diagram er als volgt uit kunnen zien: 114 KWO CARROT trial profile 300 teeners willing to participate 100 not randomised: 90 too few pustels 10 carrot aversion 100 randomly assigned to carrot rich diet 2 lost to follow-up 3 diet intolerance 100 randomly assigned to carrot free diet 1 lost to follow-up 95 completed trial 99 completed trial Vrijwel ieder artikel zal in de eerste tabel details geven over de bestudeerde patiënten, de “baselinetabel”. In het geval van een trial is dit een erg belangrijke tabel omdat deze de lezer in staat moet stellen om te kunnen beoordelen of de randomisatie is gelukt, i.e. of de groepen vergelijkbaar zijn. Hier volgt een voorbeeld van de baselinetabel van de CARROT trial: Table 4-1-1 Baseline characteristics according to assigned diet Carrot rich Carrot free Variable diet diet (N=100) (N=100) Mean age ± SD 16.2 (±2.1) 15.8 (±1.9) (years) Girls 41 47 Mean no. Of pustels 18.3 (±5.1) 18.8 (±5.6) ± SD Mean age at onset ± 14.0 (±1.6) 13.8 (±1.5) SD (years) Et cetera … … Voor de hoofdresultaten is het zaak, deze zodanig te presenteren dat de lezer de belangrijkste berekeningen (ongeveer) kan verifiëren. In het geval van klinische eindpunten in een follow-up onderzoek moeten daarom de aantallen worden gegeven en niet alleen de percentages. In ons voorbeeld is het nodig de gemiddelde aantallen pustels in het gelaat na drie maanden te geven. Tabel 4-1-2 toont hoe dit er uit kan gaan zien. In de discussie wordt vaak de volgende structuur aangebracht. Veelal wordt begonnen met een recapitulatie van de hoofdbevinding: “Our findings indicate that a carrot rich diet for three months reduces the mean number of pustels in teenagers presenting with acne vulgaris.” Vervolgens geeft men een inter-pretatie van deze hoofdbevindingen in het licht van voorgaand onderzoek bij mens en dier. Daarin kan onder meer besproken worden in hoeverre de bevindingen overeenkomen met die van eerdere soortgelijke onderzoeken, of waarom er juist verschillen werden gevonden. Een aparte alinea moet worden gewijd aan de methodologische voor- en nadelen van het onderzoek. In het geval van de CARROT-trial kan men erop wijzen dat het onderzoek door de aard van de interventie niet was te blinderen, maar dat de hoofduitkomst desalniettemin blind werd vastgesteld. Voor de secundaire uitkomst “zelfvertrouwen” geldt de vergelijkbaarheid van informatie echter niet: de tieners wisten immers of ze op het worteldieet stonden of niet, en die kennis kan tot een vertekening van de beoordeling van het zelfvertrouwen hebben geleid. De voorlaatste alinea gaat meestal over de toepasbaarheid van de bevindingen en aanbevelingen voor verder onderzoek. 115 KWO Table 4-1-2 Primary and secondary outcomes according to assigned treatment Outcome Carrot rich diet Difference 95%-CI (N=95) Primary outcome Mean number of pustels ± 11.1 ± 5.3 16.3 ± 4.9 5.2 3.8 – 6.6 50 35 p = 0.003* … … … … … SD Secondary outcomes Median self confidence score Et cetera Vindt u dat u op basis van deze trial kunt aanbevelen dat alle jongeren met jeugdpuistjes nu maar veel wortelen moeten gaan eten? Of vindt u alle bewijzen die er nu zijn over de effectiviteit van een *based onnog the te Mann-Whitney U utest; denotes confidence interval. worteldieet mager en stelt nogCI een (grotere?) trial voor? En zijn de bevindingen naar uw mening geldig in alle omstandigheden, ook bijvoorbeeld voor meisjes die de anticonceptiepil gebruiken – daarover verschafte CARROT geen gegevens. Ten slotte volgt de eindconclusie waarin men nogmaals de belangrijkste bevindingen van het onderzoek samenvat. De finesses Wanneer het IMRAD bouwwerk staat, volgt nog de afwerking. Niet alleen moeten inleiding, methoden, resultaten en discussie worden bijgeschaafd, er komen ook nog een paar nieuwe onderdelen aan de beurt. Een daarvan is de samenvatting van het artikel. Besteed hier veel aandacht aan en raffel deze tekst niet af, want dit is het meest gelezen deel van het artikel. Dit deel van de tekst wordt opgenomen in Medline en andere elektronische literatuur-bestanden en het is daarmee snel en gemakkelijk toegankelijk. Wik en weeg daarom wat u hierin kwijt wilt. Binnen de samenvatting worden de afsluitende zinnen (“Conclusion” of “Interpretation”) weer het meest gelezen. Speciale aandacht is dus hier helemaal een vereiste. Ook wordt het nu tijd om een recent exemplaar van de “Instructions for authors” voor het tijdschrift van keuze te lezen. In deze instructies wordt beschreven wat er allemaal op de titelpagina moet komen te staan: titel, auteurs, affiliatie van de auteurs, trefwoorden, naam en adres van de auteur die verantwoordelijk is voor de correspondentie over het artikel (“corresponding author”), en vaak ook nog het totale aantal woorden (voor samenvatting en hoofdtekst (IMRAD) apart), tabellen en figuren, en titel. Veel “gedoe” kan ontstaan over auteurschappen. Het is verstandig daarover vroeg afspraken te maken om latere problemen te voorkomen. Over wie auteur kan zijn van een artikel bestaan richtlijnen, geformuleerd door een groep redacteuren van medische tijdschriften [3]. Iemand komt voor auteurschap in aanmerking in geval van (a) deelname aan ontwerp en opzet, of analyse en interpretatie van gegevens en (b) deelname aan het schrijven van het artikel en (c) het goedkeuren van de definitieve versie. Wetenschappelijke publicaties zijn in de academische wereld immers de “valuta” waarop klinische onderzoekers worden afgerekend: “wie schrijft die blijft”. Ook over de plaats van de auteurs kan discussie ontstaan, maar hierover bestaan geen algemene regels. Wel is de eerste auteur diegene die het leeuwendeel van het werk heeft gedaan, de tweede vaak diens directe begeleider, en de laatste de leider van de onderzoeksgroep. Nadat na diverse versies (zeven of meer is heel gewoon) het uiteindelijke manuscript gereed is, kan het worden verzonden. Veel grote tijdschriften beoordelen eerst op het redactiebureau of het artikel past in het profiel van het tijdschrift. Is dat niet het geval dan krijgt u het snel terug met een afwijzing. Als het potentieel interessant is, gaat het artikel naar twee of drie reviewers die een beoordeling naar het redactiebureau zenden. Op basis van deze rapporten besluit de redactie of het stuk voor publicatie wordt aanvaard (dat gebeurt zelden ineens), of het voor herbeoordeling in aanmerking komt na aanpassingen, of dat het wordt afgewezen. Het is goed zich te realiseren dat bij de grote algemene tijdschriften het afwijzings-percentage hoog is: in de orde van grootte van 90%! Na afwijzing staat het u uiteraard vrij het stuk bij een ander blad aan te bieden - dikwijls worden aanvankelijk geweigerde stukken alsnog elders gepubliceerd. 116 KWO 4.1.4 Motief Waarom eigenlijk al die moeite om een goed wetenschappelijk artikel te schrijven? Er zijn (tenminste) drie argumenten te geven. Allereerst rust er op u de wetenschappelijke plicht om de resultaten van uw onderzoek wereldkundig te maken. Wanneer de bevindingen in de kast blijven liggen heeft niemand er wat aan en is het geld dat aan het onderzoek is besteed, verspild. Een tweede reden kwam al eerder aan de orde: wetenschappelijke publicaties zijn belangrijk voor uw curriculum vitae. Ten slotte kunt u ook schrijven omdat u het leuk vindt: “le plaisir de se voir imprimer”. 117 KWO 118 KWO Appendix A EVIDENCE-BASED MEDICINE Inleiding Inzicht in de fysiologie en pathologie vormde de belangrijkste basis voor het medisch handelen tot en met de eerste helft van de twintigste eeuw. Daarna is in toenemende mate geaccepteerd dat voor adequaat klinisch handelen meer nodig is: gegevens uit klinisch onderzoek die laten zien of een behandeling ook in de praktijk doeltreffend is en of de bijwerkingen het nuttig effect niet overtreffen. De afgelopen decennia is er veel goed klinisch onderzoek gedaan. Tijdschriften als het New England Journal of Medicine, de Lancet, het British Medical Journal (BMJ) en het Journal of the American Medical Association (JAMA) staan elke week weer vol met onderzoeksverslagen die betekenis hebben voor de praktijk. Ervan uitgaande dat het de taak van artsen is, hun patiënten naar beste weten te behandelen, moet de medicus practicus de resultaten van het beste onderzoek in zijn klinisch handelen integreren. Hoe kan dat gebeuren? Leerboeken lopen door hun aard jarenlang achter op tijdschriften. Bijblijven door alle relevante tijdschriftartikelen te lezen is echter ook geen optie. Bijvoorbeeld huisartsen zouden om ‘up to date’ te blijven gemiddeld 19 artikelen per dag moeten lezen en dat 365 dagen per jaar. Het is dus niet gek dat een negatieve associatie bestaat tussen de kennis over bijdetijdse zorg en de jaren verstreken sinds het artsexamen. Sinds de jaren tachtig is vanuit de McMasters Medical School te Hamilton, Canada, het concept ‘Evidence-Based Medicine (EBM)’ ontwikkeld. De gedachte is dat klinische beslissingen gebaseerd dienen te zijn op goede vraagstellingen en dat in de literatuur systematisch moet worden nagegaan wat het beste antwoord is op deze vraagstellingen. EBM probeert onderwijs, onderzoek en de klinische praktijk te integreren. Het behelst een streven om patiënten maximaal te laten profiteren van de beschikbare kennis en het is dus geen bijzondere wijze van het beoefenen van de geneeskunde. De Evidence-Based Medicine beweging De Evidence-Based Medicine Working Group pleitte in 1992 in het medisch tijdschrift JAMA voor wat zij noemen een omslag in het medisch denken en handelen. In grote lijnen kwam het erop neer dat men voorzichtig moet zijn met het gebruiken van informatie gebaseerd op pathofysiologische principes of op klinische ervaring. Deze informatie zou vaak misleidend zijn. Alle medische handelingen met betrekking tot diagnose, prognose en interventie zouden gebaseerd moeten zijn op degelijk numeriek bewijs-materiaal, verkregen met behulp van de "beste" epidemiologische onderzoeken. Men hanteert een ‘hiërarchie van bewijs-materiaal’ om te kunnen beoordelen of de "beste" epidemiologische onderzoeken zijn gebruikt. Bovenaan staat de gerandomiseerde trial. Daaronder komen achtereenvolgens het cohortonderzoek, het patiënt-controle-onderzoek, de case serie en de case report. Een dergelijke indeling wordt nu vaak gehanteerd om medisch wetenschappelijk onderzoek te waarderen. Zo ook door het Kwaliteitsinstituut voor de gezondheidszorg CBO (tabel 5-1-1). Voor het meten van de effectiviteit van interventies wordt de gerandomiseerde trial als enige valide onderzoeksmethode geaccepteerd. Voor de rubriek ‘Prevention or Treatment’ van het tijdschrift Evidence-Based Medicine komen dan ook alleen artikelen in aanmerking die gerandomiseerd onderzoek beschrijven. Cochrane Collaboration Archie Cochrane, een Engelse epidemioloog, hield al meer dan 25 jaar geleden pleidooien voor het systematisch bijeenbrengen van de informatie uit gerandomiseerde onderzoeken tot hele overzichten om zo Evidence-Based Medicine mogelijk te maken. De Cochrane Collaboration die hier uit voortgekomen is, zet zich in om dergelijke overzichten te schrijven en algemeen beschikbaar te maken. 119 KWO Tabel. Indeling van onderzoeksresultaten naar mate van bewijskracht voor interventiestudies (behandeling en preventie) zoals gehanteerd door het Kwaliteitsinstituut voor de gezondheidszorg CBO. Rangnummer A1 A2 2 3 4 Aard van onderzoek Meta-analysen die tenminste enkele gerandomiseerde onderzoeken van A2-niveau betreffen, waarbij de resultaten van afzonderlijke onderzoeken consistent zijn Gerandomiseerd vergelijkend klinisch onderzoek van goede kwaliteit (gerandomiseerde, dubbelblind gecontroleerde trials) en voldoende omvang en consistentie Gerandomiseerde klinische trials van mindere kwaliteit of onvoldoende omvang of ander vergelijkend onderzoek (niet-gerandomiseerd: cohortonderzoek, patiëntcontroleonderzoek) Niet-vergelijkend onderzoek De mening van deskundigen De gerandomiseerde effectiviteitonderzoeken die sinds het einde van de jaren veertig van de 20 e eeuw zijn verricht, worden binnen dit internationale werkverband in een database ondergebracht om op die manier systematische overzichten te kunnen maken. De term systematisch geeft aan dat men expliciet aandacht besteedt aan het formaliseren van methoden van gegevensverzameling en -bewerking, zodat de lezer de gang van zaken kan volgen en zich een oordeel kan vormen over de kwaliteit van het literatuuronderzoek. Deze systematische overzichten staan in een aparte database die zodanig wordt ontsloten (onder andere via http://www.cochrane.nl ), dat iedereen met een druk op de knop een actuele samenvatting van de stand van zaken over de in het bestand opgenomen interventies op het beeldscherm kan krijgen. Evidence-Based Health Care: vier fasen in Evidence-Based Medicine Evidence-Based Medicine betekent: integratie van de resultaten van het meest recente wetenschappelijk onderzoek in het klinisch handelen. Dit vergt een kritische houding ten aanzien van gevestigd klinisch handelen, bereidheid onzekerheden toe te geven, en flexibiliteit. De argumenten “zo doen we het altijd” en “naar onze mening hoort het zo” zouden moeten worden vervangen of aangevuld door “en wel op basis van …”. Om Evidence-Based health care te kunnen bedrijven zijn bepaalde vaardigheden nodig: de kunst en kunde om de goede gegevens te kunnen vinden, deze op validiteit te kunnen beoordelen, en te kunnen vertalen naar de eigen situatie. Men kan Evidence-Based Medicine in de praktijk brengen daar waar twijfel bestaat over de actuele kennis van een bepaald klinisch onderwerp. De volgende vier stappen dienen als handvat om Evidence-Based Medicine in praktijk te brengen. 1) Formuleren van een duidelijke klinische vraagstelling Nadat twijfel over een relevant klinisch probleem duidelijk is geworden, formuleert men een duidelijke klinische onderzoeksvraag (domein, determinant en uitkomst). (Zie ook hoofdstuk 1.2). 2) Zoeken naar literatuur De tweede stap bestaat uit het zoeken naar het beste onderzoek met betrekking tot de vraagstelling. Er worden hiervoor twee typen elektronische ‘databases’ gebruikt. Het eerste is de bibliografische, waarin de gebruiker relevante referenties in de medische literatuur kan zoeken. De bekendste is ‘Medline’, op het internet onder andere beschikbaar op de sites van de Amerikaanse ‘National Library of Medicine’, ‘Pubmed’ (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi ) of ‘HealthWorld Online’ (http://www.healthy.net/library/search/medline.asp ). In het tweede type database krijgt de gebruiker secundaire publicaties over bepaalde klinische vragen, zoals de Cochrane Database, de ACP Journal Club (een tweemaandelijks supplement bij de Annals of Internal Medicine) en Turning Research Into Practice (TRIP) (http://www.tripdatabase.com ). 3) Evalueren van de gevonden literatuur De derde stap bestaat uit het evalueren en kritisch beoordelen van het gevonden onderzoek ten aanzien van validiteit en relevantie. Deze stap is cruciaal, omdat de clinicus hier besluit of het materiaal (artikel) bruikbaar is voor het geformuleerde klinisch probleem. Helaas blijkt een groot gedeelte van het gepubliceerde medisch onderzoek slecht aan te sluiten op de praktijk of inhoudelijk niet valide te zijn. Richtlijnen voor het beoordelen van de gevonden artikelen zijn te vinden in een serie artikelen in de JAMA getiteld “Users’ Guides to the Medical Literature”, gepubliceerd in 1993 en 1994. 120 KWO 4) Implementeren van bruikbare ‘evidence’ in de klinische praktijk Kennis verkregen uit valide en relevant onderzoek kan rechtstreek het medisch handelen sturen of kan verwerkt worden in een protocol of in richtlijnen, zoals de huisartsen-standaarden. De nieuw vergaarde kennis wordt het best geïmplementeerd door middel van discussies tijdens (grote) visites of op refereeravonden die toegespitst zijn op een bepaald klinisch probleem. Veel gehoorde kritiek Naast veel lof is er ook wel kritiek op de ambities van de ‘Evidence-Based Medicine’- beweging. De kritiek betreft onder andere de methode van de meta-analyse waarvan de aanhangers van EvidenceBased Medicine hoog opgeven. Zo kon de effectiviteit van de aanbeveling op grond van metaanalyses om na een hartinfarct magnesium toe te dienen in een grote studie niet worden bevestigd. Een ander bezwaar is de mogelijkheid van selectiebias door het beleid van medische tijdschriften (zie hoofdstuk 5.4). Vraagtekens zijn ook gezet bij het optimisme waarmee de beweging denkt de gehele geneeskunde in al haar facetten te kunnen aanpakken en over de vanzelfsprekendheid waarmee in de eigen autoriteit wordt geloofd. Verder is bezorgdheid geuit over de brede scala van afnemers, die de Cochrane Collaboration voorziet. De vraag is of het wel toe te juichen is als overheidsinstanties en verzekeraars zich zo geïnteresseerd tonen in de resultaten. Ten slotte Beslissingen in de geneeskunde hangen van meer zaken af dan van ‘evidence’. Artsen die goed onderbouwde beslissingen willen nemen baseren zich op meer dan alleen gerandomiseerde trials. Bij het behandelen van de individuele patiënt heeft een integratie van gegevens en redeneringen plaats. Deze integratie gebeurt via probabilistisch denken en via causaal denken. Als je een cardioloog vraagt waarom zij thrombolytische interventie voorschrijft bij een patiënt met een hartinfarct, zal zij niet alleen antwoorden: “Vanwege zus of zo mega-trial”, maar ook gewoon: “Omdat dat het stolsel oplost”. Dit laatste antwoord helpt haar bij het nadenken over de consequenties van de behandeling. Het zal ertoe leiden dat een patiënt die recent een maagbloeding gehad heeft, geen thrombolytische interventie voorgeschreven krijgt. Volledig empirische kennis, zoals eigenlijk gepropageerd door de Evidence-Based Medicine beweging, kan niet bestaan, omdat het geen kennis is. Men kan niets aanvangen met een verzameling van feiten als men geen idee heeft over de pathofysiologie. Evidence-Based Medicine kan zeker een bijdrage leveren aan “goed en toetsbaar handelen” in de geneeskunde, maar inzicht in de etiologie en de pathogenese van ziekte blijven noodzakelijk om de individuele patiënt optimaal te behandelen. 121 KWO 122 KWO Appendix B STEEKPROEFOMVANG Inleiding Bij de planning van onderzoek is het vaak nuttig om een idee te hebben over het aantal personen dat minimaal aan een onderzoek moet deelnemen om een bepaald verband tussen determinant en uitkomst “statistisch significant” aan te kunnen tonen. De formules die voor het berekenen van de minimale groepsgrootte worden gebruikt zijn dan ook gebaseerd op de formules voor statistisch toetsen. Bij deze toetsen gaat men na of de nulhypothese van ‘geen verband’ op grond van de data verworpen moet worden. Men doet dit als de data de nulhypothese zeer onwaarschijnlijk maakt. Voor deze waarschijnlijkheidsgrens wordt traditioneel 0.05 (= ) genomen. Als de p-waarde uit een toets kleiner is dan 0.05 noemt men het verband statistisch significant, wordt de nul-hypothese verworpen, en wordt de “alternatieve hypothese” aanvaard. Het doel is hier niet om de formules voor schatting van de groepsgrootte geheel te doorgronden, maar enkel om ze op juiste wijze toe te kunnen passen. Voor verschillende associatiematen (bijv. verschil in gemiddelden of in proporties) worden verschillende formules gebruikt. Hieronder worden enkele van de meest gebruikte formules gegeven met beknopte uitleg en een uitgewerkt voorbeeld. Nadere informatie is te vinden in handboeken [1,2]. Enige statistische begrippen De volgende begrippen spelen een belangrijke rol bij de schatting van de groepsgrootte. Z = de statistische toetsingsgrootheid. = kans op onterecht verwerpen van nul-hypothese (ook: kans op type I fout, onbetrouwbaarheid of significantieniveau). Voor het meeste onderzoek is = 0.05 een acceptabele grens (maar 5% kans op een type I fout). Bij = 0.05 hoort Z = 1.96. = kans op het niet verwerpen van nul-hypothese, terwijl die niet waar is (ook: type II fout). Vaak is = 0.10 een acceptabele grens, want die komt overeen met een power (1 - ) = 0.90 (90% kans dat als de nulhypothese niet waar is, deze ook inderdaad wordt verworpen). Bij = 0.10 hoort Z 2 = 1.28. Voor de berekening van de groepsgrootte moet men eerst een aantal waarden kiezen, meestal 0.05 voor het significantie niveau , en 0.90 voor de power. Vervolgens dient men in de formules aan te geven hoe groot het verband is dat men aan wil tonen (bijv. een gemiddeld groepsverschil van 10 mm Hg in bloeddruk, een relatief risico van 2 …, etc.). Vervolgens kan in principe voor verschillende situaties bij benadering het benodigde aantal deelnemers worden berekend. Formules en voorbeelden Vergelijking van twee gemiddelden Voor het vergelijken van twee gemiddelden, bijvoorbeeld van het cholesterolgehalte van twee groepen personen, kan men onderstaande formule gebruiken voor een berekening van de benodigde groepsgrootte, 2 Z Z 2 2 n 2 2 1 2 waarbij n = het aantal benodigde personen in elk van de groepen, 1 is het gemiddelde in de referentiegroep (bv placebogroep), 2 is het gemiddelde in de index groep (bijv. behandelde groep) en is de standaard-deviatie van de metingen binnen elke groep (verondersteld wordt dat deze in beide groepen gelijk is). Deze is vaak wel uit de literatuur te halen. Men wil het effect nagaan van een nieuwe HMG-CoA-reductase remmer, Dolor, op het Low Density Lipoprotein (LDL)-cholesterolgehalte in het bloed bij patiënten met een recent myocardinfarct. Ze worden daartoe naar 4 maanden Dolor of placebo gerandomiseerd, waarna in beide groepen het LDLcholesterol gehalte wordt bepaald (parallelle groepen trial). Stel dat het LDL-c bij zulke patiënten gemiddeld 3.5 mmol/L is en de standaard deviatie 1.2 mmol/L. Als Dolor in werkelijkheid een effect heeft van 20% reductie van het LDL-c gehalte, dus een verschil van -0.7 mmol/L, moet dat met een power van 90%, lees 90% zekerheid, in het onderzoek statistisch significant worden. Daarvoor zijn dan minimaal: 123 KWO 2 2 . 128 . 12 . 196 n 2 0.72 62 personen in de placebo en de index-groep, dus in totaal 124 patiënten nodig. Het verschil tussen twee proporties Voor het vergelijken van twee proporties, bijvoorbeeld percentages sterfte tussen twee groepen, kan de volgende formule worden gebruikt om een idee van de benodigde groepsgrootte te krijgen, 2 Z Z2 P1 1 P1 P2 1 P2 2 n 2 P2 P1 P2 P1 waarbij n is het aantal benodigde personen in beide groepen, P1 is de proportie in de referentiegroep en P2 is de proportie in de index-groep. Men wil een zelfde trial als in het eerste voorbeeld doen, maar nu met het percentage overledenen na 5 jaar behandelen als uitkomst. Gemiddeld, zonder Dolor, is na 5 jaar ongeveer 20% van de patiënten overleden (P1 = 0.2). Behandeling met Dolor wordt relevant gevonden als dit percentage met 25% gereduceerd kan worden (P2 - P1 = -0.05). Als Dolor de 5-jaars sterftekans inderdaad met 25% kan reduceren, dan zijn minimaal: n 1.96 1.282 0.21 0.2 0.151 0.15 2 1248 0.05 0.15 0.22 personen in de placebo en de index-groep, dus in totaal 2496 patiënten nodig. Deze formule kan ook worden gebruikt voor de schatting van de groepsgrootte voor het detecteren van een bepaald relatief risico (RR), waarbij p2 = p1 x RR. Equivalentie Soms zijn we niet zozeer geïnteresseerd in een verschil tussen groepen, maar willen we juist aantonen dat er geen verschil is. Dit vereist een speciale aanpak bij de schatting van de groepsgrootte. Deze aanpak wordt geheel aan de hand van het voorbeeld uiteengezet. Stel, men wil een onderzoek doen waarbij de vraag is of het effect van Dolor op de 5-jaars sterfte bij patiënten met een recent doorgemaakt myocardinfarct net zo goed is als het effect van het al langer bestaande maar veel duurdere Calor. Patiënten worden gerandomiseerd naar Dolor- of naar Calorgebruik gedurende 5 jaar. De vraag is nu, gegeven dat de reductie van sterfte bij gebruik van Calor even groot is als bij gebruik van Dolor, hoeveel patiënten nodig zijn om die “equivalentie” met een power van 90% aan te kunnen tonen. De “nul-hypothese” is nu dat de sterftekans in de Dolorgroep hoger is dan in de Calor groep. Deze nulhypothese proberen we te verwerpen. Voor de benodigde aantallen kunnen we de volgende formule gebruiken: Z /2 2P1 P Z P2 1 P2 P1(1 P1) n P2 P1 2 waarbij: Z/2 = 1.65 Z = 1.28 P = (P1 + P2)/2 P1 = 5-jaars cumulatieve sterfte in Calorgroep P2 = 5-jaars cumulatieve sterfte in Dolorgroep = het verschil tussen Calor en Dolor dat we met 90% waarschijnlijkheid willen uitsluiten. Stel: 5-jaars cumulatieve sterfte (P1) onder Calor is 0.10. Aangetoond moet worden dat onder Dolor een zelfde sterftekans (P2) optreedt. We willen een van 5% met 90% waarschijnlijkheid uit kunnen 124 KWO sluiten. Daarvoor zijn bij benadering: 1.65 2 * 0.11 0.1 1.28 0.11 0.1 0.1(1 0.1) n 0.05 2 = 620 patiënten per groep nodig Patiënt-controleonderzoek Vaak wordt gebruik gemaakt van het patiënt-controleonderzoek om bepaalde associaties te bestuderen. In zijn simpelste vorm wordt één determinantfrequentie gemeten bij patiënten met een bepaalde ziekte en bij controles, de niet-zieken. Voor die situatie kan onderstaande formule gebruikt worden om tot een schatting van benodigde aantallen te komen. n Z a 2p q Z 2b p1q1 p0 q0 2 p1 p0 2 waarbij p1 p0R 1 p0 R 1 𝑞=1-𝑝 q1 = 1-p1 𝑝 = (po+p1)/2 q0 1 p0 Er is een mogelijkheid om subsidie te krijgen voor onderzoek naar de effecten bij kinderen van bepaalde stollingsstoornissen. In een academisch kinderziekenhuis wil men daarom het verband nagaan tussen hersenbloedingen bij prematuur geboren kinderen en het al dan niet hebben van een polymorfisme in een gen dat codeert voor een stollingseiwit. Over een periode van ongeveer 2 jaar worden alle nieuwe premature kinderen geselecteerd met een hersenbloeding en een in diezelfde periode geboren groep prematuren zonder hersenbloeding, om in beide groepen de aanwezigheid van het polymorfisme te bepalen. Het is bekend dat in de populatie het polymorfisme bij ongeveer 10% van de mensen voorkomt. Ik neem aan dat dit ook de determinantfrequentie van mijn referentiegroep prematuren is. Hoeveel kinderen heb ik in mijn onderzoek nodig om een relatief risico van 2 te detecteren met = 0.05 en power = 90%? p1 n 0.12 1 0.12 1 0.18 1.96 0.24 1.28 0.15 0.09 0.082 2 394 In totaal zijn dus minimaal 788 patiënten in mijn onderzoek nodig (394 cases en 394 controles bij 1:1 matching). Dit is binnen afzienbare tijd absoluut geen haalbaar aantal binnen mijn kinderziekenhuis. Na nog wat gesleutel: het verlagen van de power en het verhogen van het relatieve risico (m.a.w. als het in werkelijkheid groter dan 2 is, dan kan ik het makkelijker, lees met kleinere aantallen, vinden) blijven forse aantallen kinderen nodig. Overigens ben ik in dit onderzoek geïnteresseerd in de etiologische relatie tussen polymorfisme en hersenbloeding bij prematuren. Ik zou dus in de analyse van dit patiënt-controle onderzoek zeker ook rekening willen houden met andere risicofactoren van hersenbloeding bij prematuren, die mogelijke confounders zijn van de relatie polymorfisme en hersenbloeding. Om dat te kunnen doen zijn nog grotere aantallen patiënten nodig en mijn schatting van 788 is een ondergrens (berekening valt buiten dit bestek). Om zulke aantallen te halen moet zeker worden samengewerkt met andere grote centra, maar waarschijnlijk zelfs ook buiten Nederland. Ik 125 KWO acht dat om verschillende redenen onhaalbaar en besluit daarom maar van dit onderzoek af te zien. Groepsgrootte bij diagnostisch en prognostisch onderzoek Een formele berekeningsmethode voor de benodigde groepsgrootte m.b.t. multivariabele diagnostisch of prognostisch onderzoek bestaat (nog) niet. Om toch enigszins een idee te krijgen van de benodigde grootte van onderzoek om een multivariabele diagnostisch/ prognostisch model te kunnen gebruiken, is de regel van “één op tien” bruikbaar in de planning. Stel, je wilt in huisartsenpraktijken onderzoek doen naar de meerwaarde van 1 nieuwe test t.o.v. 4 al bestaande tests voor het aantonen dan wel uitsluiten van een myocard infarct. Dat wil zeggen dat zich onder de patiënten met verdenking myocard infarct, waarbij je de tests doet, 10 x (1+4) = 50 patiënten moeten bevinden die echt een myocard infarct blijken te hebben. Verder gesteld dat in huisartspraktijken onder personen verdacht voor een myocard infarct ongeveer de helft dat later ook inderdaad blijkt te hebben, dan heb je voor dit onderzoek tenminste 100 personen met verdenking myocard infarct nodig om de diagnostische analyse met gegevens van 5 tests goed te kunnen doen. Tips Tip: de vraag om een groepsgrootte-berekening is een van de meest gestelde aan de statisticus of de epidemioloog. Deze worden nogal eens in een laat stadium bij de opzet van een onderzoek betrokken. Ten eerste hopen we je in deze stage duidelijk te maken dat een groepsgrootte-berekening handig maar tegelijk ook betrekkelijk is. De berekening dwingt je iets aan te nemen over (grootte en relevantie van) associaties, die tegelijkertijd nou ook juist het onderwerp van je onderzoek zijn. In veel, vooral nieuw, onderzoek blijkt dat vaak een moeilijkheid. Toch geeft ook in die situaties een berekening een nuttige schatting van de orde van grootte: gaat het om tientallen, honderden of duizenden? Ten tweede hopen we je duidelijk te maken dat alle berekeningen uiteraard conditioneel zijn op de kwaliteit van de studieopzet. Een berekening op basis van een slechte studieopzet is nutteloos. Vroeg overleg over de opzet is veel belangrijker dan laat overleg over de groepsgrootte! Tip: men stelt nogal eens de vraag “Hoeveel patiënten heb ik nodig in mijn onderzoek om mijn gegevens significant te maken?”. De berekeningen maken niets significant! Ze geven alleen aan onder welke omstandigheden (bijvoorbeeld met hoeveel patiënten) je een associatie statistisch significant kunt aantonen, als die associatie in werkelijkheid ook bestaat. Tip: soms is het maximaal haalbare aantal beschikbare deelnemers/patiënten voor een onderzoek al bekend, bijvoorbeeld als er niet meer patiënten in een kliniek zijn of omdat men bijvoorbeeld in een bepaald ziekenhuis al alle in Nederland bekende patiënten geregistreerd heeft. In zulke gevallen is het mogelijk om met die aantallen te berekenen welke associatie, als die echt bestaat, je kunt aantonen (er is dan gewoon een andere onbekende in de bovengenoemde vergelijkingen). Het is dan zaak om zelf te beoordelen of zo’n associatie ook reëel is. Tip: een groepsgrootteberekening dient niet alleen om jezelf als onderzoeker te overtuigen, maar vooral ook je wetenschappelijke omgeving. Volsta voor bijvoorbeeld een subsidieaanvraag dan ook niet met een zinnetje “Gegeven deze aan te tonen associatie en met een alpha van ? en een power van ? hebben we X patiënten nodig”. Laat zien dat je zo’n berekening zelf als onderzoeker ook reëel vindt en waarom. Literatuur 1. Houwelingen van JC, Stijnen Th, Strik van R (red). Inleiding tot de medische statistiek. Utrecht: Bunge, 1995. 2. Altman DG. (computer)practical Statistics for Medical Research. London: Chapman & Hall, 1991. 3. Pocock SJ. Clinical trials. A (computer)practical approach. Chicester - New York - Brisbane Toronto - Singapore: John Wiley & Sons Ltd., 1983. 126 KWO Appendix C META-ANALYSE Inleiding Vaak is het nodig om op basis van de resultaten van meerdere onderzoeken de typische grootte van een bepaald effect te schatten, bijvoorbeeld voor het opstellen van een behandelingsrichtlijn. Dit is niet simpel. Onder andere door de beperkte precisie van met name de kleinere onderzoeken lopen de resultaten vaak sterk uiteen, waardoor het typische effect niet direct zichtbaar is. De meta-analyse is bedoeld om de resultaten van meerdere onderzoeken op formele wijze kwantitatief samen te vatten en daarmee een meer precieze schatting van het effect te leveren. Veel, maar niet alle, toepassingen van meta-analyse betreffen effectiviteit van interventie. Een voorbeeld van een meta-analyse van een vraag van risico is het recente onderzoek van Marshall et al. [1], betreffende de veelvuldig onderzochte relatie tussen de bot-mineraaldichtheid en de kans op fracturen. In dit onderzoek werden de originele gegevens van 11 observationele onderzoeken verzameld zodat men de uiteindelijke analyses met 90000 persoonsjaren en meer dan 2000 fracturen kon doen. Gemiddeld bleek de kans op een fractuur met 50% toe te nemen per standaard deviatie afname van de botmineraaldichtheid. Zoals klaarblijkelijk gelukt is in bovenstaand voorbeeld, moeten de gegevens zo origineel mogelijk zijn, dus geen effectmaten maar aantallen. Met behulp van verschillende technieken is het mogelijk om vervolgens een samenvattend effect te schatten waarbij rekening wordt gehouden met de verschillende grootte van de onderzoeken. Het samenvatten van de verschillende effecten uit meerdere onderzoeken in één effect veronderstelt dat er in werkelijkheid maar één typisch onderliggend effect is en dat verschillen tussen onderzoeken berusten op toevalsvariatie. Zo is het bijvoorbeeld heel plausibel dat het effect van een interventie varieert met de ernst van de aandoening. Het is in een meta-analyse dan ook absoluut noodzakelijk dergelijke verschillen goed te onderzoeken en zo nodig aparte schattingen voor subgroepen te maken. Forrest-plot maken (Microsoft Office 2007/ 2010) 1. 2. Maak in Excel 6 kolommen aan met de volgende variabelen: (1) nummer artikel, (2) maximale waarde 95% betrouwbaarheidsinterval (BI), (3) Gemiddelde/RR/OR, (4) minimale waarde 95% BI, (5) maximale waarde BI min Gem/OR/RR en (6) Gem/OR/RR min minimale waarde 95%BI. Geef de artikelen een nummer en noem deze niet bij naam. Voorbeeld: Artikel 1: OR = 5 (95%BI 3-9) 3. 4. 5. 6. 7. Selecteer de nummers onder de variabele “artikel” klik op het tabblad “invoegen” selecteer vervolgens de spreidingsdiagram (Spreiding met alleen markeringen) Ga naar het icoontje ‘Gegevens selecteren’ onder het tabblad “ontwerpen” klik op ‘Bewerken’ X waarden: Selecteer de waarden onder Gem/OR/RR, Y waarden: selecteer de waarden onder artikel (zijn al geselecteerd) OK Kies onder grafiekindeling een indeling waarbij geen rasterlijnen zichtbaar zijn (standaard ‘Indeling 4’). Selecteer de Y-as (as opmaken) en verander de schaal van de Y-as (primaire eenheid is 1) Selecteer de puntschatters ga naar het tabblad “indeling” en klik vervolgens op het icoontje ‘Foutbalken’ Selecteer ‘Meer opties voor foutbalken...’ sluit dit venster. De puntschatters hebben nu twee foutbalken: een horizontale foutbalk en een verticale foutbalk. Selecteer de verticale foutbalk en verwijder deze (delete). Selecteer vervolgens de horizontale foutbalk en ga opnieuw naar de optie ‘Meer opties voor foutbalken (via Indeling Foutbalken). N.B.: Je hoeft niet per se uit het menu “foutbalken opmaken te gaan”. Je kunt de foutbalken ook selecteren als je in het menu zit door op de verticale of horizontale lijnen te klikken. 127 KWO 8. a. b. Ga bij “foutweergave” naar de optie ‘aangepast’ selecteer ‘Waarde opgeven’ + selecteer de kolom maximale waarde 95%BI – Gem/OR/RR - selecteer de kolom Gem/OR/RR – minimale waarde 95%BI OK. 9. Pas de forrest-plot naar eigen inzichten verder aan. 10. Vervolgens is je figuur bijna klaar. Maar je wilt geen getallen bij de Y-as, maar de echte naam van het artikel. Hier heb je PowerPoint voor nodig. 11. Maak in PowerPoint per variabele nieuwe tekstvakken aan 12. Plak de forrest-plot vanuit Excel in Powerpoint en plaats de tekstvakken erom heen (je kunt met control en pijltjes kleine stapjes verschuiven) 13. Ook kun je met behulp van de meetlijn de precieze afstand meten tussen de tekstvakjes, zodat ze recht in het figuur komen te staan 14. Sla het figuur op als JPEG 15. Je kunt in het JPEG dan ook de randen afsnijden 16. Je forrest-plot is nu klaar Publicatiebias Een belangrijk probleem bij meta-analyse ontstaat doordat statistisch significante trials eerder in de medische literatuur terechtkomen dan de niet significante. Aangezien trials waarin een groot effect wordt gevonden eerder statistisch significant zijn, wordt in een meta-analyse van gepubliceerde trials het interventie effect in onbekende mate overschat. Deze vertekening wordt publicatiebias genoemd. Een betere schatting zou dus op basis van alle, gepubliceerde en niet gepubliceerde, onderzoeken moeten gebeuren. De gegevens uit de niet gepubliceerde onderzoeken zijn echter lastig te achterhalen en mogelijk kwalitatief inferieur omdat deze nog niet aan peer review werden onderworpen. In de praktijk geschiedt de eerste selectie van onderzoeken voor meta-analyse met behulp van computerprogramma’s (bijvoorbeeld Medline) die in bestanden van de gepubliceerde literatuur kunnen zoeken. Zo verkrijgt men in elk geval een volledige en systematische opsomming van de relevante literatuur. Subjectiviteit Hoewel in mindere mate dan bij het klassieke literatuuroverzicht, speelt ook bij meta-analyse de subjectiviteit van de onderzoeker een grote rol. Uiteindelijk bestaat er een aanzienlijke vrijheid ten aanzien van de selectie van onderzoek, de analyse van de gegevens en uiteraard ook de conclusies. De lezer dient zich hier bewust van te zijn alvorens vergaande conclusies te trekken. Nadere informatie In deze paragraaf is meta-analyse uiterst summier besproken en er is uiteraard veel meer over te zeggen. Een goede nadere bespreking kunt u vinden in een Nederlands leerboek [2]. Literatuur 1. Marshall D, Johnell O, Wedel H. Meta-analysis of how well measures of bone mineral density predict occurrence of osteoporotic fractures. BMJ 1996;312:1254-1259. 2. Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996. Bronvermelding Burger H, Hofman A. Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red). Interne Geneeskunde. Houten: Bohn Stafleu van Loghum, 2001: paragraaf 1-7-3 (Metaanalyse). 128