Uploaded by Ak al

Blokboek KWO 2021-2022 BB(1)-vrijgegeven (1)

advertisement
Blokboek
Klinisch Wetenschappelijk
Onderzoek
Geneeskunde CRU (+)
Bachelor jaar 3
Cursusjaar 2021/2022
KWO
Heb je klachten, opmerkingen of suggesties over dit blok? Mail dan naar bvt3@msfusams.nl
De BVT gaat er dan mee aan de slag!
Colofon
De inhoud van dit blokboek is tot stand gekomen onder verantwoordelijkheid van
Prof. dr. Y. van der Graaf, Dr. M. Kluijtmans, Dr. M.M. Rovers, Prof. dr. A. May en Dr. K. Jenniskens
Het theoriedeel is tot stand gekomen onder verantwoordelijkheid van de staf klinische epidemiologie
van het Julius Centrum.
De auteursrechten van dit blokboek berusten bij het Universitair Medisch Centrum Utrecht. Niets uit
deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt door middel van druk, fotokopie,
microfilm of op welke andere wijze dan ook, noch in een gegevens opzoeksysteem worden
opgeslagen, zonder voorafgaande schriftelijke toestemming van het Onderwijscentrum van het UMC
Utrecht. ©2021
Contact & vragen
cru-epidemiology@umcutrecht.nl
2
KWO
INHOUDSOPGAVE
INHOUDSOPGAVE .................................................................................................................................................... 3
DEEL I Klinisch Wetenschappelijk Onderzoek ALGEMENE INFORMATIE CURSUS ........................................ 5
Voorwoord................................................................................................................................................................. 7
Inleiding ..................................................................................................................................................................... 9
a. Introductie ..................................................................................................................................................... 9
b. Over dit blokboek.......................................................................................................................................... 9
c. Leerdoelen van de cursus ............................................................................................................................ 9
d. Klinisch hoofdprobleem ................................................................................................................................ 9
e. Begeleiding ................................................................................................................................................... 9
f. Weekstramien en werkvormen ................................................................................................................... 10
Participatie ...................................................................................................................................................... 11
Online onderwijs ............................................................................................................................................ 11
g. Literatuur & Studiemateriaal ....................................................................................................................... 11
h. Toetsing ...................................................................................................................................................... 11
Honoursprogramma....................................................................................................................................... 12
Samenstelling cijfer ....................................................................................................................................... 12
Vervangende toets ......................................................................................................................................... 13
i. Tips nodig over efficiënt studeren? ............................................................................................................. 13
j. Vertrouwenspersoon .................................................................................................................................. 13
k. Evaluatie en kwaliteitsbewaking ................................................................................................................. 13
l. Arbo, veiligheid en milieu ............................................................................................................................ 14
m. Leerlijnen Academische Vorming, Professionele Ontwikkeling en Studie Reflectie ................................... 14
Waaraan dien je te voldoen om de leerlijnen Academische Vorming, Professionele & Persoonlijke
Ontwikkeling en StudieReflectie te behalen? ..................................................................................... 14
n. Adreslijst ..................................................................................................................................................... 15
Coördinator..................................................................................................................................................... 15
Plaatsvervangend coördinator...................................................................................................................... 15
Onderwijsbureau ............................................................................................................................................ 15
Medewerkers van de medische bibliotheek die college PubMed verzorgen ............................................ 15
Hoofdbegeleiders en docenten ..................................................................................................................... 15
Week 1. Beschrijving van het klinisch hoofdprobleem ....................................................................................... 17
Indeling en uitvoering ....................................................................................................................................... 17
I.
Zelfstudie ................................................................................................................................................ 17
II.
Introductie college ................................................................................................................................. 17
III. Groepsopdracht ..................................................................................................................................... 17
IV. Hoor-werkcollege Diagnostisch onderzoek ........................................................................................ 18
V. Hoor-werkcollege Prognostisch onderzoek ........................................................................................ 18
VI. Werkgroepbijeenkomst ......................................................................................................................... 18
VII. Zelfstudie PubMed ................................................................................................................................. 19
VIII. Presentaties ........................................................................................................................................... 19
Week 2. Formuleren vraagstellingen & vooraanvraag subsidie ......................................................................... 21
Indeling en uitvoering ....................................................................................................................................... 21
I.
Zelfstudie ................................................................................................................................................ 21
II.
Zelfstudie: Statistiek.............................................................................................................................. 21
III. Hoor-werkcollege Frequentie- en associatiematen ............................................................................ 21
IV. Hoor-werkcollege Patiëntparticipatie ................................................................................................... 22
V. Groepsopdracht ..................................................................................................................................... 22
VI. Hoor-werkcollege Etiologisch onderzoek ........................................................................................... 29
VII. Hoor-werkcollege Interventieonderzoek .............................................................................................. 29
VIII. Werkgroepbijeenkomst ......................................................................................................................... 29
IX. Hoor-werkcollege Statistiek: Steekproefvariabiliteit en betrouwbaarheidsintervallen ................... 29
X. Presentaties ........................................................................................................................................... 29
Week 3. Herformuleren vraagstelling & analyseplan dataset ............................................................................. 31
Indeling en uitvoering ....................................................................................................................................... 31
I.
Zelfstudie ................................................................................................................................................ 31
II.
Zelfstudie: Statistiek.............................................................................................................................. 31
III. Groepsopdracht ..................................................................................................................................... 31
IV. Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets ........................................ 33
V. Hoor-werkcollege Statistiek: T-toetsen ............................................................................................... 34
VI. (computer)practicum Introductie SPSS (PC)....................................................................................... 34
VII. Werkgroepbijeenkomst ......................................................................................................................... 34
VIII. Presentaties ........................................................................................................................................... 34
Week 4. De resultaten............................................................................................................................................. 35
Indeling en uitvoering ....................................................................................................................................... 35
3
KWO
I.
Zelfstudie ................................................................................................................................................ 35
II.
Zelfstudie: Krantenartikelopdracht ...................................................................................................... 35
III. Nabespreking statistiek opdracht ........................................................................................................ 36
IV. Analyse eigen data ................................................................................................................................ 36
V. Computer(computer)practicum diagnostisch en prognostisch onderzoek ..................................... 36
VI. Computer(computer)practicum etiologisch en interventieonderzoek .............................................. 36
VII. Groepsopdracht ..................................................................................................................................... 36
VIII. Werkgroepbijeenkomst ......................................................................................................................... 36
IX. Presentaties ........................................................................................................................................... 36
Week 5. Rapportage en discussie ......................................................................................................................... 37
Indeling en uitvoering ....................................................................................................................................... 37
I.
Zelfstudie ................................................................................................................................................ 37
II.
Zelfstudie: Krantenartikelopdracht ...................................................................................................... 37
III. (computer)practicum PubMed: zoeken voor mini-meta analyse ....................................................... 37
IV. Groepsopdracht ..................................................................................................................................... 37
V. Werkgroepbijeenkomst ......................................................................................................................... 38
Week 6. Eindpresentaties, eindverslag en toets .................................................................................................. 39
Indeling en uitvoering ....................................................................................................................................... 39
I.
Groepsopdracht ..................................................................................................................................... 39
II.
Werkgroepbijeenkomst ......................................................................................................................... 40
III. Eindpresentaties .................................................................................................................................... 40
IV. Eindtoets ................................................................................................................................................ 41
DEEL II Klinisch Wetenschappelijk Onderzoek OEFENINGEN BIJ COLLEGES & (COMPUTER)PRACTICA 43
Week 1. Oefeningen college diagnostisch onderzoek ........................................................................................ 45
a. Oefening 1 .................................................................................................................................................. 45
b. Oefening 2 .................................................................................................................................................. 46
c. Oefening 3 .................................................................................................................................................. 48
Week 1. Oefeningen college prognostisch onderzoek ........................................................................................ 51
a. Oefening 1 .................................................................................................................................................. 51
b. Oefening 2 .................................................................................................................................................. 53
Week 2. Oefeningen bij college frequentie- en associatiematen........................................................................ 55
a. Oefening 1 .................................................................................................................................................. 55
b. Oefening 2 .................................................................................................................................................. 56
c. Oefening 3 .................................................................................................................................................. 56
Week 2. Oefeningen college etiologisch onderzoek ........................................................................................... 57
a. Oefening 1 .................................................................................................................................................. 57
b. Oefening 2 .................................................................................................................................................. 58
Week 2. Oefening college interventieonderzoek ................................................................................................. 59
Week 4. Computer(computer)practicum diagnostisch onderzoek ..................................................................... 61
Week 4. Computer(computer)practicum prognostisch onderzoek .................................................................... 63
Week 4. Computer(computer)practicum etiologisch onderzoek ........................................................................ 65
Week 4. Computer(computer)practicum interventieonderzoek .......................................................................... 67
DEEL III Klinisch Wetenschappelijk Onderzoek THEORIE ................................................................................ 69
Hoofdstuk 1 KLINISCHE EPIDEMIOLOGIE ........................................................................................................... 71
Hoofdstuk 2 AANDACHTSGEBIEDEN BINNEN DE KLINISCHE EPIDEMIOLOGIE ............................................ 79
Hoofdstuk 3 UITVOERING VAN ONDERZOEK ................................................................................................... 103
Hoofdstuk 4 RAPPORTAGE ................................................................................................................................. 113
Appendix A
EVIDENCE-BASED MEDICINE ................................................................................................... 119
Appendix B
STEEKPROEFOMVANG ............................................................................................................. 123
Appendix C
META-ANALYSE ......................................................................................................................... 127
4
KWO
DEEL I
Klinisch Wetenschappelijk Onderzoek
ALGEMENE INFORMATIE CURSUS
5
KWO
6
KWO
Voorwoord
“To study the phenomena of disease without books is to sail uncharted seas,
while to study books without patients is not to go to sea at all.”
Sir William Osler
Dit citaat van de grote arts en onderwijzer Sir William Osler geeft goed de gedachte weer die ten
grondslag heeft gelegen aan het nieuwe medisch onderwijsprogramma in het Universitair Medisch
Centrum Utrecht: vroeg in de studie kennismaken met de praktijk van de geneeskunde, zodat de theorie
kan worden getoetst aan de praktijk en de praktijk inspiratie kan leveren om de theoretische kennis te
vergroten.
Het ligt voor de hand om ook de cursus ‘klinisch wetenschappelijk onderzoek’ te verbinden aan
kennismaking met wetenschappelijk onderzoek in uitvoering en om dit parallel te laten verlopen met de
eerste ervaringen met de klinische praktijk. Immers, het doel van wetenschappelijk onderzoek is om
kennis aan te leveren die relevant is voor de uitoefening van de geneeskunde. Om die relevantie te
kunnen beoordelen is het nodig inzicht te hebben in de soort kennis waar de arts in zijn werk behoefte
aan heeft.
De patiënt die een arts bezoekt komt om uitleg en advies. Wat heb ik, waarom heb ik dit en wat gaat er
nu gebeuren? In wat formelere bewoordingen: wat is de diagnose, wat is de etiologie en wat is de
prognose? Om als arts op die vragen antwoord te kunnen geven is kennis nodig. Diagnostische,
etiologische en prognostische kennis. Toegepast medisch onderzoek heeft tot doel die kennis te leveren.
Daarom is het, bij het opzetten en bij de uitvoering van onderzoek, van groot belang goed te weten welke
vraag er beantwoord moet worden en voor welk soort patiënten. Evenzeer is het noodzakelijk om het
wetenschappelijke antwoord op zodanige wijze te geven dat dit in een praktische toepassing vertaald kan
worden.
Het doel van het onderwijs in klinisch wetenschappelijk onderzoek is om de principes en methoden te
leren begrijpen die ervoor zorgen dat onderzoek zo wordt opgezet, uitgevoerd en gepresenteerd dat het
bijdraagt tot betere en effectievere medische zorg, preventie en interventie. Dat de resultaten ervoor
zorgen dat medisch handelen kan plaatsvinden op basis van kennis over de waarde van diagnostiek,
over het relatieve belang van verschillende oorzaken in het ontstaan van ziekte en over het effect en de
bijwerkingen van behandeling. Dit is wat onder “evidence-based medicine” wordt verstaan.
De klinische epidemiologie heeft zich in de afgelopen jaren ontwikkeld tot een discipline die in nauwe
samenspraak met de kliniek een stelsel van methoden en technieken heeft ontwikkeld op basis waarvan
toegepast klinisch onderzoek zo effectief en efficiënt mogelijk kan worden ontworpen en uitgevoerd.
“Evidence-based research”, zou je kunnen zeggen. Met andere woorden: de klinische epidemiologie
levert de architectuur van klinisch wetenschappelijk onderzoek. Evenals in de bouw, gaat deze
architectuur uit van algemene principes.
Immers, op basis van dezelfde bouwkundige uitgangspunten worden scholen, huizen en theaters
gebouwd. In de toepassing van die uitgangspunten zullen architecten zich echter laten leiden door de
gebruikers van de gebouwen en door deskundigen op het gebied van wonen, onderwijs en toneel.
Evenzeer zijn klinisch epidemiologen slechts in staat de beste weg tot een relevant onderzoeksresultaat
te helpen bereiden, wanneer zij voldoende inzicht hebben in de praktijk van de geneeskunde en kunnen
rekenen op inbreng van en samenwerking met de klinische praktijk. Klinisch wetenschappelijk onderzoek
is teamwork en het onderwijs op dit gebied wordt dan ook verzorgd door onderzoekers en artsen uit
verschillende disciplines en specialismen.
Een ander citaat van Osler: Ask of any active business man or a leader in a profession the secret which
enables him to accomplish much work, and he will reply in one word, system; or as I shall term it, the
Virtue of Method, the harness without which only the horses of genius travel. Als er één doel is waarvan
wij hopen dat het wordt bereikt tijdens het onderwijs in wetenschappelijk onderzoek, is het dat de student
het systeem leert doorgronden dat structuur brengt in het traject van klinische vraag naar
wetenschappelijk antwoord. In deze cursus is dat systeem gebaseerd op epidemiologisch redeneren.
In de epidemiologie staat steeds een relatie tussen zogenaamde determinanten en uitkomsten centraal.
Bijvoorbeeld de relatie tussen bepaalde klachten en resultaten van testen (determinanten) en de kans op
7
KWO
aanwezigheid van een bepaalde ziekte (diagnose = uitkomst). Of de relatie tussen een bepaalde
behandeling (determinant) en de kans op verbetering van de symptomen (prognose = uitkomst).
Niet alleen zal onderzoek het juiste verband tussen determinant en uitkomst moeten vaststellen, tevens
zal dat verband in maat en getal moeten worden uitgedrukt. Het is immers van weinig waarde wanneer je
als arts aan een patiënt meedeelt dat deze mogelijk een bepaalde ziekte heeft wanneer je niet zo
nauwkeurig mogelijk kunt vertellen hoe groot de kans op aanwezigheid is. Het leggen van
wetenschappelijke verbanden is daarom nauw verbonden met het hanteren van kansberekening en
statistiek. Biostatistische grondbeginselen vormen om die reden onderdeel van het onderwijs in de
cursus. Om Sir William te parafraseren: “To try to understand medicine without research is to sail
uncharted seas, while to try to understand research without medicine is not to go to sea at all”.
Het is de hoop en verwachting van de samenstellers en docenten van de cursus dat een vroege
kennismaking met klinisch wetenschappelijk onderzoek zal bijdragen tot het opleiden van artsen die de
waarde van wetenschappelijk onderzoek voor de praktijk en het belang van praktische relevantie voor het
onderzoek begrijpen en waarderen.
D.E. Grobbee,
Hoogleraar klinische epidemiologie,
Divisie Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde,
UMC Utrecht
8
KWO
Inleiding
a.
Introductie
Het belangrijkste doel van deze wetenschappelijke cursus is u op te leiden tot een arts die zich
bij iedere stap van het medisch handelen (diagnose, behandeling, voorspellen van de
prognose) afvraagt in hoeverre zijn beleid gebaseerd is op goed uitgevoerd wetenschappelijk
onderzoek. Alvorens iemand in staat is andermans artikelen te beoordelen, is het onontbeerlijk,
zelf kennis gemaakt te hebben met onderzoek. Dit onderdeel staat dan ook centraal gedurende
de cursus. U maakt tijdens de cursus kennis met klinisch wetenschappelijk onderzoek in het
UMC Utrecht op het gebied van een frequent voorkomend klinisch probleem. Getracht wordt
zoveel mogelijk verschillende aspecten van onderzoek te laten zien. In een periode van zes
weken simuleert u zelf het proces van wetenschappelijk onderzoek. U leert een vraagstelling te
formuleren, u werkt een onderzoeksprotocol uit, u verzamelt gegevens en u analyseert en
rapporteert. De cursus wordt afgesloten met een tentamen waarin u een bestaand artikel moet
analyseren. Vaardigheid hierin krijgt u via oefeningen, die opgenomen zijn in het blokboek.
Daarnaast krijgt u, hoewel dit niet het hoofddoel van de cursus is, kennis over het specifieke
hoofdprobleem, hoe vaak het voorkomt, wat de oorzaken zijn, hoe u het diagnosticeert, wat de
prognose is, en hoe u een patiënt met een dergelijk probleem behandelt.
b.
Over dit blokboek
Dit blokboek bestaat uit drie delen:
- Deel I: Algemene informatie over (de opbouw van) de cursus
- Deel II: Oefeningen die tijdens colleges en (computer)practica gemaakt dienen te worden
- Deel III: Theorie waar gedurende de cursus kennis van dient te worden genomen
c.
Leerdoelen van de cursus
-
d.
Ervaren hoe nieuwe kennis wordt gegenereerd
Wetenschappelijke artikelen kunnen lezen en beoordelen op relevantie en validiteit
Formuleren van een wetenschappelijke vraagstelling en kiezen van een onderzoeksopzet
waarin deze vraagstelling kan worden beantwoord
Kennis verwerven over (verschillen in) opzet, uitvoering en analyse van de kennisgebieden
etiologisch, diagnostisch, prognostisch en interventieonderzoek
Onderzoeksresultaten interpreteren en bediscussiëren
Onderzoeksresultaten presenteren, zowel schriftelijk als mondeling
Klinisch hoofdprobleem
De cursus is opgebouwd rondom een klinisch hoofdprobleem, bijvoorbeeld pijn op de borst of
neurologische uitval. In een studiejaar komen ongeveer zes klinische hoofdproblemen aan bod.
Per blok wordt in een deelgroep (groepsgrootte ca. 35-40 studenten) gewerkt aan één klinisch
hoofdprobleem.
De hoofdproblemen zijn geselecteerd enerzijds omdat de arts relatief vaak met ze te maken
krijgt, anderzijds omdat er in het UMC Utrecht veel wetenschappelijk onderzoek op die terreinen
wordt uitgevoerd. In zes weken krijgt u kennis over het klinisch hoofdprobleem aangereikt en
worden de lacunes in de kennis duidelijk. Onderweg maakt u kennis met de theorie en praktijk
van verschillende aspecten van klinisch wetenschappelijk onderzoek, te weten:
- De epidemiologie (etiologie, diagnostiek, interventie en prognostiek)
- De statistiek
- Zoeken in medische databases zoals PubMed
- Patiëntparticipatie
e.
Begeleiding
Iedere groep van 35-40 studenten wordt zes weken lang begeleid door twee senior stafleden
van het UMC, een medisch specialist en een klinisch epidemioloog. Beiden hebben veel
ervaring met patiëntgebonden onderzoek. Naast de introductie maandag zijn zij elke vrijdag
aanwezig bij de wekelijkse presentaties en verzorgen zij aansluitend hierop een introductie van
de daaropvolgende week. Gedurende de cursus werkt u in subgroepen van vier tot zes
studenten aan een opdracht. Er zijn zes verschillende groepsopdrachten. Hierbij wordt u
9
KWO
begeleid door een werkgroepbegeleider. Hij of zij zal 1 keer per week met uw werkgroep
samenkomen, en daarnaast via email bereikbaar zijn voor vragen. Datum, tijd en plaats van de
werkgroep dient u na het introductiecollege op de eerste maandag van het blok af te spreken
met uw werkgroepbegeleider.
f.
Weekstramien en werkvormen
Het onderwijs in dit blok wordt uitgevoerd volgens een weekstramien, dat bestaat uit de
werkvormen zelfstudie, werkgroep, hoor-werkcollege, computer(computer)practicum en
presentaties. Opnames van hoor-werkcolleges zullen via Blackboard digitaal beschikbaar
worden gesteld. De werkvormen in CRU+ staan uitgebreid beschreven in het blokboek van de
cursus Vorm en Functie.
In de cursusperiode werkt u aan een onderzoeksopdracht op het terrein van het klinisch
hoofdprobleem. De taken voor iedere week worden toegelicht in dit blokboek. U werkt in
groepen van maximaal zes studenten binnen een bepaald klinisch probleem, en met de focus
op een bepaald epidemiologisch aandachtsgebied (te weten diagnostiek, prognostiek, etiologie
of interventie). De structuur voor de groepsindeling is als volgt:
Niveau
1
Niveau
2
Niveau
3
Blok 1 - 4
75-80 studenten
Klinisch probleem A
35-40 studenten
Klinisch probleem B
35-40 studenten
Groep 1
Diagnostiek
4-6 studenten
Groep 5
Diagnostiek
4-6 studenten
Groep 9
Diagnostiek
4-6 studenten
Groep 13
Diagnostiek
4-6 studenten
Groep 2
Prognostiek
4-6 studenten
Groep 6
Prognostiek
4-6 studenten
Groep 10
Prognostiek
4-6 studenten
Groep 14
Prognostiek
4-6 studenten
Groep 3
Etiologie
4-6 studenten
Groep 7
Etiologie
4-6 studenten
Groep 11
Etiologie B1
4-6 studenten
Groep 15
Etiologie
4-6 studenten
Groep 4
Interventie
4-6 studenten
Groep 8
Interventie
4-6 studenten
Groep 12
Interventie
4-6 studenten
Groep 16
Interventie
4-6 studenten
Afhankelijk van het type onderwijs wordt het onderwijs op een van bovenstaande niveaus
gegeven:
- Hoor-werkcolleges en (computer)practica
Niveau 1 (75-80 studenten)
- Introductiecollege en presentaties
Niveau 2 (35-40 studenten)
- Werkgroepen
Niveau 3 (4-6 studenten)
o In week 1 en 2 werken de subgroepen met hetzelfde onderwerp samen. Bijvoorbeeld
groepen 1 en 5 van diagnostiek bij klinisch probleem A
o In week 3 t/m 6 werken de subgroepen onafhankelijk van elkaar
Met uw werkgroep schrijft u iedere week een korte rapportage over de taken van die week.
Deze rapportages vormen de basis voor uw eindverslag. Iedere vrijdag worden per groep de
taken van die week gepresenteerd en eventuele problemen besproken. Zorg dat per week
minimaal twee leden van uw groep een deel van de presentatie invullen, zodat iedereen
meerdere keren aan de beurt komt.
De globale opbouw van onderwerpen die per week behandeld worden is als volgt:
- Week 1: Beschrijving van het klinisch hoofdprobleem
- Week 2: Formuleren vraagstellingen & vooraanvraag subsidie
- Week 3: Herformuleren vraagstelling & analyseplan dataset
- Week 4: Data-analyse & uitvoeren krantenartikelopdracht
10
KWO
-
Week 5: Mini meta-analyse & inleveren krantenartikelopdracht
Week 6: Eindpresentatie, inleveren eindverslag & tentamen (TestVision)
Participatie
Het is belangrijk dat beide partijen, studenten én docenten, zich inzetten en hun
verantwoordelijkheid nemen. Alleen dan kan een vruchtbaar interactief onderwijsklimaat
ontstaan. Van u als student wordt zelfstudie verwacht en, vooral tijdens kleinschalig
groepsonderwijs, een actieve bijdrage! Als u onvoorbereid bent en de opdracht(en) van het
kleinschalig onderwijs niet hebt gemaakt, wordt u de toegang tot de bijeenkomst geweigerd of
wordt u weggestuurd. Bij onvoldoende inspanning kan de cursuscoördinator, na voorafgaande
waarschuwing, de student uitsluiten van verdere deelname aan de cursus of een gedeelte
ervan. U bent niet verplicht om kleinschalig onderwijs (werkgroepen) te volgen, maar als u dat
wel wilt doen, dan moet u voorbereid zijn.
Er geldt een aanwezigheidsplicht voor alle(computer)practica en presentaties (zie rooster).
Indien u meer dan 20% van het verplicht gestelde onderwijs in de cursus hebt gemist,
wordt u uitgesloten van verdere deelname aan de cursus, dit geldt ook voor de toetsing
(zie OER artikel 4.4 op de website van de bachelor Geneeskunde).
Online onderwijs
In aanvulling op deze algemene afspraken en regels is een aantal gedragsregels online
onderwijs opgesteld:

De camera’s van zowel de studenten als docenten staan aan tijdens het kleinschalig
onderwijs.

Tijdens werkgroepen doet u als student actief mee en neemt u een actieve houding aan.

Stel u op zoals u dit ook zou doen bij fysiek kleinschalig onderwijs.
Wij hopen met behulp van deze regels de interactie tussen student en docent en tussen
studenten onderling te bevorderen in deze tijden van online onderwijs, zodat iedereen met
plezier het onderwijs blijft geven en volgen.
g.
Literatuur & Studiemateriaal
De volgende boeken, alsmede de achtergrondinformatie in deel III van dit blokboek, zullen
worden gebruikt tijdens de cursus:
1.
Grobbee DE, Hoes AW. Clinical Epidemiology: Principles, Methods, and Applications for
Clinical Research. 2nd ed. Burlington: Jones & Bartlett Publishers; 2015.
2.
Baldi B, Moore DS. The Practice of Statistics in the Life Sciences. 4th ed. WH Freeman &
Company; 2018.
In de medische bibliotheek kunt u ook andere epidemiologische en statistiek boeken en
wetenschappelijke artikelen vinden. Publicaties die zich achter een zogenoemde “paywall”
bevinden zijn direct toegankelijk vanuit computers in het UMCU, of vanaf locaties buiten het
UMC Utrecht door via uw Solis-account in te loggen. Vragen omtrent toegang/beschikbaarheid
van publicaties kunnen gericht worden aan de docenten van de medische bibliotheek (zie
adreslijst).
Vanwege de Covid19-crisis zal veel van het onderwijs online plaatsvinden. Om dat onderwijs
goed te kunnen volgen en ook om er actief aan deel te kunnen nemen, is het nodig om te
beschikken over een laptop/PC met camera (ingebouwd of los) en microfoon en een stabiele
internetverbinding.
h.
Toetsing
Voor algemene bepalingen rond toetsing, zie de Onderwijs en Examenregeling (OER) en het
Reglement Examencommissie op: http://students.uu.nl/gnk-b/regelingen
Je kunt met dit blok 8 studiepunten behalen. Het eindcijfer dient minimaal een 5,5 te zijn om
voor het blok te slagen. De verplichte onderdelen van dit blok zijn de
(computer)(computer)practica en presentaties. Wanneer meer dan 1 van deze verplichte
onderdelen wordt gemist, is niet voldaan aan de minimale deelname van 80% en kan geen
11
KWO
eindcijfer worden toegekend voor dit blok.
Honoursprogramma
Voor studenten die deelnemen aan het Honoursprogramma geldt het volgende:
Om KWO af te ronden op Honours niveau, moet de student actief deelgenomen hebben aan
alle groepsbijeenkomsten van het Honoursprogramma (inclusief de bijbehorende voorbereiding)
en KWO met een voldoende hebben afgerond. (Pas na afronding van alle groepsbijeenkomsten
van het Honoursprogramma, zal de registratie van KWO op Honours niveau in OSIRIS
plaatsvinden.)
Samenstelling cijfer
De toetsing bestaat uit drie onderdelen, te weten:
1. Eindpresentatie
cijfer van 0 tot 10
2. Eindverslag
cijfer van 0 tot 10
3. Tentamen
cijfer van 0 tot 10
Weging: 1
Weging: 1
Weging: 2
Om het blok met een voldoende af te sluiten moet voor ieder onderdeel minimaal een 5,5
gehaald worden, resulterend in een gewogen gemiddelde van een 5,5 of hoger. Om toegelaten
te worden tot het tentamen moet de krantenartikelopdracht op tijd en volledig ingeleverd worden
bij de werkgroepbegeleider, en met een ‘voldaan’ beoordeeld zijn. Tevens moet er zijn voldaan
aan de minimale aanwezigheidsplicht.
1. Eindpresentatie
U wordt beoordeeld door de hoofdbegeleiders op uw eindpresentatie en op de
beantwoording van vragen na afloop. Iedere groep houdt gedurende 10 minuten een
presentatie, waarbij elke student in een werkgroep een deel voor zijn/haar rekening neemt.
Vervolgens worden er door de hoofdbegeleiders en werkgroepbegeleiders methodologische
en inhoudelijke vragen gesteld aan de individuele studenten. Nadruk ligt op de
wetenschappelijke inhoud en beantwoording van vragen. Cijfers voor de presentatie worden
individueel gegeven. Dit gebeurt mede op basis van het oordeel van de
werkgroepbegeleider.
2. Eindverslag
Uw eindverslag wordt beoordeeld door de hoofdbegeleiders. Voor (mondelinge) feedback
op uw eindverslag kunt u een afspraak aanvragen bij de hoofdbegeleider van uw blok. Het
betreft hier een groepscijfer. Echter, bij minder inspanning van een student kan er van het
groepscijfer worden afgeweken. Op Blackboard vindt u tips voor het schrijven van een
onderzoeksverslag.
3. Tentamen
Het tentamen zal worden afgenomen in TestVision, en bestaand uit open en gesloten
vragen. Deze zullen gaan over abstracts uit Engelstalige en/of Nederlandstalige tijdschriften
of op zichzelf staande vragen zijn. Het betreft een open boek eindtoets, waarbij u dus alle
boeken en aantekeningen mee mag nemen. U mag echter geen gebruik maken van uw
mobiele telefoon of laptop. TestVision biedt de mogelijkheid gebruik te maken van een
digitaal rekenmachine, maar u wordt geadviseerd een eigen rekenmachine mee te nemen.
De toets is niet gerelateerd aan het klinisch onderwerp van het blok. Alle stof die in de
cursus aan bod komt zal onderdeel zijn van het tentamen. Dit betekent dat
epidemiologische als statistische concepten, alsmede ook theorie over patiëntparticipatie
aan bod zullen komen in de toets. Dit zal grofweg naar rato van tijdsbesteding per
onderdeel zijn.
Als u, op grond van een contract voor extra tentamentijd voor de toets, recht heeft op extra
tentamentijd, dan dient u dit uiterlijk twee weken voor de tentamendatum per e-mail bij de
coördinator (Dr. Kevin Jenniskens, K.Jenniskens@umcutrecht.nl) en het onderwijsbureau
(cru-epidemiology@umcutrecht.nl) kenbaar te maken.
12
KWO
Vervangende toets
Voor alle onderdelen geldt dat enkel een reparatie (herkansing) kan plaatsvinden in hetzelfde
studiejaar indien er een 4,0 of hoger is behaald voor het desbetreffende onderdeel. Indien de
krantenartikelopdracht met een onvoldoende beoordeeld is kan deze worden gereviseerd n.a.v.
de feedback van de werkgroepbegeleider en eenmalig opnieuw ingeleverd worden
1. Eindpresentatie
KWO wordt vier keer in een studiejaar gegeven. De eindpresentatie kan worden herkanst
bij het volgende KWO blok. Voor herkansing in blok 4 van KWO zal een apart moment
worden vastgesteld. De data hiervoor ontvangt u via het onderwijsbureau, daar dient u zich
ook op te geven voor de herkansing (cru-epidemiology@umcutrecht.nl).
2. Eindverslag
Het verslag dient te worden herschreven op basis van feedback die de hoofdbegeleiders
geven. U heeft met uw groep één mogelijkheid om een gereviseerde versie van het verslag
in te leveren bij de hoofdbegeleiders
3. Tentamen
KWO wordt vier keer in een studiejaar gegeven. Als u wilt herkansen kunt u aan het
tentamen van het volgende KWO blok deelnemen. Voor herkansing in blok 4 van KWO zal
een apart moment worden vastgesteld. De data hiervoor ontvangt u via het
onderwijsbureau. Aanmelding voor de herkansing is noodzakelijk en doet u via Osiris en
het onderwijsbureau (cru-epidemiology@umcutrecht.nl).
i.
Tips nodig over efficiënt studeren?
Heb je weleens moeite om de hoofd- en bijzaken van elkaar te onderscheiden of zit je de nacht
voor een tentamen nog tot midden in de nacht te studeren? Zou je hierin willen veranderen,
maar weet je niet goed hoe?
Je kunt je wenden tot je tutor of een studieadviseur. Ook kun je heel veel informatie en
trainingen / workshops vinden bij het Skillslab van de UU: https://students.uu.nl/naast-destudie/trainingen
j.
Vertrouwenspersoon
Voor studenten die tijdens de studie of coschappen te maken krijgen met ongewenste
omgangsvormen is het van belang dat zij laagdrempelig de mogelijkheid hebben om dit in
vertrouwelijk verband te kunnen bespreken. Onder ongewenste omgangsvormen wordt
verstaan: ‘alles in de omgang en communicatie wat als ongewenst/kwetsend wordt ervaren en
tot doel of gevolg heeft dat je je niet langer veilig voelt in de opleiding, tijdens de coschappen of
in de privé-sfeer.’ Je kunt hierbij denken aan (seksuele) intimidatie, agressie en geweld, pesten
en discriminatie.
Over deze zaken kun je contact opnemen met:
de studieadviseurs: adviseurs@umcutrecht.nl;
vanuit het UMCU (ook voor studenten): Bureau Ombuds- en Vertrouwenszaken, telefoon:
088-7558620, e-mail ombudsenvertrouwenszaken@umcutrecht.nl - ook voor kwesties
m.b.t. (wetenschappelijke) integriteit;
vanuit de universiteit: mevrouw Jeanette van Rees: j.vanrees@uu.nl,
vertrouwenspersoon voor alle UU-studenten.
In het handboek Kwaliteit en Veiligheid staat uitgebreider beschreven wat de mogelijkheden bij
dergelijke situaties zijn.
k.
Evaluatie en kwaliteitsbewaking
De opleiding Geneeskunde voert na iedere cursus een schriftelijke evaluatie uit. Aan studenten
wordt gevraagd om daaraan steeds mee te doen. De evaluaties zijn anoniem en worden bij
onderwijsblokken na afloop van de eindtoetsen afgenomen.
De evaluatieresultaten dragen bij aan de zorgvuldige kwaliteitsbewaking van het
13
KWO
onderwijsprogramma en aan verbeteringen van het onderwijs.
Tijdens de cursus kun je ook altijd terecht voor opmerkingen of suggesties bij de
cursuscoördinator of de bachelor vertegenwoordiging.
Eens per half jaar worden de resultaten van de onderwijsevaluaties op de
Blackboardcommunity UMCU GNK Cursusevaluaties geplaatst en wordt per blok een korte
terugkoppeling gegeven n.a.v. die evaluaties.
l.
Arbo, veiligheid en milieu
Tijdens de opleiding Geneeskunde sta je bloot aan risico’s. De belangrijkste regels m.b.t. Arbo,
veiligheid en milieu voor jezelf, de patiënt en het milieu staan beschreven in het Handboek
Kwaliteit & Veiligheid. Hier vindt u ook de gedragslijnen ter voorkoming van risico’s en hoe moet
worden gehandeld bij incidenten. Download het Handboek Kwaliteit & Veiligheid via deze
directe link: http://students.uu.nl/gnk/geneeskunde-b/onderwijs/stages-coschappen/kwaliteit-enveiligheid
In het blok KWO is geen sprake van bijzondere risico’s. Daar waar extra aandacht nodig is voor
bepaalde handelingen, wordt dit in het blokboek (de (computer)practicumhandleiding) vermeld.
m.
Leerlijnen Academische Vorming, Professionele Ontwikkeling en Studie
Reflectie
Alles wat je leert in de Bachelor Geneeskunde staat in dienst van de patiëntenzorg waaraan je
als toekomstig arts of arts-onderzoeker een bijdrage zult gaan leveren. De zogenoemde
CanMEDS-competenties (https://www.medischevervolgopleidingen.nl/competentiegerichtopleiden) zullen tijdens de opleiding centraal staan. Deze competenties ga je op meerdere
manieren ontwikkelen, namelijk tijdens de vakinhoudelijke blokken (toepassing en ervaring) én
in speciaal ontwikkelde leerlijnen die door de blokken heen lopen. De leerlijnen richten zich op
vaardigheden en competenties die vakgebied overstijgend zijn. Drie van deze speciaal
ontwikkelde leerlijnen (gedurende de gehele bachelor) zijn:

Academische Vorming
Het doel van de leerlijn Academische vorming is, naast de medische feitenkennis, het
opdoen van kennis & vaardigheden ten aanzien van een brede academische vorming
ten behoeve van het kritisch en klinisch te leren denken, redeneren en handelen, zoals
academische vaardigheden, wetenschappelijke integriteit, ethische professionaliteit en
wereldburgerschap.

Professionele & Persoonlijke Ontwikkeling
Het doel van de leerlijn Professionele & Persoonlijke Ontwikkeling is aandacht te
besteden aan verschillende aspecten van je professionele ontwikkeling tot arts. Denk
hierbij aan het op een professionele manier leren omgaan met taken, anderen
(samenwerking) en met jezelf (bv eigen emoties en bewaken van grenzen)

StudieReflectie
Het doel van de leerlijn StudieReflectie is onder andere om te leren reflecteren en zicht
te krijgen op je eigen ontwikkeling aan de hand van de CanMEDS.
Elke leerlijn heeft zijn eigen Blackboard community waarop uitgebreide informatie over de
leerlijn staat. Voor de leerlijnen Academische vorming en Professionele & Persoonlijke
Ontwikkeling maak je opdrachten die geïntegreerd in het reguliere (verplichte) onderwijs aan
bod komen. Let op: de meeste van deze opdrachten dien je aan jouw individuele portfolio toe te
voegen. Het portfolio bespreek je gedurende de bachelor in de individuele gesprekken met je
tutor als onderdeel van Studiereflectie.
In aansluitend (leerlijn-)onderwijs zoals PLO-CA (communicatie) en PLO-MT (Medisch
technische vaardigheden), Medical Humanities, Klinisch Wetenschappelijk Onderwijs en
Klinisch Lijn Onderwijs word je getraind in andere belangrijke academische en professionele
vaardigheden, zoals communicatie met patiënten; deze vaardigheden worden beschreven in de
blokboeken van dat onderwijs.
Waaraan dien je te voldoen om de leerlijnen Academische Vorming,
Professionele & Persoonlijke Ontwikkeling en StudieReflectie te behalen?
Voorwaarden voor een voldoende beoordeling:
14
KWO
1. Het naar behoren uitvoeren van per leerlijn tenminste 80% van alle opdrachten in
Bachelor jaar 1 en ten minste 80% van alle opdrachten van Bachelor jaar 2 en jaar 3
(zie OER, artikel 7.5);
2. Het samenstellen en tijdig inleveren van een compleet en correct portfolio met de
opdrachten, de benodigde documenten en het schrijven van de gevraagde reflecties;
3. Het bespreken van de inhoud van het portfolio met de tutor tijdens individuele
gesprekken.
Voor de leerlijnen Academische Vorming en Professionele & Persoonlijke Ontwikkeling gelden
de opdrachten en het bijbehorende werkgroeponderwijs als verplicht onderwijs. Dat verplichte
werkgroeponderwijs valt onder de 80% aanwezigheidsplicht van een blok. Voor de
groepsbijeenkomsten van StudieReflectie geldt een aanwezigheidsplicht van 80%. De
individuele gesprekken met de tutor zijn 100% verplicht.
Kijk op de Blackboard communities van de leerlijnen voor meer informatie.
n.
Adreslijst
Coördinator
Dr. K. Jenniskens, Julius Centrum tel. 088-7569636, k.jenniskens@umcutrecht.nl
Plaatsvervangend coördinator
Prof. dr. A. May, Julius Centrum tel. 088-7551132, a.m.may@umcutrecht.nl
Onderwijsbureau
Onderwijsbureau Epidemiologie, Julius Centrum, Str. 7.109, cru-epidemiology@umcutrecht.nl
Medewerkers van de medische bibliotheek die college PubMed verzorgen
Drs. P.H. Wiersma, medische bibliotheek, tel. 58087, P.H.Wiersma@uu.nl
Dr. Ir. B. Kramer, medische bibliotheek, tel. 58087, B.M.R.Kramer@uu.nl
F.P. Weijdema MSc, medische bibliotheek, tel. 58087, f.p.weijdema@uu.nl
Drs. M.N.W. Niessen, medische bibliotheek, tel. 58087, M.Niessen@uu.nl
Dr, M.S, Goudeau, medische bibliotheek, tel 58087, m.s.goudeau@uu.nl
Hoofdbegeleiders en docenten
Prof. dr. M.L. Bots, Julius Centrum, tel. 59352, m.l.bots@umcutrecht.nl
Dr. P. Bruining-Verhagen, Julius Centrum, tel 68137, p.bruijning@umcutrecht.nl
Dr. M.I. Geerlings, Julius Centrum, tel. 68494, M.Geerlings@umcutrecht.nl
Dr. K. Jenniskens, Julius Centrum tel. 68050, K.Jenniskens@umcutrecht.nl
Prof. Dr. A.M. May, Julius Centrum, tel. 51132, A.M.May@umcutrecht.nl
Dr. J. Roodhart, Interne geneeskunde, tel. 55555, J.Roodhart@umcutrecht.nl
Dr. A.P.E. Sachs, Julius Centrum, tel. 68505, a.p.e.sachs@umcutrecht.nl
Dr. R.P. Venekamp, Julius Centrum, tel. 53513, R.P.Venekamp@umcutrecht.nl
Prof. dr. F.L.J. Visseren, Interne geneeskunde, tel. 57324, F.L.J.Visseren@umcutrecht.nl
Dr. J. Westerink, Interne geneeskunde , tel. 71149, j.westerink-3@umcutrecht.nl
Dr. C.G. Schoemaker, WKZ, tel.xx, C.G.Schoemaker-4@umcutrecht.nl
A. Hiensch Msc, Julius Centrum, tel. 67708, A.E.Hiensch@umcutrecht.nl
Dr. J. Dorresteijn, Interne geneeskunde, tel. 56312, J.A.N.Dorresteijn-2@umcutrecht.nl
Dr. A. Uijl, Julius Centrum, tel. 68644 A.Uijl@umcutrecht.nl
Dr. C.H. Werkhoven, Julius Centrum, C.H.vanWerkhoven@umcutrecht.nl
Dr. R.J. Toorop, Interne geneeskunde, R.J.Toorop@umcutrecht.nl
15
KWO
16
KWO
Week 1. Beschrijving van het klinisch hoofdprobleem
Om de juiste vragen te kunnen stellen over een bepaalde ziekte of ziektebeeld, is het allereerst
noodzakelijk dat de onderzoeker gegevens kent over de achtergrond van de ziekte. Dit betreft
zowel epidemiologische als klinische gegevens. U zult vooral bezig zijn met het verzamelen van
basale kennis over het klinisch hoofdprobleem. Het gaat erom dat u kunt uitleggen wat de ziekte
inhoudt, wat de symptomatologie is, hoe deze gediagnosticeerd en behandeld wordt, etc. Op de
eerste maandag wordt het klinisch hoofdprobleem ingeleid door de klinische hoofdbegeleider,
mogelijk aan de hand van een patiëntdemonstratie. U wordt ingedeeld in groepen en elke groep
krijgt een werkgroepbegeleider toegewezen. Gedurende de week schrijft elke groep een
beknopte samenvatting van het klinisch hoofdprobleem, welke als introductie van uw
eindverslag zal dienen. Op vrijdag presenteren de verschillende groepen ieder hun
aandachtsgebied zodat de verschillende aspecten van het klinisch hoofdprobleem allemaal aan
de orde komen.
Indeling en uitvoering
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
Zelfstudie
Introductie college
Groepsopdracht
Hoor-werkcollege Diagnostisch onderzoek
Hoor-werkcollege Prognostisch onderzoek
Werkgroepbijeenkomst
Zelfstudie PubMed
Presentaties
I.
Zelfstudie
Lees hoofdstuk 1 (klinische epidemiologie) in deel III van dit blokboek door.
II.
Introductie college
Tijdens dit college zal de epidemiologische hoofdbegeleider de inhoud van het blok nader toelichten.
De klinische begeleider zal aan de hand van een voorbeeld uit de klinische praktijk laten zien
waarom dit blok zo belangrijk is binnen de opleiding.
Tevens zullen aan het einde van dit college de werkgroepen bekend worden gemaakt. Maak op
deze eerste dag afspraken met uw werkgroepbegeleider omtrent de datum, tijd en plaats
waarop werkgroepen zullen plaatsvinden. Aangeraden wordt om deze halverwege de week te
laten plaatsvinden. Spreek eveneens af met de werkgroepbegeleider of hij/zij de vragen voor de
werkgroep aangeleverd wilt hebben.
III.
Groepsopdracht
Deze week werkt u samen met de andere subgroep die hetzelfde aandachtsgebied heeft
(niveau 3). U dient een introductie van het klinisch hoofdprobleem te schrijven dat in uw blok
centraal staat. Het gaat om het weergeven van de huidige stand van wetenschappelijke kennis
op dit terrein, en dus niet een verhaal voor leken (Nederlands Tijdschrift voor Geneeskunde en
niet Libelle). Op deze manier krijgt de lezer inzicht in de oorzaken van de ziekte (etiologie), hoe
de ziekte gediagnosticeerd wordt, wat de prognose is en hoe de ziekte wordt behandeld. Let op:
schriftelijk dient u ALLE aspecten van het klinisch probleem aan de orde te laten komen;
bij de mondelinge presentatie op vrijdag concentreert u zich op uw aandachtsgebied
(etiologisch, diagnostisch, prognostisch of interventieonderzoek)!
Hiervoor kunt u onderstaande lijst als uitgangspunt gebruiken; de genoemde gegevens dienen
in ieder geval aan de orde te komen, maar niet noodzakelijk in de hieronder aangegeven
volgorde. U bent vrij om dit verder aan te vullen. De maximale omvang van de samenvatting is
twee tot drie pagina's A4. Verwerk in uw samenvatting ook de referenties middels de Vancouver
stijl.
17
KWO
-
Wat is de definitie van de aandoening? Zijn er onderverdelingen?
Wat is de prevalentie en incidentie? Zijn er verschillen naar leeftijd, geslacht, etniciteit?
Welke diagnostische testen worden gebruikt en hoe goed zijn deze?
Wat zijn de belangrijkste risicofactoren en beschermende factoren? (ga zowel in op
omgevingsfactoren als erfelijke factoren)
Wat is het natuurlijk beloop: complicaties, sterfte, effecten op dagelijks functioneren en
kwaliteit van leven?
Wat zijn de mogelijkheden voor behandeling? Geef van elke mogelijkheid de effectiviteit,
voor- en nadelen, mogelijke subgroepen met specifieke indicaties
Wat is het effect van behandeling op complicaties, sterfte, dagelijks functioneren en
kwaliteit van leven?
Zijn er mogelijkheden voor primaire en secundaire preventie?
Het is belangrijk om aan te geven op welke terreinen de wetenschappelijke onderbouwing
gering of afwezig is. Dit zijn de interessantste onderzoeksterreinen; zij vormen de basis
(‘rationale’) voor toekomstig wetenschappelijk onderzoek, en een potentiele focus voor het
schrijven van een subsidieaanvraag.
Informatie om de vragen in bovenstaand kader te beantwoorden dient u op te zoeken in recente
wetenschappelijke literatuur (PubMed) en klinische standaardwerken (medische bibliotheek).
Maak binnen uw werkgroep een goede taakverdeling, en zorg dat iedereen een steentje
bijdraagt.
De samenvatting van de groepsopdracht levert u uiterlijk op donderdag om 17:00 in week 1
in bij de epidemiologische hoofdbegeleider. Deze samenvatting dient als basis voor de
introductie van het eindverslag dat in week 6 ingeleverd moet worden.
IV.
Hoor-werkcollege Diagnostisch onderzoek
Tijdens het college worden de belangrijkste aspecten van diagnostisch onderzoek behandeld.
Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij
het praktische gedeelte vindt u in deel II van dit blokboek.
V.
Hoor-werkcollege Prognostisch onderzoek
Tijdens het college worden de belangrijkste aspecten van prognostisch onderzoek behandeld.
Het college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende
bij het praktische gedeelte vindt u in deel II van dit blokboek.
VI.
Werkgroepbijeenkomst
Voorafgaand aan de bijeenkomst met uw werkgroepbegeleider komt u samen met uw eigen
groep en bespreekt u de bevindingen en vragen tot dan toe. Om deze bespreking in goede
banen te leiden wijst u zelf een voorzitter en een secretaris aan (uiteraard kunnen deze rollen
per week wisselen). De voorzitter leidt de bijeenkomst; de secretaris schrijft de vragen op die u
met uw werkgroepbegeleider wilt bespreken. U en uw groep zijn in de ‘lead’ tijdens de
werkgroepbijeenkomst. Zorg dus dat u weet wat u wilt vragen.
De werkgroepbegeleider is er om u en uw groep te adviseren omtrent uw onderzoek. U kunt
gerichte vragen stellen, of vragen om feedback op uw presentatie of verslag. Wees gericht met
uw vragen. Niet: wat vindt u van het verslag? Wel: moeten we bij dit probleem de prevalentie of
de incidentie gebruiken?
Naast het wekelijkse contactmoment is de werkgroepbegeleider ook via de mail bereikbaar voor
vragen.
De voorzitter van de week bespreekt de vragen die uw werkgroep heeft met de
werkgroepbegeleider, waarna een discussie met de hele groep volgt.
Het is aan u en aan uw werkgroep of u de groepsopdracht voor de bijeenkomst naar de
werkgroepbegeleider stuurt voor feedback. U bent vrij om hier zelf een keuze in te maken.
Indien de groepsopdracht tijdig naar de werkgroepbegeleider gestuurd is, zal deze zijn/haar
suggesties en opmerkingen met u bespreken.
NB: de ervaring is dat in deze eerste week relatief weinig vragen zijn aan de
18
KWO
werkgroepbegeleider. Zie deze werkgroepbijeenkomst hiernaast dan ook als een
kennismakingsgesprek, en een moment om afspraken te maken.
VII.
Zelfstudie PubMed
Maak de trainingsmodule over PubMed die via Blackboard beschikbaar wordt gesteld.
VIII. Presentaties
Op vrijdag dient u een presentatie te geven over het klinisch hoofdprobleem. Deze dient gericht
te zijn op de informatie die u in de groepsopdracht heeft verzameld met betrekking tot het
aandachtsgebied (diagnostiek, prognostiek, etiologie of interventie) van uw werkgroep.
Richtlijnen voor presentaties kunnen worden gevonden in het kader hieronder.
Elke groep dient de powerpoint presentatie uiterlijk om 17:00 voor de dag van presentatie
in te leveren via email bij de klinisch hoofdbegeleider, epidemiologisch hoofdbegeleider,
en werkgroepbegeleider
Voorbeeld bestandsnaam: Week 1 Diagnostiek groep 1
Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 2.
Richtlijnen voor de presentaties:
Algemeen:
- Plaats niet te veel tekst op 1 dia.
- Gebruik kernwoorden i.p.v. hele zinnen op de dia’s.
- Duidelijk praten en richting de zaal kijken. Niet met uw rug naar de zaal om iets aan te wijzen
en
dan doorpraten. Bij powerpointpresentaties kunt u vaak zelf op het scherm kijken i.p.v.
op de geprojecteerde dia en dus goed contact houden met de zaal. Eventueel kunt u de
muis of een laserpointer gebruiken om dingen aan te wijzen.
Vrijdagpresentaties:
- Per keer voeren minimaal 2 studenten van een groep het woord.
- Houd het kort: max. 15 minuten. De resterende 15 minuten zullen gebruikt worden voor
discussie. De eindpresentatie in week 6 moet zelfs nog korter: maximaal 10 minuten!
- Begin elke week de presentatie met een (korte) inleiding.
Een beknopte handleiding powerpoint en beamergebruik vindt u in het studielandschap.
19
KWO
20
KWO
Week 2. Formuleren vraagstellingen & vooraanvraag subsidie
Patiëntgebonden onderzoek kan niet meer worden uitgevoerd zonder dat het plan daarvoor
eerst door anderen wordt beoordeeld. Zo eist bijvoorbeeld de wet op onderzoek bij mensen dat
onderzoeksplannen worden beoordeeld door een bevoegde medisch ethische
toetsingscommissie alvorens het onderzoek te starten. In zulke commissies zitten bijvoorbeeld
clinici, ethici, juristen, methodologen en vertegenwoordigers van patiëntenbelangen. Zij
beoordelen of een onderzoeksplan voldoet aan de medisch-ethische criteria (niet te belastend,
te veel risico) en of het onderzoek methodologisch voldoende kwaliteit heeft. Maar ook andere
beoordelingen vinden vaak plaats. Zo is goed patiëntgebonden onderzoek vrijwel altijd
afhankelijk van geld van subsidiegevers. Zij kijken niet alleen naar de wetenschappelijke
kwaliteit, maar ook naar de relevantie voor de patiënt. De toewijzing van geld voor onderzoek
gebeurt uiteraard altijd pas nadat collega’s een gedetailleerde positieve beoordeling van het
plan hebben gegeven. Maar ook dichter bij huis worden onderzoeksplannen tegen het licht
gehouden. Zo zullen ook collega’s in de directe omgeving graag over de opzet geïnformeerd
willen zijn, zeker als zij worden geacht daaraan mee te werken. Gesteld dus dat beoordeling
van een onderzoeksplan altijd, in welke vorm dan ook, vooraf plaatsvindt, dan is het
onvermijdelijk dat een onderzoeker zijn/haar plan eerst op schrift goed uitwerkt.
In de eerste week heeft u zich ingewerkt in de verschillende aspecten van het klinisch
hoofdprobleem. In deze tweede week oefent u in uw groep het uitwerken van
onderzoeksvraagstellingen die betrekking hebben op dit klinisch hoofdprobleem. U formuleert
minimaal één vraagstelling op elk van de vier aandachtsgebieden van epidemiologisch
onderzoek (diagnostiek, prognostiek, etiologie en interventie). De onderzoeksvraag gerelateerd
aan het aandachtsgebied in uw werkgroep werkt u verder uit tot een vooraanvraag voor een
subsidie.
Op vrijdag presenteert u de onderzoeksvraagstellingen die u bedacht heeft, evenals uw
vooraanvraag voor subsidie.
Indeling en uitvoering
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
IX.
X.
Zelfstudie
Zelfstudie: Statistiek
Hoor-werkcollege Frequentie- en associatiematen
Hoor-werkcollege Patiëntparticipatie
Groepsopdracht
Hoor-werkcollege Etiologisch onderzoek
Hoor-werkcollege Interventieonderzoek
Werkgroepbijeenkomst
Hoor-werkcollege Statistiek: Steekproefvariabiliteit en betrouwbaarheidsintervallen
Presentaties
I.
Zelfstudie
Lees hoofdstuk 2 (aandachtsgebieden binnen de klinische epidemiologie) in deel III van dit
blokboek door.
II.
Zelfstudie: Statistiek
In het statistiek instructie/werkbestand op Blackboard (onder het kopje statistiek in course
content) worden de zelfstudie modules voor statistiek aangegeven. In het werkbestand staat
precies aangegeven welke modules wanneer doorlopen dienen te worden. De zelfstudie
Beschrijvende Statistiek staat in het werkbestand zelf, maar er wordt ook verwezen naar een
Grasple zelfstudiemodule. Je mag zelf kiezen of je de platte tekst in het werkbestand
doorneemt, of de Grasple module. In beide gevallen bevat deze module de opdrachten die u
dient te doorlopen als voorbereiding op het hoor-werkcollege statistiek van deze week.
Opmerking: Er is tevens een SPSS-tutorial beschikbaar via Grasple (of een aantal praktische
oefeningen in het werkbestand), indien u zich hier alvast bekend mee wilt maken.
III.
Hoor-werkcollege Frequentie- en associatiematen
Tijdens het college worden de belangrijkste aspecten van frequentie- en associatiematen
21
KWO
behandeld. Het college bestaat uit een theoretisch en een praktisch gedeelte.
De oefeningen behorende bij het praktische gedeelte vindt u in deel II van dit blokboek.
IV.
Hoor-werkcollege Patiëntparticipatie
Voor subsidiegevers wordt relevantie voor de patiënt steeds belangrijker, naast
wetenschappelijke kwaliteit. Getrainde patiëntvertegenwoordigers beoordelen de
onderzoeksvoorstellen, en beslissen mee over financiering. Waar letten ze op? Welke
uitkomstmaten zijn voor hen relevant? Hoe schrijf je een goede publiekssamenvatting (vroeger
lekensamenvatting genoemd) zodat de patiënt-referent jouw onderzoek begrijpt en dus positief
beoordeelt? Ze beoordelen daarnaast ook of patiënten (-verenigingen) zijn betrokken bij je
onderzoek. Hoe doe je dat? We laten aan de hand van enkele voorbeelden zien hoe patiënten
en onderzoekers echt kunnen samenwerken.
Lees ter voorbereiding de achtergrond over Evidence-based Medicine in Appendix A
Lees ter voorbereiding de artikelen en bekijk het filmpje van de NIHR op Blackboard onder
Course Content -> Patiëntparticipatie
V.
Groepsopdracht
Deze week werkt u samen met de andere subgroep die hetzelfde aandachtsgebied heeft (niveau
3). U heeft zich aan het begin van de cursus ingelezen in een klinisch probleem, in casu een
ziekte.
U heeft zich in de eerste week verdiept in zaken als preventie, etiologie, diagnostiek, prognostiek
en mogelijkheden voor interventie met betrekking tot deze ziekte. Hierbij bent u ongetwijfeld hiaten
in de kennis en/of in de wetenschappelijke onderbouwing van de kennis tegengekomen.
Een essentieel onderdeel van deze cursus is dat u leert om een klinisch probleem aangaande een
ziekte te vertalen in een goede onderzoeksvraagstelling.
Formuleren vraagstellingen
U dient 4 vraagstellingen te formuleren, één op elk kennisgebied (diagnostiek, prognostiek,
etiologie, en interventie). In het kader hieronder vindt u de handvatten die u hierbij kunt gebruiken.
22
KWO
Vraagstelling (zie voorbeelden hieronder)
- Omschrijf over welke typische soort patiënten in welke setting u met het onderzoeksresultaat in
algemene zin een uitspraak wilt doen (domein);
- Beschrijf de determinant(en) die u in uw onderzoek wilt meten;
- Beschrijf de uitkomst(en) die u in uw onderzoek wilt meten en hun relevantie voor de patiënt;
- Formuleer op basis van uw antwoorden een eenduidige vraagstelling.
Voorbeeld 1: In de diagnostiek van perifeer vaatlijden is onbekend wat de waarde is van MR-angiografie
bij atherosclerose.
- Het domein: patiënten met klachten die doen denken aan atherosclerotisch perifeer vaatlijden en die
daarvoor worden verwezen naar de specialist.
- De determinant: uitkomst van MR-angiografie onderzoek.
- De uitkomst: aan- of afwezigheid van atherosclerotisch perifeer vaatlijden zoals vastgesteld met de
geldende gouden standaard.
- De uitkomst van MR-angiografie in relatie tot aan-/afwezigheid van atherosclerotisch perifeer
vaatlijden.
- Heeft bij patiënten, verwezen met verdenking op atherosclerotisch perifeer vaatlijden, MR-angiografie
een toegevoegde waarde als diagnostisch instrument?
Voorbeeld 2:
Bij kinderen met osteogenesis imperfecta zijn aanwijzingen dat orale toediening van bisfosfonaten een
gunstige invloed heeft op de botstofwisseling. Een probleem is dat niet bekend is of dit ook gunstig is voor
het motorisch functioneren van deze kinderen.
- Het domein: kinderen met osteogenesis imperfecta
- De determinant: bisfosfonaten
- De uitkomst: verbetering motorische functie
- Relatie tussen gebruik van bisfosfonaten en verbetering van motorische functie
- Verbetert het motorisch functioneren van kinderen met osteogenesis imperfecta als zij bisfosfonaten
gebruiken?
Voorbeeld 3:
Er zijn aanwijzingen dat te veel ijzer schadelijk is voor de bloedvaten maar directe bewijzen hiervoor
ontbreken. Het is de vraag of personen met een ‘chronisch’ teveel aan ijzer een verhoogde kans hebben
op hart- en vaatziekten. Personen die heterozygoot zijn voor het haematochromatose gen stapelen meer
ijzer dan niet-dragers.
- Het domein: personen zonder hart- en vaatziekten.
- De determinant: het genotype van het haematochromatose gen.
- De uitkomst: cardiovasculaire sterfte.
- Relatie tussen ‘heterozygoot’ zijn voor het haematochromatose gen en het optreden van
cardiovasculaire sterfte.
- Is de cardiovasculaire sterfte bij dragers van het haematochromatose gen hoger dan bij niet- dragers?
Vooraanmelding subsidieaanvraag
Eén van de vier door u geformuleerde vraagstellingen gaat u vervolgens verder uitwerken: dit
betreft de vraagstelling gericht op het aandachtsgebied van uw werkgroep (eveneens het
aandachtsgebied waar u de eerste vrijdag over heeft gepresenteerd). Bijvoorbeeld: de prognostiek
groep zal hun prognostische vraagstelling verder uitwerken. Bij deze vraagstelling dient u een
‘voor-aanmelding voor een subsidieaanvraag’ te beschrijven. Ofwel: beschrijf hoe een onderzoek
eruit zou kunnen zien die deze onderzoeksvraag tracht te beantwoorden. Deze vooraanmelding
bestaat uit een introductie, vraagstelling, domein, determinant, uitkomst en (in het kort) de
methode die u wilt gebruiken in uw onderzoek.
Het onderstaand kader kan u helpen om op een systematische manier een vooraanmelding
voor een subsidieaanvraag op te stellen. Er zijn uiteraard vele variaties denkbaar op dit kader,
maar zorg ervoor dat de verschillende aangegeven onderdelen (in min of meerdere mate)
worden beschreven, en in een logische volgorde aan de orde komen.
23
KWO
Titel onderzoek
De titel van een onderzoek is uiteraard geënt op de inhoud. Een pakkende informatieve titel is over het
algemeen aan te bevelen.
Vaststelling van het probleem
Of het nu gaat om etiologie, diagnostiek, prognose of interventie, een idee voor medisch onderzoek komt
voort uit de waarneming dat op een bepaald terrein een hiaat bestaat in de kennis.
De onderzoeker ervaart dat hiaat als een probleem dat opgelost zou moeten worden.
De oplossing dient geleverd te worden met onderzoek.
Uiteraard hoeft niet elk hiaat in de ogen van ieder lid van de (wetenschappelijke) gemeenschap een even
groot probleem te zijn. Bijvoorbeeld onderzoek gericht op mechanismen en oorzaken van ziekte kan in de
ogen van velen een groot, hoewel onvoorspelbaar, nut hebben voor de geneeskunde. Anderen zullen toch
eisen stellen aan de directe toepasbaarheid van onderzoeksresultaten. In elk geval zal de onderzoeker
aan zijn/haar wetenschappelijke omgeving (bijv. collegae onderzoekers, beleidsmakers, financiers,
medisch ethische commissies en patiënten) op overtuigende wijze duidelijk moeten kunnen maken wat
precies het probleem is. En waarom het relevant is. Als een onderzoeker dat niet kan, is er voor
bijvoorbeeld een financier weinig reden om geld voor uitvoering te geven. Een belangrijke eis is dat de
onderzoeker zeer goed op de hoogte is van de huidige stand van kennis en dat het hiaat daarin ook echt
bestaat. Gesprekken met mensen uit de doelgroep kunnen helpen om de implicaties van het probleem te
verhelderen, en daarmee de relevantie verduidelijken. Ook contacten met collega onderzoekers zijn vaak
van groot belang om tot een goede afbakening van het probleem te komen. Realiseert u zich daarbij dat
wat door de een als een belangrijk probleem wordt ervaren, door een ander soms als triviaal wordt gezien.
Gegeven dat de onderzoeker de probleemstelling helder voor ogen heeft kan de volgende lijn worden
gekozen voor de beschrijving ervan:
Tip: voorkom dus dat beoordelaars na lezing kunnen vragen: ‘Maar wat is nou eigenlijk precies het
probleem en waarom is dat relevant?’ Dit is in vele opzichten vaak een terechte maar tevens dodelijke
vraag!
Vraagstelling
Een in de regel ietwat onderschat onderdeel van een onderzoeksbeschrijving is het formuleren van een
goede onderzoeksvraagstelling. Vaak wordt die nog als impliciet onderdeel van de probleem-beschrijving
gezien of van een aparte beschrijving van het studiedoel. Toch is het belangrijk om juist expliciet een
onderzoeksvraag te formuleren, om de doodeenvoudige reden dat het die vraag is die u met uw
onderzoek wilt beantwoorden. Een vage vraag is ook met uitstekend opgezet onderzoek niet te
beantwoorden.
Laat dus beoordelaars zien dat er een heldere eenduidige vraag ligt, gebaseerd op een goed gedefinieerd
probleem, en dat uw onderzoek die vraag gaat beantwoorden.
In algemeen epidemiologisch of klinisch onderzoek dient een goede vraag tenminste de volgende
onderdelen te bevatten:
Het domein: op welke karakteristieke groep personen of patiënten heeft mijn onderzoeksvraag betrekking.
Studiepopulatie: hoe kom je aan de patiënten voor je studie (die representatief zijn voor het domein).
De bestudeerde relatie: over welke te onderzoeken determinanten en eindpunten gaat het in grote lijnen.
Voorbeeld
Er zijn aanwijzingen dat uitlokkende factoren zoals zwaar lichamelijk werk, ongewone mentale of
emotionele stress, overmatig alcoholgebruik, overmatige voedingsinname, een rol spelen in het ontstaan,
kort daarna, van acute myocardinfarcten en beroerten.
Deze factoren zouden dan een laatste stap vormen in de keten van gebeurtenissen, inclusief het relatief
langzame proces van atherosclerose, die tot acute hart- en vaatziekten leidt. Onderzoekers wilden dit
bestuderen door na te gaan of het op een bepaald moment blootgesteld zijn aan zulke factoren effect
heeft op de nationale cardiovasculaire sterftecijfers (voor geïnteresseerden: zie BMJ 2000; 321:1552-4).
Hun hypothese was dat een situatie, waarin bij een voldoende grote groep mensen een aantal van deze
triggerfactoren aanwezig mag worden geacht op eenzelfde punt in de tijd, zou leiden tot een
waarneembare stijging in het nationale aantal sterfgevallen ten gevolge van hart- en vaatziekten.
Situaties waarin zulke ongewone stressoren bij een groot aantal mensen tegelijkertijd aanwezig zijn, zijn
bijvoorbeeld aardbevingen of oorlogen. Deze situaties komen in Nederland gelukkig niet veel voor, maar
deze onderzoekers kozen als blootstelling een spannende kwartfinale wedstrijd in het Europees
24
KWO
kampioenschap van het Nederlands elftal tegen het Franse elftal in Engeland op 22 juni 1996. Deze
wedstrijd werd door de Fransen door een penaltyserie gewonnen. Een kleine 10 miljoen mensen bekeek
de wedstrijd. De uitkomst was de cardiovasculaire sterfte in juni 1996, en ter vergelijking in juni 1995 en
juni 1997, zoals verstrekt door het Centraal Bureau voor de Statistiek.
Domein: mensen die weleens aan momenten van acute stress blootstaan (=mensen).
Determinant: doormaken van acute ongewoon hoge stress (spannende verloren voetbalwedstrijd).
Uitkomst: cardiovasculaire sterfte.
Tip 1
Het aantal onderzoeksvragen dat met één onderzoek kan worden beantwoord, wordt nogal eens
schromelijk overschat. Voorkom dat beoordelaars kunnen zeggen ‘Er worden zoveel vragen gesteld, de
onderzoek(st)er weet niet wat hij/zij wil’.
Dus niet:
Is er een relatie tussen een acute stollingsstoornis en cardiovasculaire sterfte?
Is er een relatie tussen acute nicotine-intoxicatie en cardiovasculaire sterfte?
Is er een relatie tussen acuut overmatig alcoholgebruik en cardiovasculaire sterfte?
Is er een relatie tussen acute overmatige voedingsinname en cardiovasculaire sterfte?
Etc.
Maar:
Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe?
Tip 2
Een onderzoeksvraag is als zodanig het best herkenbaar als die ook als vraag wordt gesteld.
Dus niet:
We willen nagaan of ongewoon hoge stress iets te maken heeft met sterven aan hart- en vaatziekten.
Maar:
Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe?
Tip 3
Stel een onderzoeksvraag op die algemeen geldende wetenschappelijke waarde heeft, dus los van plaats
en tijd.
Dus niet:
Als mensen een spannende kwartfinale wedstrijd van het Nederlands elftal tegen Frankrijk in Engeland in
1996 meemaken, waarin Clarence Seedorf een penalty mist, hebben zij dan een hogere kans om aan
hart- en vaatziekten te sterven?
Maar:
Als mensen aan ongewoon hoge stress worden blootgesteld, neemt dan hun kans om te sterven aan harten vaatziekten toe?
Tip 4
Beschrijf het (abstracte) domein zo breed mogelijk (zie ook boven).
Dus niet:
Hebben Nederlandse pensioengerechtigde mannen die aan ongewoon hoge stress worden blootgesteld
een verhoogde kans om kort daarna te sterven aan hart- en vaatziekten?
Maar:
Hebben mensen die aan ongewoon hoge stress worden blootgesteld een verhoogde kans om te sterven
aan hart- en vaatziekten?
25
KWO
Tip 5
Houd een onderzoeksvraag leesbaar. Zet dus als regel niet bijv. een hele lijst determinanten en
uitkomsten in de vraag t.b.v. de volledigheid. Dit gaat ten koste van het begrip.
Studieopzet
In de loop van deze cursus zal u duidelijk worden dat voor de beantwoording van een specifieke
onderzoeksvraag vaak een keuze gemaakt moet worden voor een bepaalde vorm van onderzoek. De
details daarvan worden u op een ander moment duidelijk gemaakt, maar de grote lijnen in de beschrijving
van een onderzoeksontwerp zijn uniform.
Een goede beschrijving van het studieontwerp is te onderscheiden in een theoretisch deel en een
praktisch deel. In het theoretisch deel wordt beschreven met welke specifieke onderzoeksopzet de vraag
optimaal beantwoord kan worden. Wil men bijvoorbeeld het effect van een bepaald geneesmiddel op het
ziektebeloop bestuderen dan kan men tot het besluit komen dat een gerandomiseerd onderzoek daarvoor
het beste onderzoeksontwerp is. Alle meer theoretische overwegingen die bij die keuze een rol spelen
moeten in dit theoretisch deel aan bod komen. Waarom een gerandomiseerd onderzoek? Naar hoeveel
en welke interventies wordt gerandomiseerd? Wordt er geblindeerd? Hoe lang moet de follow-up zijn? Dit
soort vragen en de antwoorden daarop verdienen theoretische onderbouwing.
Het praktisch deel (ook wel operationalisatie) bestaat uit het concreet maken van deze theoretische
keuzen. Hoe worden patiënten geselecteerd die bij het gekozen domein passen? Hoe worden potentiële
deelnemers benaderd? Hoe zal de randomisatieprocedure in de praktijk verlopen? Hoe, wanneer en bij
wie worden determinanten en uitkomsten gemeten? Hoe worden de gegevens verwerkt en geanalyseerd?
De theoretische en de praktische beschrijving dienen tezamen weer te geven hoe de onderzoeksvraag
daadwerkelijk wordt beantwoord. U zou het daarmee ook kunnen opvatten als een nauwkeurige
beschrijving van een werkplan. Om dat te bereiken kunt u een beschrijving zo opstellen dat de volgende
onderdelen herkenbaar zijn:
Algemeen
Probeer een korte technische beschrijving te geven van de gekozen onderzoeksvorm (bijv. patiëntcontrole onderzoek, interventieonderzoek, etc.). Dit geeft beoordelaars de mogelijkheid om de beschrijving
in dat licht te lezen. Beschrijf het domein (welke typische persoon, welke typische patiënt?). Bedenk dat,
als u kiest voor een bepaald domein, u in het onderzoek deelnemers dient in te sluiten (studiepopulatie)
die aan de kenmerken van dat domein moeten voldoen. M.a.w. laat zien hoe u aan de juiste deelnemers
voor uw onderzoek komt. Vraag u bijvoorbeeld af of de setting waarin u van plan bent deelnemers te
rekruteren ook die deelnemers opleveren die horen bij uw domein.
Laat zien welke personen u juist wel wilt laten deelnemen en wellicht welke in het bijzonder niet. Geef dit
bijvoorbeeld puntsgewijs aan door middel van inclusie- en exclusiecriteria. Bedenk dat u in feite elke
deelnemer excludeert die niet aan de inclusiecriteria voldoet, dus inclusiecriteria zouden volstaan, maar
soms kunt u door specifiek te laten zien wie u excludeert meer duidelijk maken over het doel van het
onderzoek. Doel is om te laten zien met welke onderzoeksgroep u uiteindelijk iets wilt gaan zeggen over
het (veel bredere) domein in uw onderzoeksvraag.
Determinant-uitkomst relatie
Geef een specifieke opsomming van de onderdelen van de determinant-uitkomstrelatie die in uw
onderzoeksvraag vervat zijn. Doe dit bijvoorbeeld onder de kopjes ‘determinanten’ en ‘uitkomsten’.
Geef bij elke determinant en elk eindpunt ook de operationalisatie, dus hoe gaat u precies ‘bloeddruk als
determinant’ meten en hoe gaat u precies ‘een beroerte’ vaststellen.
Geef ook aan waarom u bepaalde factoren meet. Zijn deze direct onderdeel van de onderzoeksvraag, dan
zal dat de gemiddelde lezer duidelijk zijn. Soms echter meet u bijvoorbeeld zaken die moeten helpen om
na te gaan of de bestudeerde determinant-uitkomstrelatie in etiologische zin een werkelijke is of een
vertekende.
Factoren die u meet als confounders of effect-modificatoren of wellicht intermediaire factoren (zie voor
uitleg elders in deze cursus) moeten als zodanig herkenbaar worden beschreven.
Doel is om de beoordelaar inzicht te geven in het hoe en waarom van metingen.
Interventieonderzoek
Soms is de determinant een interventie, bijv. een geneesmiddel. Dit vraagt in de beschrijving enkele
26
KWO
aparte punten van aandacht. Beschrijf ook in een dergelijk geval exact wat deze interventie inhoudt
(dosering, duur, etc.) en eventueel wat de interventie is bij een referentiegroep (bijv. placebo).
Beschrijf zo nodig de randomisatieprocedure, de methode van randomiseren, stratificatie, etc.
Tijdsrelatie
In veel onderzoek zit een expliciete tijdsrelatie, bijv. bij follow-uponderzoek, of een impliciete tijdsrelatie,
bijv. bij cross-sectioneel onderzoek. In zowel beschrijvend als etiologisch onderzoek is een notie van hoe
de (kalender)tijd samenhangt met de determinant-uitkomstrelatie meestal van groot belang.
Bij follow-up onderzoek is van belang aan te geven wanneer determinanten en eindpunten worden
gemeten en wat de follow-upduur van personen in het onderzoek zal zijn.
Bij een patiënt-controleonderzoek is het ook van belang om aan te geven wanneer eindpunten zijn
gemeten en op welke periode de metingen van de determinanten betrekking hebben.
Associatiemaat
Soms vergemakkelijkt bijvoorbeeld het onder een apart kopje melden van de bestudeerde associatiemaat
de lezing van een onderzoeksbeschrijving.
Bestudeert u een gemiddeld groepsverschil of een relatief risico, etc.?
Data analyse
Het doel van de beschrijving van de (hoofd)analyse is, beoordelaars te laten zien hoe u in technische zin
van de gegevens die u hebt verzameld naar de beantwoording van de vraag komt. Hier zijn twee delen te
onderscheiden.
Ten eerste dient u hier aan te geven hoe u de onderzoeksgegevens gaat beschrijven.
Stel, u meet in een vervolgonderzoek klassieke risicofactoren voor hart- en vaatziekten, zoals de
bloeddruk, het serum cholesterolgehalte in het bloed en rookgedrag, als determinanten van het optreden
van herseninfarcten. U kunt hier dan aangeven dat u voor relevante groepen personen (bijvoorbeeld apart
voor mannen en vrouwen) voor de bloeddruk en het cholesterolgehalte een gemiddelde waarde met een
spreidingsmaat zult berekenen, zoals een standaard deviatie, en voor rookgedrag een percentage rokers
in elke groep.
Ten tweede dient u hier aan te geven hoe u in de analyse verbanden gaat leggen.
U laat dan zien hoe u precies het verband bepaalt tussen bijvoorbeeld hoge bloeddruk en het optreden
van beroerten, zoals het berekenen van een relatief risico.
In hoofdlijnen kan hier worden aangegeven welke statistische modellen worden gebruikt en hoe.
Dit hoeft geen exposé van statistische mogelijkheden te worden, maar dient meer om te laten zien dat u in
staat bent om de statistiek efficiënt te gebruiken bij beantwoording van uw onderzoeksvraag.
Steekproefomvang (=sample size, =statistische power)
In Appendix B (‘Steekproefomvang’) wordt meer inhoudelijk ingegaan op het berekenen van de benodigde
grootte van de steekproef voor een bepaalde studie. Het zal duidelijk zijn dat dit in de beschrijving van een
onderzoek een plaats verdient. Behalve dat het zowel onderzoeker als beoordelaar een indruk van de
haalbaarheid geeft, dwingt het de onderzoeker ook nog eens goed na te denken over de te verwachte
sterkte van associaties en de relevantie daarvan.
Haalbaarheid
Soms is het goed om in een beschrijving apart in te gaan op omstandigheden die de haalbaarheid van
onderzoek kunnen beperken of bevorderen. Bedenk hoeveel patiënten die voldoen aan de inclusiecriteria
zich per jaar zullen melden bij de locatie waar je je onderzoek gaat uitvoeren. Hoe lang gaat de studie dan
duren? Vraag ook eens aan patiënten of ze zouden willen meedoen aan het onderzoek, en waarom. Op
grond daarvan kan je aanpassingen doen om de haalbaarheid te vergroten.
Logistiek
Hier kunnen zaken vermeld worden als: verantwoordelijkheden, communicatiestructuur, wijze van
informatievoorziening aan onderzoeksdeelnemers (uitnodigingsbrieven, uitslagen, etc.), waarborgen
anonimiteit/geheimhouding, etc.
Rapportage
Het eigenlijke eindproduct van elke wetenschappelijke onderneming is de rapportage. Omdat een
onderzoeksbeschrijving in elk geval een goede planning behoeft, is het raadzaam om over de vorm en
inhoud van deze rapportage vooraf na te denken. Soms bijvoorbeeld hebben resultaten van onderzoek
een duidelijke praktische relevantie en dienen ze in die praktijk geïmplementeerd te worden. In zo’n geval
27
KWO
kan bijvoorbeeld een beleidsondersteunend advies door de onderzoekers worden geschreven.
Tijdsplanning
Onmisbaar in een goede beschrijving van de studieopzet is een formele tijdsplanning. In grote lijnen
kunnen daar in voorkomen: startdatum en duur voorbereiding; startdatum uitvoering; duur inclusie; einde
inclusie; indien van toepassing einde follow-up; duur analyse en rapportage; duur totale studie.
Begroting
Vrijwel elke instantie die onderzoek beoordeelt eist als onderdeel van de beschrijving een deugdelijke
begroting. De details hiervan worden voor dit werkboek buiten beschouwing gelaten. Echter, het is wel
van belang dat u bij het opzetten van een onderzoek in deze cursus een idee hebt van de kosten die
ermee gepaard gaan. Die zijn onder te verdelen in:
 Personeelskosten: meestal de hoogste kostenpost (dataverzameling, -management, -analyse,
ondersteuning, etc.). Vergeet hier niet de vergoeding voor de patiëntvertegenwoordigers in je
team.
 Materiaalkosten: geeft een overzicht van kosten van alle t.b.v. het onderzoek gebruikte
materialen. Denk aan materiaal t.b.v. afname van en bepalingen in bloedmonsters, vervaardigen
van vragenlijsten, portokosten, etc.
 Overige kosten: denk bijv. aan kantoorkosten (PC, huisvesting), huur onderzoeksruimte,
publicatiekosten, reiskosten, vergoeding deelnemers, etc.
Geef hierbij een totaal begroot bedrag. Tip: spendeer niet te veel tijd aan alle details, maar geef een grove
inschatting.
Algemene opmerkingen
Een goede beschrijving van onderzoek kan een aantal doelen dienen. De mate van uitgebreidheid van de
beschrijving hangt van deze doelen af. Een eerste, vaak onderschat, doel wordt gevormd door het nut van
het opschrijven voor de onderzoeker zelf. Een gedetailleerde beschrijving in een protocol dwingt de
onderzoeker met alle facetten van het onderzoek rekening te houden.
Daarnaast is het doel van een goede beschrijving vrijwel altijd om beoordelaars van uw onderzoek ervan
te overtuigen dat de kwaliteit én de relevantie zo hoog is dat het onderzoek financieel moet worden
ondersteund. Tegenwoordig gaat dat vaak in stappen van een vooraanvraag en, na selectie, een
definitieve aanvraag. In een vooraanvraag moeten de probleem-/vraagstelling en relevantie vaak goed
worden beschreven. In een definitieve aanvraag komen dan ook alle relevante details aan de orde.
Instellingen die onderzoek financieren kijken vaak niet alleen maar naar de inhoud van het onderzoek,
maar ook naar de setting waarin het wordt uitgevoerd. Is het een goede onderzoeksgroep, hebben ze veel
gepubliceerd, hebben ze ervaring met dit onderwerp, etc. Houd er rekening mee dat steeds vaker ook
patiëntvertegenwoordigers mede beoordelen. Zij letten vooral op de relevantie van de onderzoeksvraag
en de uitkomstmaten voor patiënten, de participatie van patiënten als meedenkers in het onderzoek (dus
niet alleen als proefpersoon) en de aandacht in het projectvoorstel voor de implementatie van de
resultaten.
Het devies is, dat alles waarvan de onderzoeker denkt dat het aan financiering kan bijdragen, hier dan ook
genoemd moet worden. Voor een onderzoeksprotocol dat voor alle betrokkenen als draaiboek kan dienen,
moeten alle onder studieopzet beschreven onderdelen dermate gedetailleerd beschreven en goed
geoperationaliseerd zijn, dat uitvoerbaarheid mogelijk is.
28
KWO
VI.
Hoor-werkcollege Etiologisch onderzoek
Tijdens het college worden de belangrijkste aspecten van etiologisch onderzoek behandeld. Het
college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het
praktische gedeelte vindt u in deel II van dit blokboek.
VII.
Hoor-werkcollege Interventieonderzoek
Tijdens het college worden de belangrijkste aspecten van interventieonderzoek behandeld. Het
college bestaat uit een theoretisch en een praktisch gedeelte. De oefeningen behorende bij het
praktische gedeelte vindt u in deel II van dit blokboek.
VIII. Werkgroepbijeenkomst
De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en
secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het
werkgroepsproces.
IX.
Hoor-werkcollege Statistiek: Steekproefvariabiliteit en
betrouwbaarheidsintervallen
Tijdens dit college wordt u wegwijs gemaakt in de betrouwbaarheidsintervallen. Er zullen tijdens
het college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint uitprint of
digitaal beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven.
X.
Presentaties
Op vrijdag presenteert u zowel de vier vraagstellingen als de subsidie vooraanmelding
behorende bij de vraagstelling van het aan uw groep toegewezen aandachtsgebied. Geef
tussen de vraagstellingen en de beschrijving van de vooraanmelding aan hoe en welke
patiënten u graag zou willen betrekken bij het verder uitwerken van deze vooraanmelding voor
subsidie.
Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in
te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en
werkgroepbegeleider
Voorbeeld bestandsnaam: Week 2 Prognostiek groep 3
Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 3.
29
KWO
30
KWO
Week 3. Herformuleren vraagstelling & analyseplan dataset
Deze week staat in het teken van de statistiek en data-analyse. U heeft na de presentaties in
week 2 toegang gekregen tot de achtergronddocumentatie, opdracht, en dataset horende bij uw
aandachtsgebied.
U gaat in deze week verder binnen uw eigen subgroep (4-6 studenten). U dient de
onderzoeksvraag die u bij uw eigen aandachtsgebied in week 2 geformuleerd heeft aan te
passen zodat deze met de aangeleverde dataset beantwoordt kan worden. Vervolgens maakt u
een analyseplan in woorden en lege tabellen. Met andere woorden: u bedenkt hoe u uw
vraagstelling gaat beantwoorden en hoe u de resultaten gaat presenteren. Dit vormt de basis
voor de methoden sectie in uw eindverslag. Let op: hier staan dus nog geen resultaten in!
Op vrijdag presenteert u de definitieve vraagstelling, de opbouw van de dataset, en het
analyseplan. U laat uitsluitend lege tabellen zien, nog geen resultaten!
Indeling en uitvoering
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
Zelfstudie
Zelfstudie: Statistiek
Groepsopdracht
Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets
Hoor-werkcollege Statistiek: T-toetsen
(computer)practicum Introductie SPSS (PC)
Werkgroepbijeenkomst
Presentaties
I.
Zelfstudie
Lees hoofdstuk 3 (uitvoering van onderzoek) in deel III van dit blokboek door.
II.
Zelfstudie: Statistiek
In het statistiek instructie/werkbestand op Blackboard (onder het kopje statistiek in course
content) wordt verwezen naar een zelfstudiemodule Mantel-Haenszel procedure (in het
document zelf op in Grasple). Deze module bevat de opdrachten die u dient te doorlopen als
voorbereiding op de hoor-werkcolleges statistiek van deze week.
Er is tevens een SPSS-tutorial beschikbaar via Grasple (of een aantal praktische oefeningen in
het werkbestand). Loop deze uiterlijk voor het practicum Introductie SPSS, door.
Na afloop van het derde college statistiek is er een zelfstudieopdracht in het werkbestand op
Blackboard waarin je zelf aan de slag gaat met het toepassen van de theorie. Neem deze
opgaven uiterlijk voor de nabespreking in week 4, door.
III.
Groepsopdracht
Vanaf deze week werkt u verder met uw eigen subgroep (4-6 studenten). Datasets zijn via
Blackboard onder toetsing/eindopdracht beschikbaar gesteld. (tevens zijn de datasets te vinden
op de cursus directory van de computers in het wetenschapslandschap, zie inloginformatie).
Deze gegevens zijn afkomstig van patiëntgebonden onderzoek in het UMC Utrecht en bevatten
echte onderzoeksgegevens, die in het kader van dit blok enigszins aangepast kunnen zijn.
Bij de datasets wordt ook een bestand met achtergrondinformatie en context van het onderzoek
geleverd, een lijst met beschrijving van de variabelen in de datasets (zg datadictionary), en
enkele opdrachten die u kunnen helpen de dataset te doorgronden. Deze zijn als zelfstudie te
maken en worden niet nabesproken, tenzij hier vanuit uw kant behoefte aan is. Niet alle vragen
dienen reeds in week 3 beantwoord te worden. De vragen over de data-analyse komen pas in
week 4 aan de orde.
Deze week herformuleert u de vraagstelling die u in week 2 heeft opgesteld bij uw
aandachtsgebied, zodat deze met uw dataset te beantwoorden is.
31
KWO
Let op: Sluit met de andere subgroep kort dat u niet dezelfde onderzoeksvraag heeft (dus
bijvoorbeeld: diagnostiek groep 1 en diagnostiek groep 5 dienen andere vraagstellingen te
beantwoorden met hun dataset)
Verslag
Vervolgens kunt u de eerste twee delen van uw verslag schrijven: de inleiding (gebaseerd op
wat u reeds in week 1 had geschreven maar nu toegespitst op uw dataset en vraagstelling), en
de patiënten en methoden.
Onderdelen van de patiënten en methodensectie zijn een beschrijving van de onderzoeksopzet,
studiepopulatie, datacollectie, definitie van determinant(en) en uitkomst, en een analyseplan
waarin alle analysestappen die u wilt gaan ondernemen worden beschreven (in woorden!). Een
berekening van de groepsgrootte is niet nodig. U kunt hiervoor de informatie uit de
achtergrondinformatie behorende bij de dataset gebruiken. Niet alles zal echter hierin vermeld
staan. Bedenk zelf welke kenmerken van studie design logisch zijn, en passen bij uw dataset.
Als u het analyseplan klaar heeft kunt u aan het einde van week 3, of anders begin week 4, de
data verkennen. Hierbij maakt u gebruik van de volgende leidraad. Lees deze door voordat u
met uw opdracht aan de slag gaat.
Van ruwe data naar een analysebestand
Onderzoeksgegevens die alleen nog maar ingevoerd zijn in een bestand, vormen de
zogenaamde ruwe data. Omdat er allerlei foutenbronnen bestaan, zijn de databestanden per
definitie niet perfect. Doel van deze fase van onderzoek is het beoordelen van de kwaliteit van
de gegevens en het voldoende verbeteren van fouten. Bovendien dienen de gegevens
toegankelijk te worden gemaakt om later de analyses soepel te kunnen verrichten.
Belangrijke bijkomstigheid is dat u de gegevens leert kennen.
Om een goed analysebestand te krijgen is een systematische aanpak vereist. Dit begint al bij de
naamgeving van bestanden, van variabelen en van labels (etiketten). Aangezien u ook in deze
fase fouten kunt maken, bewaart u op relevante momenten het gegevensbestand, zodat u later
op eerdere versies kunt terugvallen. Bedenk een goede systematiek voor de bestandsnamen en
handige namen voor variabelen, zodat u geen fouten maakt in de analyse.
Voorbeeld van een databestand
patnr
leeftijd
hartinf
hyperten
opleidng
rook
ooit
1
38
1
1
3
1
2
32
2
1
3
2
3
48
2
2
99
1
4
12
1
2
1
1
In een dataset hebt u altijd te maken met missende waarden. Missende waarden is een
verzamelterm voor allerlei waarden die niet direct datgene weergeven wat gemeten zou moeten
worden. Zij worden gebruikt voor een antwoord dat niet is ingevuld of een vraag die
logischerwijs is overgeslagen (bij voorkeur moet u de missende waarden differentiëren en zelf
definiëren, zodat u later precies weet of een variabele echt onbekend is of dat de variabele niet
gemeten kon worden bij die patiënt). Als gegevens niet dubbel en/of met automatische controle
zijn ingevoerd, rest er achteraf weinig anders dan ze te controleren op inconsistenties. Daarvoor
is niet veel meer nodig dan logisch nadenken en af te wegen hoever u wilt gaan met de
controle.
Coderingen moeten eenduidig, logisch en volledig zijn, ze moeten elkaar uitsluitende
categorieën vertegenwoordigen en het liefst consequent toegepast worden op alle variabelen.
Documenteer de coderingen in een codeboek.
32
KWO
Voorbeeld van een code-boek
Variabele naam
Label
Patnr
Leeftijd
Hartinf
nummer van
patiënt
leeftijd in
jaren
hartinfarct
doorgemaakt
Hyperten
hypertensie
Opleiding
niveau
opleiding
Rookooit
Ooit gerookt
Ranges
AMC3001-NIJM1054
Code
voor
missing
nvt
18-74
1=ja
2=nee
99=onbekend
1=ja
2=nee
99=onbekend
1=geen/LBO
2=MBO
3=HBO
4=universitair
99=niet ingevuld
1=ja, ik rook nog steeds
2=ja, ik heb vroeger gerookt
3=nee, nooit gerookt
99=niet ingevuld
1-2
99
99
1-2
99
99
1-4
99
99
1-3
99
99
Allereerst dient gecheckt te worden op de in- en exclusiecriteria. Daarna gaat het vooral om rare
waarden bij de variabelen. Invoer- en meetfouten zijn niet altijd even gemakkelijk op te sporen,
wel als ze (in enige mate) extreem zijn. Denk daarbij ook aan combinaties van variabelen.
Vermoedelijke of echte fouten in de gegevens kunnen op verschillende manieren worden
behandeld, afhankelijk van de moeite die u wilt of kunt nemen om de databron weer te
benaderen. Gezond verstand is een vereiste. Als u zeker bent van een misser maar u kunt niet
meer de juiste waarde achterhalen, wijs dan een (aparte) missende waarde toe.
Hulpmiddelen die statistische computerprogramma’s bieden om fouten op te sporen zijn
grafieken (zoals histogrammen en scatter plots) en tabellen (zoals frequentie- en kruistabellen).
Verder zijn er ook mogelijkheden om te sorteren, selecteren of hercoderen. Soms wilt u ook
overzichten maken van bepaalde subsets (case summaries in SPSS) om daarmee terug te
gaan naar de statussen, vragenlijsten, labuitslagen, enz.
Tot zover moet er niets worden berekend; dat hoort bij de volgende fase. Hierop is één
uitzondering, namelijk voor de variabelen die u uiteindelijk in een andere gedaante in de
analyses wilt gebruiken. Denk aan transformaties van één of meerdere variabelen, zoals
Quetelet index (gewicht/lengte2), lengte in centimeters in plaats van meters. Vaak is aan
deelnemers gevraagd naar geboortedatum, terwijl het in het onderzoek gaat om de leeftijd op
bijvoorbeeld het inclusietijdstip.
Krantenartikelopdracht
Tevens zoekt u deze week samen met uw subgroep naar een krantenartikel met betrekking tot
epidemiologisch patiëntgebonden onderzoek (per subgroep één artikel). Dit dient een recent
krantenartikel gevonden (< 4 weken oud) dat de resultaten van een epidemiologisch
patiëntgebonden onderzoek te beschrijven (geen review, meta-analyse, case report/series (=
een beschrijving van één of weinig patiënten zonder controle groep)). Vervolgens zoekt u met
behulp van PubMed het bijbehorende wetenschappelijke artikel op. U informeert uw
werkgroepbegeleider over het gekozen artikel, en laat controleren of deze geschikt is voor het
beantwoorden van de vragen (zie Krantenartikelopdracht week 4)
IV.
Hoor-werkcollege Statistiek: Toetsingstheorie en de chi-kwadraat toets
Tijdens dit college wordt u wegwijs gemaakt in het concept van statistische toetsen. Er zullen
tijdens het college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint
uitprint of digitaal beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven.
33
KWO
V.
Hoor-werkcollege Statistiek: T-toetsen
Tijdens dit college wordt u wegwijs gemaakt in enkele specifieke toetsen. Er zullen tijdens het
college verschillende opdrachten worden doorlopen. Zorg dat u de powerpoint uitprint of digitaal
beschikbaar hebt, zodat u tijdens het college niet alles mee hoeft te schrijven.
VI.
(computer)practicum Introductie SPSS (PC)
Tijdens dit (computer)practicum wordt u geïntroduceerd in SPSS. Aan de hand van een dataset
worden verschillende opdrachten uitgevoerd.
VII.
Werkgroepbijeenkomst
De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en
secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het
werkgroepsproces.
VIII. Presentaties
Op vrijdag presenteert een van de twee groepen met dezelfde aandachtsgebied de vraagstelling,
de patiënten en methoden, en uw data-analyseplan. Begin uw presentatie kort (1-2 slides) met een
inleiding over het onderwerp, die leidt naar de vraagstelling.
Hierin schrijft u hoe u de vraagstelling gaat beantwoorden. U laat, behalve de baselinetabel ter
beschrijving van uw patiënten, enkel nog lege tabellen zien, dus wat u uit uw dataset wilt gaan
halen, maar nog geen concrete resultaten. Er zal aan het begin van de presentaties geloot worden
welke subgroep zal presenteren. De groep die niet hoeft te presenteren, stelt vragen aan de
presenterende groep; alle groepen (ongeacht of ze hoeven te presenteren of niet) leveren hun
eigen presentatie in.
Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in
te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en
werkgroepbegeleider
Voorbeeld bestandsnaam: Week 3 Etiologie groep 5
Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 4.
34
KWO
Week 4. De resultaten
Nadat u vertrouwd bent geraakt met de data kunt u beginnen met de data-analyse die u in week
4 af dient te ronden. Dit doet u aan de hand van de vragen en opdrachten die u bij uw
specifieke dataset hebt gekregen.
In deze week gaat u verder met de bewerking van de gegevens. U beantwoordt nu uw
onderzoeksvraag. Volg hierbij uw data-analyseplan. U schrijft de resultatensectie van uw
verslag. Op vrijdag presenteert u uw resultaten. Daarnaast levert u de antwoorden op de vragen
horende bij de krantenartikelopdracht in bij uw werkgroepbegeleider.
Indeling en uitvoering
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
IX.
Zelfstudie
Zelfstudie: Krantenartikelopdracht
Nabespreking statistiek opdracht
Analyse eigen data
Computer(computer)practicum diagnostisch en prognostisch onderzoek
Computer(computer)practicum etiologisch en interventieonderzoek
Groepsopdracht
Werkgroepbijeenkomst
Presentaties
I.
Zelfstudie
Lees hoofdstuk 4 (rapportage) in deel III van dit blokboek door.
II.
Zelfstudie: Krantenartikelopdracht
U heeft in week 3 met uw subgroep een recent krantenartikel gevonden (< 4 weken oud) dat de
resultaten van een epidemiologisch patiëntgebonden onderzoek beschrijft (geen review, metaanalyse, case report/series (= een beschrijving van één of weinig patiënten zonder controle
groep)). Hierbij heeft u met behulp van PubMed het bijbehorende wetenschappelijke artikel
gezocht.
Ondanks dat iedereen in uw subgroep hetzelfde artikel heeft is het de bedoeling dat iedereen
individueel onderstaande vragen beantwoord:
1.
Vat het krantenartikel in maximaal 5 regels samen.
2.
Vat het wetenschappelijk artikel in maximaal 5 regels samen.
3.
Wat vindt u van de kop van het krantenartikel? Dekt deze de lading van zowel het
krantenartikel als het wetenschappelijke artikel?
4.
In welke opzichten zouden de journalistieke uitspraken volgens u moeten worden
genuanceerd of aangevuld?
5.
Om welk kennisgebied (etiologisch, diagnostisch, prognostisch of interventieonderzoek)
gaat het hier? Motiveer uw antwoord in maximaal 5 regels.
6.
Wat is het onderzoeksdomein? Motiveer uw antwoord.
7.
Wat is de onderzoekspopulatie?
8.
Wat is/zijn de determinant(en)? Hoe wordt/worden deze gemeten?
9.
Wat is/zijn de primaire uitkomstma(a)t(en)? Hoe wordt/worden deze gemeten?
10. Wat is de hoofdvraagstelling van het onderzoek?
11. Hoe noemen we deze onderzoeksopzet? Motiveer uw antwoord in maximaal 5 regels.
12. Wat is bias? Welke vormen van bias zijn er in het algemeen (dus los van het door u
gekozen artikel)? Geef van elke bias een korte uitleg.
13. Loop alle soorten bias na en licht kort toe of en waarom deze wel of geen rol spelen bij
het type onderzoek dat in uw artikel wordt beschreven.
14. Wordt er in het artikel door de onderzoekers rekening gehouden met de voor het type
onderzoek relevante bias? Indien ja: leg uit hoe. Indien nee: wat hadden de onderzoekers
volgens u moeten doen?
Lever de volgende documenten per e-mail aan vóór dinsdag 12:00 uur (week 5) bij uw
werkgroepbegeleider (tenzij deze andere afspraken met u gemaakt heeft):
- PDF van het krantenartikel
35
KWO
-
PDF van het wetenschappelijk artikel
Word document met de antwoorden op de vragen
Tijdens de werkgroep in week 5 wordt de opdracht op groepsniveau besproken. Het op tijd
inleveren van de volledige opdracht en een ‘voldaan’ beoordeling is een ingangseis voor
het tentamen.
III.
Nabespreking statistiek opdracht
De statistiek zelfstudie opdracht wordt tijdens dit college nabesproken.
IV.
Analyse eigen data
Tijdens dit (computer)practicum heeft u de ruimte om de analyses uit uw data analyseplan uit te
voeren. Er zal begeleiding aanwezig zijn vanuit de epidemiologie docent en enkele
werkgroepbegeleiders. Zij zijn beschikbaar om hulp te bieden bij uitdagingen omtrent de
analyses en/of het (technisch) gebruik van SPSS.
V.
Computer(computer)practicum diagnostisch en prognostisch onderzoek
Tijdens dit (computer)practicum krijgt u twee nieuwe SPSS-bestanden met betrekking tot een
prognostisch en diagnostisch onderzoek om zo tijdens dit (computer)practicum nog een keer te
kunnen oefenen met de diverse begrippen en analyses die kenmerkend zijn voor deze twee
typen onderzoek.
VI.
Computer(computer)practicum etiologisch en interventieonderzoek
Tijdens dit (computer)practicum krijgt u twee nieuwe SPSS-bestanden met betrekking tot een
etiologisch en interventieonderzoek om zo tijdens dit (computer)practicum nog een keer te
kunnen oefenen met de diverse begrippen en analyses die kenmerkend zijn voor deze twee
typen onderzoek.
VII.
Groepsopdracht
Deze week voert u de analyses uit zoals u die vorige week in het analyseplan heeft
opgeschreven. U schrijft deze week de resultatensectie van uw rapportage.
VIII. Werkgroepbijeenkomst
De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en
secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het
werkgroepsproces.
IX.
Presentaties
Op vrijdag presenteert één subgroep per aandachtsgebied de resultaten van de analyses. Let
hierbij op de wijze van presenteren. De tabellen uit het (concept)artikel zijn meestal onleesbaar
als ze in powerpoint geprojecteerd worden. Maak hier dus keuzes in. Ook nu start de
presentatie met een korte introductie (1-2 slides), vraagstelling en methode.
De subgroep die in week 3 presenteerde, zal deze week vragen stellen. De groep die in week 3
vragen stelde, zal deze week presenteren. Beide groepen leveren de presentatie in bij de
hoofdbegeleiders.
Elke groep dient de powerpoint presentatie uiterlijk 17:00 voor de dag van presentatie in
te leveren via email bij de klinisch hoofddocent, epidemiologisch hoofddocent, en
werkgroepbegeleider
Voorbeeld bestandsnaam: Week 4 Etiologie groep 5
Na de presentaties wordt een kort overzicht gegeven van de theorie en opdracht voor week 5.
36
KWO
Week 5. Rapportage en discussie
In deze week maakt u op basis van het commentaar op de vrijdagpresentatie van week 4 de
resultatensectie van uw verslag af. Bij de presentatie van uw onderzoek hoort een beschouwing
waarin u de gevonden resultaten plaatst in het licht van eerder gepubliceerde resultaten.
Om enige indruk te krijgen voert u in deze week een mini-meta analyse uit, waarin u een
grafisch overzicht maakt van de resultaten uit de belangrijkste publicaties (maximaal 10) op het
onderzoeksterrein. Deze artikelen zult u zoeken tijdens het (computer)practicum PubMed:
zoeken voor mini-meta analyse.
U schrijft een discussie van uw resultaten voor uw verslag. Tevens levert u deze week uw
krantenartikelopdracht op dinsdag vóór 12 uur ’s middags in (per email) bij uw
werkgroepbegeleider. De antwoorden van de krantenartikelopdracht evenals de oefentoets op
Blackboard kunnen tijdens de werkgroepbijeenkomst besproken worden als hier behoefte aan
is.
Indeling en uitvoering
I.
II.
III.
IV.
V.
Zelfstudie
Zelfstudie: Krantenartikelopdracht
(computer)practicum PubMed: zoeken voor mini-meta analyse
Groepsopdracht
Werkgroepbijeenkomst
I.
Zelfstudie
Lees Appendix C (Meta-analyse) in deel III van dit blokboek.
Maak de proeftoets op Blackboard -> Course Content -> Toetsing -> Tentamen en bespreek uw
antwoorden met uw groepsgenoten tijdens de groepsbijeenkomst.
II.
Zelfstudie: Krantenartikelopdracht
Lever uw antwoorden op de vragen vóór dinsdag 12:00 uur in bij uw werkgroepbegeleider
(tenzij deze andere afspraken met u gemaakt heeft).
Het op tijd inleveren van de volledige opdracht en een ‘voldaan’ beoordeling is ingangseis voor
het tentamen.
Zie voor meer informatie over de krantenartikelopdracht week 4.
III.
(computer)practicum PubMed: zoeken voor mini-meta analyse
In dit (computer)practicum leert u een zoekstrategie voor uw onderzoeksvraag te formuleren.
Hiermee zoekt u vervolgens de literatuur voor uw mini-meta analyse (zie hieronder).
IV.
Groepsopdracht
U werkt deze week aan de discussie van uw artikel. Een onderdeel van de discussie vormt de
mini-meta analyse. Het opsporen van de juiste literatuur is vaak een kunst. Over het
aandachtsgebied binnen uw klinisch probleem zijn vaak duizenden publicaties verschenen en
door de juiste zoekstrategie toe te passen kunt u het aantal artikelen zeer aanzienlijk beperken.
Het is in deze cursus niet mogelijk een echte formele meta-analyse uit te voeren, omdat dit vaak
een behoorlijke tijdsinvestering vraagt. Voor deze cursus is het voldoende als u een grafisch
overzicht maakt van ‘effectmaten’ uit de belangrijkste publicaties op dit terrein.
Probeer die studies te vinden en selecteren die de ‘ideale’ onderzoeksopzet hebben gebruikt en
die in Engelstalige zogenaamde peer-reviewed tijdschriften zijn gepubliceerd. Let bij het zoeken
van publicaties vooral ook op de studiepopulaties die in het gerapporteerde onderzoek
onderwerp van studie-review waren. Als u geluk heeft, is over uw onderwerp recent een metaanalyse gepubliceerd en kunt u deze als uitgangspunt voor uw studie gebruiken. Als u minder
geluk heeft vindt u weinig tot geen artikelen over uw specifieke onderzoeksvraag. Bekijk en
bespreek dan de artikelen die het beste bij uw onderzoeksvraag in de buurt komen, ook als
deze niet de ‘ideale’ onderzoeksopzet hebben.
37
KWO
Bespreek, voordat u de literatuur gaat bewerken, uw zoekstrategie met de uw
werkgroepbegeleider of met een medewerker van de medisch bibliotheek; dit kan u heel veel
tijd besparen. Bedenk, voordat u in PubMed gaat zoeken, welke gegevens u uit een publicatie
wilt extraheren. Voor een etiologisch onderzoek zal dat anders zijn dan voor een diagnostisch
onderzoek.
Plan van aanpak
1. Formuleer een zoekstrategie die op uw onderzoeksvraag van toepassing is
2. Bepaal welke gegevens u gaat extraheren
3. Maak een tabel van de geëxtraheerde gegevens
4. Voer de mini meta-analyse uit. U kunt daarbij de zogenoemde Forrest-plots maken. (zie
Appendix B voor achtergrond en instructie)
5. Bespreek de resultaten van de mini-meta analyse in de discussiesectie van uw rapport, en
vergelijk de resultaten met die van uw eigen onderzoek
Rapportage discussie
De opbouw van de discussie is belangrijk. Veel auteurs beginnen de discussie met het
weergeven van de belangrijkste bevindingen uit de studie en vervolgens wordt de relatie met
het eerdere werk van andere groepen kort besproken. Schrijf geen gedetailleerde lange
kritieken op voorgaande studies, maar beperk u tot de belangrijkste publicaties.
Vervolgens gaat u kort in op de tekortkomingen van uw studie, en de betekenis van de
resultaten voor de klinische praktijk. U sluit af met een conclusie.
V.
Werkgroepbijeenkomst
De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en
secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het
werkgroepsproces.
Ook is er ruimte om de antwoorden van de krantenartikelopdracht evenals die van de
oefentoets tijdens de werkgroep te bespreken. U dient zelf aan te geven of hier behoefte toe is,
en welke vragen u speciaal op zou willen focussen. De antwoorden van de oefentoets zullen
niet op Blackboard komen, en worden ook niet aan studenten verstrekt.
38
KWO
Week 6. Eindpresentaties, eindverslag en toets
In deze week levert u uw eindverslag in, presenteert u uw bevindingen voor een “klinisch
publiek” en vindt ook de eindtoets plaats.
In deze laatste week schrijft u een gestructureerde samenvatting (abstract) over uw onderzoek.
U maakt uw verslag nu helemaal af, delen hebt u reeds eerder geschreven. Het eindverslag
bestaat uit de Abstract (nieuw), Inleiding (week 1), Methoden (week 3), Resultaten (week 4) en
Discussie (week 5).
Op donderdag (of in sommige gevallen vrijdag) presenteert u per groep uw onderzoek, inclusief
discussie. Zie deze eindpresentatie als een ‘congrespresentatie’ voor een klinisch publiek.
Geef dus een goed lopend afgerond verhaal met een begin (Introductie) en een eind (Discussie/
conclusies), maar wel beknopt! U krijgt slechts 10 minuten en er zal streng op de tijd worden
gelet (maak ongeveer 10 dia’s in PowerPoint voor uw eindpresentatie). Na afloop worden aan
elk van u individueel vragen gesteld door de hoofdbegeleiders.
Lever uw eindverslag via de e-mail in bij: 1.) hoofdbegeleiders, 2.) werkgroepbegeleider, 3.) cruepidemiology@umcutrecht.nl Dit mag in één e-mail. De deadline voor het inleveren van het
eindverslag is de laatste vrijdag van het blok om 23.59 uur.
Op de vrijdag wordt de cursus afgesloten met een schriftelijke toets (open boek, waarbij u dus
alle boeken en aantekeningen mee mag nemen. U mag echter geen gebruik maken van uw
mobiele telefoon, dus neem een rekenmachine mee).
Indeling en uitvoering
I.
II.
III.
IV.
Groepsopdracht
Werkgroepbijeenkomst
Eindpresentaties
Eindtoets
I.
Groepsopdracht
U schrijft een gestructureerde samenvatting (abstract) over uw onderzoek. Deze samenvatting
is veelal het belangrijkste onderdeel van een wetenschappelijk artikel. Niet alleen omdat deze
opgenomen zal worden in PubMed, maar ook omdat de eerste indruk van de redacteuren van
het beoogde tijdschrift op deze samenvatting is gebaseerd. Zij beslissen na het lezen ervan of
het artikel wel interessant genoeg is voor het tijdschrift en of het aan beoordelaars zal worden
gestuurd.
Verder maakt u uw rapportage af door de samenvatting toe te voegen aan wat u vorige week
reeds geschreven hebt. Uw eindverslag bestaat nu uit een titel, samenvatting, inleiding,
patiënten en methoden, resultaten, en discussie.
Volg bij het schrijven van een artikel met primaire data (= data verzameld in patiënten) altijd de
structuur: introductie, methoden, resultaten en discussie (IMRaD). Enkele richtlijnen zijn hier
kort samengevat, maar bekijk vooral ook eens de vergelijkbare publicaties in grote tijdschriften.
Voor meer achtergrond kunt u de hoofdstukken uit het boekje van Hall et al lezen.1
1
Hall GM. How to write a paper. BMJ Publishing Group. 1999 London
39
KWO
1. Schrijf de introductie. De basis hiervoor heeft u reeds gelegd toen u het klinisch probleem
heeft verkend (week 1), en in uw vooraanvraag (week 2). De introductie moet kort en pakkend
zijn en onmiddellijk duidelijk maken waarom u de studie heeft opgezet en uitgevoerd. Geef
duidelijk aan wat de studie die u heeft uitgevoerd gaat toevoegen aan de al bestaande kennis
op dit terrein. Laat zien dat er echt nieuw onderzoek op dit terrein nodig was. Iets nog eens
overgedaan hebben is voor editors van grote tijdschriften vaak geen reden om uw bevindingen
te publiceren. Een zeer gedegen literatuuronderzoek voordat u de studie gaat opzetten kan
voorkomen dat u zaken gaat uitzoeken die allang gedaan zijn.
Als u subsidie nodig heeft zult u dit vaak al voor de subsidiegever hebben gedaan maar heel
vaak wordt de literatuur pas goed nageplozen als het artikel wordt opgeschreven. In de
introductie is geen plaats voor lange literatuuroverzichten. Wees kort en formuleer nauwkeurig
de vraagstelling die u in het onderzoek gaat beantwoorden.
2. Schrijf de methodensectie. Ook deze sectie heeft u al uitgewerkt in uw onderzoeksprotocol
(week 3). In dit onderdeel moet komen te staan hoe het onderzoeksontwerp eruitziet, hoe de
studiepopulatie eruitziet, wat de uitkomsten van de studie zijn en hoe u de gegevens heeft
geanalyseerd. Als u een studie heeft uitgevoerd waarin randomisatie heeft plaatsgevonden,
beschrijf dan precies hoe deze is uitgevoerd. Als u een cohortonderzoek heeft uitgevoerd,
beschrijf dan de tijdsrelatie tussen het vaststellen van het eindpunt en de determinant. De lezer
moet weten in hoeverre de resultaten van de studie te gebruiken zijn in de praktijk. Om deze
reden is een nauwkeurige beschrijving van de geselecteerde patiënten nodig. Wie kwamen er
voor de studie in aanmerking, wie niet, en vooral: hoe werden ze gerekruteerd voor de studie.
Geef altijd een beschrijving van de populatie waarin de studie werd uitgevoerd. In deze
zogenaamde baseline tabel staan belangrijke kenmerken (bijvoorbeeld leeftijd, geslacht,
symptomatologie, risicofactoren) van de onderzochte populatie. In een gerandomiseerde studie
vindt u hier hoe de verschillende risicofactoren over de experimentele en controle groep zijn
verdeeld. Vermeld ook altijd of u toestemming hebt verkregen van de medisch ethische
commissie en leg de lezer met getallen uit, op basis waarvan de studieomvang is gekozen.
Vaak worden stukken die in de Resultaten horen in de Methoden beschreven en omgekeerd.
Let hier goed op.
3. Beschrijf de resultaten van uw onderzoek. Deze sectie heeft u in grote lijnen reeds
geschreven bij het uitwerken van uw opdracht (week 4). De resultatensectie is het
gemakkelijkste onderdeel van het artikel. Zij kan heel kort zijn en geeft antwoord op de gestelde
vraagstelling. Leid de lezer door de resultaten en verwijs nooit alleen naar tabellen (dus niet: ‘in
tabel 1-4 vindt u de belangrijkste resultaten’). Herhaal echter niet alles wat ook in de tabellen te
vinden is.
5. Discussie. De opbouw van de discussie is belangrijk. Veel auteurs beginnen de discussie met
het weergeven van de belangrijkste bevindingen uit de studie en vervolgens wordt de relatie
met het eerdere werk van andere groepen kort besproken. Schrijf geen gedetailleerde lange
kritieken op voorgaande studies maar beperk u tot de belangrijkste publicaties. Het snelst krijgt
u hierover overzicht indien u een ‘quick and dirty’ mini-meta analyse uitvoert (zie hierboven).
Vervolgens gaat u kort in op de tekortkomingen van uw studie, de betekenis van de resultaten
voor de klinische praktijk.
II.
Werkgroepbijeenkomst
De werkgroep zal plaatsvinden op eenzelfde manier als week 1. Wissel de rol van voorzitter en
secretaris zodat iedereen gedurende de cursus een gelijkwaardige bijdrage levert aan het
werkgroepsproces.
Indien u nog niet de krantenartikelopdracht of de oefentoets tijdens de werkgroep in week 5
heeft besproken, kunt u dit alsnog in deze laatste week doen. U dient zelf aan te geven als hier
behoefte toe is, en welke vragen u speciaal op zou willen focussen. De antwoorden van de
oefentoets zullen niet op Blackboard komen, en worden ook niet aan studenten verstrekt.
III.
Eindpresentaties
Bij de eindpresentaties geeft u uw definitieve presentatie. Deze zal tevens worden beoordeeld.
De eindpresentaties zullen in de vorm van een klinisch wetenschappelijk congres
40
KWO
gepresenteerd worden (dit i.t.t. eerdere presentaties die meer het karakter hadden van een
werkbespreking). Verwerk in de eindpresentatie uw mini-meta analyse. Conform de meeste
congressen zal de tijd om uw bevindingen te presenteren kort zijn, te weten 10 minuten!
Beperk het aantal dia’s dat u wilt gebruiken; één minuut per dia is een aardige richtlijn om vast
te houden. Realiseer u dat u in een presentatie niet alles kunt vertellen, en bedenk voor wie u
staat te spreken. Zijn het artsen? Epidemiologen? Een patiëntenvereniging? Dit bepaalt welke
informatie meer uitleg behoeft, en welke informatie sneller overheen kan worden gegaan. Dia’s
moeten leesbaar zijn en uitkomsten kunnen niet zo worden weergegeven als in het uiteindelijke
artikel
Voorwaarden presentatie:
- Maximale tijdsduur:
10 minuten
- Na de presentatie:
15 minuten discussie
- Uitloop / wissel:
5 minuten
- Ieder lid van de groep neemt een deel van de presentatie voor zijn rekening.
Na afloop zullen de hoofdbegeleiders en werkgroepbegeleiders individuele studenten
(methodologische) vragen stellen.
Deze week presenteren alle groepen hun bevindingen. De indeling zal in week 5 bekend
gemaakt worden. De inzet van eerdere weken wordt meegenomen in de beoordeling van de
eindpresentatie
IV.
Eindtoets
Tot slot bereidt u zich voor op de eindtoets. Dit doet u aan de hand van de stof die gedurende
de cursus is behandeld. Meer informatie omtrent de eindtoets is te vinden in deel I van dit
blokboek, onder ‘Toetsing’.
Om de cursus te evalueren en waar nodig in de toekomst te verbeteren, verzoeken wij u om na
afloop van de eindtoets het evaluatieformulier van de cursus in te vullen. Doe dit alstublieft! Met
name opmerkingen in de vrije tekstvelden worden geapprecieerd, en bieden ons het meeste
input om de cursus te verbeteren en verfijnen. Bij voorbaat dank!
41
KWO
42
KWO
DEEL II
Klinisch Wetenschappelijk Onderzoek
OEFENINGEN BIJ COLLEGES & (COMPUTER)PRACTICA
43
KWO
44
KWO
Week 1. Oefeningen college diagnostisch onderzoek
a.
Oefening 1
Deze oefening is gebaseerd op het volgende onderzoek:
Draaisma JMTh, Lemmen van RJ, Jong AAM de, Doesburg W. Temperatuurmeting bij kinderen:
met de trommelvlies-infraroodmeter en de rectale kwikthermometer even goede resultaten op
de spoedeisendehulp-afdeling. Ned Tijdschr Geneeskd 1997;141:938-941.
Dit is een goed voorbeeld van zogenaamd testonderzoek. In testonderzoek worden de
testeigenschappen van twee diagnostische testen vergeleken. Dit soort onderzoek geeft geen
antwoord op de vraag wat de additionele waarde is van de test voor het stellen van een
diagnose.
De onderzoeksvraag was, of met behulp van een nieuwe trommelvlies-infraroodmeter accuraat
de aanwezigheid van koorts kan worden gesteld bij kinderen jonger dan 11 jaar. In dit
onderzoek werden in totaal 213 kinderen jonger dan 11 jaar gezien op een afdeling
spoedeisende hulp van een algemeen ziekenhuis. Bij alle kinderen werd de temperatuur
gemeten met de conventionele rectale kwikthermometer (RKT) en de nieuwe trommelvliesinfraroodmeter (TIM). De RKT werd als gouden standaard beschouwd en koorts werd voor
beide methoden gedefinieerd als een afgelezen temperatuur hoger dan 38° C.
Het gemiddelde verschil tussen de temperatuur gemeten met de TIM en de RKT was nihil. Bij
96 kinderen werd volgens de gouden standaard koorts geconstateerd. Volgens de TIM waren er
86 kinderen met koorts van wie 77 ook koorts hadden volgens de RKT.
1.
Formuleer de onderzoeksvraag in termen van determinant en uitkomst relatie. Wat is het
domein?
2.
Bereken de sensitiviteit en specificiteit van de TIM.
3.
Bereken de positief en negatief voorspellende waarde van de TIM.
4.
Wat verwacht u van de voorspellende waarden als deze nieuwe thermometer in de
huisartsenpraktijk wordt toegepast?
5.
Wat zijn de overwegingen in termen van voorspellende waarden voor toepassing van de
TIM in de huisartsenpraktijk? Wat vindt u belangrijker, de positief of de negatief
voorspellende waarde?
45
KWO
b.
Oefening 2
Deze oefening is gebaseerd op het volgende onderzoek:
Barenys M, Abad A, Pons JM, Moreno V, Rota R, Granados A, Admetlla M, Pique JM.
Scoring system has better discriminative value than Helicobacter pylori testing in patients
with dyspepsia in a setting with high prevalence of infection. Eur J Gastroenterol Hepatol.
2000;12:1275-82 2
Een internist verbonden aan een perifeer ziekenhuis krijgt een vrouw van 50 jaar op de
polikliniek gastroenterologie verwezen in verband met borende pijn in het epigastrium.
De klachten bestaan al enkele maanden, zijn vooral ’s nachts aanwezig en worden
tijdelijk minder na het eten. Haar moeder had iets dergelijks gehad maar details ontbreken.
De verdere anamnese vermeldt geen bijzonderheden. Alcoholgebruik: minimaal. Roken: neen.
Medicatie: gemiddeld 3 maal per week ibuprofen (een NSAID) voor haar knieklachten.
De internist denkt aan een zweer van de maag of de 12-vingerige darm (ulcus pepticum).
Opgeleid in een moderne ‘Evidence-Based Medicine’ omgeving besluit de internist een
diagnostische score te gebruiken om de patiënt als hoog of laag ulcus risico te kunnen
classificeren. Dit heeft immers de consequentie van respectievelijk wel of geen endoscopie.
De diagnostische score die de internist wil gebruiken is opgebouwd uit anamnestische
gegevens en werd in de vorm van een tabel gepresenteerd:
Indicator
Punten
Leeftijd > 40 jaar
1
Mannelijk geslacht
1
Alcohol gebruik > 30 gram / dag
1
Roken > 10 sigaretten per dag
1
NSAID gebruik > 2 doses / week
2
Episodische pijn in epigastrium
1
Pijn neemt af na eten
2
Eerdere ulcus diagnose
2
De score is de som van de punten. De positief voorspellende waarde bij score  3 is 57%
en de negatief voorspellende waarde is 89% (score < 3 is 11% kans op peptisch ulcus).
De voorafkans is 25%.
1.
De bovenstaande tabel is het resultaat van een diagnostisch wetenschappelijk
onderzoek. Hoe zou dat onderzoek eruit hebben gezien (ontwerp, uitkomst,
determinanten)?
2.
De internist, die inmiddels een kopie van deze tabel uit de bureaulade heeft getrokken,
merkt dat het gegeven ‘episodische pijn’ van de patiënt nog ontbreekt. Hij vraagt hiernaar
en krijgt een ontkennend antwoord. Tot welk domein behoort deze patiënte?
3.
Wat is de score van de patiënte en wat is haar risico op peptisch ulcus? Neem daarbij
aan dat het domein van de patiënte overeenkomt met dat van de patiënten waarvoor de
anamnestische score bedoeld is.
4.
Wat is uw bezwaar tegen deze wijze van presenteren van een gedichotomiseerde (= in
tweeën gedeelde) score?
5.
De internist gebruikt deze score en handelt naar bevinden. Tijdens het golfen bespreekt
hij de patiënte met een collega die stelt dat een C-14-ureum-ademtest op H. Pylori veel
informatiever is. Hij zegt dat de sensitiviteit van deze test 80% en de specificiteit 85% is
voor ulcuslijden. Bereken met behulp van een kruistabel en een denkbeeldige populatie
2
Voor dit onderwijs werden de getallen uit dit onderzoek enigszins aangepast.
46
KWO
van 100 patiënten uit ovengenoemd domein de positief en negatief voorspellende waarde
van de ademtest. Neem hierbij aan dat de voorafkans op een ulcus in dit domein ook
25% is.
6.
Wat vindt u van de diagnostische waarde van de ademtest op H. Pylori vergeleken met
de anamnestische score? Waarom is de vraag welke van de twee “testen” de voorkeur
heeft niet de klinisch relevante vraag? Welke is deze vraag dan wel?
7.
Hoe zou u de ‘klinisch relevante vraag’ genoemd bij vraag 5 kunnen onderzoeken?
Beschrijf kort het onderzoeksopzet. Vermeld ook de determinant-uitkomst relatie(s).
8.
In het onderzoek waarin de score werd beschreven is ook de toegevoegde waarde van
de ademtest onderzocht. De toegevoegde waarde bleek nihil. Hoe is dit te verklaren?
9.
Is het in een onderzoek naar de toegevoegde waarde van de ademtest noodzakelijk (voor
de validiteit) dat de beoordelaar van de ademtest niet op de hoogte is van het resultaat
van de anamnestische score? Zo ja, waarom?
47
KWO
c.
Oefening 3
Verdenking op myocard infarct in de huisartspraktijk
Patiënten in de huisartspraktijk met symptomen die kunnen duiden op een myocardinfarct
(MI) worden doorverwezen voor additionele diagnostiek. Echter, slechts een deel van de
doorverwezen patiënten blijkt een MI te hebben.
De leeftijd van de patiënt kan gebruikt worden als ‘test’ of een MI waarschijnlijk is.
In onderstaande tabel wordt de leeftijd weergegeven van 100 patiënten met een verdenking
op een MI met de daadwerkelijke aanwezigheid of afwezigheid van een MI.
1.
Pt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
2.
Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten die 65 jaar zijn
of ouder.
Leeft
40
40
40
41
42
43
44
44
44
45
46
47
48
48
48
48
48
49
49
49
50
51
52
53
54
55
56
56
56
57
57
58
59
60
MI
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
Pt
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
Leeft
61
62
63
63
63
63
63
64
65
66
67
68
69
70
70
70
71
71
71
71
71
71
72
73
74
75
76
76
76
76
77
77
77
78
MI
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
1
1
0
0
0
0
1
0
0
0
Pt
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Leeft
79
80
81
81
81
81
81
82
82
82
83
83
83
83
84
85
85
85
85
85
85
86
86
86
86
87
88
88
88
88
89
89
MI
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
1
0
0
1
1
0
0
1
1
0
0
1
1
Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten bij meerdere
afkappunten, namelijk
a. van 50 jaar of ouder
b. van 60 jaar of ouder
c. van 70 jaar of ouder
d. van 80 jaar of ouder
en zet deze in een ROC curve
(y-as: sensitiviteit = Terecht positief, x-as = 1-specificiteit = Vals positief).
48
KWO
49
KWO
50
KWO
Week 1. Oefeningen college prognostisch onderzoek
a.
Oefening 1
Over de afgelopen decennia hebben talloze patiënten in de wereld een Björk-Shiley
hartklepprothese ontvangen. Nu blijkt uit een studie dat er een kleine kans bestaat dat deze
klep breekt. Als dat gebeurt, moet de patiënt acuut geopereerd worden, anders sterft hij/zij aan
de klepbreuk. De sterfte onder patiënten met een klepbreuk is rond de 70%. In de studie is ook
een predictiemodel ontwikkeld om voor iedere patiënt de kans op klepbreuk te bepalen.
Men zou uit voorzorg bij iedereen met een Björk-Shiley hartklep deze klepprothese kunnen
vervangen; echter het vervangen van een hartklep brengt ook risico’s met zich mee. Om dus
een goede afweging te maken of de klepprothese al dan niet vervangen moet worden, is naast
de kans op klepbreuk ook een voorspelling van de kans op sterfte na vervanging van een
hartklepprothese nodig.
U wordt gevraagd een onderzoek naar zo’n predictiemodel voor het risico van
hartklepvervanging op te zetten.
1.
Wat is de onderzoeksvraag?
2.
Wat zijn domein, determinant, en uitkomst van de studie?
Een soortgelijke studie is al eens gedaan. Op de volgende bladzijde ziet u Tabel 1 uit deze
studie.
3.
Wat is de 30 dagen sterfte voor de gehele groep patiënten?
4.
Hoe groot is de kans dat iemand die met spoed wordt geopereerd in de eerste 30
dagen na hartklepvervanging sterft?
5.
Wat zijn de sterkste voorspellers van 30 dagen sterfte na hartklepvervanging?
6.
Denkt u dat deze factoren ieder een onafhankelijke rol hebben? Leg uit waarom
wel/niet.
7.
Bereken de kans op 30 dagen sterfte bij het vervangen van de klepprothese voor de
volgende patiënten:
- Man, 65 jaar, slechte linker ventrikel functie en coronair lijden met een aortaklepprothese.
- Vrouw, 45 jaar, met een mitraalklepprothese.
51
KWO
Table 1 Characteristics of the study population with 30 day mortality after valve replacement
Variable
Age (mean)
Type of valve replacement
Aortic
Mitral
Double
Presence of endocarditis
No
Yes
Left ventricular function
Normal
Reduced / Poor
Previous Coronary Artery Disease
No
Yes, with CABG
Yes, without CABG
Emergency valve replacement
No
Yes
Concommitant Aortic root replacement
No
Yes
Concommitant Tricuspid valve plasty
No
Yes
No. of
Patients (%)
54.3
%
Mortality
1,122(49.6)
800(35.3)
341(15.1)
4.6
7.4
12.6
2,032(89.8)
231(10.2)
5.9
15.2
2,159(95.4)
104(4.6)
6.4
15.4
1,516(67.0)
662(29.3)
85(3.7)
4.7
10.9
11.8
2,188(96.7)
75(3.3)
5.8
37.3
2,229(98.5)
34(1.5)
6.6
17.6
2,233(98.7)
30(1.3)
6.8
10.0
Om in de praktijk eenvoudig de sterftekans bij klepvervanging vast te stellen is binnen de studie een
risico score opgesteld.
Prognostic factor
Age (years)
35
45
55
65
75
Mitral valve
Double valve
Endocarditis
Poor left ventricular function
Previous CAD
Emergency
Tricuspid valve plasty
Aortic root reconstruction
Add to score
-2
-1
0
1
2
2
3
2
3
2
6
1
2
Total Score
Predicted mortality (95%
confidence interval)
-2
-1
0
1
2
3
4
5
6
7
8
9
10
1.2 (0.7-2.2)
1.7 (1.0-2.8)
2.3 (1.5-3.6)
3.2 (2.1-5.0)
4.4 (3.0-6.7)
6.1 (4.0-9.3)
8.3 (5.3-13)
11 (7.3-17)
15 (8.8-25)
20 (11-33)
26 (15-41)
32 (19-49)
40 (25-58)
Total score
52
KWO
b.
Oefening 2
Bij het kiezen van een behandeling speelt de prognose van de patiënt ook een belangrijke rol.
Daar gaat deze oefening over.
Casus
Een man van 60 jaar, die reeds driemaal een hartinfarct heeft gehad, krijgt ’s nachts plotseling
een onaangenaam gevoel achter zijn borstbeen. Hij ervaart dit als pijnlijk en drukkend en voelt
zich misselijk, zweterig, en duizelig. De patiënt wordt met de ambulance naar het ziekenhuis
gebracht. Onderweg maakt het ambulancepersoneel een 12-afleidingen elektrocardiogram
(ECG), waarop de totale ST elevatie 1.5 millivolt (mV) is en de QRS duur 130 milliseconden.
Zowel deze uitslagen als het klinisch beeld duiden op acute myocard ischemie. Op basis van
de ECG bevindingen blijkt het om een infarct van de voorwand te gaan.
De dienstdoende cardioloog staat voor de afweging of de patiënt een behandeling met
trombolyse moet ondergaan. Het is bekend dat trombolyse (het oplossen van de thrombus die
het infarct veroorzaakt) de mate van verdere infarcering van het hartweefsel kan beperken.
Het kan echter ook tot bloedingen leiden. Om deze afweging goed te kunnen maken heeft de
cardioloog inzicht nodig in de prognose van de patiënt, mét en zonder trombolyse behandeling.
U wordt gevraagd hiervoor een prognostisch model te ontwikkelen.
1.
en
Wat is de onderzoeksvraag? Formuleer een onderzoeksvraag voor het hele onderzoek
één vraag voor de additionele vraag.
2.
Wat zijn onderzoeksontwerp, domein, determinant, en uitkomst van uw studie?
Een van de manieren om een prognostisch model te ontwikkelen is door gebruik te maken van
bestaande data. Op de volgende bladzijde vindt u de lange termijn resultaten uit een
gerandomiseerde trial waarin 533 patiënten met een doorgemaakt hartinfarct tussen 1981 en
1985 werden gerandomiseerd naar behandeling met trombolyse (d.m.v. streptokinase) of
zonder thrombolyse. De tabel geeft aan welke determinanten voorspellende waarde hadden
voor de uitkomst. Voor iedere variabele ziet u de regressie-coëfficiënt en de odds ratio.
3.
a)
Wat betekent het woord ‘onafhankelijke’ in de titel van de tabel?
b)
Waar is de odds ratio een schatting voor?
c)
Wat betekent de term ‘gecorrigeerde OR’?
d)
Wat is de interpretatie van de gecorrigeerde OR van ‘leeftijd > 55 jaar’?
53
KWO
Tabel 2.
Onafhankelijke prognostische factoren voor de sterfte binnen 3 jaar na een acuut hartinfarct
Factor
Gecorrigeerde regressie-
Gecorrigeerde Odds Ratio
coëfficienta
(OR)b
Constante c
-1.99
Eerder doorgemaakt
hartinfarct (X1)
1.02
2.77
ST-elevatie > 1.2 mV (X2)
0.61
1.84
Leeftijd > 55 jaar (X3)
0.45
1.57
Inferieure infarct locatie (X4)
-0.60
0.55
a
b
c
Regressie-coëfficiënt: deze komen uit het multivariabele regressiemodel en worden gebruikt voor de
schatting van absolute kansen voor de patiënt.
De odds ratio geeft de kans op uitkomst (hier: sterfte) voor de mensen met een bepaalde
prognostische factor ten opzichte van mensen die die factor niet hebben.
De constante is een getal dat berekend wordt in het multivariabele regressiemodel en dat wordt
gebruikt in de schatting van absolute kansen in de patiënt.
Aan de hand van de regressie-coëfficiënten kan men voor iedere patiënt met een acuut
myocard infarct zijn kans op sterfte binnen drie jaar uitrekenen via de volgende formule
kans 
1
1 e
[ 1.99 (1.02* X 1)  ( 0.61* X 2 )  ( 0.45* X 3)  ( 0.60* X 4 )]
Voor een vrouwelijke patiënt van 60 jaar, met een eerste onderwand infarct en ST-elevatie van
1 mV is deze kans gelijk aan
4.
1
1 e
( 1.99 (1.02*0 )  ( 0.61*0 )  ( 0.45*1)  ( 0.60*1)
= 0.11
Bereken aan de hand van de tabel de 3-jarige sterftekans voor de patiënt uit de casus.
U weet nu de absolute sterftekansen voor deze 2 patiënten zonder thrombolyse behandeling.
Uit bovengenoemd onderzoek bleek de regressie-coëfficient voor thrombolyse behandeling 0.40 te zijn, en de gecorrigeerde odds ratio 0.67.
5.
Wat zegt de odds ratio van 0.67 over het effect van behandeling met trombolyse?
6.
Wat wordt de 3-jaars sterftekans voor de patiënt uit de casus wanneer u zou
trombolyseren?
Wanneer u dit vergelijkt met de sterftekans zonder behandeling, zou u als cardioloog
deze patiënt dan trombolyseren? Waarom wel/niet?
54
KWO
Week 2. Oefeningen bij college frequentie- en associatiematen
a.
Oefening 1
1.
Uit gegevens van het Transitie project in Nederland komt naar voren dat jaarlijks van de
1000 mannen er 19 een tonsillitis acuta krijgen, terwijl voor vrouwen dit 23 bedraagt.
a.
b.
c.
d.
2.
Wat is het domein?
Welke tijdsperiode betreft het?
Welke frequentiemaat betreft het hier?
Wat is de kans op tonsillitis acuta voor mannen per jaar gebaseerd op
bovenstaande gegevens?
Bij 3-10% van de kinderen in de algemene huisartspraktijk komt astma voor.
a. Wat is het domein?
b. Welke tijdsperiode betreft het?
c. Welke frequentiemaat betreft het hier?
3.
De kans op een mammacarcinoom gedurende het leven bedraagt 10%.
a. Wat is het domein?
b. Welke tijdsperiode betreft het?
c. Welke frequentiemaat betreft het hier?
4.
Bij 9% van mannen van 55-59 jaar is er sprake van wervelinzakkingen. Voor vrouwen
bedraagt dit 10%.
a. Wat is de kans op aanwezigheid van een wervelinzakking bij mannen in deze
leeftijdsgroep?
b. Wat is het domein?
c. Welke tijdsperiode betreft het?
d. Welke frequentiemaat betreft het hier?
5.
In een interventieonderzoek naar het effect van hormoonsuppletie na de overgang
op het ontstaan van fracturen wordt een gunstig resultaat gevonden van toediening.
a. Wat is het domein?
b. Welke tijdsperiode betreft het?
c. Welke frequentiemaat betreft het hier?
55
KWO
b.
Oefening 2
Uit het ERGO onderzoek onder mannen en vrouwen van 55 jaar en ouder is het verband
onderzocht tussen roken en het optreden van hart- en vaatziekten. De 7685 personen zijn
gescreend en vervolgens gedurende 5 jaar vervolgd. Hieronder zijn de gegevens in tabelvorm
weergegeven.
Bereken voor het verband tussen roken en het optreden van hart en vaatziekten:
1.
Wat is het domein?
2.
Welke tijdsperiode betreft het?
3.
Welke frequentiemaat betreft het hier?
4.
Welke associatiematen (maten van verband) kunnen we hier berekenen?
5.
Bereken deze associatiematen en leg in woorden uit wat ze betekenen.
HUIDIGE ROKERS
Rookt nu
Ja
Nee
Totaal
c.
HVZ-ziekte
Ja
41
107
148
Nee
1695
5842
7537
Totaal
1736
5949
7685
Oefening 3
Deze oefening is gebaseerd op het volgende onderzoek:
van Duijn CM, Tanja TA, Haaxma R, Schulte W, Saan RJ, Lameris AJ, Antonides-Hendriks G,
Hofman A. Head trauma and the risk of Alzheimer's disease. Am J Epidemiol. 1992;135:775-82
Een studie naar hoofdtrauma als mogelijke oorzaak van de ziekte van Alzheimer liet de
volgende resultaten zien. Van de 198 incidente cases met de ziekte van Alzheimer, hadden er
33 ernstig hoofdletsel in de anamnese. Van de 198 populatiecontroles, die waren gematcht voor
leeftijd en geslacht, hadden er 31 ernstig hoofdletsel in de anamnese.
1.
Wat voor onderzoeksdesign is hier toegepast?
2.
Wat is de determinant?
3.
Wat is het domein?
4.
Wat is de uitkomst?
5.
Welke associatiemaat kun je hier berekenen?
6.
Bereken deze.
56
KWO
Week 2. Oefeningen college etiologisch onderzoek
a.
Oefening 1
Op 18 oktober 1995 verraste de Britse Committee on Safety of Medicines (CSM) de wereld met
de aankondiging dat 3e-generatie anticonceptiepillen meer kans gaven op het ontstaan van
veneuze trombose in vergelijking met de wat oudere 2e-generatiepillen. Het CSM stelde voor
om 3e-generatiepillen niet langer voor te schrijven als eerste keuze bij jonge vrouwen. Deze
aankondiging was gebaseerd op 3, toen nog niet gepubliceerde, onderzoeken en wekte veel
protest en onrust. Vele artsen hadden moeite met het bericht: het zou immers toch zo kunnen
zijn dat er systematische vertekening zat in het epidemiologisch onderzoek, en bovendien was
geen enkel plausibel biologisch mechanisme bekend. De mededeling stond bovendien haaks
op wat de industrie wilde omdat volgens haar 3e generatie anticonceptiepillen juist beter waren
dan 2e generatie wat betreft het optreden van hart- en vaatziekten.
In 1997 werd een biologisch mechanisme ter verklaring van het verhoogde risico voorgesteld:
bij een nieuwe proefopzet voor het bepalen van resistentie tegen geactiveerd proteïne C (APC)
vond men hogere waarden bij vrouwen die de 3e-generatie pil gebruikten. Ook een aantal
andere stollingsafwijkingen bleken net iets minder uitgesproken bij de 2e-generatiepil.
In 1999 waren er 13 gepubliceerde patiënt-controle en cohortonderzoeken met gegevens over
de kans op veneuze trombose bij de verschillende soorten contraceptiva; in 10 van deze
onderzoekingen vindt men een verhoogd risico van 3e-generatiepreparaten en in 3
onderzoekingen relatieve risico’s van ongeveer 1.
Ondertussen zijn de verschillende partijen het nog steeds niet met elkaar eens. Zo wordt anno
1999 in het leerboek ‘Clinical Gynecologic Endocrinology and Infertility’ van Speroff, Glass and
Kase na een uitgebreide discussie van alle relevante literatuur op pagina 888 geschreven dat:
‘…the apparent differences associated with the new progestins, it is now apparent, were due to
the marketing and preferential prescribing of new products, which influenced the characteristics
of the patients for whom the new products were prescribed’.
En in het Farmacotherapeutisch kompas 2000/2001 is de 2e-generatiepil het
anticonceptiemiddel van 1e keus vanwege het ‘... lager risico op veneuze trombose... 2e
generatiepillen zijn bovendien goedkoper dan 3 e-generatiepillen’.
1.
Benoem de drie componenten (domein, determinant, en uitkomst) van de klinisch
epidemiologische vraagstelling van bovenstaand probleem.
2.
Welke studieopzet (design) zou u gebruiken om deze vraag te beantwoorden, en
waarom?
3.
Zijn er nog andere mogelijkheden?
57
KWO
b.
Oefening 2
Deze oefening is gebaseerd op het volgende onderzoek:
Key TJ, Sharp GB, Appleby PN, Beral V, Goodman MT, Soda M, Mabuchi K. Soya foods and
breast cancer risk: a prospective study in Hiroshima and Nagasaki, Japan. Br J Cancer
1999;81: 1248-56
De kans op borstkanker is verhoogd bij een hoge blootstelling aan endogene en exogene
oestrogenen (vrouwelijke geslachtshormonen). Sojavoeding is rijk aan stoffen, die een structuur
hebben die erg lijkt op oestrogenen. Deze stoffen heten phyto-estrogenen, en ze hebben zowel
een zwak oestrogeen als een zwak anti-oestrogeen werking. Dit heeft geleid tot de hypothese
dat een hoge consumptie van phyto-estrogenen door interactie met het oestrogeenmetabolisme
de kans op borstkanker zou kunnen beïnvloeden.
De onderzoeksvraag van deze studie is of het eten van sojavoeding de kans op borstkanker
verlaagt. Soja wordt traditioneel veel gegeten in Aziatische landen. Omdat er markante
verschillen in het voorkomen van borstkanker bestaan tussen Westerse (hogere incidentie) en
Aziatische landen wordt al vele jaren gezocht naar een verklaring hiervoor. Waarschijnlijk
spelen leef- en voedingsgewoonten een belangrijke rol. Het eten van de traditionele Oosterse
gerechten rijk aan soja en sojaproducten (miso, tofu) zou de kans op borstkanker kunnen
verlagen en de oorzaak kunnen zijn van de lage incidentiecijfers die in Aziatische landen gezien
worden.
Het onderzoek, dat in dit artikel is beschreven, werd uitgevoerd in het cohort van de
zogenaamde ‘Life Span Study’, een cohort vrouwen in Hiroshima en Nagasaki, Japan. Een
eerder onderzoek in ditzelfde cohort heeft laten zien dat blootstelling aan radioactieve straling
de kans op borstkanker verhoogt. Voor de studie in dit artikel maakten de onderzoekers gebruik
van voedings-vragenlijsten, die tussen 1969 en 1981 door 34 759 vrouwen uit dit cohort werden
ingevuld.
Van de vrouwen werd bijgehouden - tot 1993- bij wie borstkanker was opgetreden. 427 keer
werd borstkanker gediagnosticeerd in een totaal van 488 989 persoonsjaren ‘follow-up’.
De resultaten zagen er als volgt uit:
Aantal gevallen
Persoonsjaren
Geen tofu
37
52 793
<=1/week
139
164 476
2-4/week
199
219 025
>=5/week
52
52 695
Relatieve risico
Tofu
1.
Benoem de determinant, de uitkomst en het domein van de klinisch epidemiologische
vraagstelling.
2.
Wat is het (absolute) risico op borstkanker voor de hele populatie? En wat is het
(absolute)
risico op borstkanker voor vrouwen die een hoge tofu consumptie hebben?
3.
Wat voor type onderzoek is het beschreven onderzoek (etiologisch, diagnostisch,
prognostisch, interventie)? Bestaat er kans op ‘confounding’ in het beschreven
onderzoek?
Zo ja, noem een mogelijke ‘confounder’ in dit onderzoek. Zo nee, waarom niet?
4.
Wat is het onderzoeksontwerp (design) van het beschreven onderzoek (follow-up,
patiënt-controle, gerandomiseerd). De onderzoeksvraag zou ook door middel van een
patiëntcontrole- onderzoek onderzocht kunnen worden. Omschrijf voor dezelfde
onderzoeksvraag hoe een patiëntcontroleonderzoek eruitziet. Wat zou een mogelijk
probleem kunnen zijn?
58
KWO
Week 2. Oefening college interventieonderzoek
Deze oefening is gebaseerd op het volgende onderzoek:
Kalliomäki M, Salminen S, Arvilommi H, Kero P, Koskinen P, Isolauri E. Probiotics in primary
prevention of atopic disease: a randomised placebo-controlled trial. Lancet 2001;357:1076-79.
Het is een goed voorbeeld van een primaire preventie trial waarbij men met een specifieke
interventie probeert het risico op ontstaan van ziekte te verminderen. Het onderzoek is
gebaseerd op eerdere waarnemingen passend bij de zogenaamde hygiëne hypothese.
Kinderen die op heel jonge leeftijd veel infecties doormaakten hadden een kleinere kans op het
ontwikkelen van atopische ziekten (atopisch eczeem, allergische rhinitis, astma) dan kinderen
die minder infecties doormaakten. Deze onderzoekers veronderstelden dat bepaalde
darmbacteriën belangrijk zouden kunnen zijn in het voorkomen van atopie. Zij onderzochten
159 zwangere vrouwen met een eerstegraads familielid of een partner die leed aan atopische
ziekte. Deze zwangeren werden random toegewezen aan capsules met een probioticum (n=77,
waarvan 64 de studie afmaakten), Lactobacillus rhamnosus, dagelijks gedurende 2 - 4 weken
voor de verwachte bevalling of placebo capsules (n=82, waarvan 68 de studie afmaakten). Na
de bevalling gingen moeders die borstvoeding gaven gedurende 6 maanden met de capsules
door en anders kregen de kinderen de capsule inhoud. Na de volledige twee jaar follow-up van
het onderzoek hadden 15 kinderen in de lactobacillus groep een atopische ziekte en 31
kinderen in de placebogroep.
1.
Formuleer de vraagstelling (domein, determinant, uitkomst)
2.
Zie tabel: beargumenteer of het doel van de randomisatie is bereikt?
Verdeling van familiegeschiedenis en geboortekarakteristieken na randomisatie.
Placebo (n=82)
Lactobacillus (n=77)
77
71
43
40
37
34
21
12
11
21
Gemiddelde zwangerschapsduur (wk)
39
39
Jongens (%)
52
64
Detecteerbaar IgE in navelstrengbloed (%)
30
40
Gemiddeld gewicht (g)
3612
3631
Gemiddelde hoofdomtrek (cm)
35
35
Familiegeschiedenis
Atopie moeder (%)
Atopisch eczeem in familie (%)
Ouder broertje/zusje met atopie (%)
Roken ouders (%)
Huisdier met vacht (%)
Geboortekarakteristieken
59
KWO
Trial profiel
159 moeders
gerandomiseerd
82 placebo
14 lost to follow-up
2 ante partum
12 post partum
77 Lactobacillus
13 lost to follow-up
2 ante partum
11 post partum
68 compleet
64 compleet
Hierboven staat het ‘trial profiel’ met aantallen gerandomiseerde moeders, aantallen die
uitvielen (lost to follow-up) en aantallen die analyseerbaar waren (complete follow-up). 5 van de
14 uitvallers in de placebogroep vielen uit na 6 maanden follow-up en in de Lactobacillus groep
waren dat er 4 van de 13. Geen van de uitvallers had een atopie diagnose voor uitval.
3.
Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2
levensjaren een atopische ziekte te krijgen onder Lactobacillus behandeling?
4.
Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2
levensjaren een atopische ziekte te krijgen onder placebo behandeling?
5.
Wat is het relatieve risico?
6.
Wat is het 95% betrouwbaarheidsinterval behorend bij dit relatieve risico?
Ziekte
Determinant
Ja
Nee
Totaal
Ja
A1
B1
N1
Nee
A0
B0
N0
Het 95% betrouwbaarheidsinterval van het relatieve risico is bij benadering:
elnRR ± 1.96√[B1/(A1N1) + B0/(A0N0)]
7.
Waarom berekent men dit interval?
8.
Kan dit resultaat (deels) verklaard worden door verschillen tussen de groepen na
randomisatie? Of door de loss to follow-up? Beargumenteer.
9.
Welke conclusie kan op basis van deze resultaten worden getrokken?
60
KWO
Week 4. Computer(computer)practicum diagnostisch onderzoek
De diagnostische waarde van anamnese, lichamelijk onderzoek en verscheidene
testen voor het stellen van de diagnose longembolie
Inleiding
Een longembolie ontstaat wanneer een stukje bloedstolsel (embolus), bijvoorbeeld vanuit
een ader in de benen, via het hart in een bloedvat van de longen terecht komt en dit afsluit.
De diagnose longembolie is moeilijk te stellen. De uiteindelijke diagnose wordt gesteld door
een combinatie van een longperfusie- en ventilatiescintigram (‘longscan’) en een pulmonaire
angiografie. Het nadeel van deze testen is dat ze invasief en kostbaar zijn. Indien longembolie
ook te diagnosticeren zou zijn met behulp van eenvoudigere testen, zou dit uiteraard de voorkeur
verdienen.
Het is nog onbekend of en welke eenvoudige testen zoals anamnese, lichamelijk onderzoek,
echografie van de benen, thorax röntgenfoto en bloedgaswaarden werkelijk een belangrijke
bijdrage hebben in het stellen van de diagnose. De bijdrage van bovengenoemde testen kan
worden onderzocht met behulp van een dataset van 398 patiënten die werden verdacht van
longembolie en werden verwezen naar één van twee geselecteerde academische ziekenhuizen
in Nederland. Alle patiënten ondergingen de volgende diagnostische testen: anamnese (ongeveer
10 testen), lichamelijk onderzoek (ongeveer 3 testen), bloedgaswaarden, thorax röntgenfoto, en
een echo van de diepe venen in de benen. Vervolgens ondergingen alle patiënten de referentietest (gouden standaard). Dit was een combinatie van een longscan en/of pulmonaire angiografie.
Indien de longscan of pulmonaire angiografie wees op de aanwezigheid van longembolie, dan
werd longembolie bewezen geacht. De echo, röntgenfoto, scans en angiogrammen werden ieder
beoordeeld zonder kennis van de uitslag van de overige beeldvorming of andere diagnostische
informatie. Hieronder wordt een tabel gegeven van de variabelen die in deze dataset aanwezig zijn:
Variabele
LFT
MAN
MAL1
OK3M
PDVT
PPE
DYS
PLEURCHP
WHEE
COLL
WRIJ
TACHP1
DVTS
XRAYAFW
ECHOAFW
PCO2
PO2
EMBOLY PE
Beschrijving
Leeftijd in jaren
Geslacht (1=man, 0=vrouw)
Aanwezigheid van maligniteit (1=ja, 0=nee)
Operatie in de laatste 3 maanden (1=ja, 0=nee)
In het verleden een diep veneuze trombose gehad (1=ja, 0=nee)
In het verleden een longembolie gehad (1=ja, 0=nee)
Dyspneu (1=ja, 0=nee)
Pleuritische pijn in de borst (1=ja, 0=nee)
Piepende ademhaling (1=ja, 0=nee)
Syncope/collaps (1=ja, 0=nee)
‘Pleurawrijven’ (1=ja, 0=nee)
Tachypneu – aantal ademhalingen per minuut
Symptomen van diep veneuze trombose (1=ja, 0=nee)
Afwijkingen op thorax röntgenfoto (atelectase, verhoogde hemidiagfragma,
pleurale effusie, parenchymale afwijkingen) (1=ja, 0=nee)
Afwijkingen op echografie benen (diep veneuze trombose werd vastgesteld
indien v. femoralis en/of v. popliteale niet samendrukbaar) (1=ja, 0=nee)
pCO2 (arterieel) in mm Hg
pO2 (arterieel) in mm Hg
Longembolie aanwezig (vastgesteld m.b.v. gouden standaard) (1=ja, 0=nee)
Vraag 1:
a)
Wat is (zijn) de determinant(en)?
b)
Wat is de uitkomst?
c)
Wat is het domein?
d)
Wat is de onderzoeksvraag?
e)
Beschrijf de onderzoeksopzet.
f)
Wat zijn de voor- en nadelen van deze onderzoeksopzet?
g)
Geef een beschrijving van de onderzoekspopulatie in de vorm van een zogenaamde
baselinetabel (=tabel 1 in een wetenschappelijk artikel).
61
KWO
Vraag 2:
a)
Wat is de prior (vooraf) kans dat een patiënt die wordt verwezen in verband met
verdenking op longembolie ook inderdaad longembolie heeft (dus vóór er enige test is
uitgevoerd)?
b)
Maak een 2x2 tabel voor iedere dichotome diagnostische test uitgezet tegen de uitkomst;
wat staat er in rijen en wat in de kolommen?
c)
Bereken bij iedere tabel de sensitiviteit en de specificiteit. Bereken tevens de kans dat
longembolie aanwezig is bij een positieve test en bij een negatieve test. Welke dichotome
testen veranderen de prior kans op longembolie in een lage posterior (achteraf) kans en
zijn dus nuttig voor het uitsluiten van longembolie? Welke testen veranderen de prior
kans op longembolie in een hoge posterior kans en zijn dus nuttig voor het vaststellen
van longembolie?
d)
Er zijn 4 testen met een continue uitkomst. Om de diagnostische waarde van deze testen
te beoordelen kun je een ROC curve maken, en de ‘area under the curve’ (AUC) met
95% betrouwbaarheidsinterval berekenen. (Gebruik in SPSS Analyze en dan ROC
curve). Interpreteer ROC curve en de AUC met bijbehorend 95%
betrouwbaarheidsinterval.
e)
Een AUC kan variëren tussen 0.5 en 1.0; toch vind je bij d) ook ROC curves met een
AUC kleiner dan 0.5. Wat is hier de reden van?
Zoals reeds op college is verteld, wordt in de praktijk een diagnose nooit op basis van één
enkele test gesteld, maar op basis van een combinatie van testen. Ook in diagnostisch
onderzoek zijn we dus vooral geïnteresseerd in de diagnostische waarde van een combinatie
van testen. In dit (computer)practicum hebben we individuele testen geëvalueerd. De volgende
stap is om te kijken of combinaties van testen de diagnostische waarde verder verbeteren. We
doen dit gewoonlijk met behulp van multivariabele (logistische) regressieanalyse en
bijbehorende ROC curves. Dit valt echter buiten het bestek van dit onderwijsblok.
62
KWO
Week 4. Computer(computer)practicum prognostisch onderzoek
Predictoren van sterfte binnen 30 dagen na een acuut myocardinfarct
Inleiding
De behandeling van het acute hartinfarct is enorm verbeterd de laatste jaren. Desondanks is de
vroege sterfte nog altijd substantieel (6-9% in de eerste 30-35 dagen), zelfs voor patiënten die
in de eerste 6 uur na het hartinfarct trombolytische interventiebehandeling krijgen. Om
verschillende redenen is het belangrijk om al vroeg te weten welke patiënten een groot risico op
sterfte hebben. Een predictieregel, waarin belangrijke voorspellers zijn vertegenwoordigd, kan
van groot nut zijn in de klinische praktijk. Van u wordt gevraagd een dergelijke predictieregel af
te leiden (derivatie). Hierbij maakt u gebruik van een dataset met 785 patiënten met een acuut
hartinfarct, waarvan er 52 binnen een termijn van 30 dagen stierven.
Hieronder vindt u een overzicht van de 10 predictoren in de dataset.
Variabele
Beschrijving (codering: nee/ja is gecodeerd als 0/1)
DAY30
Overlijden binnen 30 dagen na hartinfarct
SEX
AGE
A65
KILLIP
SHO
DIA
HYP
HRT
ANT
PMI
Vrouwelijk geslacht (0/1)
Leeftijd in jaren
Leeftijd > 65 jaar (0/1)
Killip class: maat voor het functioneren van de linker ventrikel (code 1 – 4)
Shock: Killip class 3 of 4 versus 1 of 2 (0/1)
Diabetes mellitus (0/1)
Hypotensie (systolische bloeddruk < 100 mmHg) (0/1)
Tachycardie: pols > 80 slagen/minuut (0/1)
Anterior hartinfarct (0/1)
Myocardinfarct in de voorgeschiedenis (0/1)
Vraag 1:
a)
b)
c)
d)
e)
f)
g)
Wat is (zijn) de determinant(en)?
Wat is de uitkomst?
Wat is het domein?
Wat is de onderzoeksvraag?
Beschrijf de onderzoeksopzet.
Wat zijn de voor- en nadelen van deze onderzoeksopzet?
Geef een beschrijving van de onderzoekspopulatie in de vorm van de zogenaamde
baselinetabel.
Vraag 2:
a)
b)
c)
Wat is de prior kans op overlijden binnen 30 dagen?
Maak een 2x2 tabel voor iedere (gekozen) predictor uitgezet tegen de uitkomst; wat
staat er in rijen en wat in de kolommen?
Bereken het absolute risico op overlijden binnen 30 dagen bij aan- en afwezigheid van
iedere predictor. Bereken voor iedere 2x2 tabel ook het relatieve risico.
Vraag 3:
a)
Hoeveel predictoren mogen maximaal gebruikt worden voor de predictieregel?
b)
Welke predictoren zou u in de predictieregel willen opnemen?
c)
Hoe zouden zonder multivariabele model toch meerdere factoren tegelijk beschouwd
kunnen worden?
d)
Sommige predictoren kunnen zwaarder wegen dan andere; hoe zou je gewichten aan de
verschillende predictoren kunnen geven?
63
KWO
Vraag 4:
a)
Doe een voorstel voor een predictieregel.
b)
Bereken voor iedere patiënt in SPSS de uitkomst van de regel (de predictiescore). (Hint:
gebruik hiervoor Transform, en vervolgens Compute om de score-variabele te maken).
Vraag 5:
a)
b)
Maak een ROC curve om de prognostische waarde van uw predictieregel te beoordelen
(Gebruik in SPSS Analyze en dan ROC curve).
Beoordeel het risico op overlijden binnen 30 na een hartinfarct in groepen met oplopende
predictiescores. (Maak hiervoor een kruistabel waarbij u zelfgemaakte score variabele
uitzet tegen sterfte binnen 30 dagen) Ga na of er bij een hogere score inderdaad een
grotere kans bestaat om binnen 30 dagen te overlijden.
64
KWO
Week 4. Computer(computer)practicum etiologisch onderzoek
Verband tussen lengte en de kans op coronaire hartziekte: de rol van leeftijd en
overgewicht als verstorende variabelen
Inleiding
In een beperkt aantal onderzoekingen is beschreven dat kleinere (geringere lichaamslengte)
personen een hogere kans hebben op coronaire hartziekten. Dit werd met name beschreven
voor mannen. Tevens bleek dat in een aantal artikelen onvoldoende goed rekening gehouden
was met andere risicofactoren voor coronaire hartziekte. Als onderliggend mechanisme werd
gepostuleerd dat dit toegenomen risico wellicht veroorzaakt wordt doordat kleinere personen
vaak een iets hogere bloeddruk hebben. De bovenstaande gegevens zijn de aanleiding om het
verband tussen lichaamslengte en kans op coronaire hartziekte te onderzoeken in een dataset
afkomstig van cohortonderzoek onder ruim 17.000 postmenopausale vrouwen. Om de
onderzoeksvraag te beantwoorden werd een genest patiënt-controleonderzoek uitgevoerd.
Hieronder ziet u een codeboek van de variabelen die in deze dataset aanwezig zijn:
Variabele
Beschrijving
incichd
Incidente coronair hart ziekte (1 = ja, 0 = nee)
wgt80
Gewicht (1= above 80 kg: overweight, 0<= 80 kg)
hgt165
Lengte (1< 165 cm: small, 0 >= 165 cm)
age60
Leeftijd (1 > 60 jaar, 0 <= 60 jaar)
hypert
Hypertensie (1 = ja, 0 = nee)
hyperch
Hypercholesterolemia (1 = ja, 0 = nee)
rooknu
Huidige roker (1 = ja, 0 = nee)
sbp
Systolic pressure
dbp
Diastolic pressure
Vraag 1:
a)
b)
c)
d)
e)
f)
g)
h)
i)
Wat is de determinant?
Wat is de uitkomst?
Wat is het domein?
Wat is de onderzoeksvraag?
Beschrijf de onderzoeksopzet, probeer daarbij te bedenken wat “genest” zou kunnen
betekenen.
Wat zijn de voor- en nadelen van deze onderzoeksopzet?
Beargumenteer of en waarom u het zinvol vindt om voor de door u gedefinieerde
vraagstelling een “geneste” analyse te doen?
Welke associatiemaat zou u gebruiken om het verband tussen de determinant en de
ziekte aan te geven?
Geef een beschrijving van de onderzoekspopulatie in de vorm van de zogenaamde
baselinetabel
Vraag 2:
a)
b)
c)
d)
Maak voor de hoofdvraag een 2x2 tabel; wat staat er in de rijen en wat in de kolommen?
Bereken de associatiemaat die het verband aangeeft tussen de determinant en de ziekte.
Geef het 95% betrouwbaarheidsinterval.
Beschrijf het gevonden verband.
65
KWO
Vraag 3:
a)
b)
Ga na of leeftijd voldoet aan het criterium ‘confounder’.
Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de
‘gepoolde schatter van het verband’. Is leeftijd een confounder, en zo ja waarom?
Vraag 4:
a)
b)
Ga na of overgewicht voldoet aan het criterium ‘confounder’.
Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de
‘gepoolde schatter van het verband’. Is overgewicht een confounder, en zo ja waarom?
Vraag 5:
a)
b)
Ga na of bloeddruk voldoet aan het criterium ‘confounder’.
Verricht een Mantel-Haenzel procedure en vergelijk de ruwe associatiemaat met de
‘gepoolde schatter van het verband’. Is bloeddruk een confounder, en zo ja waarom?
66
KWO
Week 4. Computer(computer)practicum interventieonderzoek
Leidt het plaatsen van trommelvliesbuisjes bij kinderen met een middenoorontsteking
(OME) tot een vermindering van het gehoorverlies?
Inleiding
Otitis Media met Effusie (OME) is een zeer frequent voorkomende aandoening bij kinderen.
De aandoening gaat gepaard met een ophoping van vocht achter het trommelvlies zonder dat
het kind hierbij duidelijke klachten of symptomen heeft. De aanwezigheid van vocht zorgt
meestal voor een gering tot matig gehoorverlies en dit gehoorverlies heeft mogelijk een
nadelige werking op de (taal)ontwikkeling van deze kinderen. Het doel van het inbrengen van
trommelvliesbuisjes is het vocht te verwijderen en daarmee het gehoor te herstellen om zo
eventuele ontwikkelings-problemen te voorkomen.
Aan de hand van een dataset van een gerandomiseerde interventiestudie bij 187 kinderen met
OME kan worden nagegaan of het plaatsen van trommelvliesbuisjes inderdaad leidt tot een
vermindering van het gehoorverlies. Hieronder wordt een tabel gegeven van de variabelen
die in deze dataset aanwezig zijn.
Variabele
Beschrijving
Variabele Type
IDENT
Uniek identificatienummer van de deelnemende
patiënten
Continu
GEBDAT
Geboortedatum van de kinderen
Datum
GESLACHT
Geslacht (1 = jongen; 2 = meisje)
Dichotoom
AGE
Leeftijd (1 <2 jaar; 2 >= 2 jaar)
Dichotoom
BEHANDEL
Wel of geen trommelvliesbuisjes (1 =
trommelvliesbuisjes; 2=afwachtend beleid)
Dichotoom
meanhl0r
Gemiddeld gehoorverlies rechteroor op baseline
Continu
meanhl0l
Gemiddeld gehoorverlies linkeroor op baseline
Continu
Meanhl6r
Gemiddeld gehoorverlies rechteroor na 6
maanden
Continu
Meanhl6l
Gemiddeld gehoorverlies linkeroor na 6
maanden
Continu
Meanhlfr
Gemiddeld gehoorverlies rechteroor na 12
maanden
Continu
Meanhlfl
Gemiddeld gehoorverlies linkeroor na 12
maanden
Continu
Vraag 1:
a)
b)
c)
d)
e)
f)
g)
h)
Wat is de determinant?
Wat is de uitkomst?
Wat is het domein?
Wat is de onderzoeksvraag?
Beschrijf de onderzoeksopzet.
Wat zijn de voor- en nadelen van deze onderzoeksopzet?
Moeten we bij een dergelijke onderzoeksopzet rekening houden met confounders?
Waarom wel/niet?
Geef een beschrijving van de onderzoekspopulatie in de vorm van een zogenaamde
baselinetabel (= tabel 1 in een wetenschappelijk artikel).
67
KWO
Vraag 2:
a)
b)
Ieder kind heeft uiteraard 2 oren. Hoe zou je toch tot één uitkomstmaat per
meetmoment kunnen komen?
Maak een dergelijke nieuwe variabele (tip: gebruik de functie Compute).
Bereken het effect in beide groepen voor beide meetmomenten (6 en 12 maanden
follow-up). Is er een statistisch verschil?
Vraag 3:
Op grond van een klinische inschatting kun je groepen patiënten bedenken waarbij het effect
van trommelvliesbuisjes groter is dan bij anderen. Dit soort variabelen noem je potentiële effectmodificatoren.
a)
Welke subgroep(en) zou je op theoretische gronden kunnen onderscheiden om naar de
relatie trommelvliesbuisjes en mate van gehoorverlies te kijken?
b)
Analyseer de determinant-uitkomst relatie voor deze subgroep(en).
Vraag 4:
Bij wie lijken trommelvliesbuisjes het meest effectief te zijn?
68
KWO
DEEL III
Klinisch Wetenschappelijk Onderzoek
THEORIE
Colofon
Een publicatie van het
Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde
Universitair Medisch Centrum Utrecht
Postbus 85500
3508 GA Utrecht
Auteurs: Prof. dr. A. Algra, A.A.A. Bak, J.G. van der Bom, M.L. Bots, J.H. den Breeijen,
H. Burger, E. Buskens, Y. van der Graaf, D.E. Grobbee, P.H.M. Peeters, C.G. Schoemaker, Y.T. van
der Schouw, C.S.P.M. Uiterwaal
Auteursrecht voorbehouden
Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde, Utrecht, 2003, 2011,
2014, 2015, 2016, 2017, 2018, 2019, 2020, 2021
69
KWO
70
KWO
Hoofdstuk 1 KLINISCHE EPIDEMIOLOGIE
1.
Inleiding
Aan de opbouw van medische kennis hebben zowel culturele, politieke, economische, religieuze,
filosofische, als wetenschappelijke elementen bijgedragen. Vooral in de Westerse wereld wordt de arts
tegenwoordig meer en meer geacht op basis van wetenschappelijke kennis te handelen. Traditioneel
komt een groot deel van deze kennis uit de medisch-biologische deelwetenschappen zoals de
anatomie, celbiologie, genetica, fysiologie en biochemie. Dit heeft ertoe geleid dat artsen hoofdzakelijk
handelden op basis van deterministisch, causaal, pathofysiologisch redeneren, uiteraard in combinatie
met eigen ervaring en die van de opleider.
In de loop der tijd is in wisselende mate, maar vooral gedurende de afgelopen decennia, het besef
ontstaan dat deze sterk theoretische basis ontoereikend is. Onder andere door de grote complexiteit
van ziekte, de relatief geringe nauwkeurigheid van veel klinische waarnemingen en de beperkte
waarde van individuele ervaringen wordt de medicus practicus geconfronteerd met een grote mate
van onvoorspelbaarheid van vrijwel alle facetten van ziekte. De epidemiologie, en vooral de klinische
epidemiologie, stelt zich ten doel door formele en systematische kwantificatie die kennis te leveren die
de hieruit voortvloeiende onzekerheid moet verkleinen.
Het medisch praktisch belang van empirische en statistische kennis in plaats van theoretische en
deterministische kennis wordt zeer sterk benadrukt door een stroming die in 1992 ontstond uit de
klinische epidemiologie. Volgens de aanhangers van deze stroming, de 'Evidence-Based Medicine’
(EBM), behoort eigenlijk elke medische handeling gebaseerd te zijn op de integratie van 'evidence' uit
klinisch epidemiologisch onderzoek met de klinische expertise van de behandelaar en de waarden,
voorkeuren en omstandigheden van de patiënt. De EBM-stroming zal apart worden besproken in
paragraaf 5.1.
Terwijl de algemene epidemiologie de frequentie van het optreden van ziekte en haar determinanten
bestudeert in de algemene populatie, richt de klinische epidemiologie zich vooral op vragen die zich
voordoen in de klinische praktijk. Deze vragen betreffen etiologie, diagnose, prognose en interventie
(inclusief bijwerkingen) van ziekten. Voordat deze vragen ofwel aandachtsgebieden binnen de
klinische epidemiologie apart worden besproken in hoofdstuk 2, volgen eerst vier algemene
paragrafen.
Literatuur
Grobbee DE, Miettinen OS. Clinical epidemiology. Introduction to the discipline. Neth J Med
1995;47:2-5
Bronvermelding
Paragrafen 1.1, 1.3, 1.4 en 1.5 van hoofdstuk 1 zijn gebaseerd op: Burger H, Hofman A.
Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red). Interne Geneeskunde.
Houten: Bohn Stafleu van Loghum, 2001: respectievelijk paragrafen 1-0 (Inleiding), 1-1 (Kans),
1-2 (Vormen van klinisch epidemiologisch onderzoek), 1-3 (Precisie en validiteit), en 1-4
(Risico).
1.2
ONDERZOEKSONTWERP
1.2.1 Inleiding
Elk onderzoek begint met een bepaalde vraag. In het klinisch wetenschappelijk onderzoek moet deze
klinisch relevant zijn. Vragen met betrekking tot ziekten of ziekte-uitkomsten die erg weinig
voorkomen, slechts een zeer geringe belasting voor de patiënt betekenen of nauwelijks consequenties
hebben, zullen in het algemeen weinig relevant zijn. Omgekeerd zullen vragen over frequente en
ernstige ziekten met medische consequenties vaak wel relevant zijn. Zo is bijvoorbeeld de vraag of bij
mannelijke 65-plussers met een aneurysma aortae een hoge polsdruk een indicator is van een hoog
risico op ruptuur, uitermate relevant. Aneurysma aortae is immers bij mannelijke 65-plussers niet
zeldzaam (rond 4%), de uitkomst is niet onschuldig (mogelijk letale bloeding), en bij hoog ruptuurrisico niet zonder consequentie: onmiddellijke verwijzing naar de chirurg.
De vraagstelling moet ook helder zijn. Dus niet: ‘de rol van oestrogenen bij mammacarcinoom’, maar
‘bevordert een verhoogde blootstelling aan exogeen oestrogeen het ontstaan van
mammacarcinoom?’. Uit een duidelijke vraagstelling volgt het onderzoeksontwerp vanzelf.
Het onderzoeksontwerp wordt onderverdeeld in een theoretisch en in een praktisch gedeelte. In het
71
KWO
praktische gedeelte worden de elementen van het theoretisch ontwerp geoperationaliseerd, dat wil
zeggen vertaald in praktisch toepasbare definities en procedures. Er staat bijvoorbeeld in waar de
patiënten vandaan komen, hoe de diagnose bevestigd gaat worden, welke metingen gedaan moeten
worden, hoe afwijkingen zijn gedefinieerd, et cetera. Het praktische gedeelte van het
onderzoeksontwerp alsmede de aspecten van het theoretisch ontwerp die specifiek zijn voor de
verschillende aandachtsgebieden van de klinische epidemiologie, komen nader aan de orde in de
volgende hoofdstukken. We beperken ons hier tot het algemeen theoretische.
Het theoretisch onderzoeksontwerp heeft twee elementen: de determinant-uitkomstrelatie, in het
voorbeeld hoge polsdruk en ruptuur, en het domein, in het voorbeeld (mannelijke) 65-plussers.
1.2.2 Determinant-uitkomstrelatie
De determinant-uitkomstrelatie, ook wel epidemiologische functie genoemd, beschrijft welke uitkomst
als functie van welke determinant(en) wordt bestudeerd.
In formule: U = ƒ (D1, D2, …, Dx), waarbij U=uitkomst en D=determinant
De uitkomst moet, zoals gezegd, in elk geval klinisch relevant zijn. De uitkomst kan een
prevalentiecijfer betreffen, zoals meestal in diagnostisch onderzoek, een incidentiecijfer, een score
van een ‘kwaliteit van leven lijst’, of de uitslag van een meting, bijvoorbeeld oogboldruk.
Voor de keuze van de determinanten moet men nagaan of de determinant-uitkomstrelatie causaal
(oorzakelijk) geïnterpreteerd moet worden of niet. Als dit niet zo is noemt men de relatie descriptief,
beschrijvend. Alle diagnostische vragen zijn descriptief: is er een groep determinanten (testuitslagen)
die de ziekte (de uitkomst) karakteriseert? Of simpeler gezegd: hoe ziet de typische patiënt met ziekte
“X” er uit? Veel prognostische vragen zijn eveneens descriptief: is er een groep determinanten die de
hoog risicopatiënt karakteriseert (en dus een slechte afloop voorspelt)? Simpeler: hoe ziet de typische
hoogrisicogroep eruit? Men is bij descriptieve vragen louter en alleen geïnteresseerd in een stel
determinanten dat de uitkomst voorspelt, causaal of niet.
Het onderscheid causaal – descriptief is belangrijk omdat het consequenties heeft voor de
onderzoeksopzet, zoals gezegd in het bijzonder voor de keuze van de determinanten. We lichten dit
verder toe. Stel dat men wel een oorzakelijk (causaal) verband wil aantonen zoals in al het etiologisch
onderzoek (per definitie) en in veel interventieonderzoek. In dat geval staat één determinant centraal
en zijn alle externe determinanten van de uitkomst potentiële confounders (verstorende
determinanten) van de relatie van onderzoek (zie hoofdstuk 1.5). De consequentie voor het
onderzoeksontwerp van het al dan niet causaal willen interpreteren van een bepaalde determinantuitkomstrelatie is, dat voor het aantonen van een causale relatie in principe met alle potentiële
confounders als determinant rekening gehouden zal moeten worden. Dit, om er uiteindelijk in de
analyse voor te kunnen corrigeren. Men zal daarom bijvoorbeeld in al het onderzoek naar de etiologie
van kanker het rookgedrag van de onderzoekspopulatie nauwkeurig moeten kwantificeren. Bij
descriptieve vragen hoeft dit niet; er bestaan eenvoudigweg geen confounders. Er is immers niet één
determinant die los van externe determinanten, dat wil zeggen causaal, aan de uitkomst gerelateerd
moet worden. Bij descriptieve vragen is het enige doel, de gezamenlijke voorspellende waarde van
een groep van determinanten te kennen. Wat bij descriptief onderzoek dan wel de keuze van
determinanten bepaalt, komt in hoofdstuk 2 aan de orde.
1.2.3 Domein
Nadat uitkomst en determinanten gedefinieerd zijn richten we ons op het domein van de determinantuitkomstrelatie. Het domein is de abstracte beschrijving van het soort situatie waar de determinantuitkomstrelatie betrekking op heeft, bijvoorbeeld patiënten met decompensatio cordis bij de huisarts.
Tot het domein behoren die kenmerken van de situatie die grenzen stellen aan de
generaliseerbaarheid van determinant-uitkomstrelatie of, minder formeel gezegd, het domein geeft
aan in wat voor situaties de determinant-uitkomstrelatie geldig is. In de praktijk zijn de elementen van
het domein vooral de diagnose en de ‘setting’, dus eerste lijn, tweede lijn, EHBO, consultatiebureau,
enzovoort. Als het domein eenmaal is gedefinieerd moet een onderzoekspopulatie worden gevonden
die past bij dat domein (dit laatste hoort strikt genomen bij het praktisch onderzoeksontwerp).
De onderzoekspopulatie kan dus een heel selectieve groep zijn maar mag niet afwijken op punten die
van belang zijn voor de generaliseerbaarheid van de determinant-uitkomstrelatie.
Beschouw bijvoorbeeld de relatie tussen bloeddruk en tweede beroerte in het domein van 60-plussers
met een herseninfarct die onder behandeling zijn van een neuroloog. Deze relatie kan prima
onderzocht worden bij mannen tussen de 60 en 70 jaar met een herseninfarct die zich op de EHBO
van een academisch ziekenhuis melden, als deze patiënten niet wezenlijk, dat wil zeggen op voor
72
KWO
generalisatie relevante kenmerken, anders zijn dan hun domein-genoten: alle andere 60-plussers
onder behandeling van een neuroloog voor herseninfarct. Of de gevonden relatie ook geldig is voor
dezelfde groep maar dan onder behandeling van de huisarts, is echter maar de vraag. De grenzen
van het domein zijn vaak onderwerp van discussie. De generaliseerbaarheid van
onderzoeksresultaten komt terug in paragraaf 1.5.2.
1.3 VORMEN VAN KLINISCH EPIDEMIOLOGISCH ONDERZOEK
Een essentieel onderdeel van het praktisch onderzoeksontwerp is de vorm van onderzoek waarmee
de determinant-uitkomstrelatie gekwantificeerd moet worden.
De belangrijkste vormen van klinisch-epidemiologisch onderzoek zijn vermeld in tabel 1-3-1.
De onderzoeksvormen die in de klinische epidemiologie worden gebruikt vallen uiteen in twee
wezenlijk verschillende categorieën, te weten experimenteel en niet-experimenteel onderzoek. Het
niet-experimenteel onderzoek wordt ook wel, foutief, ‘observationeel onderzoek’ genoemd.
Bij experimenteel onderzoek bepaalt de onderzoeker, meestal at random (door het lot bepaald), welke
patiënt aan de te onderzoeken factor wordt blootgesteld, en wie niet. Deze vorm van onderzoek vindt
zijn belangrijkste toepassing in het onderzoek naar de effectiviteit van interventie, de clinical trial.
Bij niet-experimenteel onderzoek heeft de onderzoeker geen invloed op de blootstelling. In nietexperimenteel onderzoek is, ten opzichte van experimenteel onderzoek, causaliteit van een bepaald
verband vaak moeilijker aannemelijk te maken. Hier komen we bij het begrip 'confounding' in
paragraaf 1.5 nog op terug.
Een tweede fundamenteel onderscheid betreft longitudinaal versus cross-sectioneel onderzoek.
Experimenteel onderzoek is altijd longitudinaal, dat wil zeggen dat de toewijzing van de blootstelling
voorafgaat aan de vaststelling van de uitkomst, meestal ziekte. Niet-experimenteel onderzoek kan
zowel longitudinaal als cross-sectioneel zijn. Bij cross-sectioneel onderzoek (ook wel
dwarsdoorsnedeonderzoek of transversaal onderzoek) worden determinant en uitkomst op hetzelfde
moment vastgesteld. Veel diagnostisch onderzoek is cross-sectioneel omdat de vraagstelling geen
tijdsverloop kent: wat is de kans op de aanwezigheid van een bepaalde ziekte nu, gegeven de
uitslagen van diagnostische testen op dit moment. Eén van de problemen van cross-sectioneel
onderzoek is dan ook dat er geen tijdsrelatie tussen determinant en uitkomst is vast te stellen. De
meeste andere dan diagnostische vragen in de klinische epidemiologie zijn namelijk inherent
longitudinaal van aard en de beantwoording met een dwarsdoorsnedeonderzoek kan problematisch
zijn.
Een vraag van etiologie is bijvoorbeeld of een lage botdichtheid bij vrouwen rond de menopauze leidt
tot wervelinzakkingen op hogere leeftijd. Stel nu dat in een dwars-doorsnedeonderzoek bij 80-jarigen
de vrouwen met wervelinzakkingen een lagere botdichtheid hebben dan die zonder deze afwijkingen.
In dat geval is het niet zomaar duidelijk of de lage botdichtheid, wellicht via verminderde mobiliteit, de
oorzaak is van de wervel-inzakkingen, of juist een gevolg.
Het longitudinaal onderzoek is weer te verdelen in follow-up onderzoek (ook wel vervolgonderzoek of
cohortonderzoek genoemd) en patiënt-controleonderzoek. Bij follow-up onderzoek wordt een groep
personen gevolgd in de tijd waarna de frequentie van ziekte of complicatie tussen determinantcategorieën wordt vergeleken. Deze onderzoeksopzet biedt vele voordelen. De belangrijkste zijn dat
naast het relatieve ook het absolute risico van de uitkomst kan worden gemeten en dat relatief
gemakkelijk meerdere uitkomsten bestudeerd kunnen worden.
Bij patiënt-controleonderzoek wordt een serie patiënten met een bepaalde aandoening verzameld en
bij hen wordt vervolgens de frequentie van blootstelling bepaald. Tevens wordt uit de al dan niet
denkbeeldige populatie waar de patiënten vandaan kwamen een steekproef met niet-zieken
('controles') genomen om de blootstellingsfrequentie in de bronpopulatie te schatten. De selectie van
controles is vaak aanleiding voor discussie. In het algemeen is er geen probleem wanneer de
controles zodanig worden gekozen dat zij, als zij de ziekte hadden gekregen, ook als patiënten in het
onderzoek zouden zijn opgenomen. Een groot voordeel van het patiënt-controleonderzoek is dat
verschillende determinanten van zeldzame ziekten met relatief geringe inspanning onderzocht kunnen
worden.
73
KWO
De patiëntencasus of -serie is een onterecht ondergewaardeerde vorm van niet-experimenteel crosssectioneel of longitudinaal onderzoek. Bij dit onderzoek heeft de arts een aantal patiënten met een
bepaalde aandoening opgemerkt en in kaart gebracht. Vervolgens wordt gekeken of er een
gemeenschappelijk kenmerk is, bijvoorbeeld het gebruik van een bepaald geneesmiddel. Ook kan een
enkele patiënt waarbij een geheel onverwachte ziekte optreedt, aanleiding zijn voor nader onderzoek.
Een mooi voorbeeld stamt uit 1961 toen de diagnose van longembolie werd gesteld bij een jonge
vrouw. Deze aandoening is zo zeldzaam op lage leeftijd, zeker bij vrouwen, dat haar gebruik van een
oraal anticonceptivum als mogelijke oorzaak werd geopperd. Later werd deze associatie in
grootschalig onderzoek bevestigd.
Ten slotte moet hier de meta-analyse worden genoemd als bijzondere vorm van onderzoek. Bijzonder,
omdat de resultaten van verschillende onderzoeken de basis vormen voor de analyse in plaats van de
gegevens van verschillende individuen, vandaar de naam meta-analyse. Dit type onderzoek wordt
apart besproken in paragraaf 5.4
Tabel 1-3-1
Vorm van onderzoek
Cross-sectioneel
onderzoek
Follow-up-onderzoek
Vraagstelling
Diagnose
Interventie-veiligheid
Voorbeeld
De waarde van het inspannings-ECG bij de
diagnostiek van coronairsclerose
Botdichtheid als risicofactor voor heupfractuur
10-jaars-overleving na diagnose borstkanker als
functie van stadium
Jaarlijks risico van maagbloeding bij
aspirinegebruik.
Bevordert carotisstenose het ontstaan van de
ziekte van Alzheimer?
Relatief risico van hartritmestoornissen bij
antihistaminica-gebruik
Plotse dood en sildenafil
Interventie-effectiviteit
Interventie-effectiviteit
Bestraling bij hyperthyreoïdie
Antibiotica bij ulcus pepticum
Etiologie
Prognose
Interventie-veiligheid
Patiënt-controleonderzoek
Etiologie
Interventie-veiligheid
Patiënten-casus of serie
Clinical trial
Meta-analyse
1.4
RISICO
1.4.1 Vormen van risico
Men kan twee vormen van risico onderscheiden: het absolute risico en het relatieve risico. Strikt
genomen is een risico gelijk aan een kans, maar dan een kans op iets ongewenst.
Het absolute risico is gelijk aan de kans op ziekte, complicatie van ziekte of overlijden. Een absoluut
risico dient altijd voor een tijdsperiode te worden gegeven. Dit kan een concreet omschreven periode
zijn, zoals het tienjaarsrisico (10-jaars cumulatieve incidentie) van een hartinfarct bij een veertigjarige
man, maar ook een abstracte tijdsperiode, zoals het life-time risico van leukemie, waarmee de kans
dat iemand in zijn leven leukemie krijgt wordt bedoeld. Over lange perioden wordt de cumulatieve
incidentie en daarmee het risico van sterfte gelijk aan 1. Absolute risico's komen in de geneeskunde in
vele gedaanten voor. De vijf- of tienjaarsoverleving is een cumulatieve incidentie. Onder letaliteit of
case-fatality wordt meestal verstaan, het risico van overlijden bij patiënten die lijden aan een bepaalde
ziekte; het is dan een cumulatieve incidentie van sterfte. Het begrip attack rate wordt veel gebruikt
voor infectieziekten en is een cumulatieve incidentie over een korte periode. In de medische praktijk
wil men het absolute risico zo specifiek mogelijk weten. Zo hebben we weinig aan het kennen van de
kans op een hartinfarct van een Nederlander. Men wil die kans weten voor mannen en vrouwen, voor
verschillende leeftijden, voor mensen met of zonder hypertensie, met of zonder een positieve familieanamnese voor het hartinfarct, dus het risico gespecificeerd volgens de determinanten van ziekte.
Deze determinanten worden vaak risico-indicatoren genoemd omdat het risico van ziekte varieert met
categorieën van de determinanten. Wanneer de risico-indicator een causale relatie heeft met de
ziekte, wordt gesproken van een risicofactor. Zo zijn leeftijd en geslacht risico-indicatoren voor een
hartinfarct, terwijl bloeddruk en serumlipiden risicofactoren zijn; leeftijd is een risico-indicator voor
longkanker, en rookgewoonten een risicofactor.
74
KWO
Er zijn twee relatieve maten van risico: het risicoverschil (RV) en de risicoratio, vrijwel altijd aangeduid
als het relatief risico (RR).
Het relatief risico geeft het aantal keren dat het absolute risico hoger is in één categorie van de
determinant (de index-groep) tegenover een andere categorie (de referentiegroep).
Zo is het relatief risico van roken op longkanker ongeveer tien. Dat betekent dat het absolute risico
van longkanker onder rokers (R1) tien keer zo hoog is als dat onder niet-rokers (R0). Het relatief risico
kan worden berekend door de absolute risico's van index-groep (R1) en referentiegroep op elkaar
(R0) te delen: RR = R1/R0. Uit patiënt-controle-onderzoek kan men meestal geen absolute risico’s
berekenen, maar wel de verhouding van de blootstellingsfrequenties bij patiënten en controles. Deze
verhouding wordt de odds ratio (OR) genoemd en geldt als benadering van het relatieve risico.
Het risicoverschil is een maat die het verschil tussen twee absolute risico's aangeeft. Als R1 het risico
in de indexgroep en R0 het risico in de referentiegroep is, dan geldt RV = R1 - R0. Deze maat kan
worden gebruikt om na te gaan hoeveel het absolute risico van een patiënt hoger is dan een
referentiepatiënt.
De reciproque van het risicoverschil, dat wil zeggen 1/RV, kan worden gebruikt om het aantal
personen te berekenen dat moet worden behandeld om één "event" (complicatie, dood) te voorkomen.
Een voorbeeld is ontleend aan een trial die werd uitgevoerd door de Engelse Medical Research
Council (MRC) bij patiënten met matige hypertensie. In deze MRC-trial werden matig hypertensieve
patiënten behandeld met een anti-hypertensivum (bèta-blokker of diureticum) of placebo. Bij de
vergelijking van de effectiviteit van het antihypertensivum met de placebo bleek dat in de
medicatiegroep (de indexgroep) de tienjaars cumulatieve incidentie van het cerebrovasculaire
accident 1,4% was (R1 = 0,014), tegen 2,6% (R0 = 0,026) in de placebogroep. Het risicoverschil
bedroeg dus 1,2%. Dat betekent dat men gedurende tien jaar 1/0,012 = 83 patiënten met een matig
hoge bloeddruk moet behandelen om één CVA te voorkomen. Uit hetzelfde onderzoek bleek dat men
333 patiënten met milde hypertensie tien jaar moest behandelen om één myocardinfarct te
voorkomen. Voor nuancering van dit begrip verwijzen wij naar een recente publicatie [1].
1.4.2 Risicofuncties
Tot nu toe hebben we de relatie tussen één determinant en de kans op ziekte besproken. Voor de
klinische praktijk is het echter veel waardevoller om de gezamenlijke invloed van een aantal
determinanten op het absolute risico van ziekte te kennen. Deze gezamenlijke invloed kan kwantitatief
beschreven worden met een risicofunctie, ook wel risicoscore of predictieregel genoemd. De
risicofunctie is in feite een verzameling van 'gewichten' die aangeven hoeveel de afzonderlijke
determinanten bijdragen aan het absolute risico en hoe deze gecombineerd moeten worden. Vaak
heeft de risicofunctie de vorm van een scoresysteem dat bij een individuele patiënt wordt toegepast
door voor de aanwezigheid van elke determinant een aantal punten (het gewicht) toe te kennen en
deze op te tellen. Het totaal aantal punten kan dan vertaald worden in een absoluut risico.
Een goed voorbeeld is een groot Nederlands follow-up onderzoek waarin een risicofunctie voor de 10jaars mortaliteit werd afgeleid [2]. Hiermee kan de clinicus voor een patiënt het risico om binnen 10
jaar te overlijden op eenvoudige wijze berekenen aan de hand van een aantal risico-indicatoren.
Volgens deze functie is dit risico, bijvoorbeeld voor een 60-jarige man met een lengte van 1,74 meter,
een gewicht van 87 kilo, een systolische bloeddruk van 165 mm Hg waarvoor hij wordt behandeld, een
hartfrequentie van 85 slagen per minuut, en een cholesterol van 6.3 mmol/liter die 30 sigaretten per
dag rookt en geen diabetes of hartinfarct heeft gehad, gelijk aan 35%
Literatuur
[1]
Lubsen J, Hoes AW, Grobbee DE. Implications of trial results: the potentially misleading notions
of number needed to treat and average duration of life gained. Lancet 2000;356:1757-9.
[2]
Hoes AW, Grobbee DE, Valkenburg HA, Lubsen J, Hofman A. Cardiovascular risk and all-cause
mortality; a 12-year follow-up study in the Netherlands. Eur J Epidemiol 1993;9:285-292.
1.5
PRECISIE EN VALIDITEIT
1.5.1 Precisie
De precisie of nauwkeurigheid van een onderzoek kan geïnterpreteerd worden als de mate waarin het
onderzoek bij denkbeeldige herhalingen hetzelfde resultaat laat zien. De precisie zegt dus niets over
de juistheid van de resultaten, alleen iets over de reproduceerbaarheid. Zij neemt toe met de grootte
van de onderzoekspopulatie en neemt af met de grootte van meetfouten.
Op basis van de grootte van de onderzoekspopulatie en een schatting van de meetfout uit het
75
KWO
onderzoek kan daarom een uitspraak over de precisie worden gedaan, bij voorkeur in de vorm van
een 95% betrouwbaarheidsinterval. Dit interval geeft aan dat in 95 van de 100 herhalingen van het
onderzoek het gevonden 95%-betrouwbaarheidsinterval de onderliggende, onbekende, effectmaat
zou bevatten. In plaats van een betrouwbaarheidsinterval wordt de precisie van een onderzoek ook
vaak uitgedrukt in de p-waarde. De p-waarde geeft aan hoe vaak bij herhaling van het onderzoek een
waarde voor de effectmaat wordt gevonden die minstens zo groot is als die in het huidige onderzoek,
gegeven dat er in werkelijkheid geen effect is, dat wil zeggen dat de nulhypothese van geen effect juist
is.
De p-waarde is moeilijk te interpreteren omdat deze zowel afhangt van genoemde factoren als ook
van de grootte van het gevonden effect. Bij het betrouwbaarheidsinterval daarentegen, krijgen we
direct een indruk van de toevalsvariatie in de grootte van het effect, een maat voor de precisie in de
meting van een effect. Daarom wordt in de epidemiologie de voorkeur gegeven aan een
betrouwbaarheidsinterval in plaats van een p-waarde.
De vraag blijft hoe we deze maten van precisie betrekken bij de conclusie uit een onderzoek, de
statistische inferentie. Hierin zijn twee scholen. In de traditionele school wordt de nulhypothese
verworpen of aanvaard. Volgens conventie wordt bij een p-waarde kleiner dan 0.05, de alpha, de
nulhypothese ten gunste van de alternatieve hypothese van “wel een effect” verworpen. Stel dat in
een onderzoek het relatief risico van diabetes op retinopathie 2.3 bedraagt met een p-waarde van
0.04, dan wordt de nulhypothese van geen effect verworpen en wordt geconcludeerd dat er een
statistisch significant verband is tussen diabetes en retinopathie. Bij een p-waarde groter of gelijk 0.05
wordt geconcludeerd dat dit verband niet aangetoond kon worden.
Ook op basis van een betrouwbaarheidsinterval kan men een dergelijke ja-nee uitspraak doen. Als de
nulwaarde, bij een relatief risico is dit 1, zich buiten het 95%-betrouwbaarheidsinterval bevindt,
betekent dit dat er een significant verband is bij een alpha van 0.05. In genoemd voorbeeld zou dan
het 95%-betrouwbaarheidsinterval (1.4-5.2) kunnen zijn. Omgekeerd zou de conclusie bij een
betrouwbaarheidsinterval (0.9-5.7) “geen statistisch significant verband aangetoond” zijn. Overigens
doet een dergelijke conclusie geen recht aan de informatieve waarde van het
betrouwbaarheidsinterval, vooral bij een niet significant resultaat. Als bijvoorbeeld een relatief risico
van 1.1 met een klein 95%-betrouwbaarheidsinterval (0.9-1.3) wordt gevonden, dan is direct zichtbaar
dat waarden boven de 1.3 en onder de 0.9 niet erg plausibel zijn. Een p-waarde, in dit geval
bijvoorbeeld 0.2, is veel minder informatief en leidt er waarschijnlijk slechts toe dat de nulhypothese
niet verworpen wordt.
Bij de meer recent ontwikkelde statistische inferentie volgens Bayes (zie ook diagnose) wordt de
nulhypothese niet verworpen of aanvaard. In plaats daarvan wordt de statistische informatie uit het
onderzoek gebruikt om de geloofwaardigheid van een hypothese zoals die vóór het onderzoek
bestond, de a priori geloofwaardigheid, te veranderen in een achteraf (a posteriori) geloofwaardigheid.
Stel dat een arts ervan overtuigd is dat antibiotica bij de behandeling van een maagzweer niet effectief
zijn, dan zal door een onderzoek dat met geringe significantie de effectiviteit van deze behandeling
wel aantoont, die mening niet of nauwelijks worden bijgesteld. Als deze arts echter de week erop
kennis neemt van juist een zeer significant effect van antibiotica bij maagzweren, dan kan dit wel de
aanleiding zijn om zijn mening te herzien. De voortdurende verandering van het geloof in een
bepaalde hypothese op basis van steeds nieuwe gegevens is de essentie van de Bayesiaanse
inferentie. Voor nadere beschouwing verwijzen wij naar een boek gewijd aan statistische inferentie [1].
1.5.2 Validiteit
Bij de beoordeling van de validiteit van een onderzoek wordt onderscheid gemaakt tussen de interne
en externe validiteit. De interne validiteit is de mate waarin, afgezien van toevalsfouten, het gevonden
effect gelijk is aan het werkelijk effect bij personen met overeenkomstige kenmerken als die van de
onderzoekspopulatie. Vertekening, ook wel aangeduid als “bias”, is datgene wat de interne validiteit
negatief beïnvloedt. Er wordt onderscheid gemaakt tussen drie soorten van bias: selectiebias,
informatiebias en confounding bias.
Selectiebias treedt op als de inclusie van personen met de te bestuderen uitkomst niet onafhankelijk
gebeurt van de determinant, of andersom. Als in een onderzoek naar de diagnostische waarde van
ST-depressie op het elektrocardiogram (ECG) voor de diagnose “coronairsclerose” patiënten op een
hartafdeling worden onderzocht, zal er vertekening van het resultaat optreden als deze patiënten juist
omwille van deze ECG-afwijking op de hartafdeling liggen. Informatie- bias is het gevolg van
onvergelijkbare waarneming van de determinant of de uitkomst tussen de te vergelijken groepen.
76
KWO
Stel, dat in een clinical trial de nieuwste ACE-remmer wordt onderzocht op de effectiviteit voor de
behandeling van hypertensie. Als degene die de bloeddruk meet op de hoogte is van het feit of een
deelnemer het nieuwe middel krijgt of een placebo, dan is het niet onaannemelijk dat bij de ACEremmergroep systematisch anders wordt afgelezen dan bij personen in de placebogroep.
Informatiebias wordt onder andere tegengegaan door blindering van de onderzoeker en de
onderzochte personen voor de aard van de determinanten, in een trial de aard van de interventie.
Een derde vorm van bias betreft confounding, letterlijk “verwarring”. Er is sprake van confounding als
een derde factor die samenhangt met de onderzochte determinant, los van het desbetreffende
causale pad, een voorspeller is van de onderzochte uitkomst. In dat geval zijn de te contrasteren
groepen niet meer vergelijkbaar voor wat betreft de kans op de uitkomst. Indien men bijvoorbeeld
onderzoek heeft gedaan naar het serum-cholesterol als risicofactor voor een tweede myocardinfarct,
dan kan bij analyse blijken dat er in de groep personen met een hoog cholesterol veel meer rokers
zitten dan in de referentiegroep met een normaal tot laag cholesterol. Omdat de twee groepen louter
op grond van de proportie rokers prognostisch onvergelijkbaar zijn, kan een eventueel verschil in
prognose niet meer uitsluitend aan het verschil in cholesterol geweten worden. Men spreekt van
“confounding” door roken, dat wil zeggen roken, de ‘confounder’, belemmert een valide vergelijking
van de twee groepen.
Terwijl de mogelijkheid van selectiebias en informatiebias voorkómen moet worden in de
onderzoeksopzet, zijn er voor het tegengaan van confounding bias meerdere opties. Confounding kan
allereerst voorkómen worden door het onderzoek te beperken tot één categorie van de confounder,
i.e. restrictie, bijvoorbeeld door alleen rokers in het onderzoek op te nemen. Verder kan bij follow-up
onderzoek confounding voorkomen worden door de onderzoekspopulatie zo te selecteren, dat de
confounder gelijkelijk wordt verdeeld over de blootgestelde en de referentiegroep. Dit proces wordt
“matching” genoemd. Tenslotte kan als onderdeel van de data-analyse door statistische aanpassing
gecorrigeerd worden voor één of meerdere confounders. Voor al deze methoden is het vereist dat
bekend is wat de mogelijke confounders zijn en dat zij goed gemeten kunnen worden. Dit voorbehoud
geldt niet als men randomiseert in voldoende grote groepen, dat wil zeggen dat men het lot laat
bepalen wie de behandeling krijgt en wie niet. Op deze manier worden ‘automatisch’ alle factoren die
de uitkomst kunnen beïnvloeden in gelijke mate verdeeld over de te contrasteren groepen.
Zoals reeds besproken in paragraaf 1.2 is confounding alleen aan de orde als men geïnteresseerd is
in de causale relatie tussen één bepaalde factor en de uitkomst.
De externe validiteit, beter aangeduid als de generaliseerbaarheid, is de mate waarin de
onderzoeksresultaten van toepassing zijn op personen met duidelijk andere karakteristieken dan de
personen die tot de onderzoekspopulatie behoorden (zie ook hoofdstuk 1.2.3 over domein). Stel
bijvoorbeeld dat de effectiviteit van een nieuw antibioticum voor de behandeling van pneumonie werd
vastgesteld bij mannen, dan is het zeer aannemelijk dat dit middel ook effectief is bij vrouwen. Als het
onderzoek echter de diagnostische waarde van het inspanningselektrocardiogram voor
coronairsclerose zou betreffen, is de generaliseerbaarheid van mannen naar vrouwen minder
vanzelfsprekend, dit gezien het grote geslachtsverschil in ernst en voorkomen van hart- en
vaatziekten. Generaliseerbaarheid kan overigens niet gegarandeerd worden door zogenaamde
“representatieve steekproeven”; zij berust in wezen op een subjectief oordeel, waarbij ook informatie
uit ander(soortig) onderzoek moet worden betrokken.
1.5.3 Hiërarchie
Tenslotte willen wij erop wijzen dat er bij de beoordeling van de waarde van onderzoek een duidelijke
hiërarchie van criteria is. De (interne) validiteit staat voorop, dan volgt precisie, en tenslotte
generaliseerbaarheid. Wanneer bijvoorbeeld een onderzoek zeer precies is maar niet valide, heeft het
geen enkele waarde voor de wetenschap. Omgekeerd kan een zeer valide maar niet zo precies
onderzoek wel degelijk van waarde zijn, bijvoorbeeld door zijn bijdrage aan een meta-analyse (zie
paragraaf 5.4). De generaliseerbaarheid komt pas aan de orde wanneer het onderzoek intern valide
en voldoende precies is.
Literatuur
[1]
Oakes M. Statistical inference, a commentary for the social and behavioural sciences. New
York: Wiley, 1986
77
KWO
78
KWO
Hoofdstuk 2 AANDACHTSGEBIEDEN BINNEN DE KLINISCHE
EPIDEMIOLOGIE
2.1
ETIOLOGIE
2.1.1 Inleiding
Onder etiologie verstaat men de oorzaak of verzameling oorzaken van ziekte of haar beloop. Het gaat
in etiologisch onderzoek derhalve om causale, dat wil zeggen oorzakelijke, verbanden (zie ook
paragraaf 1.2.2). Dit onderzoek kan gebeuren bij gezonde mensen, en heeft dan als onderzoeksvraag
welke determinanten het ontstaan van een bepaalde ziekte veroorzaken. Het onderzoek kan echter
ook bij zieke mensen worden gedaan en heeft dan als onderzoeksvraag welke determinanten een
bepaald beloop veroorzaken, bijvoorbeeld het optreden van een complicatie of een recidief. In
tegenstelling tot het later te bespreken prognostisch onderzoek is de onderzoeker in etiologisch
onderzoek op zoek naar de oorzaak of oorzaken van ziekte of haar beloop. In prognostisch onderzoek
wil de onderzoeker kunnen voorspellen en is op zoek naar die kenmerken die het beste de kans op
bijvoorbeeld een recidief voorspellen. Deze kenmerken hoeven niet noodzakelijkerwijs oorzakelijk
samen te hangen met het optreden van het recidief en de prognostische studie is daarom
beschrijvend (zie ook hoofdstuk 2.3).
In een etiologische studieopzet zal de vraag zijn of één specifieke determinant, bijvoorbeeld een virus,
oorzakelijk geassocieerd is met het optreden van een recidief. In dat geval zal men rekening moeten
houden met de samenhang van deze factor met andere mogelijk oorzakelijke factoren voor de ziekte.
Dit zijn in het etiologisch onderzoek de verstorende variabelen, meestal ‘confounders’ genoemd (zie
paragraaf 1.5.2). Determinanten die in etiologisch onderzoek onderwerp van studie zijn noemen we
risicofactoren en zijn aanwezig vóórdat ziekte (of complicatie) optreedt. De gerandomiseerde
interventiestudie (trial) is het “rolmodel” voor etiologisch onderzoek. Een gerandomiseerde
interventiestudie is een experiment waarbij de onderzoeker geïnteresseerd is in het specifieke effect
van een bepaalde interventie, zoals medicamenteuze interventie, waarbij het effect van andere
kenmerken of invloeden is uitgesloten. In een trial waarin deze bepaalde interventie op haar effect
geëvalueerd wordt is deze interventie de etiologische determinant. Hoewel interventieonderzoek dus
etiologisch onderzoek is, wordt zij door haar geheel eigen karakteristieken elders apart (hoofdstuk 2.4)
besproken. Voor veel etiologische vraagstellingen kan de opzet van een gerandomiseerde trial echter
niet gehanteerd worden, bijvoorbeeld door de aard van het te onderzoeken kenmerk. Zo zal het,
alleen al op ethische gronden, onverantwoord zijn om in een gerandomiseerd onderzoek uit te zoeken
of de ziekte van Alzheimer wordt veroorzaakt door een virus. Vaak ziet men daarom in etiologisch
onderzoek de niet-experimentele onderzoeksopzetten (cross-sectioneel, patiënt-controle, follow-up).
De methodologie van etiologisch onderzoek is terug te vinden in vele leerboeken [1,2]. In dit hoofdstuk
wordt een standaard gegeven voor de opzet van etiologisch onderzoek.
2.1.2 Onderzoeksopzet
2.1.2.1 Determinant-uitkomstrelatie
De determinantuitkomst relatie volgt meestal direct uit de vraagstelling. Er is één specifiek kenmerk,
één specifieke determinant onderwerp van studie. De kans op ziekte is de uitkomst van de relatie
tussen die specifieke determinant en de ziekte. De onderzoeker is geïnteresseerd in een causale
relatie en zal een uitspraak over deze relatie willen doen, rekening houdend met (of corrigerend voor)
al bekende voorspellers van de ziekte voor zover zij geassocieerd zijn met de determinant van
onderzoek.
Een verband wordt in de epidemiologie vaak uitgedrukt als een relatief risico (RR). Deze geeft aan
hoe groot de kans is dat een bepaalde gebeurtenis optreedt in een groep personen met de
determinant vergeleken met een groep zonder deze determinant.
Als gezegd wordt in etiologisch onderzoek gezocht naar de oorzaken van het ontstaan van ziekte.
Dit gebeurt soms om puur wetenschappelijke redenen (fundamenteel onderzoek) maar vaak ook om
aangrijpingspunten te vinden voor interventies zoals behandeling of preventie. In etiologisch
onderzoek kunnen allerlei soorten oorzaken van een ziekte onderwerp van studie zijn. Voorbeelden
van risicofactoren die nogal eens in etiologisch onderzoek worden betrokken zijn: persoonskenmerken
(geslacht, leeftijd), anthropometrische kenmerken (lengte, gewicht, heup-taille-omtrek), leefgewoonten
(roken, alcohol, voeding), reproductieve gegevens (menarche leeftijd, pariteit, menopauze leeftijd),
omgevingsfactoren (blootstelling asbest, milieu, werk), klinische gegevens (bloeddruk, cholesterol), et
cetera. Gebruikelijk is er in etiologisch onderzoek steeds één hoofd vraagstelling, één determinant die
79
KWO
men wil onderzoeken. Men zal dan de mogelijk verstorende werking van andere reeds bekende
determinanten willen uitsluiten. Als men bijvoorbeeld wil onderzoeken of een vitaminegebrek de kans
op longkanker verhoogt, zal men willen voorkómen dat roken het waarnemen van deze relatie
beïnvloedt.
Dit probleem van verstoring of confounding is vrijwel in ieder etiologisch onderzoek aanwezig door de
multicausaliteit van ziekten. Zie paragraaf 1.5.2. voor een bespreking van de mogelijkheden om met
confounding om te gaan.
2.1.2.2 Domein
Het domein bij etiologisch onderzoek bestaat uit die mensen in een bepaalde ‘setting’, zoals
huisartsenpraktijk of algemene bevolking, die de ziekte (of complicatie) in principe kunnen krijgen. Dat
betekent dat ze op het ‘moment’ van blootstelling de ziekte (of de complicatie) nog niet hebben maar
die wel kunnen krijgen. Bij een onderzoek naar de oorzaak van endometriumkanker bestaat het
domein dus uit vrouwen in een bepaalde ‘setting’ zonder deze vorm van kanker, maar die wel hun
baarmoeder nog hebben, vrouwen die dus geen hysterectomie hebben ondergaan.
2.1.3 Uitvoering
2.1.3.1 Algemeen
Bij de opzet van etiologisch onderzoek is men veelal aangewezen op een niet-experimentele
onderzoeksopzet, met name een follow-up onderzoek (ook vervolg- of cohortonderzoek), een patiëntcontroleonderzoek of een cross-sectionele opzet (ook wel transversaal of dwarsdoorsnedeonderzoek
genoemd). Bij deze laatste twee onderzoeksopzetten kan onduidelijkheid bestaan of de determinant
aan de ziekte voorafging of dat deze een vroege uiting of gevolg van de ziekte is. Deze opzetten zijn
zeker geschikt bij determinanten die niet veranderen in het leven van de onderzochte, of die
aangeboren zijn, zoals bloedgroep of DNA-profiel.
2.1.3.2 Onderzoekspopulatie
In een follow-up onderzoek worden groepen samengesteld op basis van het al dan niet blootgesteld
zijn aan de potentieel ziek makende determinant. Een groep personen mèt de determinant wordt
geïdentificeerd en vergeleken met een groep personen zonder dit kenmerk. Een follow-up onderzoek
kan prospectief of retrospectief zijn. Bij prospectief onderzoek worden de onderzochte personen vanaf
de start van het onderzoek gevolgd tot de uitkomst optreedt. Bij het retrospectieve follow-uponderzoek kan de ziekte reeds zijn opgetreden bij de start van het onderzoek.
De onderzoeker identificeert dan de verschillende groepen op basis van aan-of afwezigheid van de
determinant in het verleden, en gaat vervolgens in deze groepen de kans op ziekte (of complicatie) na.
In een patiënt-controleonderzoek wordt een serie patiënten met een bepaalde aandoening verzameld
en vervolgens wordt bij hen de frequentie van voorkomen van de determinant bepaald.
Tevens wordt uit de al dan niet denkbeeldige populatie waar de patiënten vandaan komen een
steekproef als 'controles' genomen om de determinantfrequentie in de bronpopulatie te schatten (zie
ook hoofdstuk 1.3).
2.1.3.3 Determinanten
De keuze van determinanten is afhankelijk van de onderzoeksvraag. In etiologisch onderzoek is er
meestal één determinant waarin de onderzoeker geïnteresseerd is. Daarbij moet men ook andere
determinanten zoals confounders meten om er in de analyse voor te kunnen corrigeren. Bij de keuze
wat de belangrijkste confounders zijn laat de onderzoeker zich leiden door wat er over de ziekte
bekend is aan risicofactoren en oorzakelijke mechanismen. Deze kennis heeft de onderzoeker uit
eigen ervaring of uit de medisch wetenschappelijke literatuur. In etiologisch onderzoek is de
onderzoeker geïnteresseerd in een zo nauwkeurig mogelijke meting van de determinant. Vele soorten
determinanten kunnen onderwerp van studie zijn. Het verkrijgen van gegevens over de determinant
kan gebeuren door metingen aan de onderzoekspersonen te verrichten (bijvoorbeeld lengte,
bloeddruk), door onderzoekspersonen te interviewen of vragenlijsten voor te leggen (over voeding,
roken), door gebruik te maken van routinematig geregistreerde gegevens (bedrijfsblootstellingen,
medisch dossier), door metingen in bloed of anderszins te doen (cholesterol, cotinine in bloed als
afspiegeling van het roken, milieublootstelling m.b.v. een persoonlijke blootstellingsmeter).
In een follow-up onderzoek worden de te onderzoeken groepen geïdentificeerd op basis van aan- of
afwezigheid van de determinant. In prospectief onderzoek is de determinant gemeten vóórdat de
ziekte is opgetreden. Dit is belangrijk omdat een oorzakelijke factor uiteraard vooraf moet gaan aan de
uitkomst. Vaak is het efficiënt de te vergelijken onderzoekspopulaties zo samen te stellen dat er een
80
KWO
maximaal verschil in blootstelling is.
Het meten van de determinant gebeurt zelden foutloos, maar in prospectief onderzoek is de
misclassificatie die optreedt meestal random (of non-differentieel): dat wil zeggen dat eventuele
meetfouten optreden onafhankelijk van het later in de tijd optreden van de ziekte. Dit leidt meestal tot
een onderschatting van bestaande verbanden. In een patiënt-controleonderzoek wordt de determinant
in de regel gemeten nadat de ‘patiënten’ en de ‘controles’ gedefinieerd zijn. Hierbij bestaat naast het
gevaar voor random misclassificatie ook de kans op differentiële misclassificatie van de determinant.
In dit laatste geval wordt de blootstelling systematisch anders (beter of slechter) gemeten bij patiënten
in vergelijking met controles. Dit leidt tot een vorm van vertekening die wordt aangeduid als
informatiebias (zie ook 1.5.2).
Voorbeeld: In een patiënt-controleonderzoek naar de relatie tussen blootstellingen tijdens de
zwangerschap en het optreden van congenitale afwijkingen vergelijkt men de blootstellings-frequentie
onder moeders van kinderen met een aangeboren afwijking met die van moeders die een gezond kind
kregen. Dit kan bijvoorbeeld door de moeders te interviewen. Daarbij is de kans groot dat de moeders
van kinderen met een afwijking een betere weergave geven van mogelijke zwangerschapsblootstellingen dan de controlemoeders. Het feit dat zij een kind met een aangeboren afwijking
hebben gekregen maakt dat zij eventuele blootstellingen beter in hun geheugen bewaard hebben. Dit
kan leiden tot een overschatting van een bestaand verband. Deze vorm van informatiebias wordt ook
wel ‘recall bias’ genoemd. Recall bias kan ook de andere kant op werken en leiden tot een
onderschatting van het verband.
In een patiënt-controleonderzoek bestaat ook het gevaar van selectie bij de keuze van de patiënten en
de controles. In het geval van selectiebias hebben bijvoorbeeld patiënten met aanwezigheid van de
determinant een grotere kans om in het onderzoek betrokken te raken dan patiënten zonder deze
determinant. Dit kan leiden tot een overschatting van het effect van deze determinant. Selectiebias
kan ook leiden tot systematische onderschatting van de bestaande relatie.
2.1.3.4. Uitkomst
In etiologisch onderzoek is de uitkomst een ziekte of een andere aan gezondheid gerelateerde
uitkomst, bijvoorbeeld kanker, hemoglobinegehalte in het bloed, hoofdpijn, complicatie. Het is
belangrijk om een eenduidige definitie van de ziekte te hanteren. Dit is van belang omdat het
onderzoek een oorzakelijke determinant wil vinden. Deze determinant werkt mogelijk alleen voor een
specifieke ziekte-entiteit (bijvoorbeeld bepaalde histologische subtypen bij kanker). Overigens is dit
ook van belang voor vergelijkbaarheid met andere studies en voor mogelijke generaliseerbaarheid van
het gevonden resultaat. De uitkomst wordt eerst theoretisch geformuleerd, daarna wordt de
operationele uitkomst geformuleerd. Zo kan bijvoorbeeld ‘de kwaliteit van leven’ de theoretische
uitkomst zijn, en kan de onderzoeker besluiten deze te meten met een bestaande,
gestandaardiseerde vragenlijst, zoals de Short Form-36 [1]. Een ander voorbeeld: het meten van ‘pijn’
kan gebeuren met een ‘visual analoge scale’ (VAS), een schaal van 0 (pijnvrij) tot 10 (zeer ernstige
pijn), waarop de onderzochte de mate van pijn in een getal probeert aan te geven.
In een follow-up onderzoek worden de onderzochte personen in de tijd gevolgd tot de ziekte optreedt.
Dit kan een periode van dagen tot weken beslaan maar ook jaren, bijvoorbeeld als het optreden van
kanker eindpunt is. Het aantal mensen dat gevolgd moet worden kan eveneens sterk variëren, van
enkele tientallen tot enkele duizenden. Het aantal hangt sterk af van de frequentie van het eindpunt,
maar ook van de sterkte van het verwachte verband. Hoe frequenter de uitkomst, des te kleiner het
benodigd aantal personen in het onderzoek. En: hoe zwakker het vermoedelijke verband, des te groter
het benodigde aantal (zie verder hoofdstuk 5.3).
In een follow-up-onderzoek is het belangrijk alle personen te volgen tot het eindpunt is opgetreden of
tot het einde van de studie is bereikt. Follow-up dient voor beide groepen dus zo compleet mogelijk te
zijn, dat wil zeggen dat bij het einde van het onderzoek van zoveel mogelijk personen de uitkomst
bekend moet zijn. Als de volledigheid van follow-up zowel aan de uitkomst als aan de determinant
gerelateerd is, zal vertekening (bias) van de associatie optreden. Tevens is van belang dat dit volgen
en tellen van ziektes in de te vergelijken groepen op dezelfde manier gebeurt. Verschillen hierin
kunnen ook leiden tot bias (informatiebias).
In een patiënt-controleonderzoek worden de patiënten op basis van het eindpunt gedefinieerd. Het
aantal personen in een patiënt-controleonderzoek is over het algemeen veel lager dan voor eenzelfde
vraagstelling in een follow-uponderzoek nodig zou zijn. In dit laatste geval zou het aantal personen dat
de ziekte ontwikkelt wel ongeveer even groot zijn als in een patiënt-controleonderzoek. Het patiëntcontroleonderzoek heeft ook geen lange prospectieve follow-up tijd nodig, omdat de ziekte al is
81
KWO
opgetreden. Dit maakt de patiënt-controleonderzoek in veel situaties een goedkope en efficiënte
studieopzet.
2.1.4 Data-analyse
2.1.4.1 Algemeen
In de data-analyse van etiologisch onderzoek staat het probleem van confounding centraal.
Dit is al aan de orde geweest in hoofdstuk 1.2.2 en 1.5.2. Kort samengevat: er is sprake van
confounding als een derde factor die samenhangt met de onderzochte determinant, los van het
desbetreffende causale pad, een voorspeller is van de onderzochte uitkomst. In dat geval zijn de te
contrasteren groepen niet meer vergelijkbaar voor wat betreft de kans op de uitkomst. In de volgende
paragraaf wordt een aantal manieren geschetst hoe rekening kan worden gehouden met de
veroorzaakte verstoring door andere determinanten, dan wel hoe men deze verstoring kan opsporen.
2.1.4.2 Keuze van confounders
In een etiologisch onderzoek is de onderzoeker geïnteresseerd in het effect van één specifieke
determinant op een bepaalde uitkomst. De meeste ziektes worden door meerdere determinanten
veroorzaakt. Vaak is een aantal risicofactoren al bekend, c.q. min of meer geaccepteerd als verwekker
of determinant van de ziekte. Wanneer één van deze factoren samenhangt met de te onderzoeken
determinant, dan kan deze factor de te onderzoeken relatie verstoren. Als dit gebeurt noemen we dit
confounding. Met deze factor moet - naast de te onderzoeken determinant- in het onderzoek rekening
gehouden worden, zodat deze niet de te bestuderen relatie tussen een nieuwe risicofactor en de
ziekte kunnen verstoren. In vrijwel ieder etiologisch onderzoek wordt rekening gehouden met de
determinanten leeftijd en geslacht. Welke andere determinanten gemeten moeten worden is
afhankelijk van inzichten van de onderzoeker en hetgeen op basis van de literatuur bekend is.
Voorbeeld: Een onderzoeker wil de relatie tussen koffiedrinken en de kans op pancreaskanker
onderzoeken. Hij kiest voor een follow-up onderzoek, waarbij hij de kans op ziekte berekent voor
koffiedrinkers en dit vergelijkt met de kans bij personen, die geen koffie drinken. De groepen hebben
dezelfde geslachts- en leeftijdsverdeling. Het resultaat is een verhoogde kans op pancreaskanker bij
koffiedrinkers. Bij nadere inspectie van de gegevens blijken koffiedrinkers meer te roken dan nietkoffiedrinkers. Roken is een bekende risicofactor van pancreaskanker. Het verhoogde risico op
pancreaskanker bij koffiedrinkers is nu mogelijk geen gevolg van het koffiedrinken, maar is (in ieder
geval voor een deel) een gevolg van het roken. In dit voorbeeld is roken een confounder voor de
relatie koffiedrinken en het optreden van kanker.
2.1.4.3 Rekening houden met confounders
Er zijn verschillende manieren om rekening te houden met ‘confounders’. De eerste, belangrijkste,
stap moet gebeuren vóórdat het onderzoek start. Dit is het bedenken van de ‘confounders’ die in de te
bestuderen relatie een rol kunnen spelen. Daarna kan men kiezen om hiervoor te corrigeren vóórdat
de studie begint, of naderhand in de analysefase.
Vóór de start van de studie kan men beslissen de onderzoekspopulatie zodanig te selecteren dat de
‘confounder’ homogeen wordt (bedoeld wordt: niet meer samenhangt met de te onderzoeken
determinant). Men zou er bijvoorbeeld voor kunnen kiezen om in bovenstaand voorbeeld onderzoek te
doen alleen bij mannen, die niet roken, en die allemaal tussen 50 tot 55 jaar zijn. In dat geval kunnen
geslacht, roken en leeftijd geen ‘confounder’ meer zijn. Dat wil zeggen dat zij de te onderzoeken
relatie tussen koffie drinken en de kans op pancreaskanker niet kunnen verstoren. Dit wordt restrictie
van de onderzoekspopulatie genoemd.
Een andere manier is om in de analysefase te corrigeren voor de verstorende werking van
‘confounders’. Een eerste stap is dan dat ‘confounding’ opgespoord moet worden. Dit kan door de te
bestuderen relatie voor verschillende niveaus van de ‘confounder’ te bestuderen. Dit heet stratificeren.
Dit betekent dat het verband tussen een determinant en een ziekte wordt berekend voor verschillende
klassen (= strata) van de confounder. Zo kan men bijvoorbeeld de resultaten van een onderzoek apart
berekenen voor mannen en vrouwen en voor verschillende leeftijdsgroepen. Wanneer nu in deze
klassen andere waarden voor het effect worden gevonden dan voor de ‘overall’ maat (ook wel ruwe
effectmaat genoemd), dan spreekt men van ‘confounding’.
Voorbeeld: In bovenstaand voorbeeld heeft men voor koffiedrinken ten opzichte van niet koffiedrinken
een relatief risico van 4 gevonden. Dit betekent dat de kans op pancreaskanker voor koffiedrinkers
vier keer hoger is vergeleken met personen die niet koffiedrinken. De onderzoeker wil nagaan of deze
relatie verstoord is door een effect van roken. Hij bestudeert daartoe de relatie apart voor personen
82
KWO
die roken, en voor personen die nooit rookten. In deze klassen vindt hij relatieve risico’s van
respectievelijk 2 en 2,6.
Deze waarden wijken af van de ruwe effect-maat (RR=4) en dus betekent dit dat roken een
confounder is. De beste schatter voor de relatie tussen koffiedrinken en pancreas-kanker zal ergens
tussen de 2 en 2,6 liggen. Als de relatieve risico’s voor de beide klassen respectievelijk bijvoorbeeld
3,9 en 4,2 waren geweest, dan zou er geen sprake van ‘confounding’ zijn geweest.
Als een onderzoeker heeft geconcludeerd dat een bepaalde determinant (of meerdere) als confounder
heeft gewerkt, dan zal hij de ruwe effectmaat moeten bijstellen. De mogelijkheid bestaat om dan tot
een schatting voor het verband te komen door de verschillende relatieve risico’s (of odds ratio’s) te
middelen. Gebruikelijk gebeurt dit gewogen, met het zwaarste gewicht voor die klasse, waarin de
meeste onderzoekspersonen voorkomen. Een voorbeeld is de Mantel Haenszel odds ratio (zie
Rothman).
Voorbeeld: In bovenstaand onderzoek naar koffiedrinken en pancreaskanker wordt een relatief risico
van 4 gevonden. Het resultaat voor rokers en niet-rokers is respectievelijk 2 en 2,6. Een gemiddelde
maat voor het effect zal ergens tussen deze twee waarden liggen, en wel het dichtste bij die waarde,
die tot stand is gekomen op basis van de klasse met de meeste onderzoekspersonen.
Het gecorrigeerde relatieve risico is dus lager dan het ongecorrigeerde relatieve risico.
Dit is een gevolg van het feit dat roken een confounder is: het vertroebelt het zicht op de werkelijke
relatie tussen koffiedrinken en pancreaskanker. Wanneer men hiervoor corrigeert, vindt men een
minder sterk verband.
Het probleem van stratificeren (= in klassen opdelen) is duidelijk. Bij vele waarden van een confounder
of bij meerdere confounders worden de aantallen in iedere klasse (stratum) al snel erg klein en
ontstaan onbetrouwbare schattingen van de stratumspecifieke relatieve risico’s. In zo’n geval maken
we gebruik van een zogenaamde multivariate analysetechniek. Deze is vaak gebaseerd op het
logistische regressiemodel. Hierbij is de y-variabele (de uitkomst variabele) dichotoom; de ziekte (of
complicatie) is gecodeerd als aanwezig of afwezig (ziek of niet ziek). De etiologische determinant
(continu, in klassen of dichotoom) wordt als eerste covariaat in het model opgenomen (X1). Alle
determinanten die confounding kunnen veroorzaken worden als overige variabelen in het model
opgenomen (X2-Xn). In de analysefase wordt vervolgens gekeken wat er gebeurt met de schatting
van de regressiecoëfficiënt van de etiologische determinant (beta1) bij het verwijderen, c.q. toevoegen
van mogelijke confounders in het model (X2, X3…Xn). Een confounder wordt in het model
gehandhaafd wanneer deze bij weglaten uit het model een relevante verandering in de schatting van
de regressiecoëfficiënt van de etiologische determinant (beta1) teweegbrengt. Of een verandering in
deze regressie-coëfficiënt (beta1) van belang is wordt over het algemeen niet bepaald door
statistische significantie, maar door relevante veranderingen. De onderzoeker bepaalt vooraf welke
grootte van veranderingen van de beta1 relevant worden geacht en is dan verplicht die covariaten als
confounders in het model op te nemen, als deze bij weglating relevante veranderingen in de beta1 van
de determinant teweegbrengen. Op deze manier verkrijgt men een schatting van de
regressiecoëfficient voor de etiologische determinant (beta1), die gecorrigeerd is voor de verstorende
werking van andere determinanten.
Literatuur
[1] VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997.
[2] Rothman KJ, Greenland S (eds). Modern Epidemiology. Philadelphia: Lippincott-Raven
Publishers, 1998.
[3] Ware JE. The SF-36 health survey. In: Spilker B (editor). Quality of Life and pharmacoeconomics
in clinical trials. 2nd ed. Philadephia, Lippencott-Raven Publishers, 1996: 337-345.
2.2
DIAGNOSTIEK
2.2.1 Inleiding
Onder diagnose verstaat men die aandoening die het meest waarschijnlijk de klachten en symptomen
van een gegeven patiënt verklaart. Artsen willen diagnosen stellen om beslissingen te kunnen nemen
over het optimale beleid, inclusief een expectatief beleid. Het diagnostisch proces begint in de praktijk
altijd met de patiënt die zich bij de arts presenteert met een bepaald symptoom of een bepaalde
klacht, bijvoorbeeld met dyspnoe, hoesten en/of pijn op de borst bij ademhaling. Bij het horen van
deze klachten schiet de arts meestal al een aantal aandoeningen te binnen die de klachten zouden
83
KWO
kunnen verklaren. Dit noemt men de differentiaaldiagnose.
De waarschijnlijkheidsdiagnose is over het algemeen de meest kansrijke en/of meest ernstige
aandoening, waarvan de aan- of afwezigheid allereerst moet worden aangetoond of uitgesloten.
In het voorbeeld van de patiënt met dyspnoe, hoesten en/of pijn op de borst bij ademhaling, is de
waarschijnlijkheidsdiagnose een longembolie en de differentiaaldiagnose omvat o.a. longontsteking,
tumor en hartinfarct. Al dan niet bewust schat de arts in deze fase, voordat anamnese en aanvullende
diagnostiek is verricht, de kans op aanwezigheid van de waarschijnlijkheidsdiagnose. Dit wordt de a
priori kans of voorafkans op de ziekte genoemd. In het voorbeeld is deze ongeveer 25%. Vaak is de
arts in deze fase nog te onzeker over de diagnose om een behandeling te initiëren dan wel te
onthouden, vooral als deze behandeling ook risico’s kent. Nadere diagnostiek dient om deze
onzekerheid te reduceren, d.w.z. de voorafkans te veranderen in een extreem hoge of lage
achterafkans (de a posteriori kans). Deze diagnostiek bestaat uit een aantal opeenvolgende fasen;
altijd een anamnese en lichamelijk onderzoek, en in ons voorbeeld ook aanvullend onderzoek, zoals
(soms in willekeurige volgorde) thoraxfoto, bloedgasanalyse, elektrocardiografie, echografie van het
diep veneuze systeem, ventilatie-perfusiescan, en pulmonaire angiografie.
Voor elk klinisch probleem betreft de eerste diagnostische fase vrijwel altijd anamnese en lichamelijk
onderzoek. Niet altijd is de arts daarna voldoende zeker over de diagnose. Er volgt dan nadere
diagnostiek om de onzekerheid te reduceren, waarbij de achterafkans weer de a priori kans is voor de
volgende diagnostische test. Dit diagnostische proces duurt voort totdat een verantwoorde
beleidskeuze kan worden gemaakt. De grenzen waarboven en -onder men besluit dat er voldoende
zekerheid bestaat zijn vaak arbitrair en afhankelijk van de aard van de aandoening. Het ligt voor de
hand de vraag te stellen waarom niet alle diagnostische testen die voor een bepaald probleem
beschikbaar zijn, worden toegepast. Dit zou immers tot de grootst mogelijke diagnostische zekerheid
leiden. Het antwoord is natuurlijk dat die benadering eenvoudigweg te duur, te tijdrovend, te belastend
voor de patiënt of het medisch personeel zou zijn. Diagnostiek moet daarom zo efficiënt mogelijk
worden uitgevoerd, met inachtneming van acceptabele percentages foute beslissingen. De algemene
vraag bij diagnostiek is dus hoe men met een minimum aan belasting voor patiënt, personeel en
budget, een zo groot mogelijke diagnostische zekerheid bereikt. Het doel van diagnostisch onderzoek
is dan om te kijken of een bepaalde nieuwe test, gegeven een bepaald klinisch probleem en gegeven
reeds aanwezige diagnostische informatie, toegevoegde diagnostische waarde heeft. Een nieuwe test
wordt nooit in isolatie geëvalueerd omdat altijd reeds diagnostische informatie voorhanden is,
bijvoorbeeld leeftijd en geslacht.
2.2.2 Onderzoeksopzet
2.2.2.1 Determinant-uitkomst relatie
De determinant-uitkomst relatie volgt direct uit de vraagstelling. Deze moet bovenal relevant zijn. Zo is
een onderzoek naar de diagnostische waarde van een of andere nieuwe test bij urineweginfecties niet
erg relevant omdat deze aandoening nu al accuraat, snel, veilig en goedkoop vastgesteld kan worden.
De diagnostische vraag is vrijwel altijd een vraag van toegevoegde waarde: gegeven de overige
diagnostische informatie (leeftijd, geslacht, anamnese en/of lichamelijk onderzoek en/of testuitslagen),
wat voegt de nieuwe te evalueren test toe aan de diagnostische zekerheid over de aanwezigheid van
een bepaalde ziekte. In de determinantuitkomst relatie is de uitkomst de kans op ziekte. De
determinanten vertegenwoordigen de reeds aanwezige diagnostische informatie en de te evalueren
test, in het voorbeeld de echografie van de beenvenen. De determinant-uitkomstrelatie in het
voorbeeld wordt zoiets als:
P(L) = ƒ (leeftijd, geslacht, anamnese, lichamelijk onderzoek, X-thorax, …, echografie), waarbij P(L)=
kans op longembolie volgens de referentietest, en de variabelen tussen haakjes de determinanten.
De uitkomst, ziekte, wordt vastgesteld met behulp van de referentietest, ook wel aangeduid als de
‘gouden standaard’. De referentietest voor verdenking longembolie is een combinatie van de uitslagen
van de ventilatie-perfusiescan en de pulmonaire angiografie. Voor de determinanten neemt men,
naast de te evalueren test, die gegevens die in de praktijk reeds voorhanden zijn in de betreffende
fase van de diagnostische ‘work-up’. De diagnostische vraag is een descriptieve vraag, er bestaat
geen interesse in causale relaties tussen testuitslag en ziekte; men hoeft zich dus geen zorgen te
maken over confounders.
84
KWO
2.2.2.2 Domein
Het domein van een diagnostische studie is de theoretische definitie van de patiëntenpopulatie bij wie
de te evalueren diagnostische testen in praktijk zullen worden toegepast. De setting waarin het
probleem zich afspeelt is belangrijk voor het domein, dus bijvoorbeeld huisartspraktijk, tweede lijn, of
consultatiebureau. Het domein wordt gedefinieerd door het klinische probleem waarmee patiënten
zich presenteren of verwezen zijn, in ons voorbeeld alle patiënten verdacht voor longembolie.
Met andere woorden: het domein wordt gekenmerkt door de indicatie tot diagnostiek.
Het domein stelt de grenzen aan de generaliseerbaarheid (zie ook 1.2.3). Als het theoretische domein
gedefinieerd is, moet een concrete onderzoekspopulatie worden gevonden binnen dat domein (zie
2.2.3.2)
2.2.3 Uitvoering
2.2.3.1 Algemeen
Een diagnostische vraagstelling kan men beantwoorden met behulp van een cross-sectioneel
onderzoek, het gaat immers om de aanwezigheid van een bepaalde aandoening op het moment dat
bepaalde klachten, symptomen, testuitslagen, et cetera ook aanwezig zijn. Het lijkt op het eerste
gezicht efficiënt om diagnostisch onderzoek uit te voeren met behulp van reeds verzamelde gegevens.
Helaas gebeurt het in de praktijk zelden dat het allerbelangrijkste gegeven in diagnostisch onderzoek,
de indicatie, geregistreerd wordt. Dit gegeven is essentieel voor het selecteren van een
onderzoekspopulatie die representatief is voor het domein. Uiteindelijk wordt naast wat demografische
gegevens alleen de diagnose vastgelegd in de ziekenhuisregistratie. Als men voor de
onderzoekspopulatie uitgaat van deze registratie mist men alle patiënten die ergens in het traject een
negatieve test hadden en daarom niet de referentietest kregen, maar natuurlijk wel tot het domein van
de van de ziekte ‘verdachte’ patiënten behoren. Men houdt dus selectief patiënten met positieve
testuitslagen over. Dit kan leiden tot de meest voorkomende bias in diagnostisch onderzoek, de
zogenaamde verwijzings- of ‘referral’-bias, een vorm van selectiebias. Meestal is het noodzakelijk om
diagnostisch onderzoek nieuw op te zetten en prospectief systematisch patiënten met een bepaald
klachten- en symptomenprofiel, dat wil zeggen met een bepaalde indicatie, te onderwerpen aan
diagnostische tests en de referentietest.
2.2.3.2. Onderzoekspopulatie
Bij de uitvoering van diagnostisch onderzoek zal men eerst de patiëntenpopulatie definiëren waarbij
men de diagnose wil stellen. Dit is de onderzoekspopulatie die de kenmerken van het domein moet
hebben. Het kritische kenmerk hierbij is de indicatie voor diagnostiek.
In de praktijk is het goed de populatie te operationaliseren aan de hand van de specifieke klachten,
symptomen of kenmerken waarbij de diagnose longembolie wordt overwogen. In het voorbeeld zou
dat kunnen zijn: patiënten verwezen door de huisarts naar de tweede lijn met dyspnoe, hoesten en/of
pijnlijke ademhaling. De onderzoekspopulatie kan meer beperkingen hebben dan door het domein
worden opgelegd; voor bijvoorbeeld het domein ‘de mens’ kunnen mannen de studiepopulatie vormen.
Met andere woorden, een onderzoekspopulatie hoeft niet noodzakelijk een random sample van het
domein te zijn.
2.2.3.3. Determinanten
In diagnostisch onderzoek worden alle relevante gegevens uit de opeenvolgende fasen die de
patiënten normaliter in de praktijk doorlopen, nauwkeurig vastgelegd. Het is hierbij van belang dat de
testen in het onderzoek op dezelfde manier worden uitgevoerd (inclusief verslaglegging) als in de
praktijk. Gebeurt dit niet, bijvoorbeeld veel nauwkeuriger, dan valt de waarde van de test zoals die in
het onderzoek werd gevonden waarschijnlijk in de praktijk erg tegen. Vooraf definieert men wat
afwijkend is en wat niet.
Bij voorkeur definieert men objectieve en reproduceerbare parameters (bijvoorbeeld de aan- of
afwezigheid van atelectasis, pneumothorax) en niet alleen positief/negatief of verdacht/normaal. Als
de test in de praktijk wordt beoordeeld met kennis van andere diagnostische informatie (zoals
meestal), dan moet dit in de onderzoekssituatie ook gebeuren. Indien echter testen worden
vergeleken, dan moet elke beoordeling onafhankelijk plaatsvinden door middel van blindering voor de
uitslag van de andere.
85
KWO
2.2.3.4. Uitkomst
Indien de bijdrage van een test aan het aantonen of uitsluiten van een ziekte wordt geëvalueerd, is
een referentietest vereist. Een procedure of test die in praktijk wordt gebruikt om bij bestaande twijfel
de doorslag over de aan- of afwezigheid van een aandoening te geven, kan worden beschouwd als
een geschikte referentietest voor wetenschappelijk onderzoek. Deze wordt ook vaak ‘gouden’
standaard genoemd, maar men dient te beseffen dat ook deze ‘gouden’ standaard in praktijk tot een
verkeerde beslissing kan leiden en dus niet 24-karaats is. Daarom kan beter het begrip referentietest
worden gebruikt. Referentietesten bestaan voor veel aandoeningen, zoals bijvoorbeeld angiografie
voor hart- en vaataandoeningen, artroscopie voor gewrichtsaandoeningen, of biopsie bij een
verdenking op een maligniteit. Voor veel aandoeningen ontbreekt één bepaalde referentietest of is
deze te invasief om uit te voeren bij alle onderzoeksdeelnemers en wordt voor onderzoeksdoeleinden
gekozen voor een meer pragmatische aanpak. We onderscheiden hierbij studies waarin gebruik wordt
gemaakt van een combinatie van testen, consensus diagnose, of van informatie die in de follow-up
wordt verkregen. Ten slotte moge duidelijk zijn dat de referentie-test uitgevoerd moet worden zonder
kennis van de uitslag van de te evalueren test(en).
2.2.4. Data-analyse
2.2.4.2. Selectie van voorspellers
Na datacontrole wordt in de analyse allereerst een dichotome uitkomstmaat gedefinieerd:
aan- of afwezigheid van de referentiediagnose (longembolie). Met behulp van logistische regressie
analyse wordt de kans hierop gerelateerd aan elk diagnostisch gegeven. Deze analyse gebeurt eerst
voor iedere voorspeller (determinant) apart (univariate analyse). Alleen die variabelen die univariaat
de uitkomst voorspellen, komen in aanmerking voor het multivariate (logistische regressie) model. Met
dit model kan ook goed onderzocht worden of een bepaalde determinant toegevoegde voorspellende
waarde heeft.
2.2.4.3. Constructie van een predictieregel
De predictieregel wordt afgeleid uit de regressie-coëfficiënten van het multivariate model dat het best
voorspelde met de minste diagnostische gegevens. De multivariate analyse gebeurt in de volgorde
waarin de gegevens in praktijk zijn verzameld. Allereerst worden alle anamnestische variabelen
samen gemodelleerd en de niet-significante variabelen uit het model verwijderd. Dit levert een model
op met alleen die anamnestische variabelen die de aan- of afwezigheid van longembolie werkelijk
voorspellen. Gebleken is dat dit met name de leeftijd, aanwezigheid van maligniteiten, collaps, recent
ondergane chirurgie, en pijn in de benen zijn. Door vervolgens de bevindingen van het lichamelijk
onderzoek toe te voegen, ziet men of het lichamelijk onderzoek iets toevoegt aan het stellen van de
juiste diagnose. Zo gaat men verder, tot alle diagnostische fasen zijn doorlopen.
De formule voor een predictieregel ziet er als volgt uit:
P(Ziekte) 
1
1  e (  1 X1   2 X 2  3 X 3 ...  n X n )
waarbij de ’s de regressiecoëfficiënten voorstellen en de X-variabelen de waarden voor de
verschillende diagnostische parameters, bijvoorbeeld X 1=1 als de patiënt een vrouw is, en X2=65 als
de leeftijd van de patiënt 65 jaar is.
2.2.4.4. Testen van een predictieregel
Van het multivariate model met anamnestische gegevens wordt een Receiver Operating Characteristic
(ROC)-curve (een plot van sensitiviteit tegen 1- specificiteit) geconstrueerd, zoals weergegeven in
figuur 2-2-1. Deze curve geeft de diagnostische waarde aan van de gehele anamnese (d.w.z. de
geselecteerde anamnestische variabelen) ofwel het vermogen om patiënten met en zonder
longembolie te onderscheiden op basis van louter de anamnese. Hoe beter het model, des te meer de
curve in de linkerbovenhoek ligt. Het slechtst denkbare model, dat helemaal niet discrimineert, heeft
een oppervlak van 0.5 (zie de diagonaal in figuur 1) en een perfect discriminerend model een
oppervlak van 1.0. In ons fictieve voorbeeld is de oppervlakte 0.76, hetgeen min of meer betekent dat
bij 76% van de patiënten het anamnestische model de aan- of afwezigheid van longembolie correct
voorspelt.
86
KWO
Voor technische details met betrekking tot logistisch modelleren, ROC curven en het toepassen van
variabele-selectietechnieken, verwijzen wij naar de literatuur [1,2]. Door vervolgens de bevindingen
van het lichamelijk onderzoek toe te voegen ziet men of het lichamelijk onderzoek iets toevoegt aan
het stellen van de juiste diagnose. Indien de oppervlakte groter wordt is er sprake van toegevoegde
waarde en kan worden nagegaan welke bevindingen bij lichamelijk onderzoek hiervoor
verantwoordelijk zijn. In ons voorbeeld bleken dit met name de ademhalingsfrequentie, parese,
roodheid, zwelling, en pijn van het been te zijn. Als het oppervlak gelijk blijft is de toegevoegde waarde
nihil. Verschillen tussen ROC-oppervlakten kan men statistisch toetsen. Dit proces wordt vervolgens
herhaald door de diverse diagnostische testen stapsgewijs toe te voegen aan het voorgaande model.
Het blijkt bijvoorbeeld dat echografie aanvullende diagnostische waarde heeft ten opzichte van
anamnese en lichamelijk onderzoek. Merk op dat men in verschillende volgorde de aanvullende
(beeldvormende) testen kan toevoegen teneinde verschillende diagnostische strategieën te evalueren.
Ook kan men nagaan of en welke beeldvormende technieken het laboratoriumonderzoek zouden
kunnen vervangen.
In deze analyse geldt als uitkomstmaat embolie aanwezig versus afwezig, waarbij de categorie
afwezig alle differentiaaldiagnosen bij elkaar bevat. Een thoraxfoto kan echter in eerste instantie niet
bijdragen aan het in- dan wel uitsluiten van een longembolie, maar naderhand, wanneer deze
eenmaal is uitgesloten, wel bijdragen aan het aantonen van bijvoorbeeld een longontsteking. Met
behulp van moderne analysetechnieken, zoals polytome logistische regressie, waarin een
uitkomstmaat met meerdere categorieën (de differentiaal-diagnose zelf) gemodelleerd kan worden,
kan dit direct geëvalueerd worden.
2.2.4.5. Valideren van een predictieregel
Indien men op de hierboven geschetste wijze een predictieregel heeft geconstrueerd (derivatiefase),
moet deze worden gevalideerd in een andere populatie. De voorspellers zijn immers geselecteerd en
geschat op basis van één bepaalde dataset en vervolgens is de waarde van het model ook nog eens
geëvalueerd op diezelfde dataset. Dit betekent dat vrijwel altijd het onderscheidend vermogen van de
predictieregel overschat zal zijn. Indien men dezelfde predictieregel gaat toepassen in een andere
populatie, zal het discriminerend vermogen daarom lager zijn. Om de mate waarin dit het geval is
empirisch vast te stellen, moet de predictieregel gevalideerd worden. Dit kan met statistische
methoden in dezelfde populatie maar het is beter de predictieregel toe te passen in een andere
populatie uit het domein, en vervolgen te kijken in hoeverre de oppervlakte onder de ROC-curve
kleiner is geworden.
Figuur 2-2-1 ROC-curve
Figuur 2-2-1 ROC-curve
1.00
Sensitivity
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
1 - Specificity
Misschien is het opgevallen dat de maten sensitiviteit en specificiteit hier niet aan de orde zijn
geweest. In onze visie horen deze maten thuis bij het testonderzoek. Testonderzoek is ons inziens
nuttig in een beperkt aantal situaties. Enerzijds in situaties waarin de diagnose nagenoeg gebaseerd is
op één test zoals bij screening, anderzijds in de initiële fase van ontwikkeling van een nieuwe test of
van een bestaande test in een nieuwe medische context, waarbij om efficiency redenen testonderzoek
geïndiceerd is. Tot slot gebruiken we het bij het testen van een predictieregel, waarbij de ene
constellatie van testen wordt vergeleken met de andere, door middel van het vergelijken van de
oppervlakten onder de ROC-curven.
87
KWO
Bronvermelding
Deze paragraaf is gebaseerd op: Moons KGM, Van der Graaf Y. Evaluatie van de toegevoegde
waarde van diagnostische tests. Ned Tijdschr Geneeskd 2000;144:1256-61.
Literatuur

Van der Schouw YT, Verbeek ALM, Ruijs JHJ. ROC Curves for the initial assessment of new
diagnostic tests. Family Practice 1992;9:506-11.

Altman DG. (computer)practical Statistics for Medical Research. London: Chapman & Hall,
1991.
2.3 PROGNOSE
2.3.1 Inleiding
Onder prognose verstaat men de voorspelling omtrent het beloop van ziekte. De ‘typische’ prognose
van een ziekte betreft het beloop bij de gemiddelde patiënt. Deze prognose wordt ook wel aangeduid
als de ‘leerboekprognose’, bijvoorbeeld de 5-jaars overleving na de diagnose van een bepaalde
maligniteit. Voor de klinische praktijk echter, waarin de arts wordt geconfronteerd met één bepaalde
patiënt, heeft een dergelijke gemiddelde prognose niet of nauwelijks betekenis. Er wordt immers geen
rekening gehouden met prognostisch belangrijke verschillen tussen patiënten. Zo is bij een vrouw met
mammacarcinoom de 5-jaars overleving aanzienlijk slechter als bij diagnose ook metastasen worden
geconstateerd. De 5-jaars overleving is echter weer iets beter naarmate de vrouw bij diagnose ouder
is. Dergelijke patiënt-karakteristieken, in het voorbeeld leeftijd en metastasering, worden
prognostische indicatoren genoemd. Het zal duidelijk zijn dat, hoe meer men rekening houdt met deze
indicatoren, hoe preciezer een individuele prognose wordt. Deze reductie van onzekerheid is het doel
van prognose voor zowel arts als patiënt. Kennis van de individuele prognose is belangrijk voor de
patiënt omdat hij dan weet waar hij aan toe is. Voor de arts is de individuele prognose belangrijk,
omdat hij zo patiënten kan indelen in bijvoorbeeld gunstig of ongunstig beloop en vervolgens zijn
beleid hierop kan afstemmen: in het algemeen zal een meer intensieve interventie worden gegeven bij
een ongunstiger prognose. We richten ons in dit hoofdstuk daarom op individuele in plaats van
gemiddelde prognoses.
Tot nu toe hebben we vooral gesproken over ‘de prognose’. Dit is echter te vaag. Er zijn bij een
gegeven patiënt immers verschillende prognoses: ten aanzien van de kans op overleving, zoals in het
voorbeeld, maar ook ten aanzien van de kans op recidief, de kans op bepaalde lichamelijke
handicaps, pijn, sociaal disfunctioneren, het complicatierisico, enzovoort. De totale prognose omvat
dus de verzameling van absolute (niet relatieve) kansen op de relevante uitkomsten van ziekte.
Kansen of risico’s zonder meer hebben geen betekenis. Bij een kans op een bepaalde uitkomst moet
ook altijd een tijdsperiode worden genoemd, bijvoorbeeld de kans op het ontwikkelen van hart- en
vaatziekte bij diabetes in de komende tien jaar.
In de Framingham Study werd onder andere onderzocht hoe het 10-jaars risico van hart- en vaatziekte
bij diabetespatiënten afhangt van leeftijd, geslacht, roken, bloeddruk en de cholesterol/HDLcholesterol ratio. Uiteraard kon men met dit onderzoek voor een patiënt met diabetes de gemiddelde
kans om binnen 10 jaar hart- en vaatziekte te krijgen berekenen. Dit is de zogenaamde
‘leerboekprognose’. Voor de praktijk veel relevanter is dat het onderzoek ook liet zien dat met behulp
van bovengenoemde prognostische indicatoren een veel preciezere, individuele, prognose kan
worden bepaald. Zo is het 10-jaars risico van hart- en vaatziekte 11% voor een 50-jarige man met
diabetes die niet rookt, een normale bloeddruk en een normale cholesterol/HDL-cholesterol ratio heeft,
terwijl dit risico 42% bedraagt voor een man van 60 met diabetes die wel rookt, wel een hoge
bloeddruk en wel een hoge cholesterol/HDL-cholesterol ratio heeft.
Hier moet nog worden vermeld dat een arts ook altijd de prognoses zal beschouwen gegeven de
verschillende behandelingsopties, inclusief geen behandeling. De behandeling is dan dus één van de
prognostische indicatoren. Het schatten van de prognose vereist gedetailleerde informatie. De arts moet
weten welke prognostische indicatoren relevant zijn en hoe ze kwantitatief samenhangen met een
bepaalde uitkomst. Hij moet deze informatie uit de literatuur halen en vervolgens voor de patiënt
uitrekenen hoe dat precies voor hem uitpakt. Helaas is de benodigde informatie veelal niet voorhanden.
De methodologie van prognostisch onderzoek is relatief jong en onderzoeks-resultaten bevatten vaak
net niet die informatie die juist nodig is voor een individuele prognose. Ook leerboeken rapporteren hier
88
KWO
nauwelijks over. In dit hoofdstuk wordt uiteengezet hoe onderzoek zo kan worden opgezet, uitgevoerd
en gepresenteerd dat voor individuele prognose relevantie informatie boven water komt.
2.3.2 Onderzoeksopzet
2.3.2.1 Determinant-uitkomstrelatie
Zoals in al het klinisch epidemiologisch onderzoek, wordt de vraagstelling, en daarmee de
determinant-uitkomstrelatie, geïnspireerd door de praktijk. Bij artsen die bij patiënten een hals-cyste
diagnosticeren, leeft bijvoorbeeld de vraag wat nu de kenmerken zijn die maligne degeneratie
voorspellen. Patiënten met deze kenmerken moeten immers regelmatig gecontroleerd worden.
Heel algemeen gesteld is de vraagstelling bij prognostisch onderzoek of het mogelijk is om met enkele
eenvoudig, veilig en “goedkoop” vast te stellen determinanten de absolute kans op een bepaalde
uitkomst precies te schatten. Daarbij zal vaak de vraag zijn of één bepaalde determinant (bijvoorbeeld
een dure meting) toegevoegde voorspellende waarde heeft t.o.v. de informatie (bijvoorbeeld leeftijd,
geslacht, anamnese en lichamelijk onderzoek) die al voorhanden is. Prognostisch onderzoek kan,
evenals diagnostisch onderzoek, beschouwd worden als efficiency- ofwel doelmatigheids-onderzoek.
Bij de keuze van de uitkomst zal men zich vooral laten leiden door de relevantie voor de patiënt. Een
typisch voorbeeld van een voor de patiënt relevante uitkomst is beperking in lichamelijk functioneren,
bijvoorbeeld spraakstoornissen bij multiple sclerose. Andere voorbeelden van relevante uitkomsten
zijn kwaliteit van leven, pijn, zelfredzaamheid, sociaal-psychologisch functioneren, et cetera.
Uitkomstmaten zoals bijvoorbeeld de grootte van een tumor, of het stenose-percentage van een
coronair arterie zijn in een prognostisch onderzoek van minder belang omdat zij voor de patiënt niet
direct klinisch relevant zijn. Zij kunnen wel als benaderingen (zogenaamde proxies) dienen indien er
een goede correlatie bestaat met een voor de patiënt relevante uitkomst op de lange termijn. De
keuze van de determinanten (ook voorspellers of prognostische indicatoren genoemd) wordt in de
prognostiek door dezelfde overwegingen bepaald als in de diagnostiek.
Dit betekent dat men zich laat leiden door wat a priori voorspellers van de uitkomst zijn, en wat er in
de praktijk beschikbaar en haalbaar is. Het betekent ook dat men zich geen zorgen hoeft te maken om
confounders, omdat prognostisch onderzoek, net als diagnostisch onderzoek, descriptief
(beschrijvend) van aard is.
Vaak zijn er vele (50 tot 200) potentiële determinanten gemeten waarvan men de invloed op het
beloop van ziekte wil bestuderen. Bestudering van veel variabelen is echter inefficiënt, vaak onnodig
en statistisch ongunstig omdat het tot instabiele modellen leidt. Bovendien zijn de schattingen van
modellen met een beperkt aantal variabelen nauwkeuriger.
2.3.2.2 Domein
Het domein van een prognostische studie is de abstracte definitie van de patiëntenpopulatie bij wie de
prognose in de praktijk bepaald moet worden. Het domein wordt bepaald door de setting en door het
klinische probleem waarmee patiënten zich presenteren. Zie verder hoofdstuk 1.2.3. Als het
theoretische domein eenmaal gedefinieerd is, moet een concrete onderzoekspopulatie worden
gevonden die past bij dat domein.
2.3.3 Uitvoering
2.3.3.1 Algemeen
Een prognostische vraagstelling zal men bij voorkeur door middel van een follow-up onderzoek
proberen te beantwoorden. Het voordeel van het kwantificeren van de determinant-uitkomstrelatie in
een cohort is dat absolute kansen geschat kunnen worden, dit in tegenstelling tot de patiëntcontrolebenadering. Indien men bijvoorbeeld wil weten welke prognostische indicatoren het risico van
complicaties bij chirurgische patiënten (het domein) bepalen, zal men bij voorkeur een prospectief
follow-up onderzoek opzetten, waarin alle patiënten die in een bepaalde periode worden opgenomen
op een chirurgische afdeling worden vervolgd voor een bepaalde periode, bijvoorbeeld tot 30 dagen
na ontslag. Het is meestal lastig om in een retrospectieve studie juist die informatie te verzamelen die
men nodig heeft. Vaak is deze immers niet systematisch vastgelegd.
2.3.3.2 Onderzoekspopulatie
Bij de uitvoering van prognostisch onderzoek zal men allereerst de populatie definiëren waarvan men
de prognose wil schatten. Dit is de onderzoekspopulatie of het onderzoekscohort en moet de
kenmerken van het domein hebben. In de praktijk wordt vaak een cohort ten behoeve van
prognostisch onderzoek gedefinieerd in termen van datum waarop een diagnose werd gesteld,
89
KWO
bijvoorbeeld alle patiënten die in een bepaalde tijdsperiode in het ziekenhuis werden opgenomen met
een hartinfarct. Een nauwkeurige definitie van de onderzoekspopulatie is van groot belang, omdat
deze de reikwijdte ofwel de generaliseerbaarheid van de conclusies bepaalt.
2.3.3.3 Determinanten
Zoals gezegd wordt de keuze van determinanten (voorspellers) die men wil bestuderen bepaald door
praktische haalbaarheid, kennis, klinische inzichten, literatuurgegevens, plausibiliteit vooraf, en de
hypothesen die men wil toetsen. Het is belangrijk dat, net als bij diagnostisch onderzoek, de
determinanten op dezelfde manier, met name met dezelfde precisie als in de dagelijkse praktijk,
gemeten worden. Gebeurt dit niet, dan valt het voorspellend vermogen van een bepaalde determinant
bij toepassing in de praktijk vaak tegen. Als een determinant (bij voorbeeld de uitslag van een
röntgenfoto) in de praktijk wordt beoordeeld met kennis van andere prognostische informatie
(bijvoorbeeld leeftijd), dan moet dit in het onderzoek ook gebeuren. Indien echter determinanten
onderling worden vergeleken voor wat betreft voorspellend vermogen, dan moet elke beoordeling
onafhankelijk plaatsvinden door middel van blindering voor de te vergelijken determinant. In het followup onderzoek waarin men wil onderzoeken welke prognostische indicatoren complicaties na chirurgie
voorspellen, kan men als determinanten denken aan gegevens die te maken hebben met de ziekte
van de patiënt, de patiënt zelf, en de gepleegde interventie.
Voorbeelden zijn diagnose, leeftijd van de patiënt, rookgedrag, longfunctie, en de aard van de
interventie (bijvoorbeeld een vaatinterventie, appendectomie of circumcisie). Ook factoren zoals duur
van de operatie, hoeveelheid bloedverlies, ervaring van de chirurg of assistent zullen worden
meegenomen.
2.3.3.4 Uitkomst
Net als in een etiologisch follow-up onderzoek moet men ervoor zorgen dat follow-up zo compleet
mogelijk is en dat de uitkomst onafhankelijk van de determinanten wordt vastgesteld. In tegenstelling
tot de determinanten moet de uitkomst niet persé conform de praktijk worden vastgesteld, maar juist
zo precies mogelijk. In het onderzoek naar prognostische indicatoren van het complicatierisico op een
chirurgische afdeling kiest men als eindpunt natuurlijk complicatie. Dit klinkt simpel, maar vervolgens
moet nauwkeurig gedefinieerd worden wat onder een complicatie wordt verstaan. Het is verstandig
hierbij zoveel mogelijk aan te sluiten bij erkende definities. Zo is een veelgebruikte definitie van een
complicatie: ‘any state or event unfavourable to the patient's health that requires additional treatment
or causes damage and that was not intentional’. Vervolgens kun je dan complicaties naar ernst gaan
indelen. Het maakt uit of een patiënt als gevolg van een complicatie (zoals een gebroken heup na een
val uit bed) een operatie moet ondergaan of dat hij een urineweginfectie ontwikkelt als gevolg van een
blaaskatheter.
Het aantrekkelijke van prognostisch onderzoek is dat het uitgevoerd kan worden in de poliklinische en
klinische setting van een ziekenhuis of huisartspraktijk en dat de dataverzameling zoveel mogelijk kan
aansluiten op de klinische praktijkvoering. Omdat de uitkomsten waarnaar wij op zoek zijn vaak
frequent (vaak 10-30% in een jaar) optreden (relevantie!) kan prognostisch onderzoek vaak in één
centrum worden gedaan. In het complicatieonderzoek werden alle patiënten die in 1996 op de
chirurgische afdeling werden opgenomen in het onderzoek betrokken. Het onderzoekscohort dat op
deze manier werd verzameld bestond uit ruim 3200 patiënten, waarvan bij 694 patiënten complicaties
optraden.
Bij alle patiënten werd op gestructureerde wijze door de zaalarts een aantal patiëntkenmerken (leeftijd,
geslacht, diabetes, CARA, etc.) en gegevens over ziekte (diagnose) en behandeling (welke ingreep,
dagbehandeling, wie deed de ingreep, hoeveel bloedverlies, etc.) vastgelegd. Iedere dag werd per
patiënt nagegaan of er een complicatie was opgetreden. Deze werden door de behandelend arts, de
verpleegkundige en de onderzoeker vastgelegd.
2.3.4 Data-analyse
Prognostisch onderzoek heeft veel gemeen met diagnostisch onderzoek, zowel in concept (descriptief
onderzoek, op doelmatigheid gericht), als qua uitvoering (de praktijk volgend). Hoewel op één of
andere manier met de tijd tussen de meting van de determinanten en het optreden van de uitkomst
rekening moet worden gehouden, is de data-analyse in principe vrijwel identiek. Daarom verwijzen wij
hiervoor naar paragraaf 2.2.4 van deze klapper. Uiteraard moet dan voor diagnostische determinanten
prognostische determinanten gelezen worden, en voor ziekte als uitkomst een bepaalde
prognostische uitkomst.
90
KWO
Literatuur

Grobbee DE, Miettinen OS. Clinical epidemiology. Introduction to the discipline. Neth J Med
1995;47:2-5
91
KWO
2.4
INTERVENTIE
2.4.1 Inleiding
Onder interventieonderzoek wordt een onderzoek verstaan, waarbij de onderzoeker het effect van een
preventieve of therapeutische interventie (een ingreep of andere behandeling) wil bestuderen. De arts
wordt opgeleid om medisch te kunnen handelen of om medisch in te grijpen en hij is dus bij uitstek
geïnteresseerd in het effect hiervan. De grootte van het effect en het optreden van eventuele
bijwerkingen bepalen of de interventie zinvol is, of dat het beter is ervan af te zien.
In een interventieonderzoek zal de onderzoeker het specifieke effect van de interventie willen meten.
Hij wil niet alleen weten òf de interventie zinvol is, maar ook hóe zinvol deze is. Met andere woorden:
in een interventie- onderzoek moet ook de grootte van het effect worden gemeten.
Onderwerp van studie kan een interventie zijn in de vorm van toediening van bepaalde medicijnen of
een chirurgische ingreep, maar ook een preventieve maatregel. Zo kan de arts bijvoorbeeld willen
weten of het zinnig is mensen met hoge bloeddruk te behandelen met antihypertensiva. Bij de
behandeling van borstkanker kan de chirurg zich afvragen of een borstsparende ingreep even effectief
is als een borstamputatie. Onderwerp van studie kan ook zijn of het regelmatig verrichten van een
uitstrijkje van de baarmoederhals werkt ter voorkoming van sterfte aan cervixkanker.
Een interventiestudie is een etiologisch onderzoek: in de regel is de onderzoeker geïnteresseerd in het
oorzakelijk effect van één bepaalde interventie en de effecten van andere factoren worden dan als
verstorend ervaren. Dit wordt ‘confounding’ genoemd. Het bestuderen van het effect van een
interventie gebeurt bij voorkeur in een zogenaamd gerandomiseerd experiment. Dit betekent dat de te
bestuderen interventie door toevallige toewijzing (random) tot stand komt. Ook een niet
gerandomiseerde simultane of voor/na-vergelijking kan een schatting van het effect geven. En ook
met behulp van een patiënt-controleonderzoek kan het effect van een interventie onderzocht worden.
Voor een bespreking van niet gerandomiseerde studieopzetten wordt verwezen naar het hoofdstuk
over etiologisch onderzoek (hoofdstuk 2.1). Wij beperken ons hier voornamelijk tot de
gerandomiseerde experimenten. Over gerandomiseerde studies, ook wel gerandomiseerde trials
(randomised controlled trial = RCT) genoemd, is veel in de leerboeken terug te vinden en een enkel
leerboek is zelfs volledig hieraan gewijd [1,2]. In dit hoofdstuk wordt daarom alleen een kort overzicht
gegeven van de principes en de opzet van gerandomiseerd interventieonderzoek.
2.4.1.1 Definitie
Interventieonderzoek is onderzoek waarbij de grootte van het effect van een bepaalde interventie
wordt gemeten. Voor een dichotome uitkomst (gebeurtenis treedt wel of niet op) wordt het effect
uitgedrukt in een relatieve maat. Deze maat geeft aan hoe groot de kans is dat een bepaalde
gebeurtenis optreedt in een groep personen die de interventie krijgt vergeleken met (relatief ten
opzichte van) een groep personen die deze interventie niet krijgt. Voor een continue uitkomst
(bijvoorbeeld bloeddrukwaarden) wordt meestal een verschil in gemiddelde of in de mediaan tussen
de interventie- en de controlegroep berekend.
In een interventie studie wordt onderzoek gedaan naar het effect van een ingreep. De reden is
meestal dat de onderzoeker direct relevante informatie wil verkrijgen over de waarde van bepaalde
therapeutische of preventieve ingrepen. De informatie uit een interventiestudie kan dan direct
toegepast worden in de behandeling of preventie van ziekte. In een enkel geval is er een puur
fundamenteel wetenschappelijke reden voor de interventie studie. In dit laatste geval kan bijvoorbeeld
de producent van een geneesmiddel geïnteresseerd zijn in het effect van een specifiek onderdeel van
een pil. Onderwerp van een interventie studie kunnen eigenlijk alle vormen van interventie zijn, als ook
het afzien van interventie. Zo kan men willen uitsluiten dat een eventueel waargenomen effect een
gevolg is van bijvoorbeeld de extra aandacht die de patiënt krijgt doordat hij medicijnen krijgt voorgeschreven (een zogenaamd placebo effect). Het waargenomen effect kan ook een gevolg zijn van
veranderde leefgewoonten, die de patiënt doorvoert terwijl hij medicatie krijgt.
Om voor deze externe effecten te corrigeren kan bijvoorbeeld gebruik worden gemaakt van een
controlegroep die een vergelijkbare pil slikt, maar dan zonder het te bestuderen bestanddeel (dit wordt
een placebo of neppil genoemd). In de regel weet arts noch patiënt of het echte middel wordt geslikt of
de placebo. Men noemt het onderzoek dan ‘geblindeerd’.
92
KWO
2.4.2 Onderzoeksopzet
2.4.2.1 Determinant-uitkomstrelatie
De determinant-uitkomstrelatie in een interventieonderzoek volgt direct uit de vraagstelling. Een
specifieke interventie is onderwerp van onderzoek.
De kans op genezing is de uitkomst van de relatie tussen de specifieke interventie en de genezing.
Het gaat om een causale relatie. Zoals gezegd zijn voor een interventieonderzoek verschillende
onderzoeksopzetten mogelijk, zoals een patiënt-controleonderzoek of een ‘voor/na’ of ‘simultane
vergelijking’ (cohortonderzoek). Wij beperken ons hier tot het gerandomiseerde interventieonderzoek.
Het is belangrijk de essentie van randomisatie te begrijpen, ook omdat het gerandomiseerde
onderzoek model kan staan voor veel ander etiologisch onderzoek.
Voorbeeld: Stel, een arts wil het effect van bepaalde bloeddruk verlagende medicijnen weten. Hiertoe
geeft hij het medicijn aan een aantal patiënten, bij wie de bloeddruk boven een zekere waarde ligt.
Vervolgens besluit hij na één week de bloeddruk opnieuw te meten. Hij vindt voor de meeste patiënten
een lagere bloeddruk en gemiddeld voor de groep is de bloeddruk gedaald. Is het medicijn dan
effectief?
Er kunnen verschillende redenen zijn waarom de bloeddruk gedaald is. De eerste verklaring is dat het
natuurlijk beloop van de (hoge) bloeddruk wisselend is en dat het gevonden effect is toe te schrijven
aan random variatie of aan het fenomeen ‘regressie naar het gemiddelde’ (na selectie hebben
uitersten de neiging bij een volgende meting dichter bij het populatie-gemiddelde te liggen). Een
andere verklaring kan zijn dat patiënten gunstig reageren op de aandacht en het voorschrijven van de
medicatie. Dit is het eerder genoemde placebo effect (effecten inherent aan de interventie). Het kan
ook zijn dat de patiënten hun leefgewoonten hebben gewijzigd: minder zout en vet eten, meer
bewegen, misschien zijn ze licht afgevallen.
Het waargenomen effect is dan een gevolg van zogenaamde ‘externe effecten’. Het is ook mogelijk
dat de arts die de bloeddrukken meet, dit met een ‘gekleurde bril’ doet en geneigd is lagere waarden
af te lezen of waarden naar beneden af te ronden omdat hij een gunstig effect aannemelijk acht. Dit
leidt tot waarnemer-fouten: een systematische fout (bias) in de informatieverzameling; we noemen dit
‘informatie bias’. En tenslotte kan het effect natuurlijk ook toe te schrijven zijn aan de werkzame
bestanddelen uit de medicatie. Probleem is dat de bijdrage van deze factoren aan het uiteindelijk
effect niet zonder meer is vast te stellen.
Een waargenomen effect van een interventie in een groep patiënten is dus een combinatie van ‘effect
van het natuurlijk beloop’ + ‘externe effecten (inclusief placebo-effecten)’ + ‘waarnemer-effecten’ +
‘interventie effect’. Een eerste stap om een goede effectmeting van de interventie te verkrijgen is het
gebruik van een vergelijkingsgroep, waarin dezelfde effecten van het natuurlijk beloop, van externe
effecten en van waarnemingen optreden. Hoe wordt dit bereikt?
1) Vergelijkbaarheid in natuurlijk beloop
Tot de vergelijkingsgroep behoren patiënten met dezelfde aandoening, die hetzelfde natuurlijke
beloop hebben als de patiënten in de interventiegroep gehad zouden hebben zònder de interventie.
Om dit te bewerkstelligen is ‘randomiseren’ de beste manier. Hierbij worden patiënten at random door toevallige toewijzing - verdeeld over de interventie groep en de controle groep. Hiermee creëert
de onderzoeker twee groepen die optimaal ‘vergelijkbaar’ zijn voor wat betreft het natuurlijk beloop.
Alle factoren die het beloop en de prognose van de ziekte beïnvloeden, zijn gelijk verdeeld over de
twee groepen, met uitzondering van de behandeling. Dit geldt voor bekende en onbekende
prognostische factoren. Een voorwaarde is natuurlijk wel dat de te randomiseren groep patiënten
voldoende groot moet zijn. Randomisatie zorgt dus voor een vergelijkbaar natuurlijk beloop in de
interventie groep en de controle groep. Dit is te beoordelen door na te gaan of de verdeling van
prognostische factoren over de twee te vergelijken groepen bij start van de studie gemiddeld hetzelfde
is. (Overigens hoort deze verdeling van prognostische factoren in de eerste tabel van een artikel te
staan).
Wellicht het grootste probleem in niet gerandomiseerd interventieonderzoek is ‘confounding by
indication’. Meestal is er een reden waarom in de praktijk de ene patiënt wel en de andere niet de
specifieke interventie heeft gekregen. Het kan zijn dat met name ernstig zieke patiënten of patiënten
met co-morbiditeit niet voor de specifieke interventie in aanmerking kwamen. Omdat deze
eigenschappen prognostische kenmerken zijn, betekent dit dat deze patiënten ‘van huis uit’ een
andere prognose hebben dan de groep patiënten zonder deze interventie. Dit vertroebelt het
93
KWO
waarnemen van een interventie-effect (‘confounding by indication’).
2) Vergelijkbaarheid in externe factoren
Hierbij valt een onderscheid te maken in twee categorieën externe factoren.
De eerste categorie wordt gevormd door factoren die inherent zijn aan de interventie. Hierbij valt te
denken aan de extra aandacht die met de interventie gepaard gaat: een witte jas-effect, de smaak en
de kleur van een tablet, het onder narcose gaan voor een operatie, etc. Dit worden placebo-effecten
genoemd. Of de onderzoeker vergelijkbaarheid in placebo-effecten wil bereiken, is afhankelijk van de
onderzoeksvraag. In een zogenaamd ‘pragmatisch’ onderzoek zal dit vaak niet het geval zijn. In een
pragmatisch onderzoek wil men de interventie met alles wat erbij hoort evalueren. Omdat
farmaceutisch onderzoek het domein van de gerandomiseerde interventie studies lange tijd
gedomineerd heeft, is er (te) veel aandacht gegaan naar placebo gecontroleerde studies. De
producent wil in dat geval enkel en alleen het effect weten van een bepaald bestanddeel in een pil: dit
is een ‘explanatory’ of ‘verklarende’ trial. In de klinische praktijk van alle dag is een pragmatische
studie vaker op zijn plaats, en is gebruik van een placebo om placebo-effecten uit te sluiten soms zelfs
ongewenst.
Een tweede categorie ‘externe effecten' betreft effecten, die niet inherent zijn aan de interventie maar
die wel geïnduceerd kunnen worden door de interventie. Met name veranderingen in leefstijl
(prognostische factoren) in de interventiegroep kunnen het waarnemen van een interventie-effect
vertroebelen. Om vergelijkbaarheid in externe factoren te bewerkstelligen kan een ‘placebo’
(nepmiddel) of een nepbehandeling gebruikt worden. Het gebruik van een placebo bewerkstelligt
vergelijkbaarheid in beide categorieën van externe effecten.
Voorbeeld: Wanneer men bijvoorbeeld het effect van het insnijden van het trommelvlies bij een acute
oorontsteking bij kinderen wil bepalen, moet de controlegroep dan ‘niets’ krijgen (pragmatische
studie), of een placebobehandeling (verklarende studie)? In dit laatste geval zullen kinderen een
slaaproesje krijgen en eveneens naar de operatiekamer gaan, maar zal niet het trommelvlies
ingesneden worden. Wanneer het effect van enkel het insnijden gemeten dient te worden, is een
controlegroep met een nep-behandeling de controlegroep bij uitstek.
Dit is een verklarende trial. Een controlegroep met ‘niets’ benadert de praktijksituatie echter het beste
en is de controlegroep bij uitstek in een pragmatische gerandomiseerde trial. In de klinische praktijk is
de keuze immers ‘insnijden met alles wat erbij hoort (‘package deal’)’ of niets doen.
3) Vergelijkbaarheid in waarnemer-effecten
Het eindpunt moet in beide groepen (interventie- en controlegroep) op dezelfde wijze gemeten en
verzameld worden. Om dit te bereiken is in ieder geval een eenduidige en heldere definitie van het
eindpunt nodig, alsook een protocollering over hoe het eindpunt wordt gemeten, c.q. gegevens
verzameld worden. Om te voorkomen dat systematische fouten optreden (met systematische fouten
(bias), wordt bedoeld dat het meten voor de interventie groep systematisch anders gebeurt dan voor
de controle groep), wordt vaak blindering nagestreefd. Wanneer het om eindpunten gaat die de
patiënten zelf moeten aangeven, bijvoorbeeld vermindering in pijn of klachten of kwaliteit van leven,
dan dient de patiënt bij voorkeur geblindeerd te worden. Dit wil zeggen dat de patiënt niet weet of hij in
de interventie- of in de controlegroep zit. Dit kan bijvoorbeeld bereikt worden met een placebo of een
‘placebobehandeling’. Wanneer de onderzoeker of de arts de eindpunten bij de patiënt meet,
bijvoorbeeld de bloeddruk, dan kan het van belang zijn dat de onderzoeker ook blind is. Dan is er
sprake van een dubbelblinde studie. Soms kan ook volstaan worden met een enkelblinde studie. Zo
kan men bijvoorbeeld besluiten de onderzoekspersonen niet te blinderen voor de interventie, omdat
zijzelf de uitkomst niet kunnen beïnvloeden. Een voorbeeld van een dergelijke uitkomst is bijvoorbeeld
botdichtheid op röntgenscans. Overigens kunnen eindpunten in een open studie alsnog blind
beoordeeld worden door onderzoekers die verder niet bij het onderzoek betrokken zijn. In geval van
‘triple’ blind onderzoek is behalve de patiënt (onderzoekspersoon) en de arts (degene die het eindpunt
meet) ook de persoon geblindeerd die de analyses uitvoert, en wordt pas op het allerlaatst de
blindering opgeheven.
Het is de vraag of dit wenselijk is. Voor ‘slimme’ data-analyse is zekere kennis van zaken (en dus ook
van de betekenis van de gegevens) een voorwaarde.
De aard van het eindpunt bepaalt mede of blindering noodzakelijk is. Bij zogenaamde relatief harde
eindpunten (bijvoorbeeld sterfte) zal dit minder noodzakelijk zijn dan bij de relatief ‘zachte’ of
subjectieve eindpunten (bijvoorbeeld pijn).
94
KWO
2.4.2.2 Het domein
Het domein bij interventieonderzoek bestaat uit die patiënten voor wie de interventie zinnig wordt
geacht.
2.4.3 Uitvoering
2.4.3.1 Algemeen
Voor een gerandomiseerd onderzoek is een ethische toetsing en goedkeuring nodig (zie ook
hoofdstuk 3.2). Deelnemers aan een trial moeten volledig geïnformeerd worden over het onderzoek.
Het doel dient uitgelegd te worden. Verder behoren ze geïnformeerd te worden over wat hen te
wachten staat: welke medicijnen c.q. interventies ze krijgen (inclusief de kans van 50% dat ze de
‘nepbehandeling’ krijgen, indien van toepassing), hoe vaak ze op controle moeten komen, en wat er
dan gebeurt. Eventuele vergoedingen worden toegelicht. Na volledige voorlichting en uitleg over
werking en eventuele bijwerkingen, moeten zij schriftelijk toestemming geven (met een handtekening).
Dit heet een ‘informed consent’. Een patiënt kan zich op ieder moment zonder opgaaf van reden uit de
studie terugtrekken. Geen deelname aan de studie mag geen consequenties hebben voor de verdere
behandeling c.q. de arts-patiëntrelatie. Deze patiënten krijgen dan de conventionele behandeling.
De organisatie van een trial is in het algemeen arbeidsintensief. Vooral de randomisatie: ‘om en om’
wordt in de regel beschouwd als ongeschikt, men maakt liever gebruik van ‘random’ nummers. Vraag
is dan hoe dit op de werkvloer wordt toegepast: bellen naar het trialbureau door een arts, et cetera).
Ook eventuele blindering vereist een goede voorbereiding en een consequente uitvoering.
2.4.3.2 Populatie
Ook bij de generalisatie van een resultaat dat verkregen is in een gerandomiseerd onderzoek, is de
nodige voorzichtigheid geboden. Meestal zijn er voor de trial strenge inclusiecriteria (of
exclusiecriteria) gehanteerd, en bovendien zijn deelnemers vaak zeer gemotiveerd. Dit kan tot gevolg
hebben dat deelnemers een heel selecte groep patiënten vormen. Veel van onze huidige kennis is
gebaseerd op trials bij mannen, niet te oud, en zonder co-morbiditeit. De medicatie willen we echter
veel breder toepassen. Dit is niet altijd een probleem, maar wel als aannemelijk kan worden gemaakt
dat de medicatie in andere groepen een verschillend effect kan hebben.
2.4.3.3 Determinanten
De determinant in een interventiestudie kan een bepaalde medicatie zijn, of een bepaalde dosis van
de medicatie. Deze dosis hoeft overigens niet constant te zijn. Deze kan even goed op basis van
effecten of bijwerkingen worden bijgesteld (ook in de controlegroep). De controlegroep kan ‘niets’
krijgen, een placebo, of een andere medicatie (standaard interventie). Dit hangt af van de ziekte, de
interventie en de precieze vraagstelling. De determinant kan ook een chirurgische ingreep zijn of een
andere therapeutische interventie (bijvoorbeeld fysiotherapie). In dit geval is blinderen meestal
onmogelijk. Of dit een probleem is, is afhankelijk van de vraagstelling (pragmatisch of verklarend) en
de aard van het eindpunt (objectief of subjectief). De controlegroep kan een andere chirurgische
interventie krijgen, geen interventie, of met medicatie behandeld worden. Tenslotte kan de
determinant een preventieve maatregel zijn. Zo kan random onderzocht worden of regelmatig
mammografisch screenen de vroegtijdige ontdekking van borstkanker bevordert en uiteindelijk een
reductie in borstkankersterfte teweegbrengt. Of: verlaagt regelmatig bewegen het risico op
suikerziekte? In deze laatste twee voorbeelden zijn erg grote aantallen (gezonde) mensen nodig die
gerandomiseerd dienen te worden. Vervolgens moeten ze een lange tijd (jaren) gevolgd worden. Dit
legt beperkingen op aan gerandomiseerd interventieonderzoek.
2.4.3.4 Uitkomst
Afhankelijk van de aard van de ziekte, de te onderzoeken interventie en de precieze onderzoeksvraag
wordt een relevant (doorgaans klinisch) eindpunt gekozen. Dit is bij voorkeur een klinisch relevante
maat, waar de patiënt direct iets aan heeft. Dat pleit ervoor om patiënten of
patiëntenvertegenwoordigers te betrekken bij de keuze van uitkomstmaten.
Nogal eens worden eindpunten gekozen die ‘medisch-biologisch’ interessant zijn, maar die te weinig
zekerheid geven over uiteindelijke gezondheidswinst voor de patiënt. Een uitzondering kan gemaakt
worden voor eindpunten, waar de patiënt misschien niet direct iets aan heeft, maar waarvan op grond
van eerder wetenschappelijk onderzoek voldoende is aangetoond dat ze uiteindelijk tot
gezondheidswinst leiden (in overleving of kwaliteit van leven). We spreken dan van intermediaire
eindpunten.
95
KWO
Voorbeeld: Men wil nagaan of het gebruik van Statines (een soort geneesmiddel) het
cholesterolgehalte verlaagt bij patiënten met te hoge cholesterol waarden. Hiertoe randomiseert men
patiënten over een controlegroep met placebo en een interventiegroep met een bepaalde dosis
statines. Na enige weken wordt het cholesterolgehalte gemeten. Hoewel de patiënt zich hier niet direct
beter of slechter door voelt wordt dit eindpunt toch als klinisch relevant beschouwd, omdat voldoende
vaak is vastgesteld dat een cholesterolverlaging uiteindelijk het risico op een hart- en vaatziekte
verlaagt.
Al eerder hebben we gemeld dat de aard van het eindpunt mede bepaalt of blindering gewenst is.
Bij harde, objectieve eindpunten is blinderen minder noodzakelijk.
2.4.5 Data-analyse
2.4.5.1. Algemeen
De validiteit van een gerandomiseerde trial is hoog. Door het randomiseren, de toepassing van
blindering en het eventuele gebruik van een placebo, is optimale vergelijkbaarheid verkregen tussen
de interventiegroep en de controlegroep in natuurlijk beloop, externe effecten en waar-nemer-effecten.
Dit betekent dat een valide, betrouwbare schatting van het effect verkregen wordt. Overigens is het
wel van belang alle studiedeelnemers te blijven volgen tot het optreden van het eindpunt of het einde
van de studie. ‘Loss to follow-up’ kan de interne validiteit aantasten en de onderzoeker moet er dan
ook alles aan doen mensen (deelnemende patiënten en artsen) blijvend te motiveren voor de studie.
2.4.5.2 Confounding
Een discussie die vaak gevoerd wordt is of voor een eventuele toevallige ongelijke verdeling van een
prognostische factor bij de start van de studie toch gecorrigeerd moet worden in de analysefase (zie
2.1.4). Een ongelijke verdeling van een factor komt niet zo vaak voor, maar een enkele keer kan de
randomisatie toch zo uitvallen. Sommige epidemiologen vinden dat hiervoor niet gecorrigeerd moet
worden. Immers, voor veel onbekende prognostische factoren die misschien eveneens onevenredig
verdeeld zijn kan ook niet gecorrigeerd worden. Het lijkt echter niet aan te bevelen correctie
achterwege te laten indien de groepen aanzienlijk in belangrijke prognostische kenmerken verschillen.
Door randomisatie wordt ‘confounding by indication’ voorkomen. In niet gerandomiseerd
interventieonderzoek dient zeker voor confounders gecorrigeerd te worden. Het probleem is echter dat
vaak niet of onvoldoende bekend is waarom de ene patiënt wel en waarom de andere patiënt niet de
betreffende interventie heeft gekregen. Voor de daardoor mogelijke ‘confounding by indication’, is dan
niet te corrigeren. Het gevolg is een niet valide schatting van het interventie effect.
2.4.5.3 Intention to treat
In een gerandomiseerde interventiestudie hanteert men bij voorkeur het ‘intention to treat’ principe. Dit
betekent dat de analyse plaatsvindt naar de twee groepen zoals ze oorspronkelijk tot stand zijn
gekomen (zoals de intentie van gerandomiseerde behandeling is). Wanneer een deel van de patiënten
stopt met de medicatie, of overstapt op de andere medicatie (bijvoorbeeld die uit de controlegroep)
dan toch blijven ze, voor het bepalen van het effect van de interventie, tijdens de analyse tot hun
oorspronkelijke groep behoren. Uiteindelijk benadert dit ook het beste de praktijksituatie, waar de arts
de intentie heeft tot behandelen en geen invloed heeft op het daadwerkelijke gebruik van de
voorgeschreven medicijnen. Bovendien handhaaft het ‘intention to treat’ principe de oorspronkelijke
randomisatie en wordt confounding door selectieve uitval voorkómen. Vaak wordt ook een ‘per
protocol’ of ‘on treatment’ analyse gedaan: hierin wordt het effect gemeten bij de mensen die werkelijk
de medicatie gebruikten, vergeleken met die mensen die deze medicatie niet slikten. Voorzichtigheid
bij de interpretatie van het verkregen resultaat is dan geboden, omdat een selectieve groep patiënten
uitgevallen kan zijn.
De onderzoeker wil ook vaak subgroep analyses doen: bijvoorbeeld kijken of het medicijn bij ouderen
net zo effectief is als bij jongeren. Vaak zijn de aantallen echter te klein om hier zinvolle uitspraken
over te doen.
96
KWO
2.4.5.4 Associatiematen
Bij een dichotome uitkomst in een gerandomiseerd interventieonderzoek berekent men een relatief
risico of een risicoverschil.
Het risico op het eindpunt in de interventie-groep wordt eerst berekend. Dit is het aantal eindpunten,
gedeeld door het aantal mensen die de interventie kregen (R1). Dit risico berekent men ook in de
controlegroep (R0). Het relatief risico (RR) is R1/R0; bij een waarde groter dan 1 heeft de interventie
een grotere kans op het eindpunt, en bij een waarde kleiner dan 1 heeft de interventie een kleinere
kans op het eindpunt. Men kan een 95%-betrouwbaarheidsinterval eromheen berekenen om de
precisie te schatten. Hoe smaller het betrouwbaarheidsinterval, des te preciezer is de schatting. De
absolute risico’s kunnen ook van elkaar worden afgetrokken, men krijgt dan het risicoverschil (R1-R0).
De reciproke hiervan wordt vaak gegeven als ‘het aantal nodig om te behandelen om een (ongunstig)
eindpunt te voorkomen’.
Het gebruik van deze intuïtief aantrekkelijke maat kent echter een aantal problemen (zie ook
hoofdstuk 1.4). Een uitkomst in een gerandomiseerd onderzoek kan ook continu zijn. Men wil
bijvoorbeeld nagaan of een medicatie effectief is om de bloeddruk te doen dalen. In dit geval is de
meest voor de hand liggende analyse de vergelijking van de gemiddelde bloeddrukdaling in de
interventiegroep met die in de niet behandelde groep. De effectmaat is in dit geval dus het verschil in
de gemiddelden.
Literatuur

Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996.

Pocock SJ. Clinical trials. A (computer)practical approach. Chicester- New York - Brisbane Toronto - Singapore: John Wiley & Sons Ltd., 1983.
2.5
BIJWERKINGEN
2.5.1 Inleiding
Niet-experimenteel onderzoek (observationeel onderzoek) is van beperkte waarde bij het bestuderen
van het effect van behandeling. Zoals hiervoor beschreven is dat vooral het gevolg van fenomenen als
regressie naar het gemiddelde en confounding-by-indication. De onbedoelde effecten of bijwerkingen
van geneesmiddelen kunnen heel goed in niet experimenteel onderzoek worden bestudeerd. Dit is in
het bijzonder het geval omdat het probleem van confounding-by-indication niet speelt. De ziekte, dat is
de indicatie waarvoor het geneesmiddel dat leidt tot de bijwerking wordt gegeven, is immers in het
algemeen niet gerelateerd aan die bijwerking. Hieronder wordt in het kort een opsomming gegeven
van de verschillende onderzoeksmogelijkheden om bijwerkingen te bestuderen (zie ook tabel 1-3-1).
2.5.2 Onderzoeksvormen
2.5.2.1 Case report
Het case report of de patiëntenserie is van oudsher een zeer belangrijke bron van kennis over
bijwerkingen. Als voorbeelden kunnen worden gegeven: de agranulocytose na analgeticagebruik, de
retroperitoneale fibrose na gebruik van de bèta-blokkeerder practolol, en meer in het verleden de
retrolentale fibrose na zuurstof-toediening bij premature baby’s en het optreden van vulvacarcinoom
bij dochters van moeders die tijdens de zwangerschap diethylstilbestrol hadden gebruikt.
Een recent voorbeeld is het vermeende hogere risico op acuut myocardinfarct bij sildenafil gebruik.
Dit werd beschreven in The Lancet naar aanleiding van één 65-jarige patiënt. Zoals te verwachten
ontstond discussie of de patiënt die beschreven werd niet al voorafgaand aan het gebruik van
sildenafil een verhoogd risico op myocardinfarct had, in het bijzonder of de man niet aan een
hyperlipidaemie leed.
2.5.2.2 Cohortonderzoek
Cohortonderzoek of follow-up onderzoek kan goed worden gebruikt om bijwerkingen na te gaan.
Hierbij wordt een indexgroep van gebruikers van het geneesmiddel vergeleken met een
referentiegroep van mensen die het geneesmiddel niet gebruiken. Een belangrijk principe in het
selecteren van de referentie-groep is dat het basisrisico van een bijwerking in de referentiegroep even
groot moet zijn als dat in de indexgroep.
97
KWO
Met andere woorden: indien de indexgroep geen geneesmiddel zou hebben gebruikt, zouden er
evenveel ‘events’ die als bijwerkingen worden aangeduid moeten zijn opgetreden als in de
referentiegroep. Dit onderzoekdesign wordt toegepast in zogenoemde ‘post-marketing' surveillance
van geneesmiddelen. Patiënt-controleonderzoek kan uitstekend worden toegepast om zeldzame
bijwerkingen vast te stellen. De patiëntengroep wordt dan gevormd door de ziekte die het gevolg is
van de bijwerking (bijvoorbeeld agranulocytose), en een referentie- of controlegroep wordt gevormd
door een groep mensen die deze ziekte ten gevolge van de bijwerking niet heeft (het kan overigens
heel wel een andere ziekte zijn). In een patiënt-controleonderzoek wordt dan de frequentie van
geneesmiddelengebruik tussen de patiëntengroep vergeleken met die van de referentiegroep. Zo
wordt het gebruik van analgetica in de agranulocytosegroep vergeleken met het gebruik van
analgetica in de referentiegroep.
Een recent voorbeeld waarin deze onderzoek-opzet in een Nederlands onderzoek is gebruikt, betreft
het onderzoek naar plotse hartdood als mogelijke bijwerking van patiënten die voor hypertensie met
niet-kaliumsparende diuretica worden behandeld. In dit patiënt-controleonderzoek werden patiënten
met hypertensie die plotseling overleden vergeleken met vergelijkbare hypertensiepatiënten die niet
overleden. De frequentie van het gebruik van diuretica, en met name niet-kaliumsparende diuretica,
werd vastgesteld. Zo kon worden nagegaan of er een oversterfte was bij patiënten die nietkaliumsparende diuretica kregen voorgeschreven.
Literatuur

Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996.
Bronvermelding
Deze paragraaf is gebaseerd op:
Burger H, Hofman A. Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red).
Interne Geneeskunde. Houten: Bohn Stafleu van Loghum, 2001: paragraaf 1-7-2 (Veiligheid van
therapie).
2.6
SCREENINGSONDERZOEK
2.6.1 Inleiding
Screening of vroege opsporing houdt in dat men personen die geen medische hulp zoeken gaat testen
op de aanwezigheid van een afwijking. Hoewel vele aandoeningen zich in principe lenen voor
screening, richt dit hoofdstuk zich vooral op de meest typische vorm ervan, namelijk die op voorstadia
van kanker. De meest bekende voorbeelden betreffen baarmoederhalskanker en borstkanker. Door
een uitstrijkje van de baarmoederhals te maken beoordeelt men een grote hoeveelheid cellen op
premaligne veranderingen en door het maken van een röntgenfoto van beide borsten screent men de
borst op de aanwezigheid van kanker. Op deze manier kan men in een vroeg stadium tumoren
opsporen die anders pas jaren na het moment van screening tot klachten zouden hebben geleid.
Screening lijkt op het eerste gezicht heel aantrekkelijk omdat men de ziekte in een vroeg stadium
opspoort en behandelt, hetgeen de prognose meestal gunstig beïnvloedt. In het geval van kanker
betekent vroegere detectie een geringere kans op uitzaaiing. Een belangrijk nadeel van screening
daarentegen, is dat men in het algemeen zeer veel mensen moet screenen om slechts enkele
tumoren op te sporen. Zo vertonen bijvoorbeeld ongeveer 3 van de 1000 uitstrijkjes premaligne
afwijkingen en zijn lang niet alle verdachte uitstrijken ook werkelijk een voorstadium van kanker (foutpositieven). Daarnaast kan screening veel ongerustheid teweeg brengen. Ook is het niet altijd zo dat
tumoren die via de screening ontdekt worden, vervolgens ook succesvol behandeld kunnen worden.
Indien de patiënt moeilijk kan leven met deze wetenschap dan heeft men eigenlijk alleen maar schade
toegebracht. Voor de vroege opsporing van longkanker zijn in het verleden wetenschappelijke
onderzoeken uitgevoerd waarin de waarde van de thoraxfoto werd onderzocht. Hier kwam uit dat de
thorax-foto niet gevoelig genoeg was voor de opsporing van hele kleine longtumoren, waardoor
resectie van de tumor wel mogelijk was, maar niet tot genezing leidde. Er bestaat nu een nieuwe
techniek: spiraal CT (computer tomografie), die een grotere gevoeligheid heeft dan de thoraxfoto. Of
screening met spiraal-CT ook werkelijk tot minder longkankerdoden leidt, is nog niet bekend. Voordat
men kan gaan screenen moet aan veel voorwaarden voldaan zijn. Behalve dat men een goede
screenings-test moet hebben, die acceptabel en niet invasief is, moet er ook een goede behandeling
zijn en moet screening uiteindelijk leiden tot minder klinisch manifeste ziekte en sterfte.
98
KWO
2.6.2 Onderzoeksopzet
2.6.2.1 Determinant-uitkomst relatie
Screeningsonderzoek wordt opgezet als diagnostisch onderzoek of als interventie-onderzoek,
afhankelijk van de precieze vraag. De vraag of screening effectief is wordt bij voorkeur in een
gerandomiseerd experiment beantwoord, waarbij de determinant bestaat uit het geheel van vroege
opsporing en het daaraan gekoppelde verdere beleid, en de uitkomst meestal uit sterfte. De
vraagstelling wordt in feite net zo beantwoord als bij iedere andere interventie (medicatie, chirurgische
ingreep); zie hoofdstuk 2.4. Bij een screeningsvraagstuk kan echter ook de diagnostische waarde van
de test centraal staan. Bij de evaluatie van de diagnostische waarde van een screeningstest moet
men zich realiseren dat het vrijwel altijd de waarde van één specifieke test is ten aanzien van de
vroegdiagnostiek van een aandoening. Het gaat immers om VROEGdiagnostiek, op een moment dat
meestal nog geen klachten of symptomen, laat staan testuitslagen, aanwezig zijn. Dit maakt de
typische determinant-uitkomstrelatie bij screeningsonderzoek anders dan bij diagnostisch onderzoek,
waarbij immers de waarde van een test gegeven een aantal andere testuitslagen wordt geëvalueerd.
De determinant is dus de te onderzoeken screeningstest, bijvoorbeeld de mammografie van de borst
of het uitstrijkje van de baarmoederhals, en de uitkomst is de kans op ziekte, in casu borstkanker.
In formule:
P(Z) = ƒ (screeningstest)
waarbij P(Z)= kans op ziekte volgens de referentietest, en de variabele tussen haakjes de
determinant.
De uitkomst van het diagnostische deel van de evaluatie, ziekte, wordt vastgesteld met behulp van de
referentietest, ook wel aangeduid als de ‘gouden standaard’. Bij vrouwen met een mammogram
verdacht voor borstkanker zal een biopt de referentietest zijn. Om de sensitiviteit van het mammogram
(de screeningstest) te bepalen terwijl niet bij alle vrouwen (alleen bij degenen met een hoge
verdenking) een biopt van de borst kan worden genomen, moeten ook de zogenaamde
intervalcarcinomen bij de berekening worden betrokken. Intervalcarcinomen zijn gedefinieerd als die
carcinomen die worden ontdekt in het tijdsinterval tussen de screening en de follow-up.
2.6.2.2 Domein
Het domein van een screeningsonderzoek is de theoretische definitie van de patiëntenpopulatie bij wie
de te evalueren diagnostische testen in de praktijk zullen worden toegepast. De setting waarin het
probleem zich afspeelt is belangrijk voor het domein, dus bijvoorbeeld huisartspraktijk, tweede lijn, of
consultatie-bureau. Een screeningstest wordt meestal uitgevoerd in de algemene bevolking, vaak met
een bepaalde leeftijdsrestrictie. Voorbeelden zijn screening naar borstkanker bij alle Nederlandse
vrouwen tussen de 50 en 75 jaar, en de screening naar baarmoederhalskanker bij alle Nederlandse
vrouwen tussen 30 en 50 jaar. Als men op longkanker zou willen gaan screenen, zou men dat
bijvoorbeeld kunnen doen bij rokende mannen van 50-70 jaar.
2.6.3 Uitvoering
2.6.3.1 Algemeen
De diagnostische eigenschappen van een screeningstest kan men niet beantwoorden in een crosssectioneel onderzoek zoals de gewone diagnostische vraagstelling, omdat ook de follow-up van de
proefpersonen van belang is.
2.6.2 Onderzoekspopulatie
Bij de uitvoering van screening zal men eerst de patiëntenpopulatie definiëren waarbij men de ziekte
wil opsporen. Dit is de onderzoekspopulatie die de kenmerken van het domein moet hebben,
bijvoorbeeld 50-75 jarige vrouwen.
2.6.3.3 Determinant
Het is hierbij van belang dat de test in het onderzoek op dezelfde manier wordt uitgevoerd (inclusief
verslaglegging) als in de praktijk. Gebeurt dit niet, bijvoorbeeld veel nauwkeuriger, dan valt de waarde
van de test zoals die in het onderzoek werd gevonden waarschijnlijk in de praktijk erg tegen.
99
KWO
Men moet het erover eens zijn wat afwijkend is en wat niet, en de testuitslagen moeten
reproduceerbaar zijn. In screening heeft men niet alleen te maken met duidelijke stadia van kanker
maar ook met allerlei voorstadia waarvan niet bekend is of zij ook werkelijk maligne zullen ontaarden.
Behalve uitslagen waarin geadviseerd wordt histologisch onderzoek te doen, zal dan ook vaak het
advies ‘screeningstest’ herhalen worden gegeven.
2.6.3.4 Uitkomst
1) Diagnostische vraagstelling: Een procedure of test die in praktijk wordt gebruikt om bij bestaande
twijfel de doorslag over de aan- of afwezigheid van een aandoening te geven, kan worden beschouwd
als een geschikte referentietest voor wetenschappelijk onderzoek. Voor de referentietest gelden
dezelfde overwegingen als in hoofdstuk 2.2 genoemd. Omdat het niet mogelijk is bij de vrouwen met
een negatief mammogram ook een biopt te doen (ook niet in een evaluatie situatie) zal uit een
combinatie van de terecht positieven en de follow-up (intervalcarcinomen) de sensitiviteit van de test
moeten worden geschat.
2) Interventie vraagstelling: Vrijwel altijd is de uitkomst bij de evaluatie van screening de sterfte aan de
betreffende ziekte, niet het optreden van de ziekte zelf.
2.6.4. Data-analyse
Data-analyse bij het berekenen van de testeigenschappen van een screeningstest is relatief simpel.
Men stelt een tabel op als tabel 2-6-1 en men kan sensitiviteit, specificiteit en voorspellende waarden
uitrekenen.
Tabel 2-6-1
Screeningstest
Sensitiviteit 
Pos
Neg
Referentietest
Pos
Neg
A
B
C
D
A+C
B+D
A+B
C+D
Totaal
Specificiteit 
A
A C
Positief Voorspellende Waarde 
A
A B
D
B D
Negatief Voorspellende Waarde 
D
C D
De sensitiviteit is de kans op een positieve testuitslag bij de zieken. De specificiteit is de kans op een
negatieve testuitslag bij de niet-zieken.
De positief voorspellende waarde is de kans op ziekte bij de mensen met een positieve testuitslag.
De negatief voorspellende waarde is de kans op afwezigheid van ziekte bij de mensen met een
negatieve testuitslag.
De aard van de ziekte (hoe erg is het om de ziekte te missen) die men wil opsporen en de invasiviteit
van de referentietest (hoe schadelijk is de referentietest bij iemand die uiteindelijk de afwijking niet
blijkt te hebben) bepalen hoe men sensitiviteit en specificiteit tegen elkaar afweegt. Bij screening zal
men in het algemeen niet geneigd zijn om veel fout-positieven te accepteren, zeker als de
referentietest invasief is, omdat het hier om mensen zonder klachten gaat. In het voorbeeld van
screening op borstkanker is de referentie-test het mammabiopt. Iedere vrouw met een verdacht
mammogram zal een mammabiopt moeten ondergaan. Testeigenschappen van een screeningstest
zijn vaak pas na jaren te bepalen omdat de follow-up bij de analyse moet worden betrokken. De dataanalyse van het screeningsonderzoek als interventie is gelijk aan die van een gerandomiseerd
experiment (zie hoofdstuk 2.4).
2.6.5 Evaluatie van screening
De evaluatie van screening als interventie geschiedt bij voorkeur door het uitvoeren van een
gerandomiseerd onderzoek. De ene helft krijgt met een bepaald interval screening aangeboden
(iedere 5 jaar bij de screening op baarmoederhalskanker, iedere 2 jaar bij de screening op
borstkanker) en de andere helft niet. De sterfte aan de desbetreffende ziekte in de beide groepen
wordt na een aantal jaren vergeleken en op deze manier kan worden vastgesteld of screening leidt tot
een reductie en zo ja, hoe groot die reductie is. Vaak worden hier ook de kosten bij betrokken (kosteneffectiviteitsonderzoek) en wordt uitgerekend hoeveel een gewonnen levensjaar kost.
100
KWO
Het evalueren van screening is dus een kostbare en langdurige bezigheid. Bovendien is het moeilijk
uit te leggen dat screening lang niet altijd beter is en eist de populatie (of de politiek) in de
controlegroep ook screening omdat men het gevoel heeft dat hen iets goeds wordt onthouden. Dit
overkwam onderzoekers in de jaren 70 bij de opzet van een wetenschappelijk onderzoek naar
baarmoederhalskanker. De politiek verhinderde een gerandomiseerd experiment waardoor er altijd
twijfels zijn blijven kleven aan de effectiviteit van deze vorm van screening. Alleen nieuwe vormen van
screening kunnen goed geëvalueerd worden in een gerandomiseerd experiment. Zo gauw de test
(bijvoorbeeld de echo van de aortadiameter) gemakkelijk verkrijgbaar is wordt de vraag naar
screening in de controlearm zo groot, dat het effect van screening wordt verdund. Om het effect van
screening aan te tonen zijn duizenden mensen nodig omdat de incidentie van kanker relatief laag is.
Aan andere manieren van evaluatie, zoals het vergelijken van een gescreende en niet gescreende
populatie, kleven belangrijke nadelen.
Het vergelijken van overlevingscijfers in de gescreende en niet gescreende groep leidt tot een
onterecht gunstiger overlevings-cijfer in de gescreende groep doordat de ziekte door screening eerder
onderkend wordt. De overleving is immers de periode tussen onderkenning van de ziekte en het
tijdstip van overlijden aan de ziekte. Dit wordt ook wel ‘lead time’ bias genoemd en ontstaat omdat de
diagnose wordt vervroegd terwijl het tijdstip van overlijden hetzelfde is. Length-time bias ontstaat
omdat men met screening relatief meer langzaam groeiende tumoren opspoort die over het algemeen
een gunstiger prognose hebben. Voor een nadere bespreking van screening verwijzen wij naar de
literatuur.
Literatuur
[1]
VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997
[2]
Hennekens CH, Buring JE, Mayrent SL (eds). Epidemiology in medicine. Boston/Toronto: Little,
Brown and Company, 1987
101
KWO
102
KWO
Hoofdstuk 3 UITVOERING VAN ONDERZOEK
3.1
DATA VERZAMELING, MANAGEMENT EN ANALYSE
3.1.1 Inleiding
Wetenschappelijk onderzoek kan niet zonder gegevens ofwel data. Om de kwaliteit van de data te
verhogen is het zinvol om direct bij de opzet van een studie na te denken over hoe de data verzameld
gaan worden en de wijze van verwerken, zodat uiteindelijk een databestand ontstaat waar de
statistische analyses mee uitgevoerd kunnen worden.
3.1.2 Proefpersonen
Alvorens met een onderzoek te beginnen, is het nodig na te denken, hoe de benodigde proefpersonen
het beste bereikt kunnen worden. Als het om patiënten gaat, zal het vaak wenselijk zijn dat ze door
hun eigen behandelaar gevraagd worden deel te nemen aan het onderzoek. Betreft het gezonde
mensen, dan is het soms mogelijk deelnemers aan een eerdere of nog lopende studie weer te
benaderen voor het nieuwe onderzoek. Dit heeft als voordeel dat eerdere deelnemers vaak goed
gemotiveerd zijn om aan onderzoek deel te nemen. Soms kunnen patiënten met een bepaalde
aandoening geïdentificeerd worden via een bestaande registratie, zoals de kankerregistraties.
Werving via een advertentie in de lekenpers, dan wel telefonisch middels ‘random digit dialing’, zijn
enkele andere mogelijkheden om aan deelnemers te komen.
3.1.3 Data verzameling
De relevante data kunnen van verschillende kanten komen. Voorbeelden hiervan zijn medische
dossiers, waarin informatie is vastgelegd, de patiënt zelf die een vragenlijst invult, en
onderzoeksassistent/onderzoeker die vragen stelt en metingen verricht. Hoe beter de wijze van
gegevensverzameling is uitgedacht, hoe minder problemen er later te verwachten zijn.
3.1.3.1 Algemene aandachtspunten
Een aantal aandachtspunten leiden samen tot een goede gegevensverzameling. Het is belangrijk dat
met alle betrokkenen (onderzoekers, onderzoeksassistenten, verpleegkundigen) besproken is hoe je
de meet-instrumenten moet gebruiken. Gebruikelijk is hiervoor een Standard Operating Procedure
(SOP) te schrijven, waar iedereen zich aan dient te houden. Een SOP bevat een gedetailleerd
werkvoorschrift, opgesteld op een wijze die ervoor zorgdraagt dat iedereen de meting zou kunnen
uitvoeren. Dit waarborgt uniformiteit in het onderzoek. Alleen al een simpele meting als de tailleomtrek kan op zeer verschillende wijzen worden uitgevoerd, hetgeen resulteert in sterk variërende
meetresultaten die alleen een reflectie zijn van verschillen in meettechniek en niet van biologische
verschillen tussen proefpersonen. Bespreek met collegae en begeleiders of alle gegevens die
verzameld moeten worden ook daadwerkelijk in de lijst staan en stel niet-relevante vragen of metingen
aan de orde.
3.1.3.2 Aandachtspunten voor vragenlijsten
Draag er zorg voor dat alle betrokken goed zijn geïnstrueerd en hebben geoefend met de
vragenlijsten. Het is belangrijk voor de geloofwaardigheid van de onderzoeksgegevens dat, waar
mogelijk, een gevalideerde vragenlijst gebruikt wordt. Van een gevalideerde vragenlijst is namelijk
bekend dat de antwoorden op de vragen inderdaad meten wat gemeten moet worden. Daarnaast is
vaak de reproduceerbaarheid van de vragenlijst bekend.
Van groot belang is dat de formuleringen helder zijn. Dat wil zeggen dat elke vraag maar één
onderwerp heeft en dat er geen combinaties gemaakt moeten worden. De vragen dienen begrijpelijk
te zijn voor de doelgroep en de antwoordmogelijkheden moeten aansluiten bij de vraag. Het moet
duidelijk zijn wat er ingevuld moet worden. Geef de invuller niet onbeperkt de ruimte in zijn
antwoorden, maar stel bij voorkeur gesloten vragen. Een veel gemaakte fout is dat de antwoordcategorieën elkaar niet uitsluiten. De mogelijkheid ‘nee’ aan te kruisen, (i.p.v. ‘afvinklijstjes’) is
belangrijk omdat het dan duidelijk is dat het item niet vergeten is. Soms zijn er meerdere antwoorden
mogelijk, zet dat er dan duidelijk bij. Wil men open vragen stellen, bedenk dan vooraf goed wat er
uiteindelijk met de antwoorden moet gebeuren. Vaak brengen open vragen veel werk met zich mee en
hebben ze maar beperkte waarde. Wanneer er meerdere vragen nodig zijn om uiteindelijk een score
te bepalen, controleer dan of alle relevante vragen opgenomen zijn door de berekening alvast te
103
KWO
maken. Een vragenlijst dient natuurlijk gemakkelijk in te vullen te zijn. Aandacht voor de lay-out is
hierbij heel belangrijk.
Bij het maken van de lay-out moet men al denken aan de wijze van verwerken. Vooral als de
gegevens handmatig ingevoerd worden is het handig dat de codes die bij de antwoorden horen al bij
de aankruishokjes staan. Verder dienen op elke vragenlijst, en soms op elke pagina van de vragenlijst,
relevante identificeerbare gegevens (bijvoorbeeld een patiëntnummer) opgenomen te zijn. Tenslotte
verdient het de voorkeur de vragenlijsten bij de doelgroep te testen voorafgaand aan het onderzoek, of
in een pilot studie.
3.1.3.3 Aandachtspunten voor metingen
Bij het doen van metingen aan proefpersonen, bijvoorbeeld het meten van de bloeddruk, staat
voorafgaand aan het onderzoek het testen van de meting voorop. Tevens krijgt men dan een idee hoe
de databestanden eruit komen te zien en welke waarden de meting kan aannemen. Ook moet het
duidelijk zijn bij wie de gegevens uit de meting horen. Zij moeten immers later gekoppeld worden aan
de gegevens van de vragenlijst. Het uitvoeren van reproduceer-baarheidsonderzoek voorafgaand aan
het onderzoek is belangrijk, met name voor nieuwe metingen. Maar ook wanneer oude technieken
gebruikt worden, zal men moeten laten zien dat in hun handen de metingen reproduceerbaar zijn.
3.1.4 Invoer van gegevens
3.1.4.1 Data dictionary
Zodra de formulieren en de metingen klaar zijn, is het tijd om na te denken over hoe die gegevens in
de computer gezet worden. Voordat begonnen wordt, dient een uitgebreide beschrijving van de
dataset beschikbaar te zijn, een zogenaamde ‘data dictionary’ (code-boek). Dit is een document
waarin van elke variabele naam, label, waarden, ranges, coderingen voor ‘missing’, et cetera
beschreven staat. Een voorbeeld van een deel van een data dictionary (codeboek) is weergegeven in
tabel 3-1-1.
3.1.4.2 Invoer in de computer
Bij grote aantallen formulieren is het zinvol een computerprogramma te kiezen waar de gegevens
‘automatisch’ ingelezen worden. Vaak zal het echter zo zijn dat de gegevens handmatig ingevoerd
worden. Het beste is om daarvoor invoerschermen te maken in bijvoorbeeld de ‘data entry’ module
van SPSS of het databaseprogramma Access.
Het invoerscherm lijkt erg op het papieren formulier, en bij elk antwoord is het mogelijk precies op te
geven wat er ingevoerd mag worden. Zo worden grove invoerfouten voorkomen. Daarnaast is het wel
van belang dat er bij een steekproef gecontroleerd wordt of er niet teveel invoerfouten zijn gemaakt.
Dit kan door bijvoorbeeld 10% van de formulieren een tweede keer in te voeren en de twee bestanden
door SPSS te laten vergelijken. Bij meer dan 5% fouten bij de eerste invoerder is de kwaliteit niet goed
genoeg en is actie nodig. In sommige gevallen worden de meetresultaten eerst op papier gezet en
vervolgens ingevoerd. Voor deze benadering gelden dezelfde normen als voor een vragenlijst.
In andere gevallen, bijvoorbeeld laboratoriumbepalingen, komen gegevens direct in digitale vorm
beschikbaar (Excel bestand, ascii bestand). Van belang is ook om van deze bestanden een
beschrijving te hebben van de inhoud en lay-out alsmede een beschrijving van de procedure die
gevolgd wordt bij de koppeling van de laboratoriumwaarden aan de vragenlijstgegevens.
3.1.4.3 Tips voor invoer
Gebruik consistente coderingen voor antwoordcategorieën die vaak terugkomen (1= ja, 0=nee).
Neem de codes mee in de lay-out van het formulier door voor de aankruishokjes heel klein een
cijfer te plaatsen.
Laat het programma subvragen overslaan als de hoofdvraag ‘nee’ is.
Gebruik altijd een vaste code als er geen antwoord is ingevuld, bijvoorbeeld ‘999’, en als vragen
niet van toepassing zijn, bijvoorbeeld ‘888’.
Begin elke nieuwe pagina op een nieuw scherm.
Controleer altijd het identificatienummer.
104
KWO
Tabel 3-1-1
Onderzoeksnaam:
Bestandsnaam:
Datum gemaakt:
Gemaakt door:
Variable
naam
MI
SMART Study
SMART questionnaire 01-01-2001.sav
01 01 2001
Dr S. Pannend
Label
Myocard
infarct
Waarden
Ranges
Format *
Code voor
missing
9
0=nee
1,2,9
F1.0
1=ja
9=niet ingevuld
SYSBP
Systolische
80-250
80-250,
F3.0
999
bloeddruk
999=niet gemeten
999
(in mmHg)
HDLCHOL
HDL
0,1-2,5
0.1-2,5,99 F3.1
99
cholesterol
99=missing
(in mmol/l)
KKARWEI
Kleine
1=zonder moeite
1,2,3,4,5,9 F1.0
9
karweitjes
2=enige moeite
doen
3=veel moeite
4=onmogelijk
5= met hulpmiddel
9=niet ingevuld
*F: ‘floating point’ genoteerd; F3.1 betekent 3 cijfers met 1 cijfer achter de komma
3.1.5 Datacontrole
Als de gegevens zijn ingevoerd komt de data controle. Eerst wordt de compleetheid van de gegevens
gecontroleerd: zijn alle formulieren van een deelnemer wel ingevoerd, welke gegevens ontbreken en
welke zijn alsnog te achterhalen (bijv. in een dossier, of vragen aan de deelnemer). Het gebruik van
een code voor ‘niet van toepassing’ helpt de echte missings te selecteren. Vervolgens wordt gekeken
of de gegevens wel logische waarden hebben door per gegeven een grenswaarde te stellen. Alle
gegevens boven (of onder) die grenswaarde worden nagekeken. Een bloeddruk van 300 mm Hg is op
z’n zachtst gezegd onwaarschijnlijk. Als laatste zijn er checks op consistentie: kloppen de antwoorden
van vragen die met elkaar samenhangen wel, komen gegevens die meerdere malen gemeten zijn wel
met elkaar overeen, etc. Zo zal bijvoorbeeld van personen die aangeven dat ze nooit gerookt hebben,
de variabele ‘hoeveel sigaretten rookt u per dag’ niet beantwoord zijn, dan wel de waarde ‘0’ hebben.
Is dit niet het geval, dat is er sprake van invoerfouten en zal dit probleem nader moeten worden
bekeken. De variabele ‘hoeveel glazen bier per dag’ zal een waarde moeten bevatten voor die
personen die eerder aangegeven hadden in de vragenlijst bier te drinken. Ook zal bijvoorbeeld in een
dataset de bezoekdatum nooit liggen vóór de geboortedatum. Gegevens over de overgang of over
een baarmoederoperatie kunnen niet behoren bij de gegevens van een man, et cetera.
3.1.6 Analysebestanden
Als alle controlestappen doorlopen zijn is het databestand gereed voor analyse. Uiteraard is het van
belang dat alle variabelen kort en duidelijk omschreven zijn en alle mogelijke antwoord-categorieën
ook voorzien zijn van een omschrijving (label). Als er nieuwe variabelen berekend worden of ingedeeld
in nieuwe categorieën (bijv. leeftijd in 5-jaars leeftijdscategorieën), maak dan ook direct de
omschrijvingen aan, dan is het voor iedereen duidelijk wat er bedoeld wordt. Controleer berekeningen
en indelingen door dit met de hand na te rekenen of door frequentie- of kruistabellen te maken. Vraag
eventueel een ander om te controleren. Vaak zijn er meerdere analysebestanden bij 1 onderzoek.
Gebruik een statistisch pakket om gegevens aan elkaar te plakken. Gebruik daarbij een
identificatienummer en controleer altijd of het goed is gegaan.
Wanneer de gegevensset gebruikt wordt voor statistische analyse, komen er af en toe toch nog
invoerfouten te voorschijn. Deze moeten wederom gecorrigeerd worden. Er zal dus met enige
regelmaat een ‘definitief’ analyse- bestand beschikbaar komen. Zorg ervoor dat deze bestanden goed
te scheiden zijn door ze bijvoorbeeld specifiek te dateren en ze ‘read only’ te maken. Met name in
observationele onderzoekingen komen steeds nieuwe gegevens binnen en zullen dus met regelmaat
nieuwe analyse bestanden beschikbaar komen. Vooraf gemaakte afspraken maken duidelijk wanneer
nieuwe bestanden te verwachten zijn.
105
KWO
3.1.7 Data analyse
3.1.7.1 Inleiding
Het doel van de data analyse is het krijgen van een valide en precies antwoord op de
onderzoeksvraag. Dit is geen eenvoudig proces en voor een meer grondige bespreking moeten wij
verwijzen naar de literatuur [1,2].
Voor 1970 werd de data analyse vooral gedreven door het bewijzen dat de bevindingen niet toe
geschreven konden worden aan 'toeval'. De analyses destijds benadrukten het al dan niet verwerpen
van de nulhypothese en het al dan niet statistisch significant zijn van de bevindingen. Dus resultaten
van een onderzoek waren significant of niet, een tussenweg was er niet. De huidige zienswijze verlaat
het concept van 'wel of niet statistisch significant' als een zwart of wit fenomeen, en richt zich veel
meer op het kwantificeren van het verband en de vraag hoe precies (nauwkeurig) het beschreven
verband is. In plaats van de bewering dat 'een toegenomen leeftijd significant verband houdt met de
hoogte van de systolische bloeddruk' geven we tegenwoordig aan dat 'met het stijgen van de leeftijd
van 10 jaar de systolische bloeddruk met gemiddeld 2 mmHg [95% BI 1-3] toeneemt'.
De epidemiologie houdt zich dan ook bezig met de bestudering van het kwantitatieve verband tussen
ziekte en de factoren die de ziekte bepalen: Uitkomst = F (Determinanten).
Deze relatie geldt voor etiologische, diagnostische, prognostische en interventieonderzoeksvraagstellingen. De data analyse omvat een aantal stappen. Dit betreft controle van de verzamelde
gegevens (juistheid, compleetheid, consistentie), beschrijving van de gegevens, het schatten van
verbanden, en ten slotte, het interpreteren van de gegevens.
3.1.7.2 Beschrijven van de data
De beschrijving van de gegevens heeft tot doel de onderzoeker bekend te maken met de variabelen
waarmee geanalyseerd gaat worden. Dit betreft natuurlijk het eindpunt (de ziekte) en de
determinanten die van invloed zijn op het eindpunt (determinant, verstorende variabelen, effect
modificerende variabelen). Bij de beschrijving van de gegevens wordt gebruikgemaakt van frequentie
uitdraaien, 2 bij 2 tabellen, gemiddelden, standaard deviatie, minima, maxima, histogrammen en
scatter plots, echter zonder gebruik te maken van statistische toetsen. Het gaat hier alleen om
beschrijven van de gegevens. Er volgt nu een voorbeeld ter verduidelijking.
Tabel 3-1-2 geeft een aantal factoren weer die van
belang zijn bij de bestudering van het verband
tussen zwangerschapsduur (determinant=zw-duur)
en slagaderverkalking in de hals
(uitkomst=cca_mean) in het ARYA onderzoek.
De onderzoeker wil graag weten van hoeveel
personen gegevens beschikbaar zijn, en wat
uitersten en gemiddelden zijn. De tabel is als volgt
te lezen. Gegevens over zwangerschapsduur zijn
aanwezig bij 205 van de 249 deelnemers.
De zwangerschapsduur varieerde van 28 tot 43
weken, en was gemiddeld 39.86 weken. Voor de
uitkomst (de dikte van de slagaderwand in de hals
=cca_mean) zijn gegevens van 220 personen
beschikbaar. De dunste wand was 0.40 mm en de
dikste wand 0.75 mm, met een gemiddelde voor
alle 220 personen van 0.49 mm. De variabele
geslacht' gaat van 0 (man) naar 1 (vrouw).
Tabel 3-1-2
N
Minimu Maximu
m
m
Mean
SD
Geslacht
249
0
1
,45
,50
zw-duur
205
28
43
39,86
1,75
CCA_MEAN 220
,40
,75
,4929
0.05
Geboorte245
gewicht
1430
5100
3404,10 551,64
106
KWO
Figuur 3-1-1 geeft de verdeling weer van de systolische bloeddruk in bovengenoemd onderzoek. Uit
een dergelijke figuur blijkt dat de verdeling van de systolische bloeddruk redelijk normaal verdeeld is.
Tevens zien we uiterste waarden die biologisch wel waarschijnlijk lijken.
Figuur 3-1-1 Frequentieverdeling
50
40
30
20
10
Std. Dev = 12,21
Mean = 129,6
N = 252,00
0
100,0
110,0
105,0
120,0
115,0
130,0
125,0
140,0
135,0
150,0
145,0
160,0
155,0
165,0
gemiddelde systolische bd in bezoek 1
3.1.7.3 Schatten van effecten
Wanneer de gegevens gecontroleerd zijn en de onderzoeker zich redelijk goed bekendgemaakt heeft
met de belangrijkste variabelen, kan de data-analyse beginnen. In eerdere hoofdstukken werd reeds
aangegeven hoe de analyse aanpak zou moeten zijn in etiologisch, diagnostisch, prognostisch en
interventieonderzoek. De statistische analyse richt zich op de bestudering van de determinantuitkomstrelatie en deze zal in een kwantitatieve vorm dienen te worden weergegeven.
Over het algemeen, wanneer de uitkomst een continue variabele is en het een normale verdeling
betreft (zie figuur), zoals bijvoorbeeld bloeddruk, kan gebruikgemaakt worden van een (ongepaarde) ttoets of een lineaire regressietechniek. Een t-toets wordt gebruikt bij het nagaan of de gemiddelde
waarde, bijvoorbeeld systolische bloeddruk, in de ene groep, bijvoorbeeld mannen, verschilt van die in
de andere groep, bijvoorbeeld vrouwen. Elk statistisch rekenprogramma heeft deze mogelijkheid in
zich. Een t-toets heeft als uitslag dat het gemiddelde in de ene groep significant verschilt met het
gemiddelde in de andere groep. Een nadere kwantificering wordt in de regel niet gegeven. Doordat de
gemiddelde waarden in beide groepen gegeven worden in de uitdraai, kan men toch een indruk
krijgen van het verschil in gemiddelden tussen beide groepen.
Een andere benadering is het lineaire regressie model toe te passen. Een lineair regressie model
wordt in eenvoudige vorm weergegeven als Y = a + (b 1X1) + (b2X2) + …… (bnXn)
Hierbij is Y de uitkomst, X1 de eerste variabele, bijvoorbeeld leeftijd, en X2 de tweede variabele,
bijvoorbeeld geslacht. Dus, Y = a + (b1 * leeftijd) + (b2 * geslacht)
Met een dergelijke analyse wordt een schatting gekregen die bijvoorbeeld aangeeft dat met een
toename van 1 jaar in leeftijd de bloeddruk met 'b1' toeneemt. In tegenstelling tot de t-toets geeft het
lineaire model een kwantificering van het gemiddelde verschil tussen beide groepen en een precisie
maat (95% betrouwbaarheidsinterval). Voor verdere bespreking van deze analyse techniek wordt
verwezen naar de bestaande leerboeken.
107
KWO
Wanneer de uitkomstmaat dichotoom is (een waarde 0 of 1) heeft, kan gebruikgemaakt worden van
een chi-kwadraattoets of logistische regressie technieken. Een chi-kwadraat (2)-toets vergelijkt het
percentage, bijvoorbeeld rokers, in de ene groep, bijvoorbeeld mannen, met die in de andere groep,
bijvoorbeeld vrouwen. Een en ander is altijd in een 2x2 tabel weer te geven:
Roken
Ja
Nee
Totaal
Man
30
70
100
Vrouw
1545
85
100
Totaal
1575
155
200
Een chi-kwadraattoets gaat na in hoeverre de geobserveerde getallen hetzelfde zijn als de getallen die
verwacht zouden kunnen worden, wanneer de percentages in beide groepen identiek zouden zijn.
2 = som alle vier cellen van (Obs-Exp)2 / E
Expected wordt berekend door voor elke cel van de 2x2 tabel het rijtotaal te vermenigvuldigen met het
kolomtotaal, en dat vervolgens te delen door het totale aantal.
In formule:
E = (rijtotaal * kolom totaal)/n
In ons voorbeeld voor de mannelijke rokers bedraagt dit (45*100)/200. Voor de vrouwelijke niet-rokers
bedraagt dit (155*100)/200. Hierna wordt de 2 grootheid berekend door voor elke cel (Observed–
Expected)2 uit te rekenen en te delen door Expected en tenslotte deze 4 berekeningen op te tellen.
De chi-kwadraattoets geeft weer in hoeverre de percentages significant met elkaar verschillen.
Doordat de percentages in tabel vorm worden weergegeven, krijgt men een indruk over het
kwantitatieve verschil tussen beide groepen.
Een andere benadering betreft de logistische regressietechniek. In eenvoudige vorm wordt dit
weergegeven als:
Ln [Y/(1-Y)] = b0+ (b1*leeftijd) + (b2*geslacht)
Hierbij is Y de kans op ziekte en zijn leeftijd en geslacht de determinanten.
De uitdrukking in [Y/(1-Y)] wordt ook wel logit genoemd.
De regressie coëfficiënten (b1 en b2) weerspiegelen de natuurlijke logaritme van de odds ratio.
De anti logaritme geeft de odds ratio, een maat die in de epidemiologie vaak gebruikt wordt om de
sterkte en de richting van een verband aan te geven.
Een andere vorm van logistische regressie betreft het Cox proportional hazards model. Voor
diepgaande beschrijvingen wordt echter verwezen naar de leerboeken.
De lineaire en logistische regressie modellen worden veel gebruikt in epidemiologisch onderzoek.
Let wel dat beide technieken toegepast worden in specifieke situaties en dus niet altijd toe te passen
zijn.
De schattingen van de verbanden, de regressiecoëfficient en de odds ratio, geven op kwantitatieve
wijze de richting en sterkte van het verband weer.
3.1.8 Interpretatie
Het analyseproces is een tijdrovende aangelegenheid. Wanneer de data geschoond zijn en de
statistische bewerking kan plaatsvinden, kost het veel tijd om de onderzoeksvraagstelling te
beantwoorden. Ook de statistische analyse is een proces van stappen. Bij elke stap wordt de analyse
bekeken en geïnterpreteerd.
Dit laatste richt zich met name op de validiteit van het verband (is het echt, of is er nog sprake van
vertekening) en de biologische plausibiliteit in het licht van de onderliggende onderzoeksvraag.
Vervolgens zal er wederom verder geanalyseerd worden om uiteindelijk te komen tot de meest valide
beantwoording van de onderzoeksvraag.
Literatuur
1.
VandenBroucke JP, Hofman A (red). Grondslagen der epidemiologie. Utrecht: Bunge, 1997.
2.
Houwelingen van JC, Stijnen Th, Strik van R (red). Inleiding tot de medische statistiek. Utrecht:
Bunge, 1995.
108
KWO
3.2
ETHIEK, REGELS EN GOOD CLINICAL PRACTICE
3.2.1 Inleiding
Als er klinisch onderzoek wordt uitgevoerd waarbij sprake is van deelname door proefpersonen
moeten rechten, veiligheid en welzijn van proefpersonen worden beschermd. Dit is in
overeenstemming met de beginselen die hun oorsprong vinden in de Verklaring van Helsinki.
Om te waken over rechten, veiligheid en welzijn van proefpersonen, schrijft de Wet Medisch
Wetenschappelijk Onderzoek met mensen (WMO) voor, dat onderzoeksvoorstellen vooraf beoordeeld
moeten worden door een erkende Medisch Ethische Toetsingscommissie. Veel Nederlandse
ziekenhuizen en onderzoeksinstellingen hebben een dergelijke toetsingscommissie.
In deze commissie zitten personen met verschillende kennis over wetenschappelijk onderzoek bij
mensen. Dat zijn artsen en verpleegkundigen, maar ook methodologen, juristen,
ziekenhuisapothekers, huisartsen, deskundigen op het gebied van medische ethiek en personen die
het onderzoek vanuit het oogpunt van de proefpersonen beoordelen.
De commissie beoordeelt onder andere of:
het onderzoek zinvol is
er niet teveel risico’s of nadelen voor de proefpersoon zijn
er toereikende schriftelijke informatie voor de proefpersonen beschikbaar is
de proefpersoon zijn toestemming zelf uit vrije wil kan geven.
Als de commissie vindt dat het onderzoek te weinig rekening houdt met de belangen van de
proefpersoon, of een te zware belasting vormt, keurt ze het onderzoek niet goed. Voor de onderzoeker
betekent dit dat hij zijn onderzoek moet aanpassen. Onderzoekers kunnen dus niet zonder
beoordeling en goedkeuring vooraf wetenschappelijk onderzoek bij mensen doen.
Artsen mogen wel zonder toetsing en toestemming vooraf onderzoek doen met de gegevens van hun
eigen patiënten. Voor onderzoek met geanonimiseerd materiaal, waarbij herleidbare
persoonsgegevens niet aan de onderzoeker worden verstrekt, is ook geen toetsing in de zin van de
WMO nodig. Wel vraagt de instelling waar het onderzoek plaatsvindt vaak een toetsing van de lokale
uitvoerbaarheid van het onderzoek. Verder vragen steeds meer wetenschappelijke tijdschriften dat het
onderzoek waarover wordt gepubliceerd, getoetst is door een Medisch Ethische Toetsingscommissie.
3.2.2. Instemmingsprocedure
Indien onderzoek bij patiënten wordt uitgevoerd, dient de behandelend arts of een andere
zorgverlener potentieel geschikte patiënten te vragen of ze willen deelnemen aan het
wetenschappelijk onderzoek.
Bij gezonde proefpersonen kan de onderzoeker deze benaderen, o.a. via een algemene oproep in de
lekenpers. Hij bespreekt het onderzoek met de potentiële proefpersoon en geeft deze informatie ook
op papier.
De informatie betreft onder meer:
het doel van het onderzoek
de interventie die wordt onderzocht
hoe het onderzoek is opgezet
de eventuele extra belasting van het onderzoek voor de deelnemers
de eventuele risico's en bijwerkingen
de voordelen die er voor deelnemers kunnen zijn
wat er van deelnemers wordt verwacht tijdens het onderzoek.
Daarnaast zal de onderzoeker vertellen welke rechten en plichten de deelnemer heeft. Voordat
mensen de beslissing nemen om wel of niet mee te doen, dienen ze bedenktijd te krijgen. Het is bij
wet verplicht om, voor eventuele vragen, in de beschikbare informatie een onafhankelijk arts te
vermelden die niet betrokken is bij het wetenschappelijk onderzoek. Als een deelnemer bereid is om
mee te doen, vraagt de onderzoeker een 'informed consent' (‘geïnformeerde toestemming’)-formulier
te tekenen.
Het ondertekenen is een soort intentieverklaring, die bevestigt dat het onderzoek naar behoren is
uitgelegd en dat men vrijwillig medewerking aan het onderzoek verleent. Het wil niet zeggen dat
deelnemers zich daarmee verplichten het onderzoek af te maken. Ook degene die toestemming
vraagt, dient het formulier te ondertekenen.
3.2.3. Wilsonbekwame en minderjarige proefpersonen
De wet biedt proefpersonen die (tijdelijk) niet voor zichzelf kunnen beslissen, extra bescherming. Het
109
KWO
gaat om zogenaamde wilsonbekwamen en minderjarigen. Wilsonbekwaam zijn bijvoorbeeld patiënten
die in coma zijn, of patiënten die zo ernstig dement zijn dat ze niet meer begrijpen wat er van hen
gevraagd wordt. Minderjarigen zijn personen tot 18 jaar. De wetgever hanteert hier een “Nee, tenzij”principe. Dat wil zeggen dat onderzoek met mensen die niet voor zichzelf kunnen beslissen alleen
onder zeer strikte voorwaarden is toegestaan. Dat is het geval als het onderzoek aan de deelnemers
ten goede komt of als het onderzoek uitsluitend met die groep patiënten uitgevoerd kan worden. En
dan mag het alleen als de belasting voor de deelnemers gering is en de risico’s minimaal zijn. Omdat
de proefpersoon zelf (tijdelijk) niet kan beslissen, wordt toestemming gevraagd aan een ‘wettelijk
vertegenwoordiger’. Meestal is dit iemand van de directe familie of de partner, maar het kan ook
iemand anders zijn die daarvoor is aangewezen. Voor kinderen tot 18 jaar wordt om schriftelijke
toestemming gevraagd aan de ouders of aan een voogd. Kinderen vanaf 12 jaar moeten daarnaast
ook zelf toestemming geven om mee te doen aan het onderzoek.
3.2.4. Rechten en plichten voor proefpersonen
De rechten van proefpersonen zijn in wetgeving in de vorm van richtlijnen vastgelegd. De belangrijkste
zijn:
Recht op vrijwillige deelname
Als mensen besluiten om niet mee te doen, mag dat geen nadelige gevolgen hebben voor de
behandeling.
Recht op het ontvangen van informatie en stellen van vragen> Niet alleen vooraf, maar ook
tijdens en na het onderzoek hebben proefpersonen recht op informatie.
Recht op tussentijds stoppen met het onderzoek
Recht op vertrouwelijke behandeling van de gegevens uit het onderzoek.
De gegevens uit onderzoek zijn vertrouwelijk en moeten anoniem verwerkt worden.
Ze krijgen een code zodat identificerende informatie kan worden weggelaten. Naast rechten heeft een
proefpersoon ook verplichtingen, zoals nuchter komen of resterende geneesmiddelen telkens
meenemen. In het geval dat proefpersonen zich niet aan die afspraken houden, kan de onderzoeker
de deelname beëindigen.
3.2.5. Overige regels
Bij sommige onderzoeken is het noodzakelijk dat andere medische beroepsbeoefenaars weten dat
hun patiënt deelneemt aan het onderzoek. De deelnemers dienen hierover schriftelijk geïnformeerd te
worden. Wanneer tijdens het wetenschappelijk onderzoek blijkt dat de neveneffecten van het
onderzoek schadelijk zijn, of dat de ene behandeling duidelijk betere resultaten oplevert dan de
andere, zal het onderzoek beëindigd moeten worden. Wanneer het onderzoek voor een deelnemer
persoonlijk een schadelijk effect heeft (en dus niet voor alle proefpersonen), dan zal de onderzoeker
de deelname van die specifieke persoon beëindigen.
Onderzoekers zijn verplicht te zorgen dat een verzekering is afgesloten waaruit eventuele schade als
gevolg van het onderzoek kan worden betaald. In het geval van commerciële belangen van de
opdrachtgever, doet de opdrachtgever dat. Anders sluit de instelling waar de onderzoeker werkt een
verzekering af. Deze verzekering is door de wet gebonden aan bepaalde voorwaarden over de hoogte
van de verzekerde bedragen en de uitsluitingen van verzekering.
3.2.6. Opdrachtgevers
De opdrachtgevers voor wetenschappelijk onderzoek met mensen kunnen verschillende instanties
zijn. In de specifieke informatie die proefpersonen van de onderzoeker krijgen, hoort te staan wie de
opdrachtgever is van het wetenschappelijk onderzoek.
Er zijn twee grote categorieën:
- De geneesmiddelenindustrie of fabrikanten van medische apparatuur.
Zij hebben in hun bedrijf een nieuw medicijn of instrument ontwikkeld dat, voordat het op de markt
mag komen, eerst onderzocht moet worden op voldoende effectiviteit en veiligheid.
- Speciale onderzoeksfondsen of instituten
Voorbeelden zijn collectebusfondsen (bijvoorbeeld Nederlandse Hartstichting, Nierstichting,
Kankerbestrijding) en overheidsfondsen (via bijvoorbeeld de Nederlandse organisatie voor
Wetenschappelijk Onderzoek (NWO) of ZonMw.
3.2.7 Good Clinical Practice
3.2.7.1 Definitie, doel en historie
Good Clinical Practice (GCP) is een internationale standaard voor het ontwerpen, opzetten, uitvoeren,
controleren, vastleggen, analyseren en rapporteren van klinisch onderzoek, die zeker stelt dat de
110
KWO
gegevens en de gerapporteerde resultaten betrouwbaar en nauwkeurig zijn en dat de rechten,
integriteit en vertrouwelijkheid van proefpersonen beschermd worden. GCP heeft de vorm van een
gedragscode voor alle partijen betrokken bij klinisch onderzoek: de onderzoeker, de Medisch Ethische
Toetsing Commissie en de opdrachtgever. Deze partijen hebben verschillende belangen en daarom is
het goed dat er richtlijnen voor hun handelen zijn opgesteld. De twee belangrijkste doelstellingen van
GCP zijn:
De bescherming van de rechten van de patiënten die meedoen aan klinisch onderzoek.
De integriteit van de onderzoeksgegevens waarborgen.
Sinds 1990 bestaan GCP richtlijnen voor Europa, die sinds 1994 opgenomen zijn in de Nederlandse
wetgeving. In 1996 zijn de bestaande regelgevingen van de Europese Unie, Japan en de Verenigde
Staten, alsook van Australië, Canada, de Scandinavische landen en de
Wereldgezondheidsorganisatie geharmoniseerd tot één wereldwijd geldend ICH (Int’l. Conference on
Harmonisation) richtlijn voor GCP. Het voordeel van deze harmonisatie is dat klinische onderzoeksresultaten die voorgelegd worden aan autoriteiten overal ter wereld geproduceerd kunnen zijn, mits de
ICH/GCP richtlijn bij het onderzoek gevolgd is. Voor de harmonisatie kwam het regelmatig voor dat
identiek geneesmiddelonderzoek uitgevoerd moest worden in verschillende delen van de wereld
teneinde overal een registratie te verkrijgen.
3.2.7.2 Beginselen en toepassing
De beginselen van ICH/GCP zijn dezelfde als die verwoord in de paragrafen 3.2.2., 3.2.4 en 3.2.5 van
dit hoofdstuk. Verdere beginselen zijn:
Als het om een nieuw geneesmiddel gaat moet er voldoende informatie zijn uit eerdere (dier-)
experimenten om het nieuwe onderzoek te onderbouwen.
De medische zorg en medische beslissingen ten behoeve van de proefpersonen moeten altijd
onder verantwoordelijkheid van een bevoegd (tand)arts vallen.
Overigens wordt in de GCP richtlijn naast de beginselen ook beschreven wat de precieze
verantwoordelijkheden van de verschillende betrokken ‘partijen’ bij een klinisch onderzoek zijn. Bij
onderzoek waarvan de gegevens voorgelegd zullen worden aan de bevoegde instanties, zoals de
Inspectie voor de Gezondheidszorg of het College ter Beoordeling van Geneesmiddelen, moet men
het ICH-richtsnoer voor GCP in acht nemen. De richtlijnen kunnen uiteraard ook worden toegepast op
ander klinisch onderzoek dat de veiligheid en het welzijn van proefpersonen zou kunnen beïnvloeden.
Er is een handboek voor onderzoek met geneesmiddelen met de vertaling naar de Nederlandse
praktijk: het rood-wit-blauwe GCP-boekje. Hierin zijn de integrale tekst van het ICH-richtsnoer voor
GCP opgenomen, samen met aanpalende wet- en regelgeving en een bruikbare praktische
interpretatie van het ICH/GCP document.
111
KWO
112
KWO
Hoofdstuk 4 RAPPORTAGE
4.1
PUBLICEREN
4.1.1 Inleiding
Om met Vandenbroucke te spreken: “Zodra men beslist heeft over de vraagstelling …… schrijve men
onmiddellijk het artikel waarin de uiteindelijke gegevens zullen worden gepresenteerd” [1]. Dit klinkt
provocerend, maar nadere beschouwing zal duidelijk maken dat dit standpunt heel goed is te
verdedigen. Hieronder wordt de stelling van Vandenbroucke nader toegelicht, waarbij frequent wordt
geput uit een onder auspiciën van het Nederlands Tijdschrift voor Geneeskunde uitgegeven boek:
“Publiceren in biomedische tijdschriften” [2].
De vorige hoofdstukken van deze syllabus behandelden de opzet van verschillende vormen van
patiëntgebonden onderzoek. Kern daarbij was steeds de vraagstelling. Deze bepaalt hoe een
onderzoek het best kan worden opgezet. De vraagstelling bepaalt ook grotendeels de inhoud van de
hoofdelementen van een wetenschappelijk artikel: inleiding, methoden, resultaten en discussie. Men
kan daarom al lang voordat het onderzoek voltooid is beginnen met schrijven, conform de stelling van
Vandenbroucke. De inleiding van een artikel bevat de beschrijving van de achtergronden die hebben
geleid tot de formulering van de vraagstelling. In de methoden staat de uitwerking van de onderzoeksopzet. Voor de resultaten kan men al lege tabellen definiëren. In de beschouwing, ten slotte, kan men
reeds anticiperen op de mogelijke uitkomsten van het onderzoek, de bijbehorende alinea’s schrijven,
en commentaar geven op de gebruikte methoden.
4.1.2 Vormen van publicaties en medische tijdschriften
Een artikel waarin de auteurs de resultaten van eigen onderzoek publiceren wordt een “oorspronkelijk
artikel” (Engels “original publication”) genoemd. Voorbeelden van andere vormen van publicaties zijn:
het overzichtsartikel (‘review’), waarin aan de hand van een aantal oorspronkelijke artikelen de huidige
stand van zaken over een onderwerp wordt samengevat en voorzien van de interpretatie van de
schrijvers van het overzicht, en verder de beschrijving van een of meer ziektegeschiedenissen (‘case
reports’), en commentaren. De laatste categorie, in de Angelsaksische literatuur aangeduid als
Editorial, wordt meestal op uitnodiging van de redactie van een tijdschrift geschreven en bespreekt
veelal een in hetzelfde tijdschrift gelijktijdig gepubliceerd oorspronkelijk artikel. Tijdschriften laten zich
indelen naar lezerspubliek en taal. Enerzijds onderscheidt men de algemene tijdschriften, die zich
richten op een brede en grote medische lezerskring, anderzijds zijn er de vaktijdschriften die alleen
artikelen over een deelgebied van de geneeskunde publiceren en een veel beperktere oplage hebben.
Voorbeelden van de algemene Engelstalige tijdschriften zijn de New England Journal of Medicine
(oplage 240.000), de British Medical Journal (160.000), de Lancet (80.000) en de Journal of the
American Medical Association (kortweg JAMA). Voorbeelden van Engelstalige vaktijdschriften zijn de
Annals of Internal Medicine, Cancer, Stroke, Pediatrics ,et cetera. Deze laatste tijdschriften hebben
een oplage van hooguit enkele duizenden exemplaren. Het Nederlands Tijdschrift voor Geneeskunde
is een Nederlandstalig algemeen medisch tijdschrift (oplage 30.000). Voorbeelden van
Nederlandstalige vaktijdschriften zijn het Nederlands Tijdschrift voor Heelkunde, Tijdschrift voor
Sociale Gezondheidszorg, enzovoort.
4.1.3 Het oorspronkelijk artikel
Voorbeeld
Een fictief interventieonderzoek dient als voorbeeld. De vraagstelling van dit onderzoek is: geneest het
eten van wortels jeugdpuistjes (acne)? Achtergrond van deze vraagstelling is de volgende mix van
realiteit en fictie. Acne ontstaat door verdikking van de opperhuid, hyperkeratose. Daardoor treedt
vernauwing op van de uitmonding van de haarzakjes en kan de talg uit de talgkliertjes niet meer goed
worden afgevoerd. Dit leidt vervolgens tot mee-eters (comedomen) en pustels. Op de tienerleeftijd
komt acne veel voor en dit wordt als zeer hinderlijk ervaren. Effectieve behandeling is daarom
gewenst.
Bij muizen is aangetoond dat toevoeging van caroteen aan het dieet reeds aanwezige hyper-keratose
vermindert. In wortels komt het geelrode pigment caroteen veel voor. Hoge caroteen-spiegels kunnen
leiden tot een geelrode verkleuring van de huid, die soms lijkt op icterus. Het onderzoek, CARROT
(Carotene in Acne RegRessiOn Trial), bestond uit een randomised controlled trial bij 200 tieners met
acne. De ene helft kreeg aselect een wortelrijk dieet voor-geschreven, de andere groep een wortelvrij
dieet. Na drie maanden bepaalde een dermatoloog, die niet op de hoogte was van het gevolgde dieet,
113
KWO
de ernst van de acne op basis van gelaatsfoto’s.
De hoofdtekst
De hoofdelementen van een oorspronkelijk artikel worden samengevat met het Engelse acroniem
IMRAD: Introduction, Methods, Results And Discussion. Deze hoofdelementen worden nu
achtereenvolgens behandeld. De inleiding beschrijft de achtergrond van de vraagstelling en eindigt
met een precieze formulering daarvan. De literatuur wordt daarbij aangehaald om te beschrijven wat
de huidige stand van zaken is op het terrein van de onderzoeksvraag. In het geval van ons voorbeeld
wordt hier niet alleen geschetst hoe vaak acne op de tienerleeftijd voorkomt en wat de psychologische
belasting is van de aandoening, maar ook dat bij muizen met caroteen hyperkeratose in regressie kan
worden gebracht. Verder kunt u refereren dat uit vooronderzoek bij de mens is gebleken dat een dieet
met tenminste 2 kg wortelen per week bij een groep vrijwilligers haalbaar bleek. De vraagstelling zou u
kunnen formuleren als: “In a randomised controlled trial we investigated whether a carrot rich diet is
more effective than a carrot free diet in curing acne presenting in the teens.”
De methoden dienen de onderzoeksopzet goed te beschrijven zodat de lezer in elk geval de volgende
vragen kan beantwoorden:
1.
Hoeveel en welke patiënten kwamen in aanmerking voor het onderzoek, hoeveel daarvan
namen ook deel aan het onderzoek, en hoeveel (en welke) deden tot het einde mee?
2.
Hoe werd(en) de onderzochte determinant(en) theoretisch gedefinieerd en geoperationaliseerd?
3.
Hoe werd(en) de onderzochte uitkomst(en) theoretisch gedefinieerd en geoperationaliseerd?
4.
Hoe werden de gegevens uit het onderzoek geanalyseerd?
Deze vier vragen worden nu voor het voorbeeld kort behandeld. Men zal beschrijven dat de
onderzochte patiënten 12 tot 18 jaar oud zijn en acne hebben. Daarbij zal een aanduiding van de
ernst van de ziekte nodig zijn (inclusiecriterium, bijvoorbeeld tenminste 10 actieve pustels in het
gelaat). Als uitsluiting-criterium kan men onder meer vermelden “lust geen wortels”. Verder zal men
beschrijven hoeveel patiënten in aanmerking kwamen, hoeveel er meededen, en hoeveel er tot het
einde in het onderzoek bleven. De behandelingen (punt 2) bestaan uit de wortelrijke en wortelarme
diëten. Het is essentieel te vermelden dat de behandelingen gerandomiseerd werden voorgeschreven
en ook hoe de randomisatieprocedure plaatsvond, bijvoorbeeld door naar een centraal trialbureau op
te bellen om de patiënt aan te melden en te vernemen wat de toegewezen behandeling is.
Uitkomstmaat van het onderzoek (punt 3) is de ernst van de acne na drie maanden. U moet aangeven
hoe die ernst precies wordt vastgesteld, zodat de lezers goed kunnen begrijpen om welke mate van
de ziekte het nu gaat. Daarbij kunt u eventueel verwijzen naar een (gevalideerde!) uitkomstschaal die
reeds wijd en zijd bij deze ziekte in gebruik is. Maar als die schaal niet bestaat zult u zelf moeten
uitleggen hoe u de ernst scoorde. Bijvoorbeeld: “Three months after enrolment, a picture of the face of
the patient was taken. Two dermatologists, unaware of the patient’s diet independently, counted the
number of active pustules.”
De methoden worden besloten met een alinea over de data analyse. In het voorbeeld zou daar in
komen te staan dat als effectmaat het verschil van de gemiddelde aantallen pustels na drie maanden
werd genomen. Daarbij mag niet worden vergeten dat ook de nauwkeurigheid van de effectschatter
(het verschil van de gemiddelden) moet worden beschreven, bij voorkeur met een 95%
betrouwbaarheidsinterval. Wanneer u sub-groep analyses hebt gepland, horen deze hier te worden
aangekondigd. Ook vermeldt u op deze plaats de aannames die u voor de omvangberekening maakte
(zie ook hoofdstuk 5.3). Voor het beschrijven van de resultaten is in principe niet veel tekst nodig. Als
het goed is, staan alle essentiële gegevens in tabellen en figuren. Zij moeten wel kort worden
besproken. Daarbij is het dus niet de bedoeling de inhoud van de tabellen geheel te herhalen in de
tekst – noem alleen de krenten uit de pap. Het kan verhelderend zijn om in een stroomdiagram te
tonen welke deelnemers potentieel voor de trial in aanmerking kwamen, welke werden
gerandomiseerd en of ze tot het einde meededen.
In ons voorbeeld zou dit diagram er als volgt uit kunnen zien:
114
KWO
CARROT trial profile
300 teeners willing to participate
100 not randomised:
90 too few pustels
10 carrot aversion
100 randomly assigned
to carrot rich diet
2 lost to follow-up
3 diet intolerance
100 randomly assigned
to carrot free diet
1 lost to follow-up
95 completed trial
99 completed trial
Vrijwel ieder artikel zal in de eerste tabel details geven over de bestudeerde patiënten, de
“baselinetabel”. In het geval van een trial is dit een erg belangrijke tabel omdat deze de lezer in staat
moet stellen om te kunnen beoordelen of de randomisatie is gelukt, i.e. of de groepen vergelijkbaar
zijn. Hier volgt een voorbeeld van de baselinetabel van de CARROT trial:
Table 4-1-1
Baseline characteristics according to assigned diet
Carrot rich
Carrot free
Variable
diet
diet
(N=100)
(N=100)
Mean age ± SD
16.2 (±2.1)
15.8 (±1.9)
(years)
Girls
41
47
Mean no. Of pustels 18.3 (±5.1)
18.8 (±5.6)
± SD
Mean age at onset ± 14.0 (±1.6)
13.8 (±1.5)
SD (years)
Et cetera
…
…
Voor de hoofdresultaten is het zaak, deze zodanig te presenteren dat de lezer de belangrijkste
berekeningen (ongeveer) kan verifiëren. In het geval van klinische eindpunten in een follow-up
onderzoek moeten daarom de aantallen worden gegeven en niet alleen de percentages. In ons
voorbeeld is het nodig de gemiddelde aantallen pustels in het gelaat na drie maanden te geven.
Tabel 4-1-2 toont hoe dit er uit kan gaan zien.
In de discussie wordt vaak de volgende structuur aangebracht. Veelal wordt begonnen met een
recapitulatie van de hoofdbevinding: “Our findings indicate that a carrot rich diet for three months
reduces the mean number of pustels in teenagers presenting with acne vulgaris.” Vervolgens geeft
men een inter-pretatie van deze hoofdbevindingen in het licht van voorgaand onderzoek bij mens en
dier. Daarin kan onder meer besproken worden in hoeverre de bevindingen overeenkomen met die
van eerdere soortgelijke onderzoeken, of waarom er juist verschillen werden gevonden. Een aparte
alinea moet worden gewijd aan de methodologische voor- en nadelen van het onderzoek. In het geval
van de CARROT-trial kan men erop wijzen dat het onderzoek door de aard van de interventie niet was
te blinderen, maar dat de hoofduitkomst desalniettemin blind werd vastgesteld. Voor de secundaire
uitkomst “zelfvertrouwen” geldt de vergelijkbaarheid van informatie echter niet: de tieners wisten
immers of ze op het worteldieet stonden of niet, en die kennis kan tot een vertekening van de
beoordeling van het zelfvertrouwen hebben geleid. De voorlaatste alinea gaat meestal over de
toepasbaarheid van de bevindingen en aanbevelingen voor verder onderzoek.
115
KWO
Table 4-1-2 Primary and secondary outcomes according to assigned treatment
Outcome
Carrot rich diet
Difference
95%-CI
(N=95)
Primary outcome
Mean number of pustels ±
11.1 ± 5.3
16.3 ± 4.9
5.2
3.8 – 6.6
50
35
p = 0.003*
…
…
…
…
…
SD
Secondary outcomes
Median self confidence
score
Et cetera
Vindt u dat u op basis van deze trial kunt aanbevelen dat alle jongeren met jeugdpuistjes nu maar veel
wortelen moeten gaan eten? Of vindt u alle bewijzen die er nu zijn over de effectiviteit van een
*based onnog
the te
Mann-Whitney
U utest;
denotes
confidence
interval.
worteldieet
mager en stelt
nogCI
een
(grotere?)
trial voor?
En zijn de bevindingen naar uw
mening geldig in alle omstandigheden, ook bijvoorbeeld voor meisjes die de anticonceptiepil gebruiken
– daarover verschafte CARROT geen gegevens. Ten slotte volgt de eindconclusie waarin men
nogmaals de belangrijkste bevindingen van het onderzoek samenvat.
De finesses
Wanneer het IMRAD bouwwerk staat, volgt nog de afwerking. Niet alleen moeten inleiding, methoden,
resultaten en discussie worden bijgeschaafd, er komen ook nog een paar nieuwe onderdelen aan de
beurt. Een daarvan is de samenvatting van het artikel. Besteed hier veel aandacht aan en raffel deze
tekst niet af, want dit is het meest gelezen deel van het artikel. Dit deel van de tekst wordt opgenomen
in Medline en andere elektronische literatuur-bestanden en het is daarmee snel en gemakkelijk
toegankelijk. Wik en weeg daarom wat u hierin kwijt wilt. Binnen de samenvatting worden de
afsluitende zinnen (“Conclusion” of “Interpretation”) weer het meest gelezen. Speciale aandacht is dus
hier helemaal een vereiste. Ook wordt het nu tijd om een recent exemplaar van de “Instructions for
authors” voor het tijdschrift van keuze te lezen.
In deze instructies wordt beschreven wat er allemaal op de titelpagina moet komen te staan: titel,
auteurs, affiliatie van de auteurs, trefwoorden, naam en adres van de auteur die verantwoordelijk is
voor de correspondentie over het artikel (“corresponding author”), en vaak ook nog het totale aantal
woorden (voor samenvatting en hoofdtekst (IMRAD) apart), tabellen en figuren, en titel.
Veel “gedoe” kan ontstaan over auteurschappen. Het is verstandig daarover vroeg afspraken te
maken om latere problemen te voorkomen. Over wie auteur kan zijn van een artikel bestaan
richtlijnen, geformuleerd door een groep redacteuren van medische tijdschriften [3]. Iemand komt voor
auteurschap in aanmerking in geval van (a) deelname aan ontwerp en opzet, of analyse en
interpretatie van gegevens en (b) deelname aan het schrijven van het artikel en (c) het goedkeuren
van de definitieve versie. Wetenschappelijke publicaties zijn in de academische wereld immers de
“valuta” waarop klinische onderzoekers worden afgerekend: “wie schrijft die blijft”. Ook over de plaats
van de auteurs kan discussie ontstaan, maar hierover bestaan geen algemene regels. Wel is de
eerste auteur diegene die het leeuwendeel van het werk heeft gedaan, de tweede vaak diens directe
begeleider, en de laatste de leider van de onderzoeksgroep. Nadat na diverse versies (zeven of meer
is heel gewoon) het uiteindelijke manuscript gereed is, kan het worden verzonden. Veel grote
tijdschriften beoordelen eerst op het redactiebureau of het artikel past in het profiel van het tijdschrift.
Is dat niet het geval dan krijgt u het snel terug met een afwijzing. Als het potentieel interessant is, gaat
het artikel naar twee of drie reviewers die een beoordeling naar het redactiebureau zenden. Op basis
van deze rapporten besluit de redactie of het stuk voor publicatie wordt aanvaard (dat gebeurt zelden
ineens), of het voor herbeoordeling in aanmerking komt na aanpassingen, of dat het wordt afgewezen.
Het is goed zich te realiseren dat bij de grote algemene tijdschriften het afwijzings-percentage hoog is:
in de orde van grootte van 90%! Na afwijzing staat het u uiteraard vrij het stuk bij een ander blad aan
te bieden - dikwijls worden aanvankelijk geweigerde stukken alsnog elders gepubliceerd.
116
KWO
4.1.4 Motief
Waarom eigenlijk al die moeite om een goed wetenschappelijk artikel te schrijven? Er zijn (tenminste)
drie argumenten te geven. Allereerst rust er op u de wetenschappelijke plicht om de resultaten van uw
onderzoek wereldkundig te maken. Wanneer de bevindingen in de kast blijven liggen heeft niemand er
wat aan en is het geld dat aan het onderzoek is besteed, verspild. Een tweede reden kwam al eerder
aan de orde: wetenschappelijke publicaties zijn belangrijk voor uw curriculum vitae. Ten slotte kunt u
ook schrijven omdat u het leuk vindt: “le plaisir de se voir imprimer”.
117
KWO
118
KWO
Appendix A
EVIDENCE-BASED MEDICINE
Inleiding
Inzicht in de fysiologie en pathologie vormde de belangrijkste basis voor het medisch handelen tot en
met de eerste helft van de twintigste eeuw. Daarna is in toenemende mate geaccepteerd dat voor
adequaat klinisch handelen meer nodig is: gegevens uit klinisch onderzoek die laten zien of een
behandeling ook in de praktijk doeltreffend is en of de bijwerkingen het nuttig effect niet overtreffen.
De afgelopen decennia is er veel goed klinisch onderzoek gedaan. Tijdschriften als het New England
Journal of Medicine, de Lancet, het British Medical Journal (BMJ) en het Journal of the American
Medical Association (JAMA) staan elke week weer vol met onderzoeksverslagen die betekenis
hebben voor de praktijk. Ervan uitgaande dat het de taak van artsen is, hun patiënten naar beste
weten te behandelen, moet de medicus practicus de resultaten van het beste onderzoek in zijn
klinisch handelen integreren. Hoe kan dat gebeuren? Leerboeken lopen door hun aard jarenlang
achter op tijdschriften. Bijblijven door alle relevante tijdschriftartikelen te lezen is echter ook geen
optie. Bijvoorbeeld huisartsen zouden om ‘up to date’ te blijven gemiddeld 19 artikelen per dag moeten
lezen en dat 365 dagen per jaar. Het is dus niet gek dat een negatieve associatie bestaat tussen de
kennis over bijdetijdse zorg en de jaren verstreken sinds het artsexamen. Sinds de jaren tachtig is
vanuit de McMasters Medical School te Hamilton, Canada, het concept ‘Evidence-Based Medicine
(EBM)’ ontwikkeld. De gedachte is dat klinische beslissingen gebaseerd dienen te zijn op goede
vraagstellingen en dat in de literatuur systematisch moet worden nagegaan wat het beste antwoord is
op deze vraagstellingen. EBM probeert onderwijs, onderzoek en de klinische praktijk te integreren. Het
behelst een streven om patiënten maximaal te laten profiteren van de beschikbare kennis en het is
dus geen bijzondere wijze van het beoefenen van de geneeskunde.
De Evidence-Based Medicine beweging
De Evidence-Based Medicine Working Group pleitte in 1992 in het medisch tijdschrift JAMA voor wat
zij noemen een omslag in het medisch denken en handelen. In grote lijnen kwam het erop neer dat
men voorzichtig moet zijn met het gebruiken van informatie gebaseerd op pathofysiologische principes
of op klinische ervaring. Deze informatie zou vaak misleidend zijn. Alle medische handelingen met
betrekking tot diagnose, prognose en interventie zouden gebaseerd moeten zijn op degelijk numeriek
bewijs-materiaal, verkregen met behulp van de "beste" epidemiologische onderzoeken. Men hanteert
een ‘hiërarchie van bewijs-materiaal’ om te kunnen beoordelen of de "beste" epidemiologische
onderzoeken zijn gebruikt. Bovenaan staat de gerandomiseerde trial. Daaronder komen
achtereenvolgens het cohortonderzoek, het patiënt-controle-onderzoek, de case serie en de case
report. Een dergelijke indeling wordt nu vaak gehanteerd om medisch wetenschappelijk onderzoek te
waarderen. Zo ook door het Kwaliteitsinstituut voor de gezondheidszorg CBO (tabel 5-1-1). Voor het
meten van de effectiviteit van interventies wordt de gerandomiseerde trial als enige valide
onderzoeksmethode geaccepteerd. Voor de rubriek ‘Prevention or Treatment’ van het tijdschrift
Evidence-Based Medicine komen dan ook alleen artikelen in aanmerking die gerandomiseerd
onderzoek beschrijven.
Cochrane Collaboration
Archie Cochrane, een Engelse epidemioloog, hield al meer dan 25 jaar geleden pleidooien voor het
systematisch bijeenbrengen van de informatie uit gerandomiseerde onderzoeken tot hele overzichten
om zo Evidence-Based Medicine mogelijk te maken. De Cochrane Collaboration die hier uit
voortgekomen is, zet zich in om dergelijke overzichten te schrijven en algemeen beschikbaar te
maken.
119
KWO
Tabel. Indeling van onderzoeksresultaten naar mate van bewijskracht voor interventiestudies
(behandeling en preventie) zoals gehanteerd door het Kwaliteitsinstituut voor de gezondheidszorg
CBO.
Rangnummer
A1
A2
2
3
4
Aard van onderzoek
Meta-analysen die tenminste enkele gerandomiseerde onderzoeken van A2-niveau
betreffen, waarbij de resultaten van afzonderlijke onderzoeken consistent zijn
Gerandomiseerd vergelijkend klinisch onderzoek van goede kwaliteit (gerandomiseerde,
dubbelblind gecontroleerde trials) en voldoende omvang en consistentie
Gerandomiseerde klinische trials van mindere kwaliteit of onvoldoende omvang of ander
vergelijkend onderzoek (niet-gerandomiseerd: cohortonderzoek, patiëntcontroleonderzoek)
Niet-vergelijkend onderzoek
De mening van deskundigen
De gerandomiseerde effectiviteitonderzoeken die sinds het einde van de jaren veertig van de 20 e
eeuw zijn verricht, worden binnen dit internationale werkverband in een database ondergebracht om
op die manier systematische overzichten te kunnen maken.
De term systematisch geeft aan dat men expliciet aandacht besteedt aan het formaliseren van
methoden van gegevensverzameling en -bewerking, zodat de lezer de gang van zaken kan volgen en
zich een oordeel kan vormen over de kwaliteit van het literatuuronderzoek. Deze systematische
overzichten staan in een aparte database die zodanig wordt ontsloten (onder andere via
http://www.cochrane.nl ), dat iedereen met een druk op de knop een actuele samenvatting van de
stand van zaken over de in het bestand opgenomen interventies op het beeldscherm kan krijgen.
Evidence-Based Health Care: vier fasen in Evidence-Based Medicine
Evidence-Based Medicine betekent: integratie van de resultaten van het meest recente
wetenschappelijk onderzoek in het klinisch handelen. Dit vergt een kritische houding ten aanzien van
gevestigd klinisch handelen, bereidheid onzekerheden toe te geven, en flexibiliteit. De argumenten “zo
doen we het altijd” en “naar onze mening hoort het zo” zouden moeten worden vervangen of
aangevuld door “en wel op basis van …”. Om Evidence-Based health care te kunnen bedrijven zijn
bepaalde vaardigheden nodig: de kunst en kunde om de goede gegevens te kunnen vinden, deze op
validiteit te kunnen beoordelen, en te kunnen vertalen naar de eigen situatie.
Men kan Evidence-Based Medicine in de praktijk brengen daar waar twijfel bestaat over de actuele
kennis van een bepaald klinisch onderwerp. De volgende vier stappen dienen als handvat om
Evidence-Based Medicine in praktijk te brengen.
1) Formuleren van een duidelijke klinische vraagstelling
Nadat twijfel over een relevant klinisch probleem duidelijk is geworden, formuleert men een duidelijke
klinische onderzoeksvraag (domein, determinant en uitkomst). (Zie ook hoofdstuk 1.2).
2) Zoeken naar literatuur
De tweede stap bestaat uit het zoeken naar het beste onderzoek met betrekking tot de vraagstelling.
Er worden hiervoor twee typen elektronische ‘databases’ gebruikt. Het eerste is de bibliografische,
waarin de gebruiker relevante referenties in de medische literatuur kan zoeken. De bekendste is
‘Medline’, op het internet onder andere beschikbaar op de sites van de Amerikaanse ‘National Library
of Medicine’, ‘Pubmed’ (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi ) of ‘HealthWorld Online’
(http://www.healthy.net/library/search/medline.asp ).
In het tweede type database krijgt de gebruiker secundaire publicaties over bepaalde klinische vragen,
zoals de Cochrane Database, de ACP Journal Club (een tweemaandelijks supplement bij de Annals of
Internal Medicine) en Turning Research Into Practice (TRIP) (http://www.tripdatabase.com ).
3) Evalueren van de gevonden literatuur
De derde stap bestaat uit het evalueren en kritisch beoordelen van het gevonden onderzoek ten
aanzien van validiteit en relevantie. Deze stap is cruciaal, omdat de clinicus hier besluit of het
materiaal (artikel) bruikbaar is voor het geformuleerde klinisch probleem. Helaas blijkt een groot
gedeelte van het gepubliceerde medisch onderzoek slecht aan te sluiten op de praktijk of inhoudelijk
niet valide te zijn. Richtlijnen voor het beoordelen van de gevonden artikelen zijn te vinden in een serie
artikelen in de JAMA getiteld “Users’ Guides to the Medical Literature”, gepubliceerd in 1993 en 1994.
120
KWO
4) Implementeren van bruikbare ‘evidence’ in de klinische praktijk
Kennis verkregen uit valide en relevant onderzoek kan rechtstreek het medisch handelen sturen of
kan verwerkt worden in een protocol of in richtlijnen, zoals de huisartsen-standaarden. De nieuw
vergaarde kennis wordt het best geïmplementeerd door middel van discussies tijdens (grote) visites of
op refereeravonden die toegespitst zijn op een bepaald klinisch probleem.
Veel gehoorde kritiek
Naast veel lof is er ook wel kritiek op de ambities van de ‘Evidence-Based Medicine’- beweging. De
kritiek betreft onder andere de methode van de meta-analyse waarvan de aanhangers van EvidenceBased Medicine hoog opgeven. Zo kon de effectiviteit van de aanbeveling op grond van metaanalyses om na een hartinfarct magnesium toe te dienen in een grote studie niet worden bevestigd.
Een ander bezwaar is de mogelijkheid van selectiebias door het beleid van medische tijdschriften (zie
hoofdstuk 5.4). Vraagtekens zijn ook gezet bij het optimisme waarmee de beweging denkt de gehele
geneeskunde in al haar facetten te kunnen aanpakken en over de vanzelfsprekendheid waarmee in
de eigen autoriteit wordt geloofd. Verder is bezorgdheid geuit over de brede scala van afnemers, die
de Cochrane Collaboration voorziet. De vraag is of het wel toe te juichen is als overheidsinstanties en
verzekeraars zich zo geïnteresseerd tonen in de resultaten.
Ten slotte
Beslissingen in de geneeskunde hangen van meer zaken af dan van ‘evidence’. Artsen die goed
onderbouwde beslissingen willen nemen baseren zich op meer dan alleen gerandomiseerde trials.
Bij het behandelen van de individuele patiënt heeft een integratie van gegevens en redeneringen
plaats. Deze integratie gebeurt via probabilistisch denken en via causaal denken. Als je een
cardioloog vraagt waarom zij thrombolytische interventie voorschrijft bij een patiënt met een
hartinfarct, zal zij niet alleen antwoorden: “Vanwege zus of zo mega-trial”, maar ook gewoon: “Omdat
dat het stolsel oplost”. Dit laatste antwoord helpt haar bij het nadenken over de consequenties van de
behandeling. Het zal ertoe leiden dat een patiënt die recent een maagbloeding gehad heeft, geen
thrombolytische interventie voorgeschreven krijgt. Volledig empirische kennis, zoals eigenlijk
gepropageerd door de Evidence-Based Medicine beweging, kan niet bestaan, omdat het geen kennis
is. Men kan niets aanvangen met een verzameling van feiten als men geen idee heeft over de
pathofysiologie. Evidence-Based Medicine kan zeker een bijdrage leveren aan “goed en toetsbaar
handelen” in de geneeskunde, maar inzicht in de etiologie en de pathogenese van ziekte blijven
noodzakelijk om de individuele patiënt optimaal te behandelen.
121
KWO
122
KWO
Appendix B
STEEKPROEFOMVANG
Inleiding
Bij de planning van onderzoek is het vaak nuttig om een idee te hebben over het aantal personen dat
minimaal aan een onderzoek moet deelnemen om een bepaald verband tussen determinant en
uitkomst “statistisch significant” aan te kunnen tonen. De formules die voor het berekenen van de
minimale groepsgrootte worden gebruikt zijn dan ook gebaseerd op de formules voor statistisch
toetsen. Bij deze toetsen gaat men na of de nulhypothese van ‘geen verband’ op grond van de data
verworpen moet worden. Men doet dit als de data de nulhypothese zeer onwaarschijnlijk maakt. Voor
deze waarschijnlijkheidsgrens wordt traditioneel 0.05 (= ) genomen. Als de p-waarde uit een toets
kleiner is dan 0.05 noemt men het verband statistisch significant, wordt de nul-hypothese verworpen,
en wordt de “alternatieve hypothese” aanvaard. Het doel is hier niet om de formules voor schatting van
de groepsgrootte geheel te doorgronden, maar enkel om ze op juiste wijze toe te kunnen passen.
Voor verschillende associatiematen (bijv. verschil in gemiddelden of in proporties) worden
verschillende formules gebruikt. Hieronder worden enkele van de meest gebruikte formules gegeven
met beknopte uitleg en een uitgewerkt voorbeeld. Nadere informatie is te vinden in handboeken [1,2].
Enige statistische begrippen
De volgende begrippen spelen een belangrijke rol bij de schatting van de groepsgrootte.
 Z = de statistische toetsingsgrootheid.
  = kans op onterecht verwerpen van nul-hypothese (ook: kans op type I fout, onbetrouwbaarheid of
significantieniveau). Voor het meeste onderzoek is  = 0.05 een acceptabele grens (maar 5% kans op
een type I fout). Bij  = 0.05 hoort Z = 1.96.
  = kans op het niet verwerpen van nul-hypothese, terwijl die niet waar is (ook: type II fout). Vaak is 
= 0.10 een acceptabele grens, want die komt overeen met een power (1 - ) = 0.90 (90% kans dat als
de nulhypothese niet waar is, deze ook inderdaad wordt verworpen). Bij  = 0.10 hoort Z 2 = 1.28.
Voor de berekening van de groepsgrootte moet men eerst een aantal waarden kiezen, meestal 0.05
voor het significantie niveau , en 0.90 voor de power. Vervolgens dient men in de formules aan te
geven hoe groot het verband is dat men aan wil tonen (bijv. een gemiddeld groepsverschil van 10 mm
Hg in bloeddruk, een relatief risico van 2 …, etc.). Vervolgens kan in principe voor verschillende
situaties bij benadering het benodigde aantal deelnemers worden berekend.
Formules en voorbeelden
Vergelijking van twee gemiddelden
Voor het vergelijken van twee gemiddelden, bijvoorbeeld van het cholesterolgehalte van twee groepen
personen, kan men onderstaande formule gebruiken voor een berekening van de benodigde
groepsgrootte,
2
Z  Z 2    2

n 2
 2  1 2
waarbij n = het aantal benodigde personen in elk van de groepen, 1 is het gemiddelde in de
referentiegroep (bv placebogroep), 2 is het gemiddelde in de index groep (bijv. behandelde groep) en
 is de standaard-deviatie van de metingen binnen elke groep (verondersteld wordt dat deze in beide
groepen gelijk is). Deze  is vaak wel uit de literatuur te halen.
Men wil het effect nagaan van een nieuwe HMG-CoA-reductase remmer, Dolor, op het Low Density
Lipoprotein (LDL)-cholesterolgehalte in het bloed bij patiënten met een recent myocardinfarct. Ze
worden daartoe naar 4 maanden Dolor of placebo gerandomiseerd, waarna in beide groepen het LDLcholesterol gehalte wordt bepaald (parallelle groepen trial). Stel dat het LDL-c bij zulke patiënten
gemiddeld 3.5 mmol/L is en de standaard deviatie 1.2 mmol/L.
Als Dolor in werkelijkheid een effect heeft van 20% reductie van het LDL-c gehalte, dus een verschil
van -0.7 mmol/L, moet dat met een power van 90%, lees 90% zekerheid, in het onderzoek statistisch
significant worden. Daarvoor zijn dan minimaal:
123
KWO
2
2
.  128
.  12
. 
196
n 2
0.72
 62
personen in de placebo en de index-groep, dus in totaal 124 patiënten nodig.
Het verschil tussen twee proporties
Voor het vergelijken van twee proporties, bijvoorbeeld percentages sterfte tussen twee groepen, kan
de volgende formule worden gebruikt om een idee van de benodigde groepsgrootte te krijgen,
2
Z  Z2 P1 1  P1  P2 1  P2
2
n

2
P2  P1
P2  P1




 


waarbij n is het aantal benodigde personen in beide groepen, P1 is de proportie in de referentiegroep
en P2 is de proportie in de index-groep.
Men wil een zelfde trial als in het eerste voorbeeld doen, maar nu met het percentage overledenen na
5 jaar behandelen als uitkomst. Gemiddeld, zonder Dolor, is na 5 jaar ongeveer 20% van de patiënten
overleden (P1 = 0.2). Behandeling met Dolor wordt relevant gevonden als dit percentage met 25%
gereduceerd kan worden (P2 - P1 = -0.05).
Als Dolor de 5-jaars sterftekans inderdaad met 25% kan reduceren, dan zijn minimaal:
n
1.96  1.282  0.21 0.2  0.151 0.15 2

 1248
0.05
0.15  0.22
personen in de placebo en de index-groep, dus in totaal 2496 patiënten nodig.
Deze formule kan ook worden gebruikt voor de schatting van de groepsgrootte voor het detecteren
van een bepaald relatief risico (RR), waarbij p2 = p1 x RR.
Equivalentie
Soms zijn we niet zozeer geïnteresseerd in een verschil tussen groepen, maar willen we juist
aantonen dat er geen verschil is. Dit vereist een speciale aanpak bij de schatting van de
groepsgrootte. Deze aanpak wordt geheel aan de hand van het voorbeeld uiteengezet.
Stel, men wil een onderzoek doen waarbij de vraag is of het effect van Dolor op de 5-jaars sterfte bij
patiënten met een recent doorgemaakt myocardinfarct net zo goed is als het effect van het al langer
bestaande maar veel duurdere Calor. Patiënten worden gerandomiseerd naar Dolor- of naar Calorgebruik gedurende 5 jaar. De vraag is nu, gegeven dat de reductie van sterfte bij gebruik van Calor
even groot is als bij gebruik van Dolor, hoeveel patiënten nodig zijn om die “equivalentie” met een
power van 90% aan te kunnen tonen. De “nul-hypothese” is nu dat de sterftekans in de Dolorgroep 
hoger is dan in de Calor groep. Deze nulhypothese proberen we te verwerpen.
Voor de benodigde aantallen kunnen we de volgende formule gebruiken:
Z

 /2 2P1  P  Z  P2 1  P2   P1(1  P1) 
n 


P2  P1  


2
waarbij:
Z/2 = 1.65
Z = 1.28
P = (P1 + P2)/2
P1 = 5-jaars cumulatieve sterfte in Calorgroep
P2 = 5-jaars cumulatieve sterfte in Dolorgroep
 = het verschil tussen Calor en Dolor dat we met 90% waarschijnlijkheid willen uitsluiten.
Stel: 5-jaars cumulatieve sterfte (P1) onder Calor is 0.10. Aangetoond moet worden dat onder Dolor
een zelfde sterftekans (P2) optreedt. We willen een  van 5% met 90% waarschijnlijkheid uit kunnen
124
KWO
sluiten.
Daarvoor zijn bij benadering:
 1.65 2 * 0.11  0.1  1.28 0.11  0.1  0.1(1  0.1) 

n 
0.05




2
= 620 patiënten per groep nodig
Patiënt-controleonderzoek
Vaak wordt gebruik gemaakt van het patiënt-controleonderzoek om bepaalde associaties te
bestuderen. In zijn simpelste vorm wordt één determinantfrequentie gemeten bij patiënten met een
bepaalde ziekte en bij controles, de niet-zieken. Voor die situatie kan onderstaande formule gebruikt
worden om tot een schatting van benodigde aantallen te komen.
n
Z a 2p q  Z 2b p1q1  p0 q0
2
p1  p0  2
waarbij
p1 
p0R
1  p0 R  1
𝑞=1-𝑝
q1 = 1-p1
𝑝 = (po+p1)/2
q0  1 p0
Er is een mogelijkheid om subsidie te krijgen voor onderzoek naar de effecten bij kinderen van
bepaalde stollingsstoornissen.
In een academisch kinderziekenhuis wil men daarom het verband nagaan tussen hersenbloedingen bij
prematuur geboren kinderen en het al dan niet hebben van een polymorfisme in een gen dat codeert
voor een stollingseiwit. Over een periode van ongeveer 2 jaar worden alle nieuwe premature kinderen
geselecteerd met een hersenbloeding en een in diezelfde periode geboren groep prematuren zonder
hersenbloeding, om in beide groepen de aanwezigheid van het polymorfisme te bepalen. Het is
bekend dat in de populatie het polymorfisme bij ongeveer 10% van de mensen voorkomt. Ik neem aan
dat dit ook de determinantfrequentie van mijn referentiegroep prematuren is. Hoeveel kinderen heb ik
in mijn onderzoek nodig om een relatief risico van 2 te detecteren met  = 0.05 en power = 90%?
p1 
n
0.12
1  0.12  1
 0.18
1.96 0.24  1.28 0.15  0.09
0.082
2
 394
In totaal zijn dus minimaal 788 patiënten in mijn onderzoek nodig (394 cases en 394 controles bij 1:1
matching). Dit is binnen afzienbare tijd absoluut geen haalbaar aantal binnen mijn kinderziekenhuis.
Na nog wat gesleutel: het verlagen van de power en het verhogen van het relatieve risico (m.a.w. als
het in werkelijkheid groter dan 2 is, dan kan ik het makkelijker, lees met kleinere aantallen, vinden)
blijven forse aantallen kinderen nodig. Overigens ben ik in dit onderzoek geïnteresseerd in de
etiologische relatie tussen polymorfisme en hersenbloeding bij prematuren. Ik zou dus in de analyse
van dit patiënt-controle onderzoek zeker ook rekening willen houden met andere risicofactoren van
hersenbloeding bij prematuren, die mogelijke confounders zijn van de relatie polymorfisme en
hersenbloeding. Om dat te kunnen doen zijn nog grotere aantallen patiënten nodig en mijn schatting
van 788 is een ondergrens (berekening valt buiten dit bestek). Om zulke aantallen te halen moet zeker
worden samengewerkt met andere grote centra, maar waarschijnlijk zelfs ook buiten Nederland. Ik
125
KWO
acht dat om verschillende redenen onhaalbaar en besluit daarom maar van dit onderzoek af te zien.
Groepsgrootte bij diagnostisch en prognostisch onderzoek
Een formele berekeningsmethode voor de benodigde groepsgrootte m.b.t. multivariabele diagnostisch
of prognostisch onderzoek bestaat (nog) niet. Om toch enigszins een idee te krijgen van de benodigde
grootte van onderzoek om een multivariabele diagnostisch/ prognostisch model te kunnen gebruiken,
is de regel van “één op tien” bruikbaar in de planning. Stel, je wilt in huisartsenpraktijken onderzoek
doen naar de meerwaarde van 1 nieuwe test t.o.v. 4 al bestaande tests voor het aantonen dan wel
uitsluiten van een myocard infarct. Dat wil zeggen dat zich onder de patiënten met verdenking
myocard infarct, waarbij je de tests doet, 10 x (1+4) = 50 patiënten moeten bevinden die echt een
myocard infarct blijken te hebben.
Verder gesteld dat in huisartspraktijken onder personen verdacht voor een myocard infarct ongeveer
de helft dat later ook inderdaad blijkt te hebben, dan heb je voor dit onderzoek tenminste 100
personen met verdenking myocard infarct nodig om de diagnostische analyse met gegevens van 5
tests goed te kunnen doen.
Tips
Tip: de vraag om een groepsgrootte-berekening is een van de meest gestelde aan de statisticus of de
epidemioloog. Deze worden nogal eens in een laat stadium bij de opzet van een onderzoek betrokken.
Ten eerste hopen we je in deze stage duidelijk te maken dat een groepsgrootte-berekening handig
maar tegelijk ook betrekkelijk is.
De berekening dwingt je iets aan te nemen over (grootte en relevantie van) associaties, die
tegelijkertijd nou ook juist het onderwerp van je onderzoek zijn. In veel, vooral nieuw, onderzoek blijkt
dat vaak een moeilijkheid. Toch geeft ook in die situaties een berekening een nuttige schatting van de
orde van grootte: gaat het om tientallen, honderden of duizenden? Ten tweede hopen we je duidelijk
te maken dat alle berekeningen uiteraard conditioneel zijn op de kwaliteit van de studieopzet. Een
berekening op basis van een slechte studieopzet is nutteloos. Vroeg overleg over de opzet is veel
belangrijker dan laat overleg over de groepsgrootte!
Tip: men stelt nogal eens de vraag “Hoeveel patiënten heb ik nodig in mijn onderzoek om mijn
gegevens significant te maken?”. De berekeningen maken niets significant! Ze geven alleen aan onder
welke omstandigheden (bijvoorbeeld met hoeveel patiënten) je een associatie statistisch significant
kunt aantonen, als die associatie in werkelijkheid ook bestaat.
Tip: soms is het maximaal haalbare aantal beschikbare deelnemers/patiënten voor een onderzoek al
bekend, bijvoorbeeld als er niet meer patiënten in een kliniek zijn of omdat men bijvoorbeeld in een
bepaald ziekenhuis al alle in Nederland bekende patiënten geregistreerd heeft. In zulke gevallen is het
mogelijk om met die aantallen te berekenen welke associatie, als die echt bestaat, je kunt aantonen
(er is dan gewoon een andere onbekende in de bovengenoemde vergelijkingen). Het is dan zaak om
zelf te beoordelen of zo’n associatie ook reëel is.
Tip: een groepsgrootteberekening dient niet alleen om jezelf als onderzoeker te overtuigen, maar
vooral ook je wetenschappelijke omgeving. Volsta voor bijvoorbeeld een subsidieaanvraag dan ook
niet met een zinnetje “Gegeven deze aan te tonen associatie en met een alpha van ? en een power
van ? hebben we X patiënten nodig”. Laat zien dat je zo’n berekening zelf als onderzoeker ook reëel
vindt en waarom.
Literatuur
1.
Houwelingen van JC, Stijnen Th, Strik van R (red). Inleiding tot de medische statistiek. Utrecht:
Bunge, 1995.
2.
Altman DG. (computer)practical Statistics for Medical Research. London: Chapman & Hall,
1991.
3.
Pocock SJ. Clinical trials. A (computer)practical approach. Chicester - New York - Brisbane Toronto - Singapore: John Wiley & Sons Ltd., 1983.
126
KWO
Appendix C
META-ANALYSE
Inleiding
Vaak is het nodig om op basis van de resultaten van meerdere onderzoeken de typische grootte van
een bepaald effect te schatten, bijvoorbeeld voor het opstellen van een behandelingsrichtlijn. Dit is niet
simpel. Onder andere door de beperkte precisie van met name de kleinere onderzoeken lopen de
resultaten vaak sterk uiteen, waardoor het typische effect niet direct zichtbaar is.
De meta-analyse is bedoeld om de resultaten van meerdere onderzoeken op formele wijze
kwantitatief samen te vatten en daarmee een meer precieze schatting van het effect te leveren. Veel,
maar niet alle, toepassingen van meta-analyse betreffen effectiviteit van interventie.
Een voorbeeld van een meta-analyse van een vraag van risico is het recente onderzoek van Marshall
et al. [1], betreffende de veelvuldig onderzochte relatie tussen de bot-mineraaldichtheid en de kans op
fracturen.
In dit onderzoek werden de originele gegevens van 11 observationele onderzoeken verzameld zodat
men de uiteindelijke analyses met 90000 persoonsjaren en meer dan 2000 fracturen kon doen.
Gemiddeld bleek de kans op een fractuur met 50% toe te nemen per standaard deviatie afname van
de botmineraaldichtheid.
Zoals klaarblijkelijk gelukt is in bovenstaand voorbeeld, moeten de gegevens zo origineel mogelijk zijn,
dus geen effectmaten maar aantallen. Met behulp van verschillende technieken is het mogelijk om
vervolgens een samenvattend effect te schatten waarbij rekening wordt gehouden met de
verschillende grootte van de onderzoeken.
Het samenvatten van de verschillende effecten uit meerdere onderzoeken in één effect veronderstelt
dat er in werkelijkheid maar één typisch onderliggend effect is en dat verschillen tussen onderzoeken
berusten op toevalsvariatie. Zo is het bijvoorbeeld heel plausibel dat het effect van een interventie
varieert met de ernst van de aandoening. Het is in een meta-analyse dan ook absoluut noodzakelijk
dergelijke verschillen goed te onderzoeken en zo nodig aparte schattingen voor subgroepen te maken.
Forrest-plot maken (Microsoft Office 2007/ 2010)
1.
2.
Maak in Excel 6 kolommen aan met de volgende variabelen: (1) nummer artikel, (2)
maximale waarde 95% betrouwbaarheidsinterval (BI), (3) Gemiddelde/RR/OR, (4)
minimale waarde 95% BI, (5) maximale waarde BI min Gem/OR/RR en (6) Gem/OR/RR
min minimale waarde 95%BI.
Geef de artikelen een nummer en noem deze niet bij naam.
Voorbeeld: Artikel 1: OR = 5 (95%BI 3-9)
3.
4.
5.
6.
7.
Selecteer de nummers onder de variabele “artikel”  klik op het tabblad “invoegen” 
selecteer vervolgens de spreidingsdiagram (Spreiding met alleen markeringen)
Ga naar het icoontje ‘Gegevens selecteren’ onder het tabblad “ontwerpen”  klik op
‘Bewerken’  X waarden: Selecteer de waarden onder Gem/OR/RR, Y waarden:
selecteer de waarden onder artikel (zijn al geselecteerd)  OK
Kies onder grafiekindeling een indeling waarbij geen rasterlijnen zichtbaar zijn (standaard
‘Indeling 4’).
Selecteer de Y-as (as opmaken) en verander de schaal van de Y-as (primaire eenheid is 1)
Selecteer de puntschatters  ga naar het tabblad “indeling” en klik vervolgens op het
icoontje ‘Foutbalken’  Selecteer ‘Meer opties voor foutbalken...’  sluit dit venster.
De puntschatters hebben nu twee foutbalken: een horizontale foutbalk en een verticale
foutbalk. Selecteer de verticale foutbalk en verwijder deze (delete). Selecteer vervolgens
de horizontale foutbalk en ga opnieuw naar de optie ‘Meer opties voor foutbalken (via
Indeling  Foutbalken).
N.B.: Je hoeft niet per se uit het menu “foutbalken opmaken te gaan”. Je kunt de
foutbalken ook selecteren als je in het menu zit door op de verticale of horizontale lijnen te
klikken.
127
KWO
8.
a.
b.
Ga bij “foutweergave” naar de optie ‘aangepast’  selecteer ‘Waarde opgeven’
+  selecteer de kolom maximale waarde 95%BI – Gem/OR/RR
-  selecteer de kolom Gem/OR/RR – minimale waarde 95%BI
OK.
9. Pas de forrest-plot naar eigen inzichten verder aan.
10. Vervolgens is je figuur bijna klaar. Maar je wilt geen getallen bij de Y-as, maar de echte
naam van het artikel. Hier heb je PowerPoint voor nodig.
11. Maak in PowerPoint per variabele nieuwe tekstvakken aan
12. Plak de forrest-plot vanuit Excel in Powerpoint en plaats de tekstvakken erom heen (je kunt
met control en pijltjes kleine stapjes verschuiven)
13. Ook kun je met behulp van de meetlijn de precieze afstand meten tussen de tekstvakjes,
zodat ze recht in het figuur komen te staan
14. Sla het figuur op als JPEG
15. Je kunt in het JPEG dan ook de randen afsnijden
16. Je forrest-plot is nu klaar
Publicatiebias
Een belangrijk probleem bij meta-analyse ontstaat doordat statistisch significante trials eerder in de
medische literatuur terechtkomen dan de niet significante. Aangezien trials waarin een groot effect
wordt gevonden eerder statistisch significant zijn, wordt in een meta-analyse van gepubliceerde trials
het interventie effect in onbekende mate overschat.
Deze vertekening wordt publicatiebias genoemd. Een betere schatting zou dus op basis van alle,
gepubliceerde en niet gepubliceerde, onderzoeken moeten gebeuren. De gegevens uit de niet
gepubliceerde onderzoeken zijn echter lastig te achterhalen en mogelijk kwalitatief inferieur omdat
deze nog niet aan peer review werden onderworpen. In de praktijk geschiedt de eerste selectie van
onderzoeken voor meta-analyse met behulp van computerprogramma’s (bijvoorbeeld Medline) die in
bestanden van de gepubliceerde literatuur kunnen zoeken. Zo verkrijgt men in elk geval een volledige
en systematische opsomming van de relevante literatuur.
Subjectiviteit
Hoewel in mindere mate dan bij het klassieke literatuuroverzicht, speelt ook bij meta-analyse de
subjectiviteit van de onderzoeker een grote rol. Uiteindelijk bestaat er een aanzienlijke vrijheid ten
aanzien van de selectie van onderzoek, de analyse van de gegevens en uiteraard ook de conclusies.
De lezer dient zich hier bewust van te zijn alvorens vergaande conclusies te trekken.
Nadere informatie
In deze paragraaf is meta-analyse uiterst summier besproken en er is uiteraard veel meer over te
zeggen. Een goede nadere bespreking kunt u vinden in een Nederlands leerboek [2].
Literatuur
1.
Marshall D, Johnell O, Wedel H. Meta-analysis of how well measures of bone mineral density
predict occurrence of osteoporotic fractures. BMJ 1996;312:1254-1259.
2.
Hofman A, Grobbee DE, Lubsen J (red). Klinische epidemiologie. Utrecht: Bunge, 1996.
Bronvermelding
Burger H, Hofman A. Klinische Epidemiologie. In: Van der Meer J, Stehouwer CDA (red).
Interne Geneeskunde. Houten: Bohn Stafleu van Loghum, 2001: paragraaf 1-7-3 (Metaanalyse).
128
Download