Tijdschrift voor Evidence-Based Medicine
Clustergerandomiseerd onderzoek met een ‘stepped wedge’ protocol: in specifieke situaties een alternatief voor de klassieke clusterrandomisatie?
Het ‘stepped wedge’ clusteronderzoek is een vrij recente onderzoeksvorm (1). Het design ontleent zijn naam aan de getrapte grafische presentatie (zie figuur). Wanneer een klassieke clusterrandomisatie niet mogelijk of niet wenselijk is, kan het ‘stepped wedge’ design een alternatief zijn. Over clusterrandomisatie en pragmatisch onderzoek publiceerde Minerva al enkele methodologische bijdragen (2,3). Bij clustergerandomiseerd onderzoek met een ‘stepped wedge’ protocol krijgt aan het begin van de studie geen enkele cluster de interventie zoals in een klassieke, geblindeerde RCT. Nadien wordt de interventie op een ‘getrapte’ manier cluster per cluster geïmplementeerd in een toevallig gekozen, vooraf vastgelegde volgorde. Heming et al. bespreken in de BMJ verschillende varianten van dat soort onderzoek (4) (zie figuur).
Voordelen?
In clustergerandomiseerd onderzoek worden groepen gerandomiseerd in plaats van individuen, bv. woon- en zorgcentra, ziekenhuizen, huisartspraktijken, scholen. Die keuze wordt gemaakt als de interventie zich niet afspeelt op het individuele niveau, maar op het niveau van een groep (2): bv. niet een molecule vergelijken met placebo, maar wel het effect meten van een verandering in de zorgverlening. Clusterrandomisatie laat toe om op een zeer pragmatische manier (rekening houdend met de reële dagelijkse zorgverlening) de impact van soms complexe interventies kwantitatief te evalueren, bv. interventies op het niveau van gezondheidszorgorganisatie (5). Dat in tegenstelling tot een klassieke, verklarende RCT die het effect onderzoekt van bv. een enkele molecule binnen een interindividueel verband.
De getrapte invoer van de interventie binnen de clusters heeft enkele voordelen. De interventie moet niet in alle clusters terzelfdertijd opgezet worden, maar schuift door van de ene cluster naar de andere, waardoor de werkbelasting voor het op punt stellen van de interventie meer gespreid is. Wanneer in 1 cluster de interventie gestart is, gaat deze verder tot het einde van de studie. Iedere cluster geniet dus op het einde van de studie van de interventie en dat kan een voordeel zijn op het ethische vlak. De volgorde waarin de clusters toegelaten worden tot de interventie is toevallig en vooraf vastgelegd.
Bij grote clusters en/of een grote correlatie tussen clusters heeft de getrapte implementatie van clusters meer statistische power dan de klassieke parallelgroepen RCT. Dat heeft dan weer een voordeel op het vlak van middelengebruik (minder clusters en/of kleinere clusters nodig voor dezelfde statistische informatie). De interventie opzetten gedurende langere tijd kan ook nuttig zijn om informatie te verzamelen over zowel de factoren die de introductie van de interventie bevorderen als de factoren die deze eerder afremmen. Door clusters van blootgestelde periodes te vergelijken met clusters van niet-blootgestelde periodes, kan men de heterogeniteit in behandelingseffect tussen de clusters onderzoeken, eventueel als secundaire analyse.
Het tijdseffect: een valkuil?
Het ‘stepped wedge’-design heeft ook beperkingen. Bij de powerberekening, de statistische analyse en de vermelding van specifieke resultaten, moet men rekening houden met de correlatie tussen de clusters (clustereffect) (2,3). Ook het tijdseffect kan een risico van bias vormen. Op het einde van de studie genieten meer clusters van de interventie dan bij het begin van de studie. De gegevens van de niet-blootgestelde groepen dateren uit een vroegere tijdsperiode in vergelijking met de gegevens van de blootgestelde groepen. Dat vormt een probleem want een externe factor kan evolueren in de tijd, bv. de globale kwaliteitsverbetering van de gezondheidszorg of de verbetering van de levenskwaliteit van de patiënten in de clusters. Het effect van de interventie kan hier dus vertekend worden door een onderliggend tijdseffect, waardoor de precisie van de studie afneemt. Bij de statistische analyse moet men corrigeren voor dat tijdseffect. In de praktijk is het ook mogelijk dat clusters niet altijd op het vooraf vastgelegde tijdstip kunnen beginnen aan de interventie. In dat geval moeten clusters geëvalueerd worden volgens het intention to treat-principe: in functie van het toegewezen tijdstip, onafgezien van het feit of de interventie al dan niet op dat ogenblik plaatsvond.
Samenvattend kunnen we stellen dat een clustergerandomiseerde studie met een ‘stepped wedge’ of getrapte implementatie van de interventie een goed voorbeeld is van een pragmatische studie en zeer geschikt is om kwaliteitsbevorderende interventies te evalueren. In sommige gevallen en mits rekening te houden met de methodologische en statistische vereisten, is dat type studie-opzet goed geschikt om interventies met politieke, logistieke of ethische beperkingen toch voldoende rigoureus te evalueren.
- Brown CA, Lilford RJ. The stepped wedge trial design: a systematic review. BMC Med Res Methodol 2006;6:54.
- Chevalier P. Clusterrandomisatie. Minerva 2012;11(4):51.
- Michiels B. Bias in geclusterde studies. Minerva 2013;12(2):25.
- Hemming K, Haynes TP, Chilton PJ, et al. The stepped wedge cluster randomised trial: rationale, design, analysis, and reporting. BMJ 2015;350:h391.
- Michiels B. Wat is er zo speciaal aan pragmatische klinische studies? Minerva 2014;13(10):129.
Auteurs
Henrard G.
Département de Médecine générale, ULiège
COI :
Woordenlijst
clusterrandomisatieCodering
Commentaar
Commentaar