Tijdschrift voor Evidence-Based Medicine
De valkuilen van subgroepanalyses
Minerva 2006 Volume 5 Nummer 10 Pagina 154 - 154
Zorgberoepen
|
Die bevindingen kunnen we niet meteen naar de praktijk vertalen. We moeten voorzichtig blijven bij het interpreteren en gebruiken van resultaten van subgroepanalyses. De uitkomsten moeten namelijk aan een aantal belangrijke voorwaarden voldoen. Ten eerste moeten de subgroepanalyses ingebouwd zijn in het protocol van een studie. Alleen op die manier kan men ervoor zorgen dat de randomisatie bewaard blijft en de groepen groot genoeg zijn. Tevens moet men duidelijk beschrijven waarom men een subgroepanalyse doet en waarom men verwacht dat het effect verschillend zal zijn voor specifieke groepen patiënten (5,6). De observatie in de ISIS-2-studie dat aspirine bij patiënten na een myocardinfarct alleen effectief is bij personen die onder een specifiek teken van de dierenriem zijn geboren, illustreert hoe belangrijk het toeval is bij dergelijke analyses. Daarnaast is het belangrijk dat de power van de studie is afgestemd op de geplande subgroepanalyses (6). Zoals de auteurs in commentaren bij de genoemde studies opmerken, moeten we conclusies op basis van subgroepanalyses altijd met enige reserve bekijken (7,8,9). Om het resultaat op een studie-eindpunt statistisch significant te noemen, eisen we over het algemeen een p-waarde <0,05. De kans dat het gevonden resultaat aan toeval te wijten is, moet dus kleiner zijn dan 5%. Voor de resultaten van subgroepanalyses moeten we veel strenger zijn. Het toeval speelt daar immers een veel grotere rol (5,6). Dat auteurs daar niet altijd rekening mee houden, blijkt uit de CHARISMA-studie (1). In de subgroep van patiënten met een bestaande cardiovasculaire pathologie is het relatieve risico van een nieuw ernstig cardiovasculair incident 0,88 (95% BI 0,77 tot 0,998; p=0,046). Dat lijkt statistisch significant, maar is het niet! De grens voor statistische significantie ligt in subgroepanalyses bij een veel lagere pwaarde. Men moet de algemeen aanvaarde grens van 5% delen door het product van het aantal subgroepanalyses en het aantal eindpunten dat men evalueert (7,10,11). Als men er, zoals in deze studie, 20 uitvoert, is het resultaat pas significant bij een p-waarde van 0,0025 (9). Die drempel is lager dan de gevonden p-waarde (0,046). Het effect in deze subgroep van de CHARISMA-studie mag dus niet significant genoemd worden. |
In veel gevallen worden subgroepen pas ingedeeld bij het analyseren van de studie. Dergelijke post-hocanalyses moeten met nog meer reserve bekeken worden. Statistische toetsen zijn dan niet betrouwbaar en eventuele significantie heeft geen enkele betekenis (11). Subgroepanalyses zijn aantrekkelijk en kunnen voor de kliniek ook belangrijke praktische informatie geven, maar ze kunnen ons ook misleiden. De resultaten ervan moeten we de juiste waarde toekennen: ze beschouwen als zuiver hypothesevormend. |
P. Chevalier en M. van Driel |
Literatuur |
|
Auteurs
Chevalier P.
médecin généraliste
COI :
van Driel M.
Vakgroep Huisartsgeneeskunde en Eerstelijnsgezondheidszorg, UGent
COI :
Woordenlijst
subgroepanalyseCodering
Commentaar
Commentaar