Tijdschrift voor Evidence-Based Medicine
Het minimaal klinisch relevante verschil
Of: wanneer betekent ‘verbetering’ werkelijk ‘verbetering voor de patiënt’?
In 2014 stelden we de vraag naar het nut van glycopyrronium versus placebo bij patiënten met COPD (1,2). In de besproken RCT (de GLOW2-studie) was de score op de St. George’s Respiratory Questionnaire (SGRQ) op week 52 statistisch significant, maar klinisch niet relevant beter in de glycopyrroniumgroep (en de tiotropiumgroep) versus de placebogroep. De drempel voor een klinisch relevant verschil is bij consensus een verschil van 4 punten. De mindere mate van verslechtering van de ESW in de glycopyrronium- en de tiotropiumgroep in vergelijking met de placebogroep blijft in absolute waarde ook onder de algemeen aanvaarde drempel voor een klinisch relevante verbetering. In non-inferioriteitsstudies wordt de marge voor non-inferioriteit vooraf vastgelegd in het onderzoeksprotocol. Deze marge moet kleiner zijn dan het afkappunt voor klinisch relevante superioriteit. Over het algemeen wordt een waarde gekozen die de helft en soms twee derde bedraagt van het afkappunt voor superioriteit (3). |
Wat betekent het concept “minimaal klinisch verschil” en hoe wordt dit vastgelegd?
Het minimaal klinisch relevante verschil (Eng: minimal clinically important difference, MCID) is het kleinste gunstige effect dat waardevol is voor de patiënt (4).
Bij het vastleggen van de MCID duiken verschillende problemen op (5).
McGlothlin et al. zetten de verschillende manieren voor de bepaling van de MCID op een rijtje (6).
1. Berekening door consensus (Delphi-techniek): aan een expertenpanel wordt gevraagd om individueel een onafhankelijk oordeel te geven over wat overeenkomt met een klinisch relevant verschil; de beoordelingen worden in de expertengroep geëvalueerd en bediscussieerd tot er een consensus is over een precieze cijfermatige waarde voor de MCID.
2. Ankermethode (Eng : anchor-based method) : koppelt de uitkomst op een numerieke schaal aan een kwalitatieve categorie die door de patiënt wordt aangegeven.
Voorbeeld: in een studie over gonartrose of coxartrose was de MCID voor de WOMAC-score gebaseerd op het 75° percentiel van de WOMAC-score; 75% van de patiënten die zichzelf onderbrachten in de categorie ‘een gunstig effect ervaren’ (=anker) hadden een verbetering die gelijk was aan of groter dan de op deze manier bekomen MCID (7).
3. Distributie-gebaseerde methodes: gebaseerd op de statistische eigenschappen van de distributie van de resultaten van een bepaalde uitkomstmaat. Experten noch patiënten spelen een rol bij deze methodes. Deze methodes bepalen hoe groot een verandering moet zijn om aan te tonen dat de verandering van een uitkomstmaat als antwoord op een interventie superieur is aan de verandering door toeval. Distributie-gebaseerde methodes zijn niet aanbevolen als eerste keuze methode en bij het gebruik ervan wordt de MCID soms vervangen door het ‘minimaal meetbaar verschil’ (minimal detectable change’) (8).
Bij extensie kunnen we de MCID interpreteren als de drempel voor klinische relevantie van de resultaten van bepaalde uitkomstmaten in een studie. Op die manier kunnen we het onderscheid maken tussen een statistisch significant resultaat enerzijds en een klinisch relevant resultaat anderzijds.
Laten we terugkeren naar de hierboven vermelde GLOW2-studie (2). Het verschil in SGRQ-score tussen de glycopyrroniumgroep en de placebogroep bedraagt op het einde van de studie -3,32 in het voordeel van de glycopyrroniumgroep, met een 95% BI van -5,287 tot -1,346 en een p-waarde <0,001. Statistisch gezien is dit resultaat significant. Het minimaal klinisch relevante verschil was vooraf vastgelegd op een verschil van 4 eenheden, op basis van experimentele gegevens en interviews met patiënten. Het statistisch significante verschil van 3,32 bereikt dus niet het minimaal klinisch relevante verschil van 4.
Sommige auteurs menen dat men niet alleen rekening moet houden met een gemiddeld resultaat (met 95% BI), maar ook met het aantal patiënten waarvan de resultaten zich boven de vastgelegde drempel bevinden. In de GLOW2-studie behaalt 54,3% van de patiënten in de glycopyrroniumgroep een vermindering in SGRQ-score van minstens 4 punten versus 50,8% in de placebogroep. Het verschil in aantal patiënten bedraagt hier dus 3,5%. Klinisch lijkt dit verschil in percentage patiënten niet relevant, maar door het ontbreken van een gevalideerde referentie voor de relevantie, is deze beoordeling volledig arbitrair.
Referenties
- Chevalier P, Van Meerhaeghe A. Wat is het (relatieve) nut van glycopyrronium voor de behandeling van COPD? Minerva 2014;13(1):4-5.
- Kerwin E, Hébert J, Gallagher N, et al. Efficacy and safety of NVA237 versus placebo and tiotropium in patients with COPD: the GLOW2 study. Eur Respir J 2012;40:1106-14.
- Chevalier P. Non-inferioriteitsstudies: het nut, de beperkingen en de valkuilen. Minerva 2009;8(6):88.
- Higgins JPT, Green S. Cochrane Handbook for systematic reviews of interventions Cochrane Book Series. Copyright 2008. The Cochrane Collaboration.
- Chevalier P. Drempelwaarden voor een klinisch relevant verschil. Minerva 2011;10(8);103.
- McGlothlin AE, Lewis RJ. Minimally clinically important difference. Defining what really matters to patients. JAMA 2014;312:1342-3.
- Tubach F, Ravaud P, Baron G, et al. Evaluation of clinically relevant states in patient reported outcomes in knee and hip osteoarthritis: the patient acceptable symptom state. Ann Rheum Dis 2005;64:34–7.
- Turner D, Schünermann HJ, Griffith LE, et al. The minimal detectable change cannot replace the minimal important difference. J Clin Epidemiol 2000;63:28-36.
Commentaar
Commentaar