Tijdschrift voor Evidence-Based Medicine



Non-inferioriteitsstudies: de keuze van de non-inferioriteitsmarges


Minerva 2013 Volume 12 Nummer 5 Pagina 64 - 64

Zorgberoepen


Tekst onder de verantwoordelijkheid van de Franstalige redactie


Non-inferioriteitsstudies in de lift

In de rubriek ‘EBM-concepten’ besprak Minerva in 2009 de techniek van non-inferioriteitsstudies (1). Een non-inferioriteitsstudie wil aantonen dat een (nieuw) geneesmiddel binnen een bepaalde vastgelegde marge niet inferieur is op het vlak van werkzaamheid aan de standaardbehandeling. Verschillende studies die we in Minerva besproken hebben, zijn gebaseerd op een non-inferioriteitsopzet, bv. de studies over de nieuwe orale anticoagulantia. Dat is bijlange niet het enige onderzoeksdomein waarin niet-inferioriteitsstudies populair zijn. Een zoektocht in PubMed op het woord ‘non-inferior’ in titel en abstract leverde in 2000 9 publicaties en in 2010 260 publicaties op. In maart 2013 zijn het er 1 851 geworden.

Onterecht besluiten tot non-inferioriteit

In onze vroegere bespreking over non-inferioriteitsstudies verwezen we naar een onderzoek dat de non-inferioriteitsmarges van studies in het cardiovasculaire domein evalueerde (2). Deze auteurs besloten dat na een nauwkeurige herevaluatie, de geclaimde non-inferioriteit voor verschillende studies niet overeind bleef. Wangge et al. publiceerden in 2013 een onderzoek over de gekozen non-inferioriteitsmarges in de studies over de nieuwe anticoagulantia als preventie van trombo-embolische gebeurtenissen na een majeure orthopedische ingreep (3). Volgens deze auteurs was de keuze van de marges niet altijd correct, waardoor in deze gevallen onterecht besloten is tot non-inferioriteit. Alles draait dus om de keuze van de non-inferioriteitsmarge…

Over de grens

De non-inferioriteitsmarge is de marge of de drempel die het maximale verschil in werkzaamheid versus de referentiebehandeling bepaalt. Er is geen algemeen aanvaarde consensus over de precieze methode om deze marge te bepalen. In de praktijk kiest men over het algemeen een waarde die de helft bedraagt van de marge voor superioriteit, en soms twee derde om een duidelijke en klinisch relevante marge te bekomen (4). De FDA publiceerde in 2010 richtlijnen voor non-inferioriteitsstudies waarmee het agentschap o.m. een correcte bepaling van de non-inferioriteitsmarge wou vastleggen (5). De richtlijn geeft aan om in de eerste plaats de werkzaamheid van de actieve controlebehandeling te bepalen versus placebo. Deze waarde wordt M1 genoemd. M1 is gekozen als de minimale effectgrootte van de actieve vergelijking versus placebo. M1 komt dus overeen met de meest ‘pessimistische’ marge (=de minimale werkzaamheid) van het 95% betrouwbaarheidsinterval van de gepoolde effectgrootte in een meta-analyse van studies in het onderzochte domein.

Eens de M1-waarde vastgelegd, moet men de klinische M2-waarde bepalen. De M2-waarde bevindt zich binnen de M1-waarde en komt overeen met het grootste aanvaardbare klinische verschil tussen de nieuwe behandeling en de standaardbehandeling. De FDA legt geen strikte regel vast over de verhouding van M2 ten opzichte van M1, maar kiest in een illustratie voor een M2-waarde die 50% bedraagt van de M1-waarde. Het belangrijkste is om in termen van klinische relevantie vast te leggen hoeveel van de werkzaamheid van de referentiebehandeling er maximaal mag verloren gaan bij de toepassing van de nieuwe behandeling.

De formules om de M2-waarde te berekenen variëren naargelang de werkzaamheid tussen de referentiebehandeling en placebo uitgedrukt is als risicoverschil (ARR: absolute risicoreductie) of relatief risico (RR). In haar richtlijn geeft de FDA niet aan welke de beste keuze is.

 

Illustratie in de FDA-richtlijn

De FDA voerde in 2010 een meta-analyse uit met studies over warfarine bij voorkamerfibrillatie. Bij analyse met het random effects model bedroeg het relatief risico voor warfarine versus placebo 0,361 (95% BI van 0,248 tot 0,527) voor de primaire uitkomstmaat (CVA, TIA of systemische embolie) (RR (Warfarine/Placebo)). De meest pessimistische marge (0,527) komt overeen met een risicoreductie van 47%. Anders uitgedrukt betekent dit dat het risico bij placebo toeneemt met ongeveer 90% versus warfarine (1/0,527 = 1,898 = RR (P/W)). De M1-waarde is hier dus 1,898. Voor een meer symmetrische verdeling kunnen we de natuurlijke logaritme (ln) gebruiken: ln 1,898 = 0,641. Wanneer we kiezen voor een M2-waarde die 50% bedraagt van de M1-waarde, is de ln voor M2 0,641 x 50% = 0,3205. Niet logaritmisch uitgedrukt betekent dit: e0,3205 = 1,378. Deze non-inferioriteitsmarge van 1,378 mag dus niet overschreden worden wanneer men de non-inferioriteit van een andere behandeling wil aantonen versus warfarine.

De SPORTIF V-studie vergeleek het effect van ximelagatran met warfarine. Het relatieve risico voor het primaire eindpunt bedroeg 1,39 (95% BI van 0,91 tot 2,12). De marge van het betrouwbaarheidsinterval (2,12) was groter dan de hierboven vastgelegde M2-waarde (1,378). In dit voorbeeld is de non-inferioriteit van ximelagatran ten opzichte van warfarine dus niet aangetoond.

 

Hypothese van overeenstemming (‘constancy assumption’)

In een non-inferioriteitsstudie wil men op een indirecte manier de werkzaamheid van een nieuwe behandeling aantonen ten opzichte van placebo door de nieuwe behandeling te vergelijken met een referentiebehandeling die werkzaam is gebleken versus placebo.

Om valide conclusies te kunnen trekken uit een non-inferioriteitsstudie (om dus de resultaten van de steekproef te kunnen veralgemenen naar de betrokken populatie) neemt men aan dat het effect van de actieve controlebehandeling in de non-inferioriteitsstudie gelijk is aan het effect van deze behandeling versus placebo in de studies waarin de M1-waarde werd bepaald. Dat is de zogenaamde ‘constancy assumption’. Het betekent dat de patiëntkenmerken in de non-inferioriteitsstudie en in de studies die placebo vergeleken met de referentiebehandeling identiek zijn en dat de medische behandeling, de co-behandelingen, de referentiewaarden (INR-streefwaarden bijvoorbeeld) of de uitkomstmaten in belangrijke mate overeenkomen.

 

Besluit

Verschillende publicaties, o.a. deze van Wangge et al., wijzen op een aantal cruciale vragen bij het toepassen van non-inferioriteitsstudies, meer bepaald met betrekking tot het vastleggen van de non-inferioriteitsmarge en de hypothese van overeenstemming met de referentiestudies waarin de marge werd vastgelegd. Strikte internationale aanbevelingen en de garantie dat deze toegepast worden, zouden voor clinici een geruststelling betekenen over de validiteit van de conclusies van non-inferioriteitsstudies.

 

Met dank aan Piet Vancraeynest voor zijn waardevolle commentaar

 

Referenties

  1. Chevalier P. Non-inferioriteitsstudies: het nut, de beperkingen en de valkuilen. Minerva 2009;8(6):88.
  2. Kaul S, Diamond GA. Good enough: a primer on the analysis and interpretation of noninferiority trials. Ann Intern Med 2006;145:62-9.
  3. Wangge G, Roes K, de Boer A, et al. The challenges of determining noninferiority margins: a case study of noninferiority randomized controlled trials of novel oral anticoagulants. CMAJ 2013;185:222-7.
  4. Grouin JM et Coste M. Essais de non-infériorité et d’équivalence: méthodologie et analyse. In Essais cliniques : théorie, pratique et critique. Médecine-Sciences Editions Flammarion 2006.
  5. FDA. Guidance for industry non-inferiority clinical trials.
Non-inferioriteitsstudies: de keuze van de non-inferioriteitsmarges



Commentaar

Commentaar